Apple объясняет технологию, стоящую за способностью Siri находить местные направления

Apple опубликовала новую статью в своем Журнале Машинного Обучения, предоставляющую технические детали о том, как она работает над улучшением способности Siri распознавать названия местных достопримечательностей. В посте под названием “Поиск местных направлений с помощью регионально специфических языковых моделей Siri для распознавания речи” Apple объясняет, как iOS включает знания о текущем местоположении пользователя в систему распознавания речи, стоящую за Siri, чтобы обеспечить уровень точности, превышающий простое общее распознавание речи, до такой степени, что Siri может более точно распознавать именованные сущности, такие как местные бизнесы.

Хотя Apple признает, что у большинства виртуальных помощников нет проблем с правильным распознаванием и пониманием названий известных бизнесов, таких как Starbucks, гораздо сложнее точно идентифицировать названия миллионов меньших местных бизнесов и услуг, о которых спрашивают пользователи. Чтобы решить эту проблему, Apple начала с включения знаний о местоположении пользователя в систему распознавания речи, не только для идентификации бизнесов, которые могут находиться рядом с местоположением пользователя, но и для создания региональной акустической модели того, как пользователи могут произносить названия местных бизнесов, а также для решения сложности сотен названий бизнесов, которые имеют мало или вовсе не имеют представительства в базе данных языковой модели Siri.

Apple создала 169 индивидуализированных языковых моделей, называемых “Geo-LMs”, для каждой из Объединенных Статистических Районов (CSA) в Соединенных Штатах, а также одну глобальную Geo-LM для использования в ситуациях, когда пользователь находится либо вне одного из предопределенных районов, либо его местоположение просто не может быть определено. Каждая Geo-LM содержит дополнительные данные, которые передаются в Siri наряду со стандартными акустическими моделями, чтобы предоставить дополнительные данные о скорости распознавания, специфичные для региона этого пользователя, помогая Siri лучше понимать предполагаемую последовательность слов пользователя, а также региональную дикцию и произношение названий бизнесов.

Get new posts in your inbox