Tecnologia Siri · 1 min read · Oct 10, 2025
A Apple explica a tecnologia por trás da capacidade da Siri de encontrar destinos locais
A Apple compartilhou um novo artigo em seu Jornal de Aprendizado de Máquina fornecendo detalhes técnicos sobre como trabalha para melhorar a capacidade da Siri de reconhecer nomes de pontos de interesse locais. Em uma postagem intitulada Encontrando Destinos Locais com os Modelos de Linguagem Regionalmente Específicos da Siri para Reconhecimento de Fala, a Apple explica como o iOS incorpora o conhecimento da localização atual do usuário no sistema de reconhecimento de fala por trás da Siri, para fornecer um nível de precisão além do mero reconhecimento de fala geral, permitindo que a Siri reconheça de forma mais precisa entidades nomeadas como negócios locais.

Embora a Apple reconheça que a maioria dos assistentes virtuais tenha pouca dificuldade em reconhecer e entender corretamente os nomes de negócios de alto perfil como Starbucks, é um desafio mais complexo identificar com precisão os nomes de milhões de pequenos negócios e serviços locais sobre os quais os usuários perguntam. Para abordar isso, a Apple começou incorporando o conhecimento da localização do usuário no sistema de reconhecimento de fala, não apenas para identificar negócios que possam estar próximos à localização do usuário, mas também para construir um modelo acústico regional de como os usuários podem pronunciar nomes de negócios locais, além de lidar com a complexidade de centenas de nomes de negócios que têm pouca ou nenhuma representação no banco de dados do modelo de linguagem da Siri.
A Apple criou 169 modelos de linguagem personalizados, chamados de “Geo-LMs”, para cada uma das Áreas Estatísticas Combinadas (CSA) nos Estados Unidos, juntamente com um único Geo-LM global para usar em situações onde o usuário está fora de uma das áreas predefinidas ou sua localização simplesmente não pode ser identificada. Cada Geo-LM contém dados adicionais que são alimentados na Siri juntamente com os modelos acústicos padrão para fornecer dados de reconhecimento de velocidade adicionais específicos da região daquele usuário, ajudando a Siri a entender melhor a sequência de palavras pretendida pelo usuário, bem como a dicção e pronúncia específicas da região dos nomes dos negócios.
Receba novas postagens na sua caixa de entrada
Sem spam. Cancele a assinatura a qualquer momento.