Apple spiega la tecnologia dietro la capacità di Siri di trovare destinazioni locali

Apple ha condiviso un nuovo documento nel suo Machine Learning Journal fornendo dettagli tecnici su come lavora per migliorare la capacità di Siri di riconoscere i nomi dei punti di interesse locali. In un post intitolato Trovare Destinazioni Locali con i Modelli Linguistici Regionali Specifici di Siri per il Riconoscimento Vocale, Apple spiega come iOS incorpora la conoscenza della posizione attuale dell’utente nel sistema di riconoscimento vocale dietro Siri, per fornire un livello di accuratezza oltre il semplice riconoscimento vocale generale fino al punto di consentire a Siri di riconoscere più accuratamente entità nominate come le attività locali.

Mentre Apple riconosce che la maggior parte degli assistenti virtuali ha pochi problemi a riconoscere e comprendere correttamente i nomi di attività di alto profilo come Starbucks, è più una sfida identificare accuratamente i nomi di milioni di piccole attività locali e servizi di cui gli utenti chiedono. Per affrontare questo, Apple ha iniziato incorporando la conoscenza della posizione dell’utente nel sistema di riconoscimento vocale, non solo per identificare le attività che potrebbero essere vicine alla posizione di un utente, ma anche per costruire un modello acustico regionale di come gli utenti potrebbero pronunciare i nomi delle attività locali, oltre a affrontare la complessità di centinaia di nomi di attività che hanno poca o nessuna rappresentazione nel database del modello linguistico di Siri.

Apple ha creato 169 modelli linguistici personalizzati, chiamati “Geo-LM”, per ciascuna delle Aree Statistiche Combinate (CSA) negli Stati Uniti, insieme a un singolo Geo-LM globale da utilizzare in situazioni in cui l’utente si trova al di fuori di una delle aree predefinite o la sua posizione semplicemente non può essere identificata. Ogni Geo-LM contiene dati aggiuntivi che vengono forniti a Siri insieme ai modelli acustici standard per fornire dati di riconoscimento aggiuntivi specifici per la regione di quell’utente, aiutando Siri a comprendere meglio la sequenza di parole intesa dall’utente, così come la dizione e la pronuncia specifiche della regione dei nomi delle attività.

Ricevi i nuovi post nella tua casella di posta.