Altro che guida autonoma e robot: la vera rivoluzione è il riconoscimento vocale


La rivoluzione non arriverà da aggeggi fantascientifici. Arriverà insegnando alle macchine quello che gli uomini sanno fare da quando sono bambini: capire il significato di un discorso. O almeno così dice Google. Che, certo, è parte in causa e quindi ha tutto l'interesse di dirlo. È però difficile dare torto a Ben Gomes, capo delle ricerche di Mountain View, quando dice che il riconoscimento vocale e la comprensione del linguaggio da parte dei software saranno cruciali per il futuro di Internet (e non solo di Internet).

Il dialogo tra uomo e macchina

Spesso definiamo “semplice” qualcosa solo perché la sappiamo fare. E così, a furia di pronunciare e ascoltare ogni giorno parole e frasi, rischiamo di dimenticarci quanto sia complesso comprendere il linguaggio. Consentire alle macchine di replicare gli stessi processi è, invece, molto complicato. “Ci sono problemi difficili da superare”, ha spiegato Gomes al Guardian. Ad esempio capire un riferimento esterno alla frase o chi indica un 'lui' o 'lei'”. E questi sono solo due dei “milioni di problemi” che è chiamato a risolvere chi intende far dialogare uomo e macchina.

Dai comandi vocali più semplici alle conversazioni con l'intelligenza artificiale, fino alle ricerche online. È solo l'inizio. Perché è vero che gli assistenti digitali (da Siri a Google Assistant) sono in miliardi di dispositivi. Ma è anche vero che, in futuro, tutto o quasi sarà parola. Dalla ricerca all'acquisto, grazie anche agli smart speaker che converseranno con il padrone di casa per governare l'abitazione. La voce, in fondo, è una via di comunicazione più immediata della scrittura. Così come lingua e palato sono strumenti più diretti rispetto a una tastiera. A patto che la conversazione sia “umana” e non robotica. Questo non significa solo avere una voce più morbida e meno meccanica.

Così cambiano le ricerche

Google ha mosso i primi passi lungo questa strada accidentata nel 2000, con le correzioni ortografiche alle ricerche. Capire quello che l'utente desidera non è così semplice. Perché i confini delle singole parole (e ancor più delle frasi) non sono sempre definiti. “Si può pensare ai primi motori di ricerca come a sistemi in grado di trovare parole con confini netti. Questo è il termine che hai digitato, adesso lo troverò nel titolo di un documento”. Da allora, però, molto è passato.

E oggi i motori di ricerca fanno molto di più. “Le persone usano un certo tipo di linguaggio se conoscono un argomento e un altro se non lo conoscono”. Eppure cercano la stessa cosa. Non è solo una questione di sinonimi. Restituire risultati simili anche con chiavi di ricerche diverse è una sfida che Google ha iniziato a vincere solo dopo cinque anni di sviluppo. Una vittoria transitori, che rappresenta solo una tappa. L'obiettivo, afferma Gomes, è “fornire risposte sempre più sofisticate a domande sempre più complesse. Fino ad avere una conversazione con Google”.

Gli effetti nei Paesi in via di sviluppo

Riconoscimento vocale e comprensione del linguaggio sono tecnologie che avranno un impatto dirompente ovunque, ma ancor di più nei Paesi in via di sviluppo. Un effetto che Gomes aveva in parte sottovalutato: “Non è stato ovvio, per noi, pensare che una tecnologia avanzata per l'Occidente potesse essere fondamentale in Stati come l'India”. Una realtà che Gomes conosce bene: è nato in Tanzania, ma è cresciuto a Bangalore. “Molte lingue nei Paesi in via di sviluppo – spiega il manager di Mountain View – non hanno mai avuto tastiere. Io stesso ho studiato l'hindi per dieci anni, ma non saprei come scriverlo. Parlare è molto più semplice di digitare”.  

Vedi: Altro che guida autonoma e robot: la vera rivoluzione è il riconoscimento vocale
Fonte: innovazione agi