Continua la corsa all’IA migliore al mondo: Google rilancia con un bot in grado di tradurre fino a 1.000 lingue in tempo reale
Da mesi è cominciata la corsa verso le Intelligenze Artificiali da parte delle aziende tecnologiche più forti. Dopo l’arrivo di ChatGPT, di OpenAI, ed il forte successo che ha riscosso sull’utenza, i colossi del mondo stanno cercando di accaparrarsi una simile tecnologia, emularla e, soprattutto, migliorarla.
Abbiamo visto come Bing stia cercando di implementare l’IA testuale nel suo motore di ricerca, mentre Google ha annunciato Bard che, pur se con qualche problema, mira a diventare una versione evoluta e migliorata di ChatGPT, rivoluzionando, a detta dei suoi creatori, il modo di interfacciarsi con la nuova tecnologia.
Un duro scontro per l’IA migliore
Mentre Microsoft e Google si sfidano su quale chatbot IA sia migliore, questo non è l’unico uso per l’apprendimento automatico e i modelli linguistici su cui sta avvenendo questa “corsa al progresso”.
Si vocifera addirittura di un progetto di Google volto a mostrare più di 20 prodotti basati sull’intelligenza artificiale durante l’evento annuale I/O di quest’anno. Appare evidente come le intelligenze artificiali siano ormai la base delle nuove tecnologie in cantiere per il futuro.
Parlare tutte le lingue del mondo? Sarà possibile
Google, tra i tanti progetti basati sulle IA, sta facendo progressi verso l’obiettivo di costruire un modello linguistico di intelligenza artificiale in grado di supportare 1.000 lingue diverse. In un aggiornamento pubblicato lunedì, la multinazionale del motore di ricerca più utilizzato al mondo ha condiviso ulteriori informazioni sull’Universal Speech Model (USM), un sistema che Google descrive come un “primo passo critico” nella realizzazione dei suoi obiettivi.
Lo scorso novembre, l’azienda ha annunciato l’intenzione di creare tale progetto linguistico in grado di supportare 1.000 delle lingue più parlate al mondo, rivelando al contempo il modello USM. Google descrive USM come “una famiglia di modelli vocali all’avanguardia” con 2 miliardi di parametri addestrati su 12 milioni di ore di parlato e 28 miliardi di frasi in oltre 300 lingue.
USM, che YouTube utilizza già per generare didascalie chiuse, supporta anche il riconoscimento vocale automatico (ASR). Questo rileva e traduce automaticamente le lingue, tra cui inglese, mandarino, amarico, cebuano, assamese e altre ancora. Sarà quindi possibile utilizzarlo per parlare con qualunque interlocutore straniero traducendo contestualmente tutto ciò che diciamo.
Al momento, Google afferma che USM supporta oltre 100 lingue e servirà come “base” per costruire un sistema ancora più esteso. Meta sta lavorando a uno strumento di traduzione IA simile, ancora in fase iniziale. Per saperne di più sull’USM e sul suo funzionamento, si può leggere il documento di ricerca pubblicato da Google qui.
Solo una base di partenza per progetti più ambiziosi
Una destinazione per la tecnologia potrebbe essere quella degli occhiali a realtà aumentata, come quelli che Google ha mostrato durante l’evento I/O dello scorso anno, in grado di rilevare e fornire traduzioni in tempo reale che appaiono proprio davanti agli occhi.
Questa tecnologia, tuttavia, sembra ancora un po’ lontana, e l’errata rappresentazione della lingua araba da parte di Google durante l’evento I/O dimostra quanto possa essere facile sbagliare.