Google ha lanciato una nuova famiglia di IA che prende il nome collettivo di Gemini: ecco tutto quello che c’è da sapere.
Le intelligenze artificiali hanno predominato l’ambito informatico e tecnologico nel corso del 2023 e molto probabilmente continueranno a farlo anche nel 2024.
Anche se è prerogativa ormai dei governi cercare di regolamentare questo tipo di tecnologia prima che sia troppo tardi, è indubbio che le principali aziende del settore tech abbiano la volontà di puntare molto sulle IA anche nell’immediato futuro.
Anche se l’intelligenza artificiale potrebbe essere utilizzata per scopi immorali e, purtroppo, anche illegali, nell’ultimo periodo ciò che è andato per la maggiore è stato sicuramente il settore delle intelligenze artificiali generative, ovvero quelle in grado di generare un qualcosa partendo da input di comando forniti dagli utenti.
Tra le IA generative più celebri bisogna citare il solito ChatGPT che chiaramente ha fatto partire il nuovo filone recente di questa tecnologia.
Accanto a ChatGPT, progettato e istruito da OpenAI, sono nate tante altre intelligenze artificiali generative in grado sia di generare testi che immagini come DALL-E, Midjourney, Bing Image Creator, Microsoft Copilot e tante altre ancora.
Chiaramente anche Google ha voluto dire la sua e ha da poco annunciato la nuova famiglia di IA generative chiamata Gemini.
Che cosa è Gemini e cosa c’entra con Google Bard
Gemini, come detto, è una famiglia di modelli di intelligenze artificiali generative lanciata da Google nell’ultimo periodo.
Anche se per Google si tratta di un prodotto a dir poco rivoluzionario, gli utenti sono rimasti particolarmente sorpresi dall’annuncio dato che fino a questo momento tutti erano convinti che l’IA principale dell’azienda di Mountain View si chiamasse Bard.
C’è da fare quindi una distinzione molto importante: Google Bard è soltanto un’interfaccia attraverso la quale utilizzare l’intelligenza artificiale istruita e addestrata da Big G, che appunto si chiama Gemini.
In parole povere Bard è il mezzo attraverso il quale funziona Gemini, che è in realtà a sua volta un nome complessivo che indica una famiglia di modelli di IA generative che possono svolgere diverse funzioni.
Per fare un paragone con uno strumento maggiormente conosciuto e utilizzato si può dire che Bard sta a ChatGPT come Gemini sta alla famiglia di modelli GPT.
Attualmente infatti i nuovi modelli presenti in ChatGPT funzionano attraverso GPT-5, che fa parte della stessa famiglia di modelli che sono presenti per esempio anche in DALL-E, il generatore d’immagini progettato da OpenAI.
Gemini è l’IA definitiva? Ecco tutto quello che può fare
Se diversi modelli di intelligenza artificiale presenti sul web sono in grado di svolgere solo alcune funzioni, la famiglia Gemini è un modello multimodale e dunque è in grado di svolgere tantissime funzioni.
Non solo generare testi e immagini, ma anche correggere bozze, sottotitolare i video, tradurre, ma per adesso la tecnologia è ancora nelle sue prime fasi e Google deve ancora perfezionarle al meglio.
Gemini è stato presentato in tre versioni differenti: la versione Ultra, Pro e infine Nano che differiscono per diverse caratteristiche.
Gemini Ultra è il modello base da cui partono tutti i modelli della famiglia, il quale al momento è solo esclusivo per pochi eletti ma alla fine del 2024 dovrebbe essere rilasciato globalmente.
Questa versione, secondo Google, è la più potente di tutte perché è in grado anche di svolgere problemi di fisica passo dopo passo e analizzare documenti scientifici.
La versione “Pro” è disponibile pubblicamente, ma allo stesso tempo può essere utilizzata solo su particolari dispositivi.
Questa versione ha capacità limitate rispetto alla Ultra, anche se comunque è in grado di svolgere la maggior parte delle funzioni base di un’IA generativa.
Infine la Nano è una versione ridotta delle precedenti che è possibile anche utilizzare su smartphone, chiaramente sui Pixel di Google.