Dopo il terremoto portato da Deep Seek che ha sconvolto i colossi americani con le performance a basso costo adesso c’è un modo per creare la propria IA con il prezzo di un pieno di benzina.
Allenare un modello di intelligenza artificiale perché sia in grado di simulare un ragionamento e di produrre serie di parole simili a un discorso fatto da un uomo è frutto di una spesa enorme. O almeno questo è quello che le grandi società americane hanno fatto credere a tutti.

Se si guarda ora al panorama delle intelligenze artificiali, infatti, salta agli occhi quello che i cinesi sono riusciti a fare con Deep Seek. È vero, ci sono ancora molte cose che non sono chiare riguardo questa IA, ma non si può negare che si tratti di qualcosa che funziona con poche risorse.
E adesso a dimostrazione che in realtà forse non c’è bisogno di spendere i miliardi arriva un’altra intelligenza artificiale messa insieme con una spesa di 50 euro e che è anche open source su GitHub.
Creare la propria IA, possono bastare pochi soldi
Una intelligenza artificiale dovrebbe riuscire a aiutare nella vita di tutti i giorni. Questo, quanto meno, è quello che le società che hanno creato ChatGPT, Gemini e gli altri servizi ora a disposizione degli utenti vogliono che gli utenti pensino. E mentre, in qualità di esseri umani, ancora cerchiamo di trovare una giustificazione all’esistenza di qualcosa che consuma energia come un intero piccolo continente, c’è già chi prova a creare modelli molto più low cost.

Una idea che si può ricopiare con un po’ di pazienza e con l’equivalente di 50 euro. Perché un gruppo di ricercatori della Stanford University e dalla University of Washington sono riusciti a mettere insieme, con 50 euro di crediti di cloud computing che gli ha permesso di utilizzare 16 GPU Nvidia H100, un modello di ragionamento basato su Gemini che però, anche se probabilmente risulta comunque leggermente inferiore al modello di partenza, ha un plus veramente interessante: è stato addestrato ad aspettare.
Il problema delle slot machine che chiamiamo intelligenza artificiale è che nel momento in cui il treno di quello che dovrebbe essere il loro ragionamento è partito e ha raggiunto l’obiettivo, il risultato viene prodotto e proposto all’utente. Abbiamo però imparato rapidamente quanto possano allucinare; il modello di questi ricercatori, denominato S1, è stato invece addestrato ad aspettare prima di produrre la risposta.
Nel tempo aggiuntivo che all’intelligenza artificiale è stato dato, il ragionamento viene ricontrollato e questo consente di evitare soluzioni con errori troppo evidenti. È chiaro che il modello costruito dai ricercatori di Stanford e della University of Washington è un modello che si basa sul lavoro di qualcun altro e quindi anche questo abbassa i costi, ma viene da chiedersi se forse anche Gemini non trarrebbe beneficio dall’imparare ad aspettare prima di rispondere. Questo modello da 50 euro, del resto, lo fa.