Meta ha lanciato una sfida diretta a ChatGPT con il rilascio di Llama 3.1, un nuovo modello linguistico di grandi dimensioni.
Con una versione che vanta ben 405 miliardi di parametri, Llama 3.1 si posiziona come il più grande modello open-source mai realizzato fino ad oggi.
L’innovazione non si ferma alla sua grandezza; infatti, Llama 3.1 è disponibile in tre diverse versioni: da 405B, 70B e 8B parametri, rendendolo accessibile a un vasto pubblico di sviluppatori e ricercatori. Questa strategia open-source è stata fortemente voluta da Mark Zuckerberg, che prevede un futuro dove i modelli open-source supereranno quelli proprietari in termini di sviluppo e utilizzo.
I test effettuati da Meta hanno dimostrato che la versione da 405B supera i principali modelli rivali come GPT-4o di OpenAI e Claude 3.5 Sonnet di Anthropic in molti benchmark significativi. Questo risultato evidenzia non solo l’avanzamento tecnologico rappresentato da Llama 3.1 ma anche l’impegno dell’azienda nel promuovere l’innovazione nel settore IA.
Le tre versioni del modello sono progettate per essere multilingua, includendo anche la lingua italiana tra le altre, e capaci di interpretare e generare codice informatico. Ciò amplia enormemente le potenzialità d’uso del modello in vari ambiti applicativi, dalla traduzione automatica allo sviluppo software.
Per raggiungere questi risultati eccezionali, Meta ha investito ingenti risorse nell’addestramento del modello: oltre 39 milioni di ore su GPU Nvidia H100-80 GB sono state necessarie per elaborare i dati provenienti da fonti pubbliche aggiornate a dicembre del 2023.
Mark Zuckerberg ha paragonato questa mossa all’Open Compute Project (OCP), sottolineando come la filosofia open source possa accelerare l’innovazione attraverso la collaborazione tra diverse entità industriali. La decisione strategica di rendere Llama 3.1 un progetto open source mira a creare un punto d’inflexione nel settore IA dove gli sviluppatori prediligono soluzioni aperte per le loro innovazioni.
Per facilitare l’integrazione e la diffusione del nuovo modello linguistico, Meta sta collaborando con giganti tecnologici quali Microsoft, Amazon Google Nvidia e Databricks. Queste partnership mirano a ridurre i costosi oneri computazionali associati all’utilizzo dei modelli linguistici avanzati come GPT-4o.
L’introduzione sul mercato delle innovazioni legate a Llama 3.1 avverrà tramite piattaforme popolari come WhatsApp negli Stati Uniti. Tuttavia alcune funzionalità rimarranno limitate al territorio statunitense a causa delle normative europee riguardanti l’utilizzo dei dati pubblici. Tuttavia gli utenti italiani possono comunque accedere al download del modello linguistico segnando così un passaggio importante verso una maggiore democratizzazione dell’intelligenza artificiale globale
This post was published on 26 Luglio 2024 8:30
Non finiscono mai i cambiamenti per il digitale terrestre con un nuovo canale che molto…
Per diversi profili che sono clienti di Postemobile arriva una brutta sorpresa: ecco che cosa…
Cercate tre prodotti di lusso per una pulizia casalinga profonda? Approfittate delle offerte Black Friday…
Amadeus, passato dalla Rai al blocco di canali Discovery Warner Bros, stavolta non ha centrato…
Per la prima volta nella storia di Fortnite, Epic Games ho in programma un aumento…
Il sistema di geolocalizzazione migliorerà sempre di più e questo sarà possibile grazie a Pokémon…