ChatGPT+%C3%A8+stato+battuto%2C+anzi%2C+stracciato+%7C+Anthropic+ha+buttato+la+bomba

player

/tech/554754-anthropic-claude3-contro-gpt-gemini.html/amp/

ChatGPT è stato battuto, anzi, stracciato | Anthropic ha buttato la bomba

In cosa si misura l’efficacia di una buon Large Language Model, come ChatGPT di OpenAI, o Gemini di Google? Secondo Anthropic, azienda fondata nel 2021 da numerosi ex impiegati di OpenAI, la chiave sembra essere la velocità di risposta, unita alla complessità delle risposte fornite; dopotutto nessuno vuole aspettare minuti interi per ricevere una risposta, che magari risulta anche vaga o raffazzonata. Ecco allora che arriva Claude 3, la nuova famiglia di modelli IA, dalle prestazioni avanzatissime.

“Meglio di ChatGPT e Gemini”

Le performance di Claude 3 comparate a quelle di GPT-4, GPT-3.5, Gemini Ultra e Gemini Pro

Anthropic, rendendo pubblica la nuova famiglia di modelli IA, Claude 3, afferma che il proprio modello riesca ad avere performance superiori rispetto ai due grandi competitor del mondo LLM, ovvero ChatGPT e Gemini, rispettivamente creati da OpenAI e Google. Il nuovo modello IA, che rispetto al predecessore Claude 2.1 è multimodale, ovvero riesce a comprendere sia input scritti che immagini, va ad ovviare uno dei grandi problemi del vecchio modello di Anthropic: i falsi rifiuti.

La maggior parte delle IA, per motivi non solo di sicurezza ma anche di responsabilità legale, non possono rispondere a domande ritenute pericolose, ad esempio si rifiuterebbero di riassumerci come creare sostanze pericolose, oppure di comunicarci dati sensibili di persone famose. Alcune volte però, può capitare che un’IA sia tarata per essere fin troppo cauta, rifiutandosi di rispondere a domande del tutto innocue, ma percepite dal modello IA come nocive. Secondo Anthropic, il problema di Claude 2.1 era una “mancanza di comprensione del contesto”, su cui sono intervenuti nella creazione del successore Claude 3.

Secondo Anthropic i modelli Claude 3, Haiku, Sonnet ed Opus, sono capaci di fornire risposte quasi istantanee anche a domande molto complesse, che richiedono di consultare ad esempio paper scientifici, arrivando ad affermare che Haiku, la versione più piccola del modello, sia “il modello più veloce ed economicamente vantaggioso sul mercato”, capace di leggere in pochi secondi documenti di ricerca e rispondere con grafici e paragrafi riassuntivi “in meno di tre secondi”.

Anthropic non si è però fermata qui, ed ha testato il proprio modello in diversi benchmark contro diverse versioni sia di ChatGPT che di Gemini, provando, stando alla tabella riassuntiva pubblicata dalla stessa azienda, che il proprio modello riesca a superare in comprensione, matematica, programmazione ed altri temi importanti i competitor. I nuovi modelli sono infatti un grande balzo in avanti per Anthropic; Sonnet ad esempio risulta il doppio più veloce rispetto a Claude 2 e Claude 2.1, “eccelle[ndo] nelle task che richiedono risposte veloci, come il recupero di dati o nell’automatizzazione delle vendite”.

L’azienda dichiara di aver addestrato i modelli Claude 3 con un misto di dati interni, non pubblici, dataset di terze parti e dati di dominio pubblico disponibili sin da Agosto 2023, mentre l’hardware è stato fornito da Amazon Web Services e Google Cloud; entrambe le aziende avevano investito in Anthropic, Amazon ad esempio aveva investito circa $4 miliardi di dollari nella creatrice di Claude 3, che adesso sarà disponibile sia nella libreria di modelli Amazon Web Services, Bedrock, sia in Vertex AI di Google.

This post was published on 7 Marzo 2024 13:30

Gaetano Rilievo

Storyteller, Giocatore e appasionato di Forklore e Leggende, non mi sono più staccato dal mio PC dalla prima partita di Age of Mythology. Nel tempo libero adoro tirare dadi a venti facce, collezionare strani oggetti e ovviamente proseguire le infine run dei titoli che cadono sotto le mie grinfie.

Prossimo Non solo chiavi e portafogli: cosa puoi tracciare con AirTag e stare più tranquillo »

Precedente « Realtà virtuale e visori, come fare la scelta migliore: le caratteristiche da valutare

Pubblicato da

Gaetano Rilievo

7 Marzo 2024 13:30

Instagram sta per rubare una funzione di TikTok: cambierà l’intera app
C'è ancora lavoro da fare per Instagram, soprattutto per riprendersi quella fetta di pubblico che…
Social network presto bloccati in tutta la Nazione: proteste per la decisione del Governo
I social network continuano a far discutere e ad essere divisivi ed ora arriva una…
Migliaia di siti sono appena stati bloccati, caos online: che sta succedendo
Tantissimi siti in Italia stanno per chiudere: la novità che spiazza tutti e cambia il…

Instagram sta per rubare una funzione di TikTok: cambierà l’intera app

C'è ancora lavoro da fare per Instagram, soprattutto per riprendersi quella fetta di pubblico che…

News

Questi giochi da tavolo sono PAZZESCHI e al prezzo più basso di sempre con le Offerte di Primavera Amazon

Il periodo perfetto per acquistare giochi da tavolo è finalmente arrivato: impazzano le "Offerte di…

News

Grossi sconti sui LEGO per le Offerte di Primavera di Amazon, ecco tutti i modelli sottocosto

Arrivano le offerte di Primavera di Amazon: tanti prodotti in sconto speciale tra cui i…

News

Deprezzati i migliori smart TV OLED del mercato per le Offerte di Primavera Amazon

Se siete alla ricerca di un'ottima smart TV OLED, il momento giusto per risparmiare su…

Fuorigioco

Anticipazioni Tradimento 27 marzo: Oylum prende una decisione terribile

Oylum si trova in uno dei momenti più difficili della sua vita e non sembra…

News

ARK pubblica un trailer terribile fatto con l’IA, lo studio si scusa dicendo che “non lo sapeva”

La famosa serie survival ARK avrà un nuovo DLC, ma il trailer di presentazione è…