Il suo contributo migliorerà anche la prossima versione dell’algoritmo!
Ogni grande eroe ha bisogno della sua spalla: Batman e Robin, Capitan America e Bucky, Chat GPT e GPTBot… Come dite? Non conoscete quest’ultimo? Tranquilli, è probabilmente l’aiutante di cui sentirete più parlare in futuro. Open AI, la società creatrice di Chat GPT, ha infatti messo a punto un aiutante virtuale per il suo algoritmo di intelligenza artificiale: GPTBot è pronto per il lancio e promette di migliorare incredibilmente le performance di Chat GPT, preparando il terreno per le sue future iterazioni. Vediamo in cosa consiste.
Fenomenali poteri cosmici…
GPTBot è ancora un prototipo, ma sembra funzionare benissimo. Il suo scopo è scandagliare la Rete ed analizzare abnormi quantità di informazioni, tutte accessibili da fonti aperte e dunque senza violare la riservatezza di dati sensibili. Open AI ha anche assicurato che i proprietari dei siti Internet avranno facoltà di inibire la raccolta ed analisi di testi presenti sugli stessi, o di limitarne la scansione a porzioni specifiche. Ecco come viene presentato il bot sul sito della compagnia:
GPTBot è il “web crawler” di OpenAI e può essere identificato dal seguente user agent e stringa.
https://platform.openai.com/docs/gptbot
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Le pagine Web scansionate con GPTBot potrebbero essere utilizzate per migliorare i futuri modelli e sono filtrate per rimuovere sorgenti che richiedano un accesso tramite paywall, oppure che siano note per aggregare informazioni personali sensibili (PII) o i cui testi violino le nsotre politiche. Consentire a GPTBot di accedere al vostro sito può aiutare i modelli di AI a diventare più accurati e migliorare le loro capacità e sicurezza generale.
In sostanza GPTBot è l’insegnante che impartisce le lezioni e assegna i compiti a casa a ChatGPT, facendola studiare per migliorare costantemente il proprio sapere. Più informazioni a a disposizione, maggiore sarà la precisione dell’algoritmo nelle sue risposte e minori i rischi di errore. Peraltro questa metodologia di allenamento sarà applicata da OpenAI non solo a Chat GPT-4, ma anche alla sua nuova versione tuttora in sviluppo, GPT-5, già accessibile agli iscritti al programma GPT Plus. La nuova versione dell’AI promette di risolvere problemi ancor più complessi in minor tempo rispetto alla versione corrente. OpenAI ha depositato il marchio lo scorso luglio, segno che ormai i tempi sono abbastanza maturi per potersi aspettare un lancio ufficiale in tempi brevi, presumibilmente già nel corso del 2024.
…in un infinito spazio virtuale
Con un web che diventa sempre più grande, la quantità di dati cui GPTBot può attingere è pressoché sterminato, anche se questo crawling di pagine web non ha mancato già da tempo di sollevare perplessità in alcune voci critiche che vorrebbero informazioni più chiare sulle modalità di raccolta di tali informazioni, nonché garanzie e rassicurazioni sul fatto che non vengano commessi furti di proprietà intellettuale. Il problema tocca forse in modo minore GPT-4 rispetto ad altri tipi di AI, per esempio quelle dedicate alla generazione di immagini, che attingono a immagini campionate dal web lasciando il dubbio se si tratti di materiale protetto o meno da copyright.
In ogni caso, la sterminata disponibilità di informazioni reperite in Rete da GPTBot concorrerà al data training di GPT-5, la prossima iterazione dell’algoritmo di AI attorno a cui c’è moltissima aspettativa. Per ora OpenAI non ha specificatamente illustrato le potenzialità della nuova versione, nonostante appaia chiaro che la mole di dati utilizzata per allenarla sia di molti ordini superiore a GPT-4 e suoi predecessori. Ci si aspetta poi che la quinta iterazione dell’AI migliori sensibilmente sul fronte della riduzione degli errori, portando vicino allo zero l’insorgenza delle cosiddette “allucinazioni“, ovvero l’erronea individuazioni di pattern nei testi che portano l’AI a formulazioni sconclusionate, ad esempio l’ammissione di essersi innamorate degli utenti, o dare con assoluta sicurezza informazioni totalmente errate circa date, eventi e personaggi storici. Un altro probabile miglioramento di GPT-5 potrebbe essere la multimodalità, ovvero la capacità di non limitarsi a generare testi, ma anche a realizzare immagini e suoni, magari persino modelli 3D su input testuali (e non) dell’utente.
Insomma GPT-5 promette di realizzare alcuni dei sogni più reconditi dell’essere umano rispetto alle intelligenze artificiali, ma anche alcuni tra i suoi maggiori timori: il dilemma etico è sempre dietro l’angolo, e la questione non farà che inasprirsi non appena avremo informazioni più precise su cosa aspettarci da questa prossima versione di LLM.