Le+AI+stanno+riempiendo+di+spazzatura+Internet+%7C+C%26%238217%3B%C3%A8+un%26%238217%3Bunica+soluzione+per+evitare+il+collasso

player

/tech/550318-ia-dilagano-ma-consumano-se-stesse.html/amp/

Tech

Le AI stanno riempiendo di spazzatura Internet | C’è un’unica soluzione per evitare il collasso

Inutili allarmismi a parte, nessuno può negare che l’Internet stia venendo letteralmente invaso dalle IA, dalle fake news fasulle generate automaticamente, alle SEO Heist che fanno spam di contenuti senza controllo. Insomma, l’idea di un Internet dominato dalle Intelligenze Artificiali non è solo una possibilità, ma ormai una realtà.

L’Uroboro delle IA, addestrate su contenuti generati

“Entra Spazzatura, Esce Spazzatura” probabilmente diventerà il motto dei Large Language Models

La grande diffusione dei contenuti generati da IA sta portando ad un problema che, in molti, non avrebbero potuto prevedere, legato alla stessa natura delle IA: per funzionare a dovere, i cosiddetti Large Language Models (o LLM in breve) vengono istruiti raccogliendo grandi masse di dati da Internet, in modo che questi possano essere elaborati e permettere agli LLM di imparare a produrne di nuovi. Mettendo da parte le ovvie implicazioni etiche di copiare, spesso senza alcun tipo di consenso, contenuti creati da artisti e scrittori; cosa succede se la gran parte dei contenuti su internet provengono già da IA?

Più i contenuti generati da Ia si diffondono su Internet, più è alta la probabilità che un LLM raccolga anche questi contenuti e li includa nel suo repertorio “educativo”, andando con ogni iterazione a “sporcare” sempre di più i risultati con dati-spazzatura, perdendo dunque in qualità, precisione e diversità dei contenuti generati.

Il crollo della qualità dei suddetti contenuti è però un fenomeno più subdolo e, come dimostrano recenti studi, la situazione potrebbe ancora peggiorare. In un recente studio della Johannes Gutenberg University di Magonza, in Germania, “Questi loop di addestramento di auto-consumo migliorano inizialmente sia la qualità che la diversità. Dopo però poche generazioni gli output inevitabilmente degenerano per diversità. Abbiamo determinato che il ritmo di degenerazione dipenda dalla proporzione tra dati reali e dati generati.”

Altre due ricerche accademiche pubblicate nel 2023 sull’argomento, concordano essenzialmente con quanto determinato dagli studiosi tedeschi: i ricercatori delle università di Oxford, Cambridge, dell’Imperial College di Londra, dell’Università di Toronto e di quella di Edimburgo affermano infatti che “l’uso di contenuti generati nel training dei modelli causa difetti irreversibili nei suddetti modelli”, causando il cosiddetto “collasso del modello”.

Forse però, non tutto è perduto. Nella battaglia tra le sempre più affamate IA, in cerca di nuovi contenuti creati da umani per evitare questa sorta di auto-cannibalismo digitale, ed i creativi umani che tentano di proteggere il loro lavoro, sembra che i secondi stiano facendo sempre maggiori passi avanti: a partire dalla denuncia del New York Times contro Microsoft e OpenAI, accusati di violazione di copyright, passando per gli innovativi tool come Nightshade, che promettono di “avvelenare” le IA se dovessero rubare le immagini trattate, l’idea è quella di rendere quanto più difficile possibile la vita alle IA. Possiamo immaginare, poi, che il “collasso dei modelli” possa portare ad una naturale diminuzione dell’uso stesso delle IA, quando il senso di novità sarà “concluso” e il pubblico non troverà più così tanto utile i contenuti dalla qualità così bassa.

This post was published on 30 Gennaio 2024 15:00

Gaetano Rilievo

Storyteller, Giocatore e appasionato di Forklore e Leggende, non mi sono più staccato dal mio PC dalla prima partita di Age of Mythology. Nel tempo libero adoro tirare dadi a venti facce, collezionare strani oggetti e ovviamente proseguire le infine run dei titoli che cadono sotto le mie grinfie.

Prossimo L’Escape from Tarkov fantasy Dungeonborne sarà a breve disponibile su Steam »

Precedente « Super offerte mobile a prezzi imbattibili | Ecco le nuove offerte WindTre

Pubblicato da

Gaetano Rilievo

30 Gennaio 2024 15:00

Luce e gas, se hai questo operatore preparati: bollette pesanti in arrivo
Luce e gas di nuovo alle stelle con l'impennata del costo all’ingrosso dell’energia. Colpite soprattutto…
Attiva subito questa impostazione sul tuo telefono o te ne pentirai: la procedura
Per il tuo smartphone c'è una impostazione che andrebbe attivata subito, appena lo compri. Se…
Il mouse del futuro è questo: un anello elegante con tante funzioni uniche
Un dispositivo innovativo. Progettato per imporsi come il mouse del futuro. Una novità che potrebbe…

Stanchi del solito fidanzato o fidanzata? Il seguito di Palworld ha la soluzione che fa per voi!

Il dating sim di Palworld è realtà: ora puoi davvero stringere relazioni con i Pal…

Recensioni

The Last Of Us Parte II Remastered | Recensione PC | Tutto al suo posto

The Last of Us Parte II arriva finalmente su PC come l’ennesimo titolo di casa…

Fuorigioco

Anticipazioni Tradimento 5 aprile: la proposta shock di Tarik

Tarik è pronto all'ennesima mossa a sorpresa: l'inatteso sviluppo andrà in scena il giorno 5…

Fuorigioco

Presto fare la spesa potrebbe costare molto di meno: la novità che cambia tutto

Per la spesa che quotidianamente facciamo arriva una svolta significativa. Presto i prezzi potrebbero precipitare…

Giochi di ruolo

10 GDR che non vediamo l’ora di provare al PLAY Festival del Gioco 2025 di Bologna

Sta arrivando il PLAY Festival del Gioco, quest'anno trasferitosi a Bologna con un paio di…

Giochi da Tavolo

Con la nostra recensione di Bang! Dice Explosion ci siamo ritrovati a lanciare dadi nel Far West!

Abbiamo provato il pacchetto completo Bang! Dice Explosion, che riunisce il gioco base e tutte…