Le+AI+stanno+riempiendo+di+spazzatura+Internet+%7C+C%26%238217%3B%C3%A8+un%26%238217%3Bunica+soluzione+per+evitare+il+collasso
player
/tech/550318-ia-dilagano-ma-consumano-se-stesse.html/amp/
Tech

Le AI stanno riempiendo di spazzatura Internet | C’è un’unica soluzione per evitare il collasso

Inutili allarmismi a parte, nessuno può negare che l’Internet stia venendo letteralmente invaso dalle IA, dalle fake news fasulle generate automaticamente, alle SEO Heist che fanno spam di contenuti senza controllo. Insomma, l’idea di un Internet dominato dalle Intelligenze Artificiali non è solo una possibilità, ma ormai una realtà.

L’Uroboro delle IA, addestrate su contenuti generati

“Entra Spazzatura, Esce Spazzatura” probabilmente diventerà il motto dei Large Language Models

La grande diffusione dei contenuti generati da IA sta portando ad un problema che, in molti, non avrebbero potuto prevedere, legato alla stessa natura delle IA: per funzionare a dovere, i cosiddetti Large Language Models (o LLM in breve) vengono istruiti raccogliendo grandi masse di dati da Internet, in modo che questi possano essere elaborati e permettere agli LLM di imparare a produrne di nuovi. Mettendo da parte le ovvie implicazioni etiche di copiare, spesso senza alcun tipo di consenso, contenuti creati da artisti e scrittori; cosa succede se la gran parte dei contenuti su internet provengono già da IA?

Più i contenuti generati da Ia si diffondono su Internet, più è alta la probabilità che un LLM raccolga anche questi contenuti e li includa nel suo repertorio “educativo”, andando con ogni iterazione a “sporcare” sempre di più i risultati con dati-spazzatura, perdendo dunque in qualità, precisione e diversità dei contenuti generati.

Il crollo della qualità dei suddetti contenuti è però un fenomeno più subdolo e, come dimostrano recenti studi, la situazione potrebbe ancora peggiorare. In un recente studio della Johannes Gutenberg University di Magonza, in Germania, “Questi loop di addestramento di auto-consumo migliorano inizialmente sia la qualità che la diversità. Dopo però poche generazioni gli output inevitabilmente degenerano per diversità. Abbiamo determinato che il ritmo di degenerazione dipenda dalla proporzione tra dati reali e dati generati.”

Altre due ricerche accademiche pubblicate nel 2023 sull’argomento, concordano essenzialmente con quanto determinato dagli studiosi tedeschi: i ricercatori delle università di Oxford, Cambridge, dell’Imperial College di Londra, dell’Università di Toronto e di quella di Edimburgo affermano infatti che “l’uso di contenuti generati nel training dei modelli causa difetti irreversibili nei suddetti modelli”, causando il cosiddetto “collasso del modello”.

Forse però, non tutto è perduto. Nella battaglia tra le sempre più affamate IA, in cerca di nuovi contenuti creati da umani per evitare questa sorta di auto-cannibalismo digitale, ed i creativi umani che tentano di proteggere il loro lavoro, sembra che i secondi stiano facendo sempre maggiori passi avanti: a partire dalla denuncia del New York Times contro Microsoft e OpenAI, accusati di violazione di copyright, passando per gli innovativi tool come Nightshade, che promettono di “avvelenare” le IA se dovessero rubare le immagini trattate, l’idea è quella di rendere quanto più difficile possibile la vita alle IA. Possiamo immaginare, poi, che il “collasso dei modelli” possa portare ad una naturale diminuzione dell’uso stesso delle IA, quando il senso di novità sarà “concluso” e il pubblico non troverà più così tanto utile i contenuti dalla qualità così bassa.

This post was published on 30 Gennaio 2024 15:00

Gaetano Rilievo

Storyteller, Giocatore e appasionato di Forklore e Leggende, non mi sono più staccato dal mio PC dalla prima partita di Age of Mythology. Nel tempo libero adoro tirare dadi a venti facce, collezionare strani oggetti e ovviamente proseguire le infine run dei titoli che cadono sotto le mie grinfie.

Pubblicato da

Recent Posts

Far Cry 3: Blood Dragon; Ubisoft fa uscire di nascosto il seguito (c’è anche Rayman)

Col favore delle tenebre, Ubisoft pubblica un nuovo gioco con all'interno Rayman, eppure nessuno ne…

Il miglior tablet Xiaomi crolla di prezzo e offre: 128 GB di memoria, 6 di RAM e la ricarica velocissima!

Siete alla ricerca di un nuovo tablet potente e a un prezzo invitante? Xiaomi ha…

Amazon, buono di fine anno: come ottenere 15€ in regalo

Amazon ha deciso di festeggiare la fine dell'anno con un regalo: un buono da 15…

Il platform più famoso di sempre diventa uno splatter (e scommettiamo che Nintendo non ne sarà felice)

Un modder ha rilasciato una mod che rende Super Mario 64, un gioco molto più…

Sony lancia la bomba con PS Plus: ecco i 12 nuovi giochi gratis da provare subito!

PlayStation Plus Extra ti regala un Natale all'insegna dei videogiochi: ecco tutti i titoli in…

Iliad ottiene il blocco di un servizio e fa felici gli utenti: “Vincolo eccessivo”

Gli utenti di Iliad trarranno vantaggio da una vittoria giudiziaria della compagnia telefonica francese: eliminato…