Uno dei prodotti più bizzarri visti al CES è una AI completa di faccia, anche se è tutt’altro che rassicurante…
Da quando l’intelligenza artificiale è diventata la nuova frontiera dell’hi-tech ci si è iniziati a domandare se sia possibile realizzare una tecnologia dal volto umano… letteralmente parlando: ovvero se e quanto sia possibile fornire dei connotati umanoidi a questi algoritmi, per rendere più agevole l’interazione uomo-macchina. D’altronde il concetto di androide, ovvero un costrutto artificiale dalle fattezze e dall’espressività simile agli umani, è da sempre un argomento prediletto dalla fantascienza, basti pensare al ciclo letterario dei Robot di Isaac Asimov, ed è un concetto che si porta dietro sempre un filo di inquietudine, probabilmente derivante da quello che è il romanzo primigenio di tutto questo filone letterario, che non è altro che il fantahorror gotico Frankenstein di Mary Shelley.
Proprio come il mostro di Frankenstein, non tutte le ciambelle riescono col buco, come dimostra anche una creazione decisamente bizzarra esposta in anteprima al CES di Los Angeles.
La tecnologia dal volto umano… più o meno!
Dare un volto ad un’AI vocale potrebbe anche essere una buona idea sulla carta, salvandoci da quel senso di straniamento prodotto dal parlare con un’entità incorporea che ci risponde da asettici dispositivi che “sparano fuori” una voce sintetica, come ci hanno abituato a fare gli assistenti vocali dei nostri smartphone o dispositivi di domotica. WeHead vuole essere una risposta a questo “problema”. Si tratta sostanzialmente di un dispositivo che genera un simulacro di volto umano che faccia da complemento visivo a ChatGPT, il Large Language Model sviluppato da OpenAI. Rivolgendo a noi il suo sguardo e restituendoci (più o meno) l’immagine di un volto umano, in teoria il suo scopo sarebbe quello di facilitare l’interazione uomo-macchina mettendoci a disposizione un individuo con cui interloquire. Tutto questo, appunto, in teoria, perché basta guardarlo per rendersi conto di quanto inquietante!
Come si vede dal video dimostrativo qui sopra, pubblicato dal canale YouTube ufficiale dell’azienda, in sostanza WeHead è un dispositivo multischermo posto su un piedistallo che ne permette la rotazione sull’asse, nonché di una videocamera atta a non perderci mai di vista (ruota di 320 gradi sull’asse orizzontale e di 70 su quella verticale). In questo modo WeHead segue i movimenti della persona che le si rivolge, mantenendo il “contatto visivo” con la stessa. Il complesso sistema di differenti display assemblati restituiscono un avatar dalle sembianze maschili o femminili, in accordo al tipo di sintesi vocale impostato dall’utente per ChatGPT. Tutto questo, secondo l’azienda, dovrebbe garantire un livello di familiarità e spontaneità senza precedenti nelle nostre interazioni con l’AI.
Tutto questo, appunto, in teoria. Perché non so voi, ma al sottoscritto le sole immagini e video qui sopra sembrano parecchio inquietanti, e mi fanno nascere il desiderio di non averci nulla a che fare. Inoltre chi ha avuto modo di sperimentarlo di persona al CES non ne ha ricavato impressioni propriamente entusiastiche…
A tu per tu con l’AI
Kimberley Gideon, giornalista di Mashable, offre un resoconto tragicomico della sua esperienza a tu per tu con WeHead, un’interazione da lei giudicata piuttosto disturbante.
Ciò che è particolarmente inquietante di WeHead è quanto stoico e inespressivo sia questo aggeggio durante la sua interazione con me. (…) a differenza di ChatGPT, che ha di recente rilasciato il suo modello di sintesi vocale in prova gratuita lo scorso novembre, WeHead non suona per nulla umano. Suona invece assai robotico, un po’ alla maniera di Siri. – Kimberley Gedeon, This creepy AI head at CES 2024 is proof that ChatGPT should remain faceless – 9 gennaio 2024
Gedeon descrive alcuni tentativi di interazione con WeHead, che sono andati tutto sommato a buon fine, restituendole informazioni utili con risposte lunghe ad articolate, ben espresse. Tuttavia il tono monocorde dell’AI le ha provocato una strana sensazione di perturbante, a volte amplificata dalla comparsa di alcuni prompt testuali che comparivano in sovraimpressione rispetto all’avatar (ma forse si trattava solo di un difetto di questo modello prototipale). Insomma la reporter è rimasta molto perplessa di fronte a questo bislacco gadget hi-tech, tanto più quando, parlando con i responsabili, ha scoperto che non si trattava di un modello limitato a qualche ambito specialistico B2B, bensì di un prodotto pensato per essere commercializzato verso il rande pubblico, peraltro ad un prezzo esorbitante: il prezzo di listino per gli Stati Uniti è attualmente fissato a $4950! In alternativa, è disponibile un’opzione di noleggio a “soli” 199 dollari al mese.
Se foste curiosi di sapere per cosa state pagando esattamente, qui sotto trovate le specifiche tecniche:
- Processore 8-core 2.7GHz
- Memoria 512GB
- 4 display 1440p AMOLED dinamico HDR 10+
- 3 camere da 10Mp
- Speaker con potenza di 10 Watts
- Microfono direzionale
- raffreddamento attivo (opzionale)
- Wi-Fi
- Alimentazione 150w
- Dimensioni 7,5×7,5×14 pollici (circa 19x19x35 cm)
- Peso 5 libbre (circa 2,2 Kg)