Fonte della ristampa dell'articolo: Silicon Star People
Fonte immagine: generata da Unbounded AI
Da quando il concetto di metaverso è stato reso popolare da Zuckerberg nel 2021, è sempre stato percepito dalle persone come uno “straniero molto familiare”, sempre distante, a volte lontano e a volte vicino. Per dirla senza mezzi termini, tutti sentono che la sua presenza non è abbastanza forte e non è così potente come si immagina.
Perché quando si parla dell’Universo Yuan, l’impressione nella mente dei netizen è ancora questa:
Zuckerberg si è fatto un selfie con il famoso avatar di Horizon Worlds che è stato "ridicolizzato" dalla folla. L'immagine è tratta da Facebook
Ma nel giro di un solo anno, una conversazione a distanza di un’ora avvenuta nel mondo del metaverso è venuta fuori dal nulla, facendo esplodere i social network. Questa volta è stato il turno dei netizen di rimanere sbalorditi ed esclamare, come ha potuto evolversi silenziosamente in questo modo senza prestare attenzione? !
Di recente, Lex Fridman, scienziato del MIT, esperto di intelligenza artificiale e noto conduttore di podcast, ha condotto un'intervista approfondita con Mark Zuckerberg, CEO di Meta, su realtà aumentata, intelligenza artificiale e modelli linguistici di grandi dimensioni.
La differenza rispetto al passato è che questa volta i due non si sono incontrati nel mondo fisico, ma hanno completato la conversazione nel metaverso utilizzando immagini virtuali 3D ultra-realistiche, separati dalla metà degli Stati Uniti. Al momento in cui scrivo, questa intervista intitolata "Prima intervista nel Metaverso" ha totalizzato quasi 13 milioni di visualizzazioni su X (Twitter originale).
Immagine dal canale Youtube di Lex Fridman
All'inizio del video, l'avatar digitale ad alta definizione a figura intera di Lex Fridman appare in uno spazio futuristico bianco. Ha affermato: "Sebbene io e Mark ci troviamo a centinaia di chilometri di distanza nel mondo reale, poiché le nostre immagini sono modellate con modelli 3D fotoaccurati e presentate l'una all'altra tramite audio spaziale, è come se comunicassimo faccia a faccia nella stessa stanza. Questa tecnologia è straordinaria! Credo che questo sarà il modo in cui le persone potranno connettersi tra loro in modo più profondo e significativo su Internet in futuro."
Durante l'intervista entrambi indossavano il visore Meta Quest Pro VR. Forse perché l'effetto nel campo visivo era troppo reale, per un po' Lex si sentì come un bambino curioso. Oltre a sorridere, continuava a esclamare: "Dove sono? Mark, sei davvero tu? Fantastico! Non ti dispiace che ti stia troppo vicino, vero?"
Naturalmente è possibile regolare la distanza di visibilità. Non solo, puoi anche regolare la posizione della fonte di luce controllando la maniglia per trovare l'angolazione di illuminazione che meglio mette in risalto i tuoi lineamenti del viso.
Zuckerberg ha affermato che, a differenza delle versioni cartoon o delle trasmissioni video di Horizon Worlds, la creazione di queste nuove immagini virtuali Meta Codec che simulano persone reali richiede una scansione approfondita delle varie espressioni facciali e dei dettagli dei movimenti degli utenti, che vengono poi modellati e compressi in una versione codificata.
Le capacità di tracciamento oculare e facciale in tempo reale del visore catturano quindi le espressioni dell'utente, le mappano su un avatar virtuale 3D e "inviano una versione codificata di come dovresti apparire" alle persone all'altro capo del mondo virtuale o della conference call, presentando loro un te dall'aspetto realistico.
Poiché i dati delle immagini nel Metaverso vengono trasmessi in forma codificata, oltre a essere realistici, consentono anche di risparmiare più larghezza di banda rispetto all'invio di un video immersivo completo.
A giudicare dal video dell'intervista, la capacità dell'avatar virtuale di ripristinare i dettagli della vita reale è davvero troppo forte. Come dice Lex, "Cattura tutto, compresi i difetti del viso. Per me, questi difetti sono le sottigliezze degli esseri umani, queste lentiggini, queste rughe, queste guance asimmetriche, le espressioni agli angoli degli occhi quando sorrido... Mi fanno apprezzare di più il film e mi fanno capire che la perfezione non è la chiave per immergersi."
"Gli occhi sono davvero importanti", ha affermato Zuckerberg. Molti studi hanno dimostrato che le persone comunicano principalmente attraverso le espressioni e il linguaggio del corpo, piuttosto che attraverso il linguaggio. Meta ha lavorato duramente per catturare queste espressioni con il suo sistema virtuale classico, offrendo un senso di presenza speciale attraverso un'esperienza fotorealistica. Egli ritiene che ciò tocchi anche il nucleo visivo della realtà virtuale e della realtà aumentata, che consiste nel far sentire le persone unite, indipendentemente da dove si trovino nel mondo.
Immagina di entrare in una sala conferenze del futuro. Alcune persone sono realmente presenti, mentre altre appaiono in questa forma virtuale realistica e sono sovrapposte all'ambiente fisico attraverso la combinazione della tecnologia della realtà mista: pensi che lui/lei sia seduto al tavolo a parlare con te del progetto, ma in realtà si trova a migliaia di chilometri di distanza; quando è tardi e ti trovi da solo in un altro posto e ti manca casa, puoi indossare le cuffie e i tuoi parenti saranno lì vicino. Ogni sorriso e ogni minima espressione facciale della persona dall'altra parte possono essere riprodotti in tre dimensioni praticamente senza ritardi o perdite.
Durante l'esperienza, Lex non poté fare a meno di esclamare che era meraviglioso. "Il mio cuore batteva forte in quel momento. L'intimità della conversazione può essere raggiunta a distanza, così. Ho sentito le emozioni e ho sentito che tu ed io esistevamo davvero. Questa è una delle esperienze più incredibili della mia vita. È davvero illuminante!"
Tuttavia, bisogna tenere presente che per le persone comuni non è così facile ottenere l'effetto dialogo nel video. Prima dell'intervista, entrambi sono volati a Pittsburgh e si sono sottoposti a una scansione approfondita durata diverse ore presso il team del progetto Meta Codec, che ha combinato le più avanzate tecnologie software e hardware del momento.
Alla conferenza Connect, conclusasi pochi giorni fa, Zuckerberg ha affermato che la sua più grande visione è quella di rendere le tecnologie all'avanguardia accessibili a tutti e di cambiare la vita della maggior parte delle persone. Cosa prevede questa volta per il futuro?
Zuckerberg ha detto che siamo solo all'inizio. Analizzando prima un piccolo numero di persone e raccogliendo dati sufficienti sulle espressioni facciali, possiamo verificare in che misura l'intero processo può essere semplificato, in modo che risulti più fluido quando applicato a un gran numero di persone. Sebbene questa tecnologia non sia ancora completamente pronta per il mercato, continuerà a essere adattata e ottimizzata nei prossimi anni, in modo da poter essere applicata agli scenari lavorativi e risolvere i problemi di produttività il prima possibile.
Ciò su cui sta lavorando Meta è rendere possibile l'esecuzione di una scansione facciale molto rapida con un telefono cellulare, ad esempio agitando il telefono davanti al viso, pronunciando alcune parole e assumendo alcune espressioni facciali. L'intero processo potrebbe richiedere solo due o tre minuti per produrre una chiamata con la stessa qualità di adesso. Una delle prossime sfide sarà come garantire un'esperienza migliore e al contempo una maggiore efficienza.
Lex ritiene che i nuovi Meta Codec Avatar abbiano evidentemente oltrepassato la "valle perturbante" del passato. Il piccolo Zuckerberg nella telecamera è identico a se stesso. Poi sorrise timidamente e chiese: "Quindi non abbiamo bisogno di braccia e gambe, giusto?"
"No, no, risolveremo comunque questi problemi", spiegò Zuckerberg in fretta. "In effetti, c'è un problema. La scansione full-body ad alta precisione richiede un'elevata potenza di calcolo, sia per i sensori del display della testa che per le capacità di rendering. Quindi potremmo valutare di ripristinare il corpo con una fedeltà inferiore, ad esempio mantenendo i movimenti ampi, ma è il volto a dover essere analizzato maggiormente. Dopotutto, muovere le sopracciglia di un millimetro può trasmettere emozioni completamente diverse. Al contrario, muovere il braccio di un pollice non è così importante."
Gli avatar di Horizon Worlds sono stati descritti come dotati dell'"effetto valle perturbante" a causa delle loro espressioni pallide e dell'assenza della parte inferiore del corpo. Immagine da Meta
In seguito i due hanno parlato del nuovo Quest 3, della realtà aumentata, dell'intelligenza artificiale nel metaverso e del futuro dell'umanità. Lex ha scherzato dicendo che l'intervista con Zuckerberg è stata "l'incontro nel metaverso tra le due persone con l'espressione più rigida di Internet". Credeva che in questo spazio virtuale la sua espressività sarebbe stata più facile da catturare e le sue emozioni avrebbero potuto essere trasmesse in modo più realistico: "Spero davvero che più persone possano venire e sperimentarlo di persona!" Zuckerberg ha anche affermato di non vedere l'ora di vedere le reazioni degli utenti dopo aver guardato questa puntata del podcast. La sua unica preoccupazione era se il pubblico avrebbe potuto davvero percepire il vero shock che stava per esplodere attraverso lo schermo 2D.
A giudicare dai commenti degli internauti, è ovvio che non solo ne sono rimasti colpiti, ma sono anche rimasti profondamente scioccati.
Anche se negli ultimi mesi abbiamo assistito a diversi cicli di aggiornamenti esplosivi da parte di Google, Microsoft e in particolar modo ChatGPT di OpenAI, e abbiamo visto il mondo, questa intervista nel metaverso va ancora oltre la cognizione delle persone. MrBeast, uno degli YouTuber più in voga al mondo, ha commentato sotto il video: "Come siamo arrivati dalle persone virtuali pixelate a questo punto? Cosa mi sono perso!" Anche altri hanno fatto lo stesso, affermando: "Questa è una delle cose più incredibili che abbia mai visto".
C'è chi sostiene che Meta avrà sempre un posto nel team di persone forti che guidano l'innovazione tecnologica. Dopo essere stato messo in discussione, ridicolizzato e persino criticato per così tanto tempo, il Metaverso si è finalmente evoluto in una potente forma 3.0.
Lex disse: Ho visto il futuro.
"Credo che il prossimo anno sarà piuttosto folle", ha detto Zuckerberg.
Indipendentemente da come si svilupperà Meta in futuro, questa prima conversazione tra "persone reali" avvenuta a centinaia di chilometri di distanza nel Metaverso ha un'importanza fondamentale. Siamo abbastanza fortunati da nascere in quest'epoca e da vedere tutto ciò che era impossibile diventare possibile.
