記事転載元:シリコンスターピープル

画像ソース: Unbounded AI によって生成

メタバースの概念が 2021 年にザッカーバーグによって普及されて以来、人々にとってメタバースは常に遠く、時には遠く、時には近くにある「最も身近な見知らぬ人」のように感じられてきました。はっきり言って存在感が足りず、想像していたほど迫力が無いと誰もが感じています。

なぜなら、元宇宙について語るとき、ネチズンの心に残る印象は今でも次のとおりだからです。

ザッカーバーグ氏は、群衆に「嘲笑」された有名なホライズン・ワールドのアバターと一緒にセルフィーを撮った。写真はFacebookからのものだ。

しかし、わずか 1 年で、メタバース世界で行われた 1 時間の遠距離会話がどこからともなく出てきて、ソーシャル ネットワークが爆発しました。今度はネチズンが唖然として叫ぶ番だった、どうして注意もせずにこのように静かに進化することができたのでしょうか? !

最近、人工知能の第一人者であり、有名なポッドキャストの司会者でもあるマサチューセッツ工科大学の科学者レックス・フリッドマン氏は、拡張現実、AI、大規模言語モデルについて、メタ社の CEO マーク・ザッカーバーグ氏と詳細なインタビューを行いました。

これまでと異なるのは、今回は二人が物理世界で会うのではなく、米国の半分以上を隔てた超現実的な 3D 仮想画像を使用してメタバース内で会話を完了したことです。 Silicon Star が報道に掲載された時点で、「メタバースでの最初のインタビュー」と題されたインタビューは X (旧 Twitter) で 1,300 万近くの再生回数を獲得していました。

画像はレックス・フリッドマンのYoutubeチャンネルより

ビデオの冒頭で、レックス・フリッドマンの全身高精細デジタルアバターが白い未来的な空間に現れ、彼はこう語った。「マークと私は現実世界では何百マイルも離れていますが、私たちの画像はすべて 3D モデルだからです。写真レベルの精度、空間オーディオでお互いをモデリングして提示する、まるで同じ部屋で対面してコミュニケーションしているようなこのテクノロジーは、人間がより深くつながる方法になると思います。将来のインターネット上の有意義な方法。」

両氏はインタビュー中、Meta Quest Pro VR ヘッドセットを着用しました。視界に映る効果があまりにもリアルだったからかもしれないが、レックスはしばらくの間、ニヤニヤするだけでなく、ため息をつき続けた。気にしないでください。「近すぎますか?」

もちろん視距離の調整も可能です。それだけでなく、ハンドルを操作して光源の位置を調整し、顔の利点を最も強調する照明角度を見つけることもできます。

ザッカーバーグ氏は、Horizo​​n Worlds での漫画版やビデオ送信とは異なり、現実の人間をシミュレートするこれらの新しいメタ コーデック アバターを作成するには、ユーザーのさまざまな顔の表情や動きの詳細を広範にスキャンし、エンコードされたバージョンにモデリングして圧縮する必要があると述べました。

ヘッドセットのリアルタイムの目と顔の追跡機能は、ユーザーの表情をキャプチャして 3D アバターにマッピングし、仮想世界または電話会議の相手に「どのように見えるべきかのエンコードされたバージョンを送信」し​​ます。本当のあなたに似た人を彼らの前に提示してください。

メタバース内の画像データはエンコードされた形式で送信されるため、実物に近いだけでなく、完全なイマーシブ ビデオを送信するよりも帯域幅効率が高くなります。

インタビュービデオから判断すると、実際の人間の細部を復元するアバターの能力は確かに強すぎます。レックスの言葉を借りれば、「人間の顔の欠点も含めてすべてを捉えます。私にとって、これらの欠点は人間の繊細さです。」小さなそばかす、しわ、非対称の頬、笑ったときの目尻の表情...それらは私にそれをより楽しんでもらい、完璧であることが没入感の鍵ではないことに気づきました。」

ザッカーバーグ氏は、「目は確かに重要です。人間のコミュニケーションは主に言語ではなく表情や体の動きによって行われることが多くの研究で証明されています。メタは、写真を通じてこれらの表情を独自の古典的な仮想システムで捉えることに懸命に取り組んできました。」これは、現実の体験と特別な臨場感を提供します。」彼は、これは、人々が世界のどこにいても一緒にいると感じさせるという、仮想現実と拡張現実の視覚的核心にも触れていると信じています。

将来、会議室に入ると、実際に存在する人もいれば、複合現実技術を組み合わせて物理環境に重ね合わせた現実的な仮想形式で現れる人もいると想像してください。彼らはテーブルに座ってプロジェクトについて話しているように見えますが、実際、何千マイルも離れた真夜中に、外国で一人で家が恋しくなったとき、ヘッドセットを装着すれば、近くにいる愛する人たちを見ることができます。相手のしかめっ面や笑顔、あらゆる微妙な表情を、遅延やロスがほとんどなく、リアルに三次元的に再現します。

体験中、レックスはこれがとても素晴らしいと思わず叫んだ。あなたと私は本当にそこにいます。これは私の人生で最も困難なことです。「最も信じられない経験の一つ、本当に目を見張るような経験です!」

ただし、一般の人にとって動画で対話効果を実現するのはまだ簡単ではないことに注意してください。インタビューを始める前に、両氏は事前にピッツバーグに飛び、現在のソフトウェアとハ​​ードウェアの最高技術を統合したメタコーデックプロジェクトチームとともに数時間にわたって詳細なスキャンを実施した。

数日前に閉幕したばかりのConnectカンファレンスで、ザッカーバーグ氏は自身の最大のビジョンは、こうしたハイエンドテクノロジーを人々が利用できるようにして、ほとんどの人々の生活を変えることだと語った。さて、今回彼は将来について何を考えているのでしょうか?

シャオ・ザーは、まだ始まったばかりだと言いました。最初に少数の人をスキャンし、十分な表情データを収集することで、プロセス全体をどれだけ簡素化できるかを検討し、その後、多数の人に適用した場合にスムーズにすることができます。このテクノロジーはまだ市場に導入する準備が完全には整っていませんが、生産性の問題を解決するためにできるだけ早く作業シナリオに適用できるよう、今後数年間で引き続き調整と最適化が行われる予定です。

Meta が達成しようと懸命に取り組んでいることは、携帯電話を手に取り、顔の前で振り、いくつかの言葉を発し、いくつかの表情を作るなど、携帯電話を使用して非常に高速な顔スキャンを実行するだけでよいということです。プロセス全体で、現在と同じ通話品質が得られるまでに 2 ~ 3 分しかかかりません。エクスペリエンスを確保しながら効率を高める方法は、今後の課題の 1 つです。

レックスは、新しいメタ コーデック アバターが過去の「恐怖の谷」を明らかに越えたと信じています。カメラに映るシャオ ザーは自分にそっくりです。そして、彼はためらいながら微笑んでこう尋ねました。 、 右?"

「いいえ、いいえ、これらの問題はまだ解決します。」とザッカーバーグ氏は急いで説明した。そこで、大きな動きはそのままに、忠実度を下げて体を復元することも考えられますが、結局のところ、眉毛を1ミリ動かすだけで、まったく異なる感情を伝えることができるのです。腕が1インチ動いても関係ありません。」

Horizo​​n Worlds のアバターは、顔色が悪く、下半身が欠如しているため、「不気味の谷効果」と呼ばれています。

その後、二人は新しくリリースされたクエスト 3、拡張現実、メタバースの人工知能、そして人類の未来について語りました。レックスはザッカーバーグとのこのインタビューを「インターネット上で最も硬い表情をした二人がメタバースで出会った」と揶揄し、この仮想空間では彼の表現力がより捉えやすく、よりリアルに感情を完璧に伝えることができると感じた。さらに、シャオ・ザーさんは、ポッドキャストのこのエピソードを見たネチズンの反応をとても楽しみにしていると述べ、唯一の心配は、視聴者が本当にそれを体験できるかどうかだということだ。このリアルな衝撃感が2Dスクリーンから出てきます。

ネチズンのコメントから判断すると、彼らがそれを感じただけでなく、ショックを受けたことは明らかです。

過去数か月間、Google、Microsoft、特に OpenAI の ChatGPT の数回にわたる怒涛のアップデートの洗礼を受けてきましたが、メタバースでのこのインタビューは依然として人々の認識の範囲を超えていると考えることができます。世界のトップYoutuberであるMrBeastは、ビデオの下にコメントを残し、「ピクセルアバターからどうやってここにたどり着いたのか?私が見逃していたものは何だったのか?」とコメントした人もいた。ものを。」

メタは今後も技術革新における強力なリーダーの一員としての地位を占めるだろうと言う人もいる。メタバースは、長い間質問され、からかわれ、さらには批判されてきたにもかかわらず、依然としてこのような強力な 3.0 形式に進化しています。

レックスは、「私には未来が見えました」と言いました。

「来年はかなりクレイジーな年になると信じている」とザッカーバーグ氏は語った。

メタがどのように発展し、将来的に進むかに関係なく、100マイルにわたるメタバースにおける「現実の人間」の間のこの最初の空対空会話はマイルストーンです。私たちは幸運にもこの時代に生まれ、不可能が可能になるのを目の当たりにすることができます。