Nguồn bài viết in lại: Silicon Star People
Nguồn hình ảnh: Được tạo bởi AI không giới hạn
Kể từ khi khái niệm metaverse được Zuckerberg phổ biến vào năm 2021, nó luôn có cảm giác như một “người lạ quen thuộc nhất” đối với mọi người, luôn xa cách, đôi khi xa và đôi khi gần. Nói trắng ra, mọi người đều cảm thấy sự hiện diện của nó không đủ mạnh, cũng không mạnh mẽ như tưởng tượng.
Bởi khi nhắc tới Nguyên Vũ, ấn tượng trong đầu cư dân mạng vẫn là thế này:
Zuckerberg chụp ảnh selfie với avatar nổi tiếng của Horizon Worlds bị đám đông "chế giễu" Bức ảnh được lấy từ Facebook.
Nhưng chỉ trong một năm, một cuộc trò chuyện đường dài kéo dài một giờ diễn ra trong thế giới metaverse bất ngờ xuất hiện, làm bùng nổ mạng xã hội. Lần này đến lượt cư dân mạng ngơ ngác kêu lên, sao có thể lặng lẽ diễn biến như vậy mà không thèm để ý? !
Gần đây, nhà khoa học Lex Fridman của MIT, đồng thời là chuyên gia trí tuệ nhân tạo và người dẫn chương trình podcast nổi tiếng, đã thực hiện một cuộc phỏng vấn sâu với Giám đốc điều hành Meta Mark Zuckerberg về thực tế tăng cường, AI và các mô hình ngôn ngữ lớn.
Điều khác biệt so với trước đây là lần này cả hai không gặp nhau ở thế giới vật chất mà thay vào đó, họ hoàn thành cuộc trò chuyện trong metaverse bằng hình ảnh ảo 3D siêu thực, cách nhau hơn một nửa nước Mỹ. Tính đến thời điểm Silicon Star lên báo, cuộc phỏng vấn có tựa đề "Phỏng vấn đầu tiên ở Metaverse" đã thu hút được gần 13 triệu lượt xem trên X (trước đây là Twitter).
Hình ảnh từ kênh Youtube Lex Fridman
Ở đầu video, hình đại diện kỹ thuật số toàn thân có độ phân giải cao của Lex Fridman xuất hiện trong một không gian tương lai màu trắng. Anh ấy nói: “Mặc dù Mark và tôi cách nhau hàng trăm dặm trong thế giới thực, vì hình ảnh của chúng tôi đều là mô hình 3D. Độ chính xác ở cấp độ hình ảnh Tạo mô hình và trình bày cho nhau bằng âm thanh không gian, giống như chúng ta đang giao tiếp trực tiếp trong cùng một phòng. Công nghệ này thật tuyệt vời! Tôi nghĩ đây sẽ là cách để con người kết nối với nhau sâu sắc hơn. và có ý nghĩa trên Internet trong tương lai".
Cả hai người đàn ông đều đeo tai nghe Meta Quest Pro VR trong cuộc phỏng vấn. Có lẽ là do hiệu ứng trong tầm nhìn quá chân thực, Lex nhất thời giống như một đứa trẻ tò mò, ngoài việc cười toe toét, anh ấy còn không ngừng thở dài: "Tôi đang ở đâu vậy? Mark có phải là bạn không? Điều này thật tuyệt! Bạn không có." đừng bận tâm đến tôi. "Quá gần bạn?"
Tất nhiên, khoảng cách tầm nhìn có thể được điều chỉnh. Không những vậy, bạn còn có thể điều chỉnh vị trí nguồn sáng bằng cách điều khiển tay cầm để tìm ra góc chiếu sáng làm nổi bật nhất những ưu điểm trên khuôn mặt của mình.
Zuckerberg cho biết rằng không giống như các phiên bản hoạt hình hoặc truyền video trong Horizon Worlds, việc tạo các hình đại diện Meta Codec mới này mô phỏng người thật đòi hỏi phải quét rộng rãi các biểu cảm khuôn mặt và chi tiết chuyển động khác nhau của người dùng, sau đó lập mô hình và nén thành phiên bản được mã hóa.
Sau đó, khả năng theo dõi mắt và khuôn mặt theo thời gian thực của tai nghe sẽ ghi lại biểu cảm của người dùng, ánh xạ chúng lên hình đại diện 3D và "gửi phiên bản được mã hóa về diện mạo của bạn" tới thế giới ảo hoặc người ở đầu bên kia của hội nghị hãy gọi. Trình bày trước mặt họ một người trông giống bạn thật.
Vì dữ liệu hình ảnh trong metaverse được truyền ở dạng mã hóa nên nó không chỉ sống động như thật mà còn tiết kiệm băng thông hơn so với việc gửi một video hoàn chỉnh.
Đánh giá từ video phỏng vấn, khả năng khôi phục chi tiết về người thật của avatar quả thực quá mạnh. Theo lời của Lex, "Nó nắm bắt được mọi thứ, kể cả những khuyết điểm trên khuôn mặt con người. Đối với tôi, những khuyết điểm này là sự tinh tế của con người." Những vết tàn nhang nhỏ, những nếp nhăn, đôi má không cân đối, biểu cảm ở khóe mắt khi tôi cười… chúng khiến tôi thích thú hơn và nhận ra rằng sự hoàn hảo không phải là chìa khóa của sự đắm chìm.”
"Đôi mắt thực sự rất quan trọng", Zuckerberg nói. "Nhiều nghiên cứu đã chứng minh rằng giao tiếp của con người chủ yếu được thực hiện bằng biểu cảm và chuyển động cơ thể, thay vì ngôn ngữ. Meta đã và đang nỗ lực để ghi lại những biểu hiện này bằng hệ thống ảo cổ điển của riêng mình, thông qua các bức ảnh". Nó mang lại trải nghiệm thực tế và mang lại cảm giác hiện diện đặc biệt." Anh tin rằng điều này cũng chạm đến cốt lõi hình ảnh của thực tế ảo và thực tế tăng cường, giúp mọi người cảm thấy gần nhau bất kể họ ở đâu trên thế giới.
Hãy tưởng tượng bạn bước vào một phòng họp trong tương lai, một số người thực sự có mặt, trong khi những người khác xuất hiện ở dạng ảo thực tế này, được đặt trên môi trường vật lý bằng cách kết hợp công nghệ thực tế hỗn hợp: bạn nghĩ rằng họ đang ngồi vào bàn nói chuyện với bạn về các dự án, nhưng thực tế là vậy. thực tế là họ ở xa hàng ngàn dặm; trong đêm khuya, khi bạn một mình ở xứ lạ và nhớ nhà, bạn có thể đeo tai nghe để nhìn thấy những người thân yêu của mình ở gần. Cái cau mày và nụ cười của người đối diện cũng như mọi nét mặt tinh tế đều có thể được tái tạo một cách chân thực theo không gian ba chiều mà hầu như không có độ trễ hoặc mất mát.
Trong quá trình trải nghiệm, Lex không khỏi thốt lên rằng điều này thật tuyệt vời: “Tim tôi lúc này đập rất nhanh, sự gần gũi của cuộc trò chuyện có thể được nhận ra từ xa như thế này. Tôi cảm nhận được cảm xúc, và tôi cũng cảm nhận được”. rằng bạn và tôi thực sự ở đó. Đây là điều khó khăn nhất trong cuộc đời tôi. "Một trong những trải nghiệm đáng kinh ngạc nhất, thực sự mở rộng tầm mắt!"
Tuy nhiên, cần lưu ý rằng việc đạt được hiệu ứng hội thoại trong video vẫn chưa phải là điều dễ dàng đối với người bình thường. Trước khi bắt đầu cuộc phỏng vấn, cả hai đã bay tới Pittsburgh trước và tiến hành quét chi tiết trong vài giờ trong nhóm dự án Meta Codec, nơi tích hợp công nghệ cao nhất của phần mềm và phần cứng hiện tại.
Tại hội nghị Connect vừa kết thúc vài ngày trước, Zuckerberg nói rằng tầm nhìn lớn nhất của anh là làm cho những công nghệ cao cấp đó có thể tiếp cận được với mọi người và thay đổi cuộc sống của hầu hết mọi người. Vậy lần này anh ấy có dự định gì cho tương lai?
Tiêu Zha nói rằng chúng ta vừa mới bắt đầu. Bằng cách quét một số ít người trước tiên và thu thập đủ dữ liệu biểu hiện khuôn mặt, chúng tôi có thể khám phá xem toàn bộ quá trình có thể được đơn giản hóa đến mức nào và sau đó làm cho nó mượt mà hơn khi áp dụng cho một số lượng lớn người. Mặc dù công nghệ này vẫn chưa hoàn toàn sẵn sàng để đưa ra thị trường nhưng nó sẽ tiếp tục được điều chỉnh và tối ưu hóa trong vài năm tới để được áp dụng vào các kịch bản công việc càng sớm càng tốt nhằm giải quyết các vấn đề về năng suất.
Điều mà Meta đang nỗ lực đạt được là bạn chỉ cần sử dụng điện thoại di động để thực hiện quét khuôn mặt rất nhanh, chẳng hạn như nhấc điện thoại di động lên và lắc trước mặt, nói vài từ và thực hiện một số biểu cảm Toàn bộ quá trình có thể chỉ mất hai hoặc ba phút để tạo ra chất lượng cuộc trò chuyện như hiện tại. Làm thế nào để hiệu quả hơn mà vẫn đảm bảo trải nghiệm vẫn là một trong những thách thức tiếp theo.
Lex tin rằng các Avatar Meta Codec mới rõ ràng đã vượt qua "thung lũng khủng bố" trước đây. Tiêu Zha trong camera trông giống hệt anh ta, sau đó anh ta ngập ngừng mỉm cười hỏi: "Vậy là chúng ta không cần tay chân nữa." ,Phải?"
"Không, không, chúng tôi vẫn sẽ giải quyết những vấn đề này", Zuckerberg vội vàng giải thích "Thực ra là có một vấn đề. Quét toàn bộ cơ thể với độ chính xác cao đòi hỏi khả năng hỗ trợ sức mạnh tính toán mạnh mẽ, cả về cảm biến của màn hình gắn trên đầu lẫn khả năng hiển thị. Vì vậy, chúng ta có thể cân nhắc việc khôi phục cơ thể với độ chân thực thấp hơn, chẳng hạn như vẫn giữ lại những chuyển động lớn, nhưng khuôn mặt mới là thứ cần được phân tích nhiều nhất, việc di chuyển lông mày từng milimet có thể truyền tải những cảm xúc hoàn toàn khác. Sẽ không có vấn đề gì nếu cánh tay của bạn di chuyển một inch.”
Các avatar trong Horizon Worlds được mô tả là "hiệu ứng thung lũng kỳ lạ" do biểu cảm nhợt nhạt và thiếu phần thân dưới. Ảnh từ Meta.
Sau đó, cả hai nói về Quest 3 mới được phát hành, thực tế tăng cường, trí tuệ nhân tạo trong Metaverse và tương lai của nhân loại. Lex chế giễu cuộc phỏng vấn này với Zuckerberg là "cuộc gặp gỡ của hai người có biểu cảm cứng rắn nhất trên Internet trong metaverse." Anh ấy cảm thấy rằng trong không gian ảo này, khả năng biểu cảm của anh ấy dễ nắm bắt hơn và chân thực hơn để truyền tải cảm xúc một cách hoàn hảo: " Tôi thực sự hy vọng nhiều người hơn có thể đến và tự mình trải nghiệm!" Tiêu Zha cũng bày tỏ rằng anh rất mong chờ phản ứng của cư dân mạng sau khi xem tập podcast này. Điều lo lắng duy nhất là liệu khán giả có thực sự có thể trải nghiệm qua hay không màn hình 2D này sắp xuất hiện cảm giác sốc thực sự.
Đánh giá từ những bình luận của cư dân mạng, rõ ràng họ không chỉ cảm nhận được mà còn bị sốc.
Mặc dù vài tháng qua đã trải qua nhiều đợt cập nhật gây bão của Google, Microsoft và đặc biệt là ChatGPT của OpenAI, nhưng có thể coi cuộc phỏng vấn này trong metaverse vẫn nằm ngoài phạm vi nhận thức của mọi người. MrBeast, Youtuber hàng đầu thế giới, đã để lại bình luận bên dưới video rằng: "Làm thế nào chúng ta đến được đây từ hình đại diện pixel? Tôi đã bỏ lỡ điều gì?" Những người khác cũng bình luận: "Đây là điều đáng kinh ngạc nhất mà tôi từng thấy. Một trong những điều đó". các điều."
Một số người cho rằng Meta sẽ luôn có một vị trí trong số những công ty đi đầu về đổi mới công nghệ. Sau một thời gian dài bị chất vấn, trêu chọc và thậm chí bị chỉ trích, Metaverse vẫn phát triển thành dạng 3.0 mạnh mẽ như vậy.
Lex nói, tôi đã nhìn thấy tương lai.
“Tôi tin rằng năm tới sẽ khá điên rồ”, Zuckerberg nói.
Bất kể Meta sẽ phát triển hay tiến triển như thế nào trong tương lai, cuộc trò chuyện trực tiếp đầu tiên này giữa một "người thật" trải dài một trăm dặm và trong metaverse là một cột mốc quan trọng. Chúng ta thật may mắn khi được sinh ra trong thời đại này và chứng kiến những điều không thể trở thành có thể.
