
Meta đã giới thiệu Segment Anything, mô hình nền tảng mới của họ để phân đoạn hình ảnh. Quá trình xác định pixel hình ảnh nào thuộc về một đối tượng là một nhiệm vụ quan trọng trong thị giác máy tính và được sử dụng trong nhiều ứng dụng, từ phân tích hình ảnh khoa học đến chỉnh sửa ảnh.
Trong bài đăng trên blog giới thiệu, công ty đã nêu rõ rằng việc tạo ra các mô hình phân đoạn chính xác cho các tác vụ cụ thể trong thị giác máy tính thường đòi hỏi công việc chuyên môn của các chuyên gia kỹ thuật có quyền truy cập vào cơ sở hạ tầng đào tạo AI và khối lượng lớn dữ liệu trong miền được chú thích cẩn thận.
Tuy nhiên, điều này có thể sớm thay đổi với dự án Segment Anything vì tập dữ liệu và mô hình mới của dự án này dự kiến sẽ giúp các mô hình phân đoạn chính xác dễ tiếp cận hơn với nhiều đối tượng hơn, loại bỏ nhu cầu về chuyên môn kỹ thuật và cơ sở hạ tầng chuyên biệt. Để đạt được điều đó, các nhà nghiên cứu đã xây dựng một mô hình có thể nhắc nhở được đào tạo trên nhiều dữ liệu khác nhau và có thể thích ứng với các tác vụ cụ thể, tương tự như cách nhắc nhở được sử dụng trong các mô hình xử lý ngôn ngữ tự nhiên hoặc chatbot.
Để dân chủ hóa phân đoạn hơn nữa, Meta đang cung cấp bộ dữ liệu SA-1B khổng lồ cho mục đích nghiên cứu và Mô hình phân đoạn bất kỳ có sẵn theo giấy phép mở cho phép (Apache 2.0). Ngoài ra, công ty đã phát triển bản demo cho phép người dùng dùng thử SAM với hình ảnh của riêng họ.
Meta thấy các trường hợp sử dụng tiềm năng cho SAM trong các lĩnh vực AI, AR/VR và sáng tạo. SAM có tiềm năng trở thành một yếu tố quan trọng trong các hệ thống AI lớn hơn nhằm đạt được sự hiểu biết đa phương thức tổng quát hơn về thế giới. Ví dụ, nó có thể tạo điều kiện cho việc hiểu cả nội dung trực quan và văn bản trên một trang web.
Ngoài ra, trong lĩnh vực AR/VR, SAM có thể cho phép lựa chọn đối tượng dựa trên ánh nhìn của người dùng và cho phép đối tượng được "nâng" lên 3D. Hơn nữa, người sáng tạo nội dung có thể sử dụng SAM để nâng cao các ứng dụng sáng tạo như trích xuất vùng hình ảnh để ghép ảnh hoặc chỉnh sửa video.
Meta đã tăng cường nỗ lực AI của mình trong bối cảnh bùng nổ AI tạo ra và sự quan tâm giảm dần đối với metaverse. Mặc dù công ty đã đặt cược 70 tỷ đô la vào metaverse, bộ phận metaverse Reality Labs của công ty đã chứng kiến khoản lỗ 13,7 tỷ đô la Mỹ vào năm ngoái. Gần đây, Meta cũng đã chấm dứt hoạt động NFT của mình trên Facebook và Instagram.
Trong một cuộc phỏng vấn với Nikkei Asia vào thứ Tư, Giám đốc công nghệ Meta Chris Bosworth cho biết các giám đốc điều hành hàng đầu của Meta đã dành phần lớn thời gian của họ cho AI. Giám đốc điều hành Meta Mark Zuckerberg đã công bố vào tháng 2 một nhóm sản phẩm mới tập trung vào AI tạo sinh sau khi phát hành mô hình ngôn ngữ lớn mới có tên là LLaMA (Mô hình ngôn ngữ lớn Meta AI).
Bosworth nói với Nikkei rằng công ty dự kiến sẽ ra mắt một số ứng dụng AI tạo quảng cáo trong năm nay.
Đọc thêm:
Square Enix có kế hoạch mở rộng để phát triển chiến lược Metaverse
Samsung Latam bước vào thế giới siêu thực với “House of Sam” tại Decentraland
Meta: người dùng hiện có thể đăng chéo NFT trên Instagram và Facebook
CFTC công bố cáo buộc mới đối với Sam Bankman-Fried, FTX và Alameda
CEO của OpenAI tuyên bố rằng hệ thống giáo dục nên thích ứng với ChatGPT, không phải cấm nó
Bài đăng Meta giới thiệu Segment Anything, mô hình AI mới dành cho phân đoạn hình ảnh xuất hiện đầu tiên trên Metaverse Post.
