Meta telah memperkenalkan Segmen Anything, model dasar barunya untuk segmentasi gambar. Proses mengidentifikasi piksel gambar mana yang dimiliki suatu objek merupakan tugas penting dalam visi komputer dan digunakan dalam berbagai aplikasi, mulai dari menganalisis citra ilmiah hingga mengedit foto. 

Dalam postingan blog perkenalannya, perusahaan tersebut menyatakan bahwa membuat model segmentasi yang akurat untuk tugas-tugas tertentu dalam visi komputer biasanya memerlukan kerja khusus dari pakar teknis yang memiliki akses ke infrastruktur pelatihan AI dan sejumlah besar data dalam domain yang dianotasi dengan cermat. 

Namun, hal ini mungkin akan segera berubah dengan adanya proyek Segment Anything karena kumpulan data dan model barunya diharapkan dapat membuat model segmentasi yang akurat lebih mudah diakses oleh khalayak yang lebih luas, sehingga menghilangkan kebutuhan akan keahlian teknis dan infrastruktur khusus. Untuk mencapai hal tersebut, para peneliti membangun model promptable yang dilatih pada beragam data dan dapat beradaptasi dengan tugas-tugas tertentu, mirip dengan bagaimana prompt digunakan dalam model pemrosesan bahasa alami atau chatbots.

Untuk lebih mendemokratisasikan segmentasi, Meta menyediakan kumpulan data SA-1B yang sangat besar untuk tujuan penelitian, dan Model Segmen Apapun tersedia di bawah lisensi terbuka yang permisif (Apache 2.0). Selain itu, perusahaan telah mengembangkan demo yang memungkinkan pengguna mencoba SAM dengan gambar mereka sendiri.

Meta melihat potensi kasus penggunaan SAM di domain AI, AR/VR, dan pembuat konten. SAM berpotensi menjadi elemen penting dalam sistem AI yang lebih besar yang bertujuan untuk mencapai pemahaman multimodal dunia yang lebih umum. Misalnya, ini dapat memfasilitasi pemahaman konten visual dan tekstual pada halaman web. 

Selain itu, dalam domain AR/VR, SAM dapat mengaktifkan pemilihan objek berdasarkan pandangan pengguna dan memungkinkan objek “diangkat” menjadi 3D. Selain itu, pembuat konten dapat menggunakan SAM untuk meningkatkan aplikasi kreatif seperti mengekstraksi area gambar untuk kolase atau pengeditan video.

Meta telah meningkatkan upaya AI-nya di tengah booming AI generatif dan berkurangnya minat terhadap metaverse. Meskipun perusahaan bertaruh $70 miliar pada metaverse, divisi metaverse Reality Labs mengalami kerugian sebesar US$13,7 miliar tahun lalu. Baru-baru ini, Meta juga menghentikan operasi NFT-nya di Facebook dan Instagram.

Dalam sebuah wawancara dengan Nikkei Asia pada hari Rabu, CTO Meta Chris Bosworth mengatakan bahwa para eksekutif puncak Meta telah menghabiskan sebagian besar waktunya di bidang AI. CEO Meta Mark Zuckerberg mengumumkan pada bulan Februari grup produk baru yang berfokus pada AI generatif setelah merilis model bahasa besar baru yang disebut LLaMA (Large Language Model Meta AI).

Perusahaan diperkirakan akan meluncurkan beberapa aplikasi AI pembuat iklan tahun ini, kata Bosworth kepada Nikkei.

Baca selengkapnya:

  • Square Enix merencanakan ekspansi untuk mengembangkan strategi Metaverse

  • Samsung Latam memasuki metaverse dengan “House of Sam” di Decentraland 

  • Meta: pengguna sekarang dapat melakukan cross-posting NFT di Instagram dan Facebook

  • CFTC mengumumkan tuntutan baru terhadap Sam Bankman-Fried, FTX, dan Alameda

  • CEO OpenAI menyatakan bahwa sistem pendidikan harus beradaptasi dengan ChatGPT, bukan melarangnya

Pos Meta Memperkenalkan Segmen Apa Saja, Model AI Baru untuk Segmentasi Gambar muncul pertama kali di Metaverse Post.