Meta 推出了 Segment Anything,這是其用於圖像分割的新基礎模型。識別哪些圖像像素屬於某個對象的過程是計算機視覺中的一項關鍵任務,並用於從分析科學圖像到編輯照片等各種應用中。

在其介紹性博客文章中,該公司表示,爲計算機視覺中的特定任務創建準確的分割模型通常需要技術專家進行專業工作,他們可以訪問 AI 訓練基礎設施和大量經過仔細註釋的領域內數據。

然而,隨着 Segment Anything 項目的實施,這種情況可能很快就會改變,因爲該項目的新數據集和模型有望讓更廣泛的受衆更容易獲得準確的細分模型,從而消除對專業技術知識和基礎設施的需求。爲了實現這一點,研究人員構建了一個可提示的模型,該模型經過各種數據的訓練,可以適應特定任務,類似於自然語言處理模型或聊天機器人中的提示方式。

爲了進一步實現分割的民主化,Meta 正在將龐大的 SA-1B 數據集用於研究目的,並且 Segment Anything Model 可在寬鬆的開放許可 (Apache 2.0) 下使用。此外,該公司還開發了一個演示版,允許用戶使用自己的圖像嘗試 SAM。

Meta 認爲 SAM 在 AI、AR/VR 和創作者領域具有潛在用途。SAM 有可能成爲大型 AI 系統中的關鍵元素,旨在實現對世界的更普遍的多模式理解。例如,它可以促進對網頁上視覺和文本內容的理解。

此外,在 AR/VR 領域,SAM 可以根據用戶的注視選擇對象,並允許將對象“提升”爲 3D。此外,內容創建者可以使用 SAM 來增強創意應用,例如提取圖像區域進行拼貼或視頻編輯。

在生成式人工智能蓬勃發展、人們對元宇宙的興趣逐漸減弱的背景下,Meta 一直在加大人工智能方面的投入。儘管該公司在元宇宙上押注了 700 億美元,但其元宇宙部門 Reality Labs 去年虧損了 137 億美元。最近,Meta 還停止了 Facebook 和 Instagram 上的 NFT 業務。

Meta 首席技術官克里斯·博斯沃思週三接受日經亞洲版採訪時表示,Meta 的高管大部分時間都花在了人工智能上。Meta 首席執行官馬克·扎克伯格在 2 月份發佈了名爲 LLaMA(大型語言模型 Meta AI)的新大型語言模型後,宣佈成立一個專注於生成式人工智能的新產品團隊。

博斯沃思向日經新聞表示,該公司預計今年將推出一些廣告製作人工智能應用程序。

閱讀更多:

  • Square Enix 計劃擴張 Metaverse 戰略

  • 三星拉美公司在 Decentraland 推出“House of Sam”進入元宇宙

  • Meta:用戶現在可以在 Instagram 和 Facebook 上交叉發佈 NFT

  • CFTC 公佈對 Sam Bankman-Fried、FTX 和 Alameda 的新指控

  • OpenAI 首席執行官表示,教育系統應該適應 ChatGPT,而不是禁止它

Meta 推出其用於圖像分割的全新 AI 模型“Segment Anything”,該文章最先出現在 Metaverse Post 上。