
Meta представила Segment Anything, свою новую базовую модель для сегментации изображений. Процесс определения того, какие пиксели изображения принадлежат объекту, является важнейшей задачей в компьютерном зрении и используется в различных приложениях, от анализа научных изображений до редактирования фотографий.
В своем вступительном сообщении в блоге компания задала тон, заявив, что создание точных моделей сегментации для конкретных задач в области компьютерного зрения обычно требует специализированной работы технических экспертов с доступом к инфраструктуре обучения ИИ и большим объемам тщательно аннотированных данных в предметной области.
Однако это может скоро измениться с проектом Segment Anything, поскольку его новый набор данных и модель, как ожидается, сделают точные модели сегментации более доступными для более широкой аудитории, устраняя необходимость в специализированных технических знаниях и инфраструктуре. Чтобы добиться этого, исследователи создали модель с подсказками, которая обучается на разнообразных данных и может адаптироваться к конкретным задачам, подобно тому, как подсказки используются в моделях обработки естественного языка или чат-ботах.
Для дальнейшей демократизации сегментации Meta делает массивный набор данных SA-1B доступным для исследовательских целей, а модель Segment Anything доступна по разрешительной открытой лицензии (Apache 2.0). Кроме того, компания разработала демоверсию, которая позволяет пользователям попробовать SAM с их собственными изображениями.
Meta видит потенциальные варианты использования SAM в областях AI, AR/VR и создателей. SAM может стать критически важным элементом в более крупных системах AI, которые нацелены на достижение более общего мультимодального понимания мира. Например, он может облегчить понимание как визуального, так и текстового контента на веб-странице.
Кроме того, в области AR/VR SAM может обеспечить выбор объекта на основе взгляда пользователя и позволить объекту «подняться» в 3D. Более того, создатели контента могут использовать SAM для улучшения творческих приложений, таких как извлечение областей изображения для коллажей или редактирования видео.
Meta наращивает свои усилия в области ИИ на фоне бума генеративного ИИ и угасающего интереса к метавселенной. Несмотря на ставку компании в размере 70 миллиардов долларов на метавселенную, ее подразделение метавселенной Reality Labs в прошлом году понесло убытки в размере 13,7 миллиардов долларов США. Недавно Meta также прекратила свои операции NFT в Facebook и Instagram.
В интервью Nikkei Asia в среду технический директор Meta Крис Босворт сказал, что топ-менеджеры Meta тратят большую часть своего времени на ИИ. Генеральный директор Meta Марк Цукерберг объявил в феврале о создании новой группы продуктов, ориентированной на генеративный ИИ, после выпуска своей новой большой языковой модели под названием LLaMA (Large Language Model Meta AI).
Босворт сообщил Nikkei, что в этом году компания планирует представить несколько приложений на базе искусственного интеллекта для создания рекламы.
Читать далее:
Square Enix планирует расширение для развития стратегии Metaverse
Samsung Latam входит в метавселенную с «House of Sam» в Decentraland
Мета: теперь пользователи могут делать кросс-посты NFT в Instagram и Facebook
CFTC предъявляет новые обвинения Сэму Бэнкману-Фриду, FTX и Аламеде
Генеральный директор OpenAI заявил, что система образования должна адаптироваться к ChatGPT, а не запрещать его
Публикация Meta представляет Segment Anything — новую модель искусственного интеллекта для сегментации изображений впервые появилась на Metaverse Post.
