Источник перепечатки статьи: AIGC.

Источник: Шидао

Источник изображения: Создано Unbounded AI

Питер Тиль, известный инвестор в Силиконовой долине и основатель всемирно известного платежного инструмента PayPal, однажды сказал: «Конкуренция — для проигравших. Если вы хотите создать и получить долгосрочную ценность, постройте монополию».

Это предложение является высшим выражением фразы «Победитель получает все». «Победитель получает все» означает, что пока продукт или услуга немного лучше, чем у ваших конкурентов (например, 1%), то вы получите непропорционально огромную сумму дохода (например, 90-100%) среди продуктов или услуги в этой категории, оставив своих конкурентов далеко позади.

Это явление отражено во многих отраслях, особенно в технологической отрасли. В глобальном масштабе IBM доминировала на рынке компьютеров на протяжении десятилетий; Microsoft доминировала на рынке персональных компьютеров, а Amazon по-прежнему единолично доминирует в электронной коммерции; Очевидно, что главной особенностью эпохи Интернета является то, что «победители получают все, а проигравшие всегда остаются слабыми».

Важно прояснить этот вопрос, потому что это изменит нашу инвестиционную логику: если традиционный интернет-подход «сжигать деньги для субсидирования – убить второго игрока – монополизировать рынок – оказывать сетевое воздействие» больше не будет работать, то опытные инвесторы, которые Пережившие эпоху «тысячи сражающихся полков» также могут нуждаться в новой инвестиционной методологии.

Чтобы получить ответ, команда Shidao Investment Research обратилась к нескольким внешним статьям. Среди авторов были Бенедикт Эванс, партнер A16Z, Гуру Чахал, партнер Lightspeed Venture Partners, и другие, пытаясь разобраться в некоторых похожих или противоречивых. просмотры, чтобы каждый мог подумать.

Победитель получает все: представитель Фанг Эндрю Нг

В целом, модель эффективного цикла искусственного интеллекта, представленная Эндрю Нг, обеспечивает основную логику принципа «победитель получает все».

Изначально продукты искусственного интеллекта создаются на основе ограниченных данных. Впоследствии, по мере взаимодействия продукта с пользователями, он каждый день собирает все больше и больше данных. Основой машинного обучения являются данные — множество данных.

Больше данных = более точные модели = лучшие продукты = больше пользователей = больше данных

Эта формула благотворного цикла считается важным фактором на рынке искусственного интеллекта, где победитель получает все. Сочетание больших данных и машинного обучения усиливает сетевой эффект и возвращает масштаб, еще раз усиливая доминирование лидеров рынка технологий, а это означает, что компании, которые уже являются крупными и обладают большими объемами данных, станут еще более могущественными.

Судя по внутренней ситуации, барьеры в передаче данных также являются стеной, стоящей перед развивающимися компаниями. Качественные китайские данные — большая проблема для стартапов, а накопление данных требует времени и опыта. Для такой компании, как Baidu, которая на протяжении многих лет накапливала данные с помощью множества интернет-приложений и приложений IoT, таких как поиск, с самого начала она, по крайней мере, на несколько позиций впереди.

Принципа «победитель получает все» не будет: представитель партии A16Z

Данные имеют решающее значение, но относительно роли данных в реальной работе партнер A16Z и известный аналитик Бенедикт Эванс До выдвигает другую точку зрения.

Эванс Доус отметил в статье «ИИ делает сильные технологические компании сильнее?», что, хотя машинное обучение требует большого количества данных, данные, которые вы используете, должны очень подходить для проблемы, которую вы пытаетесь решить.

У General Electric есть много данных телеметрии с газовых турбин, у Google есть много данных поиска, а у American Express есть много данных о мошенничестве с кредитными картами. Но вы не можете обучить модель на данных о турбинах, чтобы выявлять мошеннические транзакции, и вы не можете обучить модель на данных веб-поиска, чтобы выявлять газовые турбины, которые вот-вот выйдут из строя.

Каждая модель, которую вы обучаете, может делать только одну вещь.

Это очень похоже на предыдущие волны автоматизации: точно так же, как стиральная машина может только стирать одежду, а не посуду и готовить, а шахматная программа не может платить налоги, система перевода машинного обучения не может распознать кошку.

Приложение, которое вы создаете, и необходимые наборы данных тесно связаны с задачей, которую вы пытаетесь решить. (Хотя это подвижная цель: исследования пытаются выяснить, как сделать модели машинного обучения более легко переносимыми между различными наборами данных.)

Это означает, что Google становится лучше в том, чтобы быть Google, но это не значит, что он становится лучше в других вещах.

Некоторые отрасли будут это делать, а некоторые нет: вам нужно посмотреть на конкретные вертикальные области.

Итак, могут ли ведущие компании в вертикальной сфере полагаться на свои огромные преимущества в области данных, чтобы захватить весь рынок?

ЭвансДоес полагает, что ситуация усложнится.

Например, кому принадлежат данные, насколько они уникальны, на каком уровне они уникальны и где лучше всего агрегировать и анализировать данные. Ответы на эти вопросы будут различаться для разных бизнес-подразделений, разных отраслей и разных сценариев использования.

Давайте предположим, что если вы создаете компанию, которая будет использовать машинное обучение для решения реальных проблем, вы столкнетесь с двумя основными проблемами с данными:

1. Как получить первую порцию данных для обучения модели привлечению первого клиента?

2. Сколько данных вам нужно?

Второй вопрос можно разбить на множество вопросов:

Вы пытаетесь решить проблему, используя менее доступные данные? (но доступен многим конкурентам).

Или вам нужно больше данных, которые трудно получить, чтобы решить вашу проблему?

Если да, то существует ли сетевой эффект, который мог бы выиграть от этого? Получит ли один победитель все данные?

Становятся ли продукты лучше с увеличением количества данных или существует S-образная кривая?

Все зависит от ситуации.

Некоторые данные уникальны для предприятия или продукта или имеют серьезные собственные преимущества, например, технология телеметрии турбин General Motors. Но это может оказаться бесполезным при анализе турбин Rolls-Royce.

Некоторые данные можно использовать для сценариев использования во многих компаниях и даже во многих отраслях. Из этого родилось множество стартапов для решения общих проблем для многих компаний или разных отраслей, и данные здесь имеют сетевой эффект.

Но бывают случаи, когда после определенного момента поставщику даже не нужны дополнительные данные, поскольку продукт уже работает.

ЭвансДоес считает, что подобная ситуация уже произошла во многих стартап-компаниях. Например, инвестиционная компания Everlaw, принадлежащая A16Z, разрабатывает юридическое программное обеспечение. Программное обеспечение может выполнять анализ настроений по миллиону электронных писем, устраняя необходимость обучения работе с данными судебных разбирательств по конкретным клиентам.

В более экстремальном случае крупный производитель автомобилей использует обучение модели для разработки более точного детектора прокола шины. Это модель, обученная на основе большого количества данных о шинах. Но очевидно, что получить эти данные несложно.

Другими словами, популярность машинного обучения не означает, что Google стал более могущественным, а означает, что различные стартапы могут использовать эту передовую технологию для создания приложений и решения проблем быстрее, чем раньше.

В будущем больше не будет стартапов с «искусственным интеллектом», это будут компании, занимающиеся аналитикой промышленных процессов, компаниями, занимающимися юридическими платформами, или компаниями, занимающимися оптимизацией продаж.

ЭвансДос сравнил машинное обучение с SQL (языком структурированных запросов).

Раньше, если вы не использовали SQL, вы отставали. Например, основным фактором успеха Wal-Mart является использование SQL для более эффективного управления запасами и логистикой.

Но сегодня, когда вы открываете розничную компанию и говорите: «...мы собираемся использовать SQL», это не делает компанию более ценной, потому что SQL уже является частью всего, а затем он исчез. .

Будущее машинного обучения будет таким же. ‍

Как инвестировать в эпоху «большой модели»? По крайней мере, интернет-логика действительно больше не работает.

Команда Shidao Investment Research считает, что независимо от того, возникнет ли ситуация «победитель получает все», по крайней мере, инвестиционная логика эпохи Интернета больше не осуществима в эпоху искусственного интеллекта.

Основная логика заключается в том, что в эпоху Интернета «трафик» является бесплатным, что приводит к концепции «сетевого эффекта»: то есть, когда общие эксплуатационные расходы остаются неизменными, чем больше пользователей, тем выше ценность сети. Это так называемое «все отрасли пригодны для переделки интернет-мышления».

Однако отличие эпохи больших моделей в том, что вычислительная мощность имеет свою цену. Таким образом, каждый раз, когда вы добавляете еще одного пользователя, вам фактически приходится тратить вычислительную мощность, и сетевого эффекта не будет. Это делает субсидию бессмысленной. Чем больше у вас новых пользователей, тем меньше денег вы можете заработать.

Кроме того, текущие большие модели имеют такие проблемы, как высокая стоимость использования, большая задержка вывода, утечка данных и недостаточная точность для профессиональных задач. Для сравнения также проявились преимущества некоторых меньших по размеру специализированных (скорректированных + усовершенствованных) моделей с длинным хвостом.

Следовательно, даже если большинство технологий могут сыграть роль в накоплении богатства, а гиганты искусственного интеллекта действительно смогут собрать большое количество богатства, общее количество богатства станет ограниченным из-за стоимости вычислительной мощности и невозможности занять весь рынок. .