記事転載元:AIGC

出典: シダオ

画像ソース: Unbounded AI によって生成

シリコンバレーの有名な投資家であり、国際的に有名な決済ツールPayPalの創設者であるピーター・ティールはかつてこう言いました。「競争は敗者のためのものだ。永続的な価値を創造し、獲得したいなら、独占を確立せよ。」

この一文は「Winner Takes All」の究極の表現です。 「勝者総取り」とは、製品またはサービスが競合他社よりわずかに優れている限り (たとえば 1%)、製品間で不釣り合いに莫大な収益 (たとえば 90 ~ 100%) を獲得できることを意味します。またはそのカテゴリーのサービスで、競合他社を大きく引き離しています。

この現象は多くの業界、特にテクノロジー業界に反映されています。世界的には、IBM が何十年にもわたってコンピューティングを支配し、マイクロソフトは依然として電子商取引を独力で支配しています。言うまでもなく、インターネット時代の大きな特徴は、「勝者が総取りし、敗者は常に弱いままである」ということです。

この問題を明確にすることが重要です。なぜなら、それは私たちの投資ロジックを変えるからです。「補助金を得るためにお金を燃やす - 2番目のプレイヤーを殺す - 市場を独占する - ネットワーク効果を発揮する」という従来のインターネットのアプローチが機能しなくなるのであれば、投資家は次のようなことを経験します。 「数千の連隊が戦う」時代を生きてきた人々も、新たな投資手法を必要とするかもしれない。

答えを得るために、Shidao Investment Research チームは、A16Z のパートナーである Benedict Evans 氏、Lightspeed Venture Partners のパートナーである Guru Chahal 氏などを含むいくつかの外部記事を参照し、いくつかの類似点や矛盾点を整理しようとしました。ビュー、誰もが考えることができます。

勝者がすべてを手に入れる:ファン・アンドリュー・ン下院議員

全体として、Andrew Ng によって導入された人工知能の好循環モデルは、「勝者総取り」の基礎となるロジックを提供します。

当初、AI 製品は限られたデータを使用して構築されます。その後、製品がユーザーと関わるにつれて、毎日さらに多くのデータが収集されます。機械学習の基礎はデータ、つまり大量のデータです。

より多くのデータ = より正確なモデル = より良い製品 = より多くのユーザー = より多くのデータ

この好循環の公式は、人工知能の勝者総取り市場において重要な要素と考えられています。ビッグデータと機械学習の組み合わせにより、ネットワーク効果が増幅され、規模が回復し、テクノロジー市場のリーダーの優位性が再び強化されます。これは、すでに大規模で大量のデータを保有している企業がさらに強力になることを意味します。

国内の状況を見ると、データの壁は新興企業にとっても直面する壁となっている。高品質の中国語コーパス データはスタートアップにとって大きな課題であり、データの蓄積には時間と経験が必要です。複数のインターネットや検索などの IoT アプリケーションを通じて長年にわたってデータを蓄積してきた Baidu のような企業にとって、当初から少なくとも数ポジションはリードしています。

勝者総取りはありません: 代表政党 A16Z

データは重要ですが、実際の業務におけるデータの役割に関しては、A16Z パートナーで有名なアナリストであるベネディクト・エヴァンス・ドゥス氏は異なる見解を提唱しています。

EvansDoes 氏は記事 (AI が強いテクノロジー企業をより強くする?) の中で、機械学習には大量のデータが必要だが、使用するデータは解決しようとしている問題に非常に適している必要があると指摘しました。

General Electric はガスタービンからの遠隔測定データを大量に保有し、Google は大量の検索データを保有し、American Express はクレジット カード詐欺データを大量に保有しています。しかし、不正取引を見つけるためにタービン データに基づいてモデルをトレーニングすることはできません。また、故障しそうなガス タービンを見つけるために Web 検索データに基づいてモデルをトレーニングすることもできません。

トレーニングする各モデルは 1 つのことしか実行できません。

これは、これまでの自動化の波とよく似ています。洗濯機は衣服を洗うことしかできず、食器や調理はできません。また、チェス プログラムは税金を支払うことができないのと同じように、機械学習翻訳システムは猫を認識できません。

構築するアプリケーションと必要なデータセットは、解決しようとしているタスクと強く関連しています。 (ただし、これは流動的な目標であり、機械学習モデルを異なるデータセット間でより簡単に転送できるようにする方法を発見しようとする研究が行われています。)

これは、Google が Google であることにおいては向上していることを意味しますが、他のことにおいては向上していることを意味するわけではありません。

実施する業界もあれば、実施しない業界もあります。特定の垂直分野に注目する必要があります。

では、垂直分野において、大手企業は圧倒的なデータ優位性を利用して市場全体を掌握できるのでしょうか?

エバンス・ドーズ氏は、状況はさらに複雑になるだろうと考えている。

データの所有者、データの固有性、データのレベルの固有性、データを集約して分析するのに適切な場所はどこかなどです。これらの質問に対する答えは、事業単位、業界、使用例によって異なります。

現実世界の問題を解決するために機械学習を使用する会社を設立している場合、次の 2 つの基本的なデータの問題に直面することになります。

1. 最初の顧客を獲得するためにモデルをトレーニングするための最初のデータ バッチをどのように取得しますか?

2. どのくらいのデータ量が必要ですか?

2 番目の質問は、多くの質問に分類できます。

より少ない、簡単に入手できるデータを使用して問題を解決したいですか? (ただし、多くの競合他社が利用可能です)。

それとも、問題を解決するために、さらに入手が難しいデータが必要ですか?

もしそうなら、これによって恩恵を受ける可能性のあるネットワーク効果はありますか? 1 人の勝者がすべてのデータを取得できるでしょうか?

データが増えれば製品は無限に向上するのでしょうか、それとも S 字カーブは存在しますか?

すべては状況次第です。

データの中には、企業または製品に固有のもの、またはゼネラル モーターズのタービン テレメトリ テクノロジなど、独自の強力な利点を持つものもあります。しかし、これはロールス・ロイスのタービンの解析にはあまり役に立たないかもしれません。

また、一部のデータは、多くの企業、さらには多くの業界のユースケースに使用できます。多くの企業やさまざまな業界の共通の問題を解決するために、ここから多くのスタートアップが生まれており、ここでのデータにはネットワーク効果があります。

しかし、ある時点以降、製品がすでに機能しているため、サプライヤーがそれ以上のデータを必要としないケースもあります。

EvansDoes 氏は、この状況は多くのスタートアップ企業ですでに起こっていると考えています。たとえば、A16Z の投資会社 Everlaw は合法的なソフトウェアを開発しています。このソフトウェアは 100 万件の電子メールに対してセンチメント分析を実行できるため、クライアント固有の訴訟データに関するトレーニングの必要がなくなります。

より極端なケースでは、大手自動車メーカーはモデル トレーニングを使用して、より正確なタイヤパンク検出器を開発しています。大量のタイヤデータに基づいてトレーニングされたモデルです。しかし、明らかに、これらのデータを入手するのは難しくありません。

言い換えれば、機械学習の人気は Google がより強力になったことを意味するのではなく、さまざまなスタートアップがこの最先端のテクノロジーを使用してアプリケーションを構築し、以前よりも速く問題を解決できるようになるということを意味します。

将来、これ以上の「人工知能」スタートアップは存在しないでしょう。それらは産業プロセス分析会社、法的プラットフォーム会社、または販売最適化会社になるでしょう。

EvansDoes は、機械学習を SQL (Structured Query Language) と比較しました。

昔は、SQL を使用していないと遅れを取っていました。たとえば、ウォルマートの成功の主な要因は、SQL を使用して在庫と物流をより効果的に管理したことです。

しかし今日、小売会社を立ち上げて「...SQL を使用するつもりです」と言ったところで、SQL はすでにすべての一部となっており、議論の中に消えてしまっているため、会社の価値がさらに高まるわけではありません。 。

機械学習の未来も同様です。 ‍

「ビッグモデル」時代にどう投資するか?少なくともインターネットのロジックはもう本当に機能しません

シダオ投資リサーチチームは、「勝者総取り」の状況が存在するかどうかに関係なく、少なくともインターネット時代の投資ロジックは人工知能時代ではもはや実現不可能であると考えています。

中心となるロジックは、インターネット時代には「トラフィック」が無料であるというもので、これが「ネットワーク効果」の概念につながります。つまり、総運用コストが変わらない場合、ユーザーが増えるほどネットワークの価値が高まります。いわゆる「あらゆる業界がインターネット思考でやり直すのに適している」というやつだ。

ただし、大規模モデルの時代と異なるのは、コンピューティング能力にはコストがかかることです。したがって、ユーザーを 1 人追加するたびに、実際にコンピューティング能力を費やす必要があり、ネットワーク効果がなくなるため、新しいユーザーが増えれば増えるほど、得られる収益は減少します。

さらに、現在の大規模モデルには、使用コストが高い、推論遅延が大きい、データ漏洩、専門的なタスクには精度が不十分であるなどの問題があります。比較すると、いくつかの小型で特殊化された(調整 + 洗練された)ロングテール モデルの利点も明らかになりました。

したがって、たとえほとんどのテクノロジーが富を集める役割を果たすことができ、人工知能の巨人が実際に多額の富を集めることができたとしても、計算能力のコストと市場全体を占有することができないため、富の総量は制限されるでしょう。 。