Źródło przedruku artykułu: AIGC

źródło: Shidao

Źródło obrazu: wygenerowane przez Unbounded AI

Peter Thiel, znany inwestor z Doliny Krzemowej i założyciel znanego na całym świecie narzędzia płatniczego PayPal, powiedział kiedyś: „Konkurencja jest dla przegranych. Jeśli chcesz stworzyć i uzyskać trwałą wartość, ustanowij monopol”.

To zdanie jest ostatecznym wyrażeniem „Zwycięzca bierze wszystko”. „Zwycięzca bierze wszystko” oznacza, że ​​dopóki produkt lub usługa będzie nieco lepsza od konkurencji (na przykład o 1%), wówczas uzyskasz nieproporcjonalnie dużą kwotę przychodów (na przykład 90-100%) pomiędzy produktami lub usług w tej kategorii, pozostawiając swoich konkurentów daleko w tyle.

Zjawisko to jest widoczne w wielu branżach, zwłaszcza w sektorze technologicznym. Globalnie IBM dominował na rynku komputerowym przez dekady; Microsoft zdominował rynek komputerów osobistych; a Amazon nadal samodzielnie dominuje w handlu elektronicznym. Niewątpliwie, charakterystyczną cechą ery internetu jest model „zwycięzca bierze wszystko”, w którym przegrany pozostaje bezbronny.

Ważne jest, aby wyjaśnić tę kwestię, ponieważ zmieni to naszą logikę inwestycyjną: jeśli tradycyjne podejście internetowe polegające na „przepalaniu pieniędzy na dotacje – eliminowaniu drugiego miejsca – monopolizowaniu rynku – wykorzystywaniu efektów sieciowych” przestanie działać, to inwestorzy, którzy doświadczyli ery „wojny tysięcy grup”, mogą również potrzebować nowej metodologii inwestycyjnej.

Aby uzyskać odpowiedź, zespół ds. badań inwestycyjnych Shidao zapoznał się z kilkoma zewnętrznymi artykułami, których autorami byli m.in. Benedict Evans, partner w A16Z, Guru Chahal, partner w Lightspeed Venture Partners, i inni, starając się uporządkować podobne lub sprzeczne poglądy, aby wszyscy mogli się nad nimi zastanowić.

Zwycięzca bierze wszystko: przedstawiciel Andrew Ng

Ogólnie rzecz biorąc, model błędnego koła sztucznej inteligencji przedstawiony przez Andrew Nga stanowi podstawę logiki modelu „zwycięzca bierze wszystko”.

Początkowo produkty AI są tworzone z ograniczoną ilością danych. Następnie, w miarę interakcji z użytkownikami, zbierają coraz więcej danych każdego dnia. Podstawą uczenia maszynowego są dane – i to duże.

Więcej danych = dokładniejsze modele = lepsze produkty = więcej użytkowników = więcej danych

Ten pozytywny cykl jest uważany za kluczowy czynnik na rynku sztucznej inteligencji, gdzie zwycięzca bierze wszystko. Połączenie big data i uczenia maszynowego wzmacnia efekty sieciowe i korzyści skali, dodatkowo wzmacniając dominację liderów rynku technologicznego i sprawiając, że i tak już duże firmy dysponujące ogromnymi zbiorami danych stają się jeszcze potężniejsze.

W Chinach bariery danych stanowią również istotną przeszkodę dla rozwijających się firm. Pozyskanie wysokiej jakości chińskich danych korpusowych stanowi poważne wyzwanie dla startupów, a ich gromadzenie wymaga czasu i doświadczenia. Firmy takie jak Baidu, które przez lata gromadziły dane za pośrednictwem wyszukiwarek i innych aplikacji internetowych i IoT, mają już przewagę.

Nie ma zwycięzcy, który bierze wszystko: A16Z

Dane mają kluczowe znaczenie, ale partner A16Z i znany analityk Benedict EvansDoes ma odmienny pogląd na rolę danych w rzeczywistej pracy.

EvansDoes w swoim artykule (AI makes strong tech companies stronger?) zauważa, że chociaż uczenie maszynowe wymaga dużej ilości danych, dane, których używasz, muszą być ściśle powiązane z problemem, który próbujesz rozwiązać.

GE ma mnóstwo danych telemetrycznych z turbin gazowych, Google ma mnóstwo danych z wyszukiwarek, a American Express ma mnóstwo danych o oszustwach na kartach kredytowych. Nie da się jednak wykorzystać danych z turbin do trenowania modelu wykrywającego oszukańcze transakcje, ani danych z wyszukiwarek internetowych do trenowania modelu wykrywającego turbiny gazowe, które są bliskie awarii.

Każdy model, który trenujesz, powinien robić tylko jedną rzecz.

Jest to bardzo podobne do poprzednich fal automatyzacji: tak jak pralka potrafi tylko prać, ale nie potrafi zmywać ani gotować, a program szachowy nie potrafi płacić podatków, system tłumaczeniowy oparty na uczeniu maszynowym nie potrafi rozpoznać kota.

Aplikacja, którą tworzysz, i zestaw danych, którego potrzebujesz, są ściśle powiązane z zadaniem, które próbujesz rozwiązać. (Choć jest to cel ruchomy, prowadzone są badania mające na celu odkrycie, jak ułatwić przenoszenie modeli uczenia maszynowego między różnymi zestawami danych).

Oznacza to, że Google staje się coraz lepsze w byciu Google, ale nie oznacza to, że jest lepsze w innych dziedzinach.

Niektóre branże tak, inne nie: zależy to od konkretnego pola pionowego

Czy zatem wiodące firmy w sektorach pionowych mogą przejąć cały rynek, opierając się na swojej przewadze w zakresie danych?

EvansDoes uważa, że sytuacja stanie się bardziej skomplikowana.

Na przykład, kto jest właścicielem danych, jak bardzo są one unikatowe, na jakim poziomie są unikatowe oraz gdzie najlepiej je agregować i analizować. Odpowiedzi na te pytania będą się różnić w zależności od jednostek biznesowych, branż i przypadków użycia.

Wyobraźmy sobie scenariusz, w którym budujesz firmę, która ma rozwiązywać rzeczywiste problemy za pomocą uczenia maszynowego. Staniesz w obliczu dwóch fundamentalnych problemów z danymi:

1. W jaki sposób uzyskać pierwszą partię danych potrzebną do wytrenowania modelu, aby pozyskać pierwszego klienta?

2. Ile danych potrzebujesz?

Drugie pytanie można rozbić na kilka kwestii:

Czy rozwiązujesz problem, mając do dyspozycji mniej łatwo dostępne dane? (Ale dostępne dla wielu konkurentów)

A może potrzebujesz więcej trudniejszych do uzyskania danych, aby rozwiązać problem?

Jeśli tak, czy istnieje efekt sieciowy, który mógłby na tym skorzystać, polegający na tym, że jeden zwycięzca zdobędzie wszystkie dane?

Czy produkt staje się lepszy w nieskończoność wraz z większą ilością danych, czy też istnieje krzywa S?

Wszystko zależy od sytuacji.

Niektóre dane są unikalne dla danej firmy lub produktu albo mają silne, zastrzeżone zalety, jak na przykład technologia telemetrii turbin General Motors. Mogą one jednak okazać się mało przydatne do analizy turbin Rolls-Royce'a.

Niektóre dane mogą być wykorzystywane w różnych zastosowaniach w wielu firmach, a nawet branżach. Wiele startupów powstało w ten sposób, aby rozwiązywać typowe problemy w wielu firmach lub branżach, a dane w tym przypadku mają charakter sieciowy.

Ale zdarzają się też przypadki, że po pewnym czasie sprzedawca nie potrzebuje już żadnych danych, ponieważ produkt po prostu działa.

Evans uważa, że wiele startupów już to robi. Na przykład Everlaw, spółka z portfela A16Z, opracowuje oprogramowanie prawnicze, które potrafi analizować sentymenty milionów wiadomości e-mail, eliminując potrzebę szkoleń z zakresu danych procesowych dotyczących konkretnych klientów.

W bardziej ekstremalnym przypadku, duży producent pojazdów opracowuje dokładniejszy detektor pęknięć opon poprzez trenowanie modelu. Model ten jest trenowany w oparciu o dużą ilość danych o oponach. Jednak uzyskanie tych danych nie jest oczywiście trudne.

Innymi słowy, popularyzacja uczenia maszynowego nie oznacza, że Google stało się potężniejsze, ale raczej, że wiele startupów może wykorzystać tę nowatorską technologię do tworzenia aplikacji i rozwiązywania problemów szybciej niż kiedykolwiek wcześniej.

W przyszłości nie będzie już więcej startupów zajmujących się sztuczną inteligencją; będą to firmy zajmujące się analizą procesów przemysłowych, firmy oferujące platformy prawne lub firmy zajmujące się optymalizacją sprzedaży.

EvansDoes porównuje uczenie maszynowe do języka SQL (Structured Query Language).

W przeszłości, jeśli nie korzystałeś z SQL, zostawałeś w tyle. Na przykład, jednym z kluczowych czynników sukcesu Walmartu było wykorzystanie SQL do efektywniejszego zarządzania zapasami i logistyką.

Ale dzisiaj, gdy zakładasz firmę detaliczną i mówisz „…będziemy używać SQL”, nie sprawia to, że firma wygląda na bardziej wartościową, ponieważ SQL jest już częścią wszystkiego i gubi się w dyskursie.

Przyszłość uczenia maszynowego nie będzie się różnić.

Jak inwestować w erze „wielkich modeli”? Przynajmniej logika internetu nie jest już wykonalna.

Zespół ds. badań inwestycyjnych Shidao uważa, że niezależnie od tego, czy zdarzy się sytuacja „zwycięzca bierze wszystko”, przynajmniej logika inwestycyjna ery Internetu nie sprawdzi się w erze sztucznej inteligencji.

Podstawową ideą jest to, że w dobie internetu „ruch” jest darmowy, stąd bierze się koncepcja „efektu sieciowego”: oznacza to, że przy stałym całkowitym koszcie operacyjnym, im więcej użytkowników, tym większa wartość sieci. To właśnie oznacza stwierdzenie, że „wszystkie branże nadają się do transformacji z wykorzystaniem internetu”.

Jednak era dużych modeli różni się tym, że moc obliczeniowa ma swoją cenę. Każdy dodatkowy użytkownik wymaga faktycznej mocy obliczeniowej, która nie generuje efektów sieciowych. To sprawia, że dotacje tracą sens: im więcej nowych użytkowników dodasz, tym mniej zarobisz.

Ponadto obecne duże modele borykają się z problemami, takimi jak wysokie koszty użytkowania, duże opóźnienia wnioskowania, wycieki danych i niedokładność w zadaniach specjalistycznych. Dla porównania, zalety niektórych mniejszych, wyspecjalizowanych (skorygowanych i udoskonalonych) modeli z długim ogonem również stały się oczywiste.

Dlatego też, mimo że większość technologii może odgrywać rolę w akumulacji bogactwa, a giganci sztucznej inteligencji rzeczywiście mogą zgromadzić dużą ilość bogactwa, to całkowita ilość bogactwa będzie ograniczona ze względu na koszty mocy obliczeniowej i brak możliwości zajęcia całego rynku.