¿Ha desaparecido la regla de que “el ganador se lo lleva todo” en el emprendimiento de IA? Tal vez puedas regresar

Fuente de la reimpresión del artículo: AIGC
Fuente: Shidao
Fuente de la imagen: Generada por IA ilimitada
Peter Thiel, un famoso inversor de Silicon Valley y fundador de la herramienta de pago de renombre internacional PayPal, dijo una vez: "La competencia es para los perdedores. Si quieres crear y obtener valor duradero, construye un monopolio".
Esta frase es la máxima expresión de "El ganador se lo lleva todo". "El ganador se lo lleva todo" significa que mientras un producto o servicio sea ligeramente mejor que sus competidores (por ejemplo, 1%), obtendrá una cantidad desproporcionadamente enorme de ingresos (por ejemplo, 90-100%) entre productos o servicios en esa categoría, dejando muy atrás a sus competidores.
Este fenómeno se refleja en muchas industrias, especialmente en la industria tecnológica. A nivel mundial, IBM dominó la informática durante décadas; Microsoft dominó el mercado de las computadoras personales y Amazon todavía domina por sí solo el comercio electrónico. Obviamente, una característica importante de la era de Internet es que "los ganadores se lo llevan todo y los perdedores siempre siguen siendo débiles".
Es importante aclarar esta cuestión, porque cambiará nuestra lógica de inversión: si el enfoque tradicional de Internet de "quemar dinero para subsidiar - matar al segundo jugador - monopolizar el mercado - ejercer efectos de red" ya no funciona, entonces los inversores con experiencia que Los que han vivido la era de "miles de regimientos luchando" también pueden necesitar una nueva metodología de inversión.
Para obtener la respuesta, el equipo de Shidao Investment Research se remitió a varios artículos externos. Entre los autores se encontraban Benedict Evans, socio de A16Z, Guru Chahal, socio de Lightspeed Venture Partners, y otros, tratando de resolver algunos similares o contradictorios. vistas, para que todos piensen.
El ganador se lo lleva todo: Representante Fang Andrew Ng
En general, el modelo de ciclo virtuoso de la inteligencia artificial introducido por Andrew Ng proporciona la lógica subyacente de que "el ganador se lo lleva todo".
Inicialmente, los productos de IA se crean con datos limitados. Posteriormente, a medida que el producto interactúa con los usuarios, recopila más y más datos cada día. La base del aprendizaje automático son los datos: muchos datos.
Más datos = modelos más precisos = mejores productos = más usuarios = más datos
Esta fórmula del círculo virtuoso se considera un factor importante en el mercado de la inteligencia artificial en el que el ganador se lo lleva todo. La combinación de big data y aprendizaje automático amplifica los efectos de red y los retornos a escala, fortaleciendo una vez más el dominio de los líderes del mercado tecnológico, lo que significa que las empresas que ya son grandes y poseen grandes cantidades de datos se volverán aún más poderosas.
A juzgar por la situación interna, las barreras de datos también son un muro al que se enfrentan las empresas emergentes. Los datos de corpus chinos de alta calidad son un gran desafío para las empresas emergentes, y la acumulación de datos requiere tiempo y experiencia. Para una empresa como Baidu, que ha acumulado datos a través de múltiples aplicaciones de Internet e IoT, como la búsqueda, a lo largo de los años, está al menos algunas posiciones por delante desde el principio.
No habrá un ganador que se lo lleve todo: el partido representativo A16Z
Los datos son cruciales, pero con respecto al papel de los datos en el trabajo real, el socio de A16Z y famoso analista Benedict Evans Does presenta una visión diferente.
Evans¿Señaló en el artículo "¿La IA fortalece a las empresas de tecnología sólidas?" que aunque el aprendizaje automático requiere una gran cantidad de datos, los datos que utiliza deben ser muy adecuados para el problema que está tratando de resolver.
General Electric tiene muchos datos de telemetría de turbinas de gas, Google tiene muchos datos de búsqueda y American Express tiene muchos datos sobre fraudes con tarjetas de crédito. Pero no se puede entrenar un modelo con datos de turbinas para detectar transacciones fraudulentas, y no se puede entrenar un modelo con datos de búsqueda web para detectar turbinas de gas que están a punto de fallar.
Cada modelo que entrenas solo puede hacer una cosa.
Esto es muy similar a oleadas anteriores de automatización: así como una lavadora sólo puede lavar ropa, no platos ni cocinar, y un programa de ajedrez no puede pagar impuestos, un sistema de traducción de aprendizaje automático no puede reconocer a un gato.
La aplicación que cree y los conjuntos de datos que necesita están fuertemente relacionados con la tarea que intenta resolver. (Aunque este es un objetivo en movimiento, las investigaciones intentan descubrir cómo hacer que los modelos de aprendizaje automático sean más fácilmente transferibles entre diferentes conjuntos de datos).
Eso significa que Google está mejorando en su calidad de Google, pero no significa que esté mejorando en otras cosas.
Algunas industrias lo harán y otras no: es necesario observar los campos verticales específicos.
Entonces, en el campo vertical, ¿pueden las empresas líderes confiar en sus ventajas de datos líderes para apoderarse de todo el mercado?
EvansDoes cree que la situación se complicará más.
Cosas como quién es el propietario de los datos, qué tan únicos son, en qué nivel son únicos y dónde está el lugar adecuado para agregarlos y analizarlos. Las respuestas a estas preguntas diferirán según las diferentes unidades de negocio, diferentes industrias y diferentes casos de uso.
Supongamos un escenario si está creando una empresa para utilizar el aprendizaje automático para resolver problemas del mundo real, entonces enfrentará dos problemas de datos básicos:
1. ¿Cómo se obtiene el primer lote de datos para entrenar su modelo y conseguir su primer cliente?
2. ¿Cuántos datos necesitas?
La segunda pregunta se puede dividir en muchas preguntas:
¿Está intentando resolver un problema con datos de menor disponibilidad? (pero disponible para muchos competidores).
¿O necesita más datos difíciles de obtener para resolver su problema?
Si es así, ¿existe algún efecto de red que podría beneficiarse de esto? ¿Un ganador obtendrá todos los datos?
¿Los productos mejoran indefinidamente con más datos o existe una curva en S?
Todo depende de la situación.
Algunos datos son exclusivos de una empresa o producto, o tienen fuertes ventajas de propiedad, como la tecnología de telemetría de turbinas de General Motors. Pero esto puede no ser de mucha utilidad al analizar las turbinas de Rolls-Royce.
Y algunos datos se pueden utilizar para casos de uso en muchas empresas e incluso en muchas industrias. Muchas startups han nacido de esto para resolver problemas comunes para muchas empresas o diferentes industrias, y los datos aquí tienen efectos de red.
Pero también hay casos en los que, pasado cierto punto, el proveedor ni siquiera necesita más datos porque el producto ya funciona.
EvansDoes cree que esta situación ya ha ocurrido en muchas empresas emergentes. Por ejemplo, la empresa de inversión de A16Z, Everlaw, desarrolla un software legal. El software puede realizar análisis de opinión en un millón de correos electrónicos, eliminando la necesidad de capacitación sobre datos de litigios específicos del cliente.
En un caso más extremo, un gran fabricante de vehículos está utilizando el entrenamiento con modelos para desarrollar un detector de pinchazos de neumáticos más preciso. Este es un modelo entrenado en base a una gran cantidad de datos de neumáticos. Pero evidentemente no es difícil obtener estos datos.
En otras palabras, la popularidad del aprendizaje automático no significa que Google se haya vuelto más poderoso, sino que una variedad de nuevas empresas pueden usar esta tecnología de vanguardia para crear una aplicación y resolver un problema más rápido que antes.
No habrá más startups de “inteligencia artificial” en el futuro, serán empresas de análisis de procesos industriales, empresas de plataformas legales o empresas de optimización de ventas.
EvansDoes comparó el aprendizaje automático con SQL (lenguaje de consulta estructurado).
En los viejos tiempos, si no usabas SQL, te quedabas atrás. Por ejemplo, un factor importante en el éxito de Wal-Mart es el uso de SQL para gestionar el inventario y la logística de manera más eficaz.
Pero hoy, cuando inicias una empresa minorista y dices "...vamos a usar SQL", eso no hace que la empresa parezca más valiosa porque SQL ya es parte de todo y luego desaparece del discurso. .
El futuro del aprendizaje automático será el mismo. ‍
¿Cómo invertir en la era de los "grandes modelos"? Al menos la lógica de Internet ya no funciona
El equipo de Shidao Investment Research cree que, independientemente de si habrá una situación en la que "el ganador se lo lleva todo", al menos la lógica de inversión de la era de Internet ya no es factible en la era de la inteligencia artificial.
La lógica central es que en la era de Internet, el "tráfico" es gratuito, lo que lleva al concepto de "efecto red": es decir, cuando el costo operativo total permanece sin cambios, cuantos más usuarios, mayor será el valor de la red. Este es el llamado "todas las industrias son aptas para rehacerlo con el pensamiento de Internet".
Sin embargo, la diferencia en la era de los modelos grandes es que la potencia informática tiene un coste. Por lo tanto, cada vez que agrega un usuario más, debe gastar potencia informática y no habrá ningún efecto de red. Esto hace que el subsidio no tenga sentido. Cuanto más usuarios nuevos tenga, menos dinero podrá ganar.
Además, los grandes modelos actuales tienen problemas como altos costos de uso, grandes retrasos en la inferencia, fugas de datos y precisión insuficiente para tareas profesionales. En comparación, también han surgido las ventajas de algunos modelos de cola larga más pequeños y especializados (ajustados + refinados).
Por lo tanto, incluso si la mayoría de las tecnologías pueden desempeñar un papel en la acumulación de riqueza, y los gigantes de la inteligencia artificial pueden efectivamente reunir una gran cantidad de riqueza, la cantidad total de riqueza será limitada debido al costo de la potencia informática y la incapacidad de ocupar todo el mercado. .