Fuente de la reimpresión del artículo: AIGC
Fuente original: Soporte de silicona
Autor | Luo Yihang

Fuente de la imagen: Generada por Unbounded AI
Este es el primer modelo de lenguaje grande que he experimentado desarrollado de forma independiente por un fabricante de teléfonos inteligentes: el "Blue Heart Little V" lanzado por vivo basado en el modelo grande de Blue Heart. Como "gran modelo Shennong", me recordaré a mí mismo que debo "reducir mis expectativas" antes de probar cualquier servicio modelo recientemente, especialmente para demostraciones cuyos videos son demasiado interesantes. Pero en cuanto al modelo de gran corazón azul, mi sensación es la siguiente: está en línea con las expectativas. No es genial, pero es funcional.
Como modelo de lenguaje grande lanzado por los fabricantes de teléfonos inteligentes, la gente generalmente piensa que no será demasiado grande, tendrá parámetros bajos, el efecto de aparición puede no ser muy bueno y habrá errores en la comprensión de algunos textos e intenciones complejos. Pero la experiencia que obtuve del Blue Heart Model es lo contrario: muestra una gran capacidad de razonamiento en la creación y el resumen, que puede alcanzar más de 80 puntos. Por el contrario, su desempeño en la búsqueda básica de imágenes y la escritura regular es promedio.
Debe saber que el modelo de corazón azul actualmente instalado en los teléfonos móviles de la serie vivo X100 es un modelo de doble uso para escenarios del lado del dispositivo y nubes especialmente diseñado para teléfonos móviles. Es mucho menos "grande" que un modelo grande con cientos de. miles de millones de parámetros. Pero cuando le entregué un artículo sobre si el fenómeno de aparición de modelos grandes realmente existe, encontré con mucha precisión el argumento más crítico y central: la aparición de capacidades de aparición de modelos grandes es una métrica elegida por los investigadores en lugar del resultado de la expansión de las capacidades del modelo, por lo que no se trata de un verdadero "surgimiento de inteligencia".

Esto realmente me dejó alucinado. Debido a que "leer documentos" es una tarea algo difícil para modelos de lenguaje grandes, no todos los modelos pueden leerlos bien. Por ejemplo, la capacidad de ChatGPT para leer archivos PDF largos y complejos ha experimentado recientemente una degradación alarmante, especialmente en su capacidad para resumir. Pero el Blue Heart Little V del Blue Heart Big Model puede encontrar el argumento más crítico de inmediato. Vale la pena mencionar que durante la prueba, verifiqué específicamente la función de "resumen local", que utilizó completamente la potencia informática de la máquina vivo X100 (MediaTek Dimensity 9300) y las capacidades de razonamiento para resumir. En esta medida, rompe la percepción inherente de que. "Los grandes modelos deben ser grandes".
Luego, descubrí un fenómeno más interesante: cuando subes un artículo más largo al Modelo del Corazón Azul, aún puedes extraer las ideas y hallazgos más críticos e importantes, pero la narrativa extendida a menudo consta de algunas oraciones descuidadas. Eso es todo, "es. Es bueno leerlo sin pedir una explicación profunda". Contrasta con otros grandes modelos de Chat Bots en términos de capacidades de comprensión lectora: muchos modelos son buenos para desmantelar información, pero no lo suficiente para refinarla y resumirla. El gran modelo de corazón azul está resumido y refinado con extrema precisión, pero no está dispuesto a desmontarlo y leerlo detenidamente, y no está dispuesto a desperdiciar fichas en cuestiones explicativas. Esto debería estar estrechamente relacionado con el tamaño del modelo.

En términos de búsqueda de fotografías locales e imágenes en el teléfono móvil, la velocidad de respuesta del modelo Blue Heart es tan fluida como la seda. Por ejemplo, todas las "fotos sobre la Ciudad Prohibida" almacenadas localmente en el teléfono móvil se pueden encontrar en uno. segundo. En cuanto a redacción de guías de viaje y otros aspectos, su rendimiento es bastante satisfactorio. En términos de creación de imágenes, sus pinturas de la Ciudad Prohibida, Beef Ramen y Spicy Hotpot están cerca del nivel de DALL-E de ChatGPT, pero no es tan rico en imaginación como ChatGPT y no puede dibujar particularmente loco e imaginativo. fotos. Sin embargo, cuando le pedí que dibujara "una IA que pensara profundamente en el futuro de la humanidad", en realidad me dio una imagen con una concepción tan artística.

Además, es destacable la capacidad del modelo del corazón azul para controlar la APP mediante un diálogo natural. Le digo que quiero pedir comida para llevar de Mala Xiangguo y le dirá que Meituan no está instalado en este nuevo teléfono. Después de aceptar su instalación, descargará automáticamente la aplicación Meituan de la tienda de aplicaciones. Luego, te ayudaré a abrir la página llena de "Spicy Hotpot". Por supuesto, puedes pensar que Siri de Apple también puede hacerlo, porque como aplicación de nivel asistente en la parte inferior del sistema, es fácil acceder a los permisos en este teléfono. Pero la diferencia es que Siri solo puede aceptar instrucciones muy claras para abrir qué aplicación es incapaz de enfrentar una demanda general de lenguaje natural. Es un módulo de voz inteligente integrado, pero Lanxin Xiao V está en el Lanxin Big Model. Bendición, ya es un copiloto con capacidades de comprensión del lenguaje natural.
En resumen, después de ajustar varias funciones clave, tendrá una dirección y un juicio más seguros, es decir, el modelo grande final está establecido y es confiable. Además, para que el modelo del lado del cliente a gran escala o incluso todo el modelo de lenguaje a gran escala se implemente en miles de hogares y en todos los seres vivos, es posible que aún tenga que confiar en los fabricantes de teléfonos móviles, le guste o no.
Hasta cierto punto, el modelo grande adaptado a teléfonos móviles está más cerca del "modelo de lenguaje pequeño" que Microsoft enfatizó recientemente. Sus parámetros generalmente no pueden exceder los 10 mil millones, de lo contrario la memoria del teléfono móvil no puede funcionar, lo que también significa que puede. solo realice aspectos específicos del entrenamiento, o entrene un modelo a un cierto nivel de salida y luego deténgalo. Para la mayoría de la gente, esto es suficiente. Mistral AI, una startup parisina que se ha vuelto popular recientemente, es una empresa modelo tan pequeña.
A juzgar por los parámetros anunciados por el Blue Heart Large Model, el modelo grande basado en la nube de 170 mil millones de parámetros se utiliza para destilar y entrenar modelos de bajo nivel de parámetros, lo que da como resultado un modelo de 7 mil millones de parámetros. Tanto en el lado de la nube como en el lado del teléfono móvil, el cálculo y el razonamiento del modelo de mil millones de parámetros están solo en el lado del dispositivo. Esto es lo que Qualcomm, MediaTek, Intel y AMD intentan y modifican constantemente para deshacerse de la maldición de Nvidia. Si los modelos no están conectados a teléfonos móviles y ordenadores, no tienen ninguna posibilidad. Sin embargo, los modelos que se pueden insertar en teléfonos móviles y PC a menudo no son lo suficientemente grandes y son modelos pequeños.
Los modelos pequeños tienen las ventajas de los modelos pequeños: solo se enfocan en hacer algunas cosas bien, no generan información ni código extensos, tienen algunos aspectos destacados, pero son promedio en otros aspectos. Por ejemplo, la escritura de código de Mistral AI es mejor que la de ChatGPT. Otro ejemplo es el modelo Blue Heart, que es más preciso que otros modelos a la hora de refinar y procesar documentos locales, y es más eficiente a la hora de gestionar documentos y agendas en teléfonos móviles personales. También se encuentran disponibles otros dibujos, escrituras y búsquedas, pero no son sobresalientes. ¿Y qué?
Cuando China discute actualmente el futuro de la inteligencia artificial generativa, se produce un fenómeno extraño: quienes la mantienen en alto y la golpean alto no bajan al suelo, y quienes se ponen a vivir no tienen ningún interés en la IA. La mayoría de las personas nunca han usado ChatGPT. Es posible que hayan oído hablar de Wenxinyiyan, Tongyi Qianwen y ChatGLM y los hayan usado ocasionalmente, pero no ven ningún cambio esencial en estas cosas para ellos. En cuanto a estos jugadores que están obsesionados con los parámetros de modelos grandes, la escala y los resultados de las evaluaciones comparativas, todos sus resultados se publican en Hugging Face y GitHub. Casi nunca promocionan a la gente común y no tienen ningún interés en la gente común. Los desarrolladores y usuarios de IA son mutuamente indiferentes y es posible que esta situación no cambie en el corto plazo.
Pero si los fabricantes de teléfonos inteligentes fabrican modelos lingüísticos más grandes, la cosa puede ser diferente. La razón principal es: los usuarios tienen sentimientos. Cuando el modelo grande está integrado en la capa inferior del sistema operativo, puede evocar, ayudar y llamar funciones en cualquier momento, al igual que el modelo grande del corazón azul en Origin OS4, los usuarios lo necesitarán involuntariamente, necesitarán su ayuda y probarán. su potencial. Incluso necesita su compañía. Puede que no sea un modelo grande universal, puede que sea un modelo pequeño, pero comprende a sus usuarios, está familiarizado con los datos del dispositivo, comprende los hábitos del usuario, protege la privacidad del usuario y puede ayudar a programar, abrir menús para llevar y resumir documentos. Simplemente elija fotografías y complete algunos escritos básicos, y será una IA que será "suficiente" y "confiable" para la mayoría de las personas.
La promoción de la popularización de grandes modelos de lenguaje ciertamente no se logrará mediante la programación de IA, ni los avances tecnológicos que actualicen las evaluaciones SOTA podrán beneficiar a la mayoría de la humanidad. Así como no sabes si un zapato te queda bien o no hasta que te lo pones, no sabes si un modelo te queda bien o no hasta que lo usas. He estado "des-ChatGPT" conscientemente estos días: confío en Kimi Chat para leer artículos y documentos, confío en Wen Xinyiyan y ChatGLM para el trabajo de escritorio y confío en el modelo vivo Blue Heart como mi asistente personal, sin ninguna otra razón. que "en forma". No esperas que alcance completamente a ChatGPT, pero realmente necesito un “modelo grande” o un “modelo pequeño” que pueda usarse en teléfonos móviles, proteja la privacidad personal y la seguridad de los datos y tenga puntuaciones promedio decentes.
Los modelos de lenguaje grandes son para que los use la gente, no para alardear.
