¿Es el marco AI Agent la última pieza del rompecabezas? ¿Cómo interpretar la "dualidad onda-partícula" del marco?

Autor: Kevin, el investigador de BlockBooster
 
Como pieza clave del rompecabezas para el desarrollo de la industria, el marco del Agente de IA puede contener el doble potencial de promover la implementación de tecnología y la madurez ecológica. Los marcos más discutidos en el mercado incluyen: Eliza, Rig, Swarms, ZerePy, etc. Estos marcos atraen a desarrolladores y crean reputación a través de Github Repo. Estos marcos se emiten en forma de monedas de "biblioteca", similar a cómo la luz tiene las características de ondas y partículas. El marco del Agente tiene las características de externalidades graves y Memecoin al mismo tiempo. Este artículo se centrará en explicar la "dualidad onda-partícula" del marco y por qué el marco del Agente puede convertirse en el último rincón.
Las externalidades provocadas por el marco del Agente pueden dejar brotes primaverales una vez que la burbuja amaina.
Desde el nacimiento de GOAT, el impacto de la narrativa del Agente en el mercado ha ido aumentando. Como un maestro de Kung Fu, con su puño izquierdo "Memecoin" y su palma derecha "Industry Hope", siempre serás derrotado en uno de los movimientos. . De hecho, los escenarios de aplicación de AI Agent no se distinguen estrictamente y los límites entre plataformas, marcos y aplicaciones específicas son borrosos, pero aún se pueden clasificar aproximadamente según las preferencias de tokens o protocolos. Sin embargo, según las preferencias de desarrollo de tokens o protocolos, aún se pueden dividir en las siguientes categorías:
Launchpad: plataforma de pelo de activos. Protocolo Virtuals y clanker en la cadena Base, Dasha en la cadena Solana.
Aplicación AI Agent: Es gratuita entre Agent y Memecoin, y tiene características destacadas en la configuración de la memoria, como GOAT, aixbt, etc. Estas aplicaciones generalmente tienen salida unidireccional y condiciones de entrada muy limitadas.
Motor AI Agent: grifo de la cadena Solana y Spectre AI de la cadena base. griffain puede evolucionar del modo de lectura y escritura al modo de lectura, escritura y acción; Spectre AI es un motor RAG y búsqueda en cadena.
Marco del Agente AI: para la plataforma marco, el Agente en sí es un activo, por lo que el marco del Agente es la plataforma de emisión de activos del Agente y la plataforma de lanzamiento del Agente. Los proyectos representativos actuales incluyen ai16, Zerebro, ARC y Swarms, que han sido objeto de acalorados debates en los últimos dos días.
Otras direcciones pequeñas: Agente Simmi completo; Modo de protocolo AgentFi; Agente de falsificación Seraph en tiempo real; API Agent Creator.Bid.
Al analizar más a fondo el marco del Agente, podemos ver que tiene suficientes externalidades. A diferencia de las principales cadenas y protocolos públicos, los desarrolladores solo pueden elegir entre diferentes entornos de lenguaje de desarrollo, y el número total de desarrolladores en la industria no ha mostrado un crecimiento correspondiente en el valor de mercado. Github Repo es el lugar donde los desarrolladores de Web2 y Web3 crean consenso. La comunidad de desarrolladores establecida aquí es más atractiva e influyente para los desarrolladores de Web2 que el paquete "plug and play" desarrollado por cualquier protocolo por sí solo.
Los cuatro marcos mencionados en este artículo son todos de código abierto: el marco Eliza de ai16z recibió 6200 estrellas; el marco ZerePy de Zerebro recibió 191 estrellas; el marco RIG de ARC recibió 1700 estrellas; Actualmente, el marco Eliza se usa ampliamente en varias aplicaciones de Agentes y es el marco con la cobertura más amplia. El nivel de desarrollo de ZerePy no es alto, su dirección de desarrollo es principalmente X y aún no admite LLM local ni memoria integrada. RIG es relativamente difícil de desarrollar, pero puede brindar a los desarrolladores la mayor libertad para optimizar el rendimiento. Swarms no tiene otros casos de uso aparte del equipo que lanza mcs, pero Swarms puede integrar diferentes marcos y tiene mucho espacio para la imaginación.
Además, en la clasificación anterior, el motor del Agente y el marco están separados, lo que puede causar confusión. Pero creo que hay una diferencia entre los dos. Primero, ¿por qué un motor? La analogía entre Lenovo y los motores de búsqueda de la vida real es relativamente consistente. A diferencia de las aplicaciones del Agente homogéneas, el rendimiento del motor del Agente está por encima, pero al mismo tiempo es una caja negra completamente encapsulada que se puede ajustar a través de la interfaz API. Los usuarios pueden experimentar el rendimiento del motor del Agente en forma de bifurcación, pero no pueden tener la imagen completa y la libertad de personalización como el marco básico. El motor de cada usuario es como generar una imagen en el Agente sintonizado e interactuar con la imagen. El marco es esencialmente adaptarse a la cadena, porque el objetivo final de hacer un marco de Agente en Agente es integrarse con la cadena correspondiente, cómo definir el método de interacción de datos, cómo definir el método de verificación de datos, cómo definir el bloque. tamaño y cómo equilibrar el consenso y el rendimiento, estas son cosas que los marcos deben considerar. ¿Y qué pasa con el motor? Solo necesita ajustar completamente el modelo y configurar la relación entre la interacción de datos y la memoria en una determinada dirección. El rendimiento es el único criterio de evaluación, pero el marco no.
Utilizar la perspectiva de la "dualidad onda-partícula" para evaluar el marco del Agente puede ser un requisito previo para garantizar que vaya en la dirección correcta.
En el ciclo de vida de un agente que ejecuta una entrada y una salida, se requieren tres partes. Primero, el modelo subyacente determina la profundidad y la forma de pensar, y luego la memoria es un lugar de personalización. Una vez que el modelo básico tiene salida, se modifica en función de la memoria y, finalmente, la operación de salida se completa en diferentes clientes.
Fuente: @SuhailKakar
Para demostrar que el marco del Agente tiene "dualidad onda-partícula", "onda" tiene las características de "Memecoin", que representa la cultura comunitaria y la actividad de los desarrolladores, enfatizando el atractivo y la capacidad de comunicación del "grano" del Agente; "Expectativas", que representan el rendimiento subyacente, casos de uso práctico y profundidad técnica. Ilustraré los tutoriales de desarrollo desde dos aspectos combinando los tres marcos como ejemplos:
Marco Eliza de montaje rápido
Configurar el entorno
Fuente: @SuhailKakar
Instalar Eliza
Fuente: @SuhailKakar
3. Archivo de configuración
Fuente: @SuhailKakar
4.Establecer personalidad del agente
Fuente: @SuhailKakar
El marco de Eliza es relativamente fácil de usar. Está basado en TypeScript, un lenguaje con el que la mayoría de los desarrolladores web y web3 están familiarizados. El marco es conciso y no demasiado abstracto, lo que permite a los desarrolladores agregar fácilmente las funciones que deseen. En el paso 3, puede ver que Eliza se puede integrar con múltiples clientes y puede entenderlo como un ensamblador para la integración de múltiples clientes. Eliza soporta plataformas como DC, TG y
Debido a la simplicidad del marco y la riqueza de las interfaces, Eliza ha reducido considerablemente el umbral de acceso y ha logrado estándares de interfaz relativamente unificados.
Marco ZerePy con un clic
1.Bifurcación de la biblioteca ZerePy
Fuente: https://replit.com/@blormdev/ZerePy?v=1
2. Configurar X y GPT
Fuente: https://replit.com/@blormdev/ZerePy?v=1
3.Establecer personalidad del agente
Fuente: https://replit.com/@blormdev/ZerePy?v=1
Marco Rig de rendimiento optimizado
Tomemos como ejemplo la creación de un agente RAG (generación mejorada de recuperación):
1. Configurar el entorno y la clave OpenAI
Fuente: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
2. Configure el cliente OpenAI y use Chunking para el procesamiento de PDF
Fuente: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
3. Configurar la estructura e incrustación del documento.
Fuente: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
4. Cree almacenamiento de vectores y agente RAG.
Fuente: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig (ARC) es un marco de construcción de sistemas de IA basado en el lenguaje Rust para motores de flujo de trabajo LLM. Resuelve problemas de optimización del rendimiento de nivel inferior. En otras palabras, ARC es una "caja de herramientas" del motor de IA que proporciona llamadas de IA y optimización del rendimiento. almacenamiento de datos, manejo de excepciones y otros servicios de soporte en segundo plano.
Lo que Rig quiere resolver es el problema de las "llamadas" para ayudar a los desarrolladores a elegir mejor LLM, optimizar mejor las palabras clave, administrar tokens de manera más efectiva y cómo manejar el procesamiento concurrente, administrar recursos, reducir la latencia, etc. Su enfoque está en la IA. ​Modelo LLM Cómo "hacer un buen uso de él" al colaborar con el sistema AI Agent.
Rig es una biblioteca Rust de código abierto diseñada para simplificar el desarrollo de aplicaciones basadas en LLM, incluidos RAG Agents. Debido a que Rig es más abierto, tiene mayores requisitos para los desarrolladores y una mayor comprensión de Rust y Agent. El tutorial aquí es el proceso de configuración del agente RAG más básico. RAG mejora LLM al combinar LLM con la recuperación de conocimientos externos. En otras DEMOs del sitio web oficial, puedes ver que Rig tiene las siguientes características:
Interfaz LLM unificada: admite API consistentes de diferentes proveedores de LLM para simplificar la integración.
Flujo de trabajo abstracto: los componentes modulares prediseñados permiten a Rig emprender el diseño de sistemas complejos de IA.
Almacenamiento vectorial integrado: soporte integrado para almacenamiento de categorías, que proporciona un rendimiento eficiente en agentes de búsqueda similares como RAG Agent.
Incrustación flexible: proporciona una API fácil de usar para procesar la incrustación, lo que reduce la dificultad de la comprensión semántica al desarrollar agentes de búsqueda similares como RAG Agent.
Se puede ver que, en comparación con Eliza, Rig proporciona a los desarrolladores espacio adicional para la optimización del rendimiento, lo que ayuda a los desarrolladores a depurar mejor las llamadas de LLM y Agent y la optimización colaborativa. Rig ofrece rendimiento impulsado por Rust, aprovechando las abstracciones de costo cero y las operaciones LLM de baja latencia, alto rendimiento y seguridad de memoria de Rust. Puede proporcionar un mayor grado de libertad en el nivel subyacente.
Descomponiendo el marco combinado de Swarms
Swarms tiene como objetivo proporcionar un marco de orquestación de múltiples agentes a nivel empresarial. El sitio web oficial proporciona docenas de flujos de trabajo y arquitecturas en serie y paralelas de agentes.
Flujo de trabajo secuencial
Fuente: https://docs.swarms.world
La arquitectura Sequential Swarm procesa tareas en una secuencia lineal. Cada Agente completa su tarea antes de pasar los resultados al siguiente Agente de la cadena. Esta arquitectura garantiza un procesamiento ordenado y es útil cuando las tareas tienen dependencias.
Caso de uso:
Cada paso de un flujo de trabajo depende del paso anterior, como una línea de montaje o un procesamiento de datos secuencial.
Escenarios que requieren seguir estrictamente el orden de las operaciones.
Arquitectura jerárquica:
Fuente: https://docs.swarms.world
Para lograr un control de arriba hacia abajo, el Agente superior coordina las tareas entre los Agentes subordinados. Los agentes realizan tareas simultáneamente y luego introducen sus resultados en el bucle para su agregación final. Esto es útil para tareas altamente paralelizables.
Arquitectura de formato de hoja de cálculo:
Fuente: https://docs.swarms.world
Arquitectura de enjambre a gran escala para gestionar múltiples agentes que trabajan simultáneamente. Se pueden gestionar miles de agentes simultáneamente, cada uno ejecutándose en su propio hilo. Es ideal para supervisar la producción de agentes a gran escala.
Swarms no es solo un marco de Agente, también es compatible con los marcos Eliza, ZerePy y Rig mencionados anteriormente. Con una idea modular, maximiza el rendimiento del Agente en diferentes flujos de trabajo y arquitecturas para resolver los problemas correspondientes. El concepto de Swarms y el progreso de la comunidad de desarrolladores están bien.
Eliza: La más fácil de usar, adecuada para principiantes y creación rápida de prototipos, especialmente adecuada para la interacción de IA en plataformas de redes sociales. El marco es simple, fácil de integrar y modificar rápidamente, y es adecuado para escenarios que no requieren una optimización excesiva del rendimiento.
ZerePy: implementación con un solo clic, adecuada para el desarrollo rápido de aplicaciones AI Agent para Web3 y plataformas sociales. Adecuado para aplicaciones de IA livianas, con un marco simple y configuración flexible, adecuado para una construcción e iteración rápidas.
Rig: se centra en la optimización del rendimiento, especialmente en tareas de alta concurrencia y alto rendimiento, y es adecuado para desarrolladores que requieren control y optimización detallados. El marco es relativamente complejo y requiere cierto conocimiento de Rust, lo que lo hace adecuado para desarrolladores más experimentados.
Swarms: adecuado para aplicaciones de nivel empresarial, que admite la colaboración entre múltiples agentes y la gestión de tareas complejas. El marco es flexible, admite procesamiento paralelo masivo y ofrece múltiples configuraciones arquitectónicas, pero debido a su complejidad, puede requerir una formación técnica más sólida para una aplicación eficaz.
En general, Eliza y ZerePy tienen ventajas en cuanto a facilidad de uso y rápido desarrollo, mientras que Rig y Swarms son más adecuados para desarrolladores profesionales o aplicaciones empresariales que requieren alto rendimiento y procesamiento a gran escala.
Es por eso que el marco del Agente tiene la característica de "esperanza de la industria". El marco anterior aún se encuentra en sus primeras etapas y la máxima prioridad es aprovechar la ventaja del primero en actuar y establecer una comunidad de desarrolladores activa. El rendimiento del marco en sí y si va por detrás de las aplicaciones Web2 populares no son las principales contradicciones. En última instancia, solo los marcos con una afluencia continua de desarrolladores pueden ganar, porque la industria Web3 siempre necesita atraer la atención del mercado, sin importar cuán fuerte sea el desempeño del marco y cuán sólidos sean los fundamentos, si es difícil comenzar y no. si a uno le importa, pondrá el carro delante del caballo. Partiendo de la premisa de que el marco en sí puede atraer desarrolladores, se destacarán los marcos con modelos económicos simbólicos más maduros y completos.
El marco del Agente tiene la función "Memecoin", que es muy fácil de entender. Ninguno de los tokens de marco mencionados anteriormente tiene un diseño económico de tokens razonable. Los tokens no tienen casos de uso o casos de uso muy únicos. No existe un modelo de negocio probado y no existe un volante de token efectivo. no hay conexión entre este y los tokens, una combinación orgánica completa, el crecimiento del precio del token es difícil de obtener apoyo fundamental excepto FOMO, y no hay suficiente foso para garantizar un crecimiento de valor estable y duradero. Al mismo tiempo, el marco mencionado anteriormente parece relativamente tosco y su valor real no coincide con el valor de mercado actual, por lo que tiene fuertes características de "Memecoin".
Vale la pena señalar que la "dualidad onda-partícula" del marco del Agente no es una deficiencia y no puede entenderse aproximadamente como una botella de agua medio vacía que no es ni un Memecoin puro ni un caso de uso simbólico. Como mencioné en mi artículo anterior: el agente liviano está cubierto por el velo ambiguo de Memecoin, la cultura y los fundamentos de la comunidad ya no serán contradictorios, y gradualmente está surgiendo un nuevo camino de desarrollo de activos, aunque hay burbujas e incertidumbres en las primeras etapas de Agent; el marco, pero no se puede ignorar su potencial para atraer desarrolladores y promover la implementación de aplicaciones. En el futuro, un marco con un modelo económico de tokens completo y un ecosistema de desarrolladores sólido puede convertirse en un pilar clave de esta vía.
 
Acerca de BlockBooster: BlockBooster es un estudio asiático de capital de riesgo Web3 respaldado por OKX Ventures y otras instituciones importantes, comprometido a convertirse en un socio confiable para emprendedores destacados. A través de inversiones estratégicas e incubación en profundidad, conectamos proyectos Web3 con el mundo real y ayudamos a crecer proyectos empresariales de alta calidad.
Descargo de responsabilidad: este artículo/blog es solo de referencia y representa las opiniones personales del autor y no representa la posición de BlockBooster. Este artículo no pretende proporcionar: (i) asesoramiento de inversión o recomendaciones de inversión; (ii) una oferta o solicitud para comprar, vender o mantener activos digitales o (iii) asesoramiento financiero, contable, legal o fiscal; Mantener activos digitales, incluidas monedas estables y NFT, es extremadamente riesgoso, con grandes fluctuaciones de precios, e incluso puede perder valor. Debe considerar cuidadosamente si comerciar o mantener activos digitales es adecuado para usted en función de su propia situación financiera. Consulte a su asesor legal, fiscal o de inversiones si tiene preguntas sobre su situación específica. La información proporcionada en este documento (incluidos datos y estadísticas de mercado, si corresponde) se proporciona únicamente para información general. Se ha tenido un cuidado razonable en la preparación de estos datos y gráficos, pero no se acepta ninguna responsabilidad por los errores u omisiones fácticos expresados ​​en ellos.