Recientemente, el sitio web de consulta de datos cifrados Dune anunció que actualizó su hoja de ruta LLM (modelo de lenguaje grande, modelo de lenguaje grande), lanzó la función de explicaciones de consulta compatible con GPT-4 en la primera fase y agregará gradualmente más funciones en el futuro. , como consultas en lenguaje natural (consultas en lenguaje natural), escape de declaraciones SQL (traducciones de consultas) y búsqueda optimizada, etc.

A diferencia de otros sitios web de análisis de datos que utilizan rutas de comercialización de consultas pagas, Dune siempre ha sido gratuito y abierto a los usuarios comunes después de su lanzamiento. Por lo tanto, ha acumulado una cantidad suficiente de usuarios durante el último ciclo del mercado alcista y se espera la incorporación de LLM. para acumular más datos, las declaraciones de consulta y los carteles se transforman en funciones realmente espectaculares, y se guía a los usuarios comunes para que se unan a las filas de los creadores.

División de consultas de datos de Dune

Gracias a la apertura y transparencia de los datos de blockchain, cualquiera puede acceder directamente a los datos de blockchain, pero los datos sin procesar (Raw Data) a menudo son difíciles de identificar y es difícil para los programadores no profesionales comprender su significado, pero los datos que contienen. Contiene un enorme valor económico, por lo que han surgido varias herramientas de análisis de datos para proporcionar acceso indirecto y herramientas de análisis en profundidad para diversos analistas, investigadores e inversores minoristas comunes.

Dune es el más llamativo de ellos porque proporciona una herramienta de análisis poderosa y verdaderamente gratuita. Cualquiera puede consultar, compartir y mostrar datos a través de declaraciones SQL. Algunos proyectos incluso eligen directamente Dune como la plataforma oficial de visualización de información.

Sin embargo, la función de consulta SQL de Dune parece ser un modelo UGC, que otorga a todos los usuarios los mismos derechos para realizar tareas de consulta. Sin embargo, de hecho, el modelo SQL adoptado por Dune tiene dos problemas. Uno es que el umbral es demasiado alto y SQL. es (estructurado) la abreviatura de lenguaje de consulta estructurado), por ejemplo, consultar el número de pares comerciales DAI en Uniswap solo requiere 5 líneas de código para completarse. Sin embargo, una vez que la lógica de ejecución de la consulta se vuelve compleja, la cantidad de código puede aumentar significativamente, lo que dificulta que los programadores no profesionales lo escriban por sí mismos. Esto hace que una gran cantidad de usuarios se conviertan en simples espectadores.

Por ejemplo, el proceso de consulta oficial simplificado "nft.trades" contiene casi 200.000 líneas de conversión de declaraciones SQL, 100.000 líneas de código de prueba y en él participan 55 miembros de la comunidad. Un solo usuario no puede manejar una consulta a tan gran escala.

La segunda es que los estándares SQL admitidos entre las versiones V1 y V2 de Dune no están unificados. V1 y V2 usan PostgreSQL y Spark SQL respectivamente, y los planes posteriores están unificados por Dune SQL.

Antes de esta actualización de la función LLM, Dune ya estaba preparando un motor de consultas unificado y planeaba migrar todo a Dune SQL después de julio de este año para garantizar la unidad de la lógica del producto. El Dune SQL actualizado se basa en la implementación del motor de consulta de código abierto Trino. Dune lo optimiza para adaptarse a las propias necesidades de Dune. No hay ninguna diferencia esencial con el popular Spark SQL, pero mejora más en funciones y sintaxis específicas. Por ejemplo, Dune SQL proporciona más operadores para facilitar el cálculo rápido de fechas y horas, así como restricciones en los permisos de administración. Todas las operaciones que implican la eliminación y actualización de los datos originales en sí no se pueden realizar para garantizar la seguridad de los datos.

Sin embargo, el problema del alto umbral de consulta SQL no se puede resolver cambiando el paradigma SQL. Esto significa que la mayoría de los usuarios y programadores tienen que adaptarse al nuevo formato de sintaxis. Por ejemplo, para declaraciones de consulta específicas, los nuevos usuarios y programadores tienen que adaptarse. El nuevo formato de sintaxis. Para adaptarse. La demanda de herramientas de automatización no sólo tiene importancia práctica para los usuarios comunes, sino también de gran beneficio para los programadores que no están familiarizados con la nueva sintaxis.

De hecho, en la hoja de ruta de migración de Dune SQL, Dune ya está intentando experimentar con herramientas de automatización que pueden convertir de manera uniforme diferentes formatos de sintaxis en declaraciones de Dune SQL. Después de que GPT-4 use LLM para mostrar el poder de la interacción persona-computadora, Dune también Toma. Aprovecha la tendencia y lanza tu propio plan LLM.

LLM: Liberando el sentido de participación de los usuarios comunes

El proceso típico de Dune es deconstruir los datos en la cadena, los usuarios profesionales ejecutan consultas a través de SQL y luego comparten el Panel con los usuarios que lo necesitan. En este proceso, lo más crítico es ejecutar la consulta y la mayoría de los usuarios no pueden utilizar la función de consulta por falta de conocimiento del código.

Después de la introducción de la función de explicación de la consulta, el proceso anterior se ha sometido a algunos ajustes. En la interfaz de consulta SQL escrita por usuarios profesionales, aparecerá una página de explicación que le indica intuitivamente al usuario la función específica del código en un lenguaje natural. formato, que equivale a agregar una consulta SQL. El parche explicado no cambiará el flujo de trabajo actual. Esta es también la lección que aprendió el equipo al fusionar declaraciones SQL, que es reducir la interferencia con los hábitos existentes de los usuarios y optimizar la experiencia tanto como sea posible. posible en el proceso existente.

Después de que LLM se unió, la diferencia de capacidades entre los usuarios profesionales y los usuarios comunes se borró hasta cierto punto. Con la ayuda de la capacidad de GPT-4 para comprender códigos, los usuarios comunes pueden comprender intuitivamente la función de las declaraciones de consulta sin dominar el conocimiento de SQL. Antes de la introducción de esta función, los usuarios solo podían leer gráficos de forma pasiva en la página del panel. Sin embargo, después de la introducción de la función de explicación de consultas, los usuarios comunes también pueden comprender el significado específico del código SQL.

Por ejemplo, si Alice quiere consultar información sobre las transacciones de LayerZero, puede encontrar directamente el panel de Dune que Bob ha creado. Se puede encontrar que el 49,4% de los usuarios se concentran en 1 vez. Entonces Alice tiene motivos para inferir que esto es para. potencial estímulo económico. Se llevó a cabo la transacción falsa, pero la conclusión no se pudo finalizar, por lo que Alice decidió leer el código para verificar si la conclusión era confiable.

Sin embargo, Alice descubrió que aunque el resultado solo tenía 5 filas de datos, el código de consulta tenía 150 filas completas. El nivel SQL de Alice no era suficiente para confirmar la exactitud de cada declaración. En este momento, la función de explicación de la consulta se "traduciría". las instrucciones específicas del código, como Como se muestra en la figura, la consulta se divide en 3 partes: los datos recopilados cubren múltiples cadenas como Arbitrum, Avalanche, BNB, Ethereum, Optimism, Polygon y Fantom, y la segunda parte es para calcular el número de transacciones para cada usuario ("remitente"). El tercer paso es establecer umbrales de cantidad para clasificar a los usuarios: 1 Tx', '2 ~ 5 Tx', '5 ~ 10 Tx', '10 ~ 20 Tx' y '>= 20 Tx'.

Entonces, en este momento, Alice puede analizar y juzgar sin comprender el significado del código escrito por Bob. En esencia, la función de explicación de consultas es equivalente a escapar y traducir entre código y humanos. A su vez, el lenguaje humano también se puede traducir a declaraciones SQL, gracias a la enorme cantidad de datos acumulados por Dune. Los datos del estado de cuenta no son difíciles de lograr.

Las consultas en lenguaje natural son una dirección importante para las mejoras posteriores del LLM de Dune. Las consultas en lenguaje natural permiten a los usuarios realizar tareas de generación de gráficos transmitiendo instrucciones, lo que está más en línea con la forma de pensar de la gente común que el uso de declaraciones SQL, generación de arrastre y otros modos, y elimina la necesidad de prestar atención a los detalles de implementación.

Además, la consulta en lenguaje natural no es una función de reemplazo para usuarios profesionales como los analistas, sino un complemento. El Dune existente tiene casi 700.000 gráficos. Una parte considerable de las tareas de análisis se superponen y son conflictivas, y el uso de consultas en lenguaje natural también ayuda. el sistema comprende la correlación entre gráficos, mejorando así aún más la eficiencia de todo el trabajo de análisis.

Después de que LLM se una, los gráficos, SpellBook y los datos de documentos existentes también se reintegrarán. Siguiendo el chatbot de OpenAI, Dune también desarrollará robots conversacionales para ayudar a los usuarios a comprender y utilizar los sistemas de conocimiento existentes de una manera más fácil sin la necesidad de interferencia de información irrelevante.

Por ejemplo, Alice puede revertir la consulta anterior sobre la distribución del volumen de transacciones de usuarios de LayerZero. Primero emita el comando de consulta en inglés y explique el flujo de trabajo de cada paso. Luego, Dune ayudará a Alice a escribir 150 líneas de código y luego generará un gráfico.

Conclusión: todo el mundo puede ser analista de datos

El objetivo de Dune no es construir una plataforma pura de análisis de datos en cadena, sino crear un canal de datos que permita que la información fluya libremente, permitiendo a los usuarios capturar, transformar, administrar, consultar, visualizar y utilizar datos para tomar medidas.

La premisa del flujo de datos es que debe modularizarse y puede combinarse y configurarse arbitrariamente y, en última instancia, construir un conjunto de datos compartido por la comunidad, en lugar de concentrarse en declaraciones SQL complejas o API pagas, y, en última instancia, lograr los mismos derechos para que todos interactúen. con datos.

En resumen, el plan LLM de Dune es una "traducción" y un asistente. El objetivo es permitir que los usuarios comunes comprendan todo lo que representan los datos. No es solo la visualización de los resultados finales, sino que también profundiza en el proceso de generación. todos pueden realizarlo. Análisis de datos en cadena.