Недавно веб-сайт запроса зашифрованных данных Dune объявил, что он обновил свою дорожную карту LLM (Большая языковая модель, Большая языковая модель), запустив на первом этапе функцию «Пояснения запросов», поддерживаемую GPT-4, и постепенно будет добавлять больше функций в будущем. , такие как запросы на естественном языке (запросы на естественном языке), экранирование операторов SQL (переводы запросов), оптимизированный поиск и т. д.
В отличие от других веб-сайтов анализа данных, которые используют пути коммерциализации платных запросов, Dune всегда была бесплатной и открытой для обычных пользователей после своего запуска. Таким образом, во время последнего бычьего рыночного цикла она накопила достаточное количество пользователей, и ожидается добавление LLM. для накопления большего количества данных. Запросы и рекламные щиты превращаются в настоящие убийственные функции, а обычным пользователям предлагается присоединиться к рядам создателей.
Пробел в запросах данных Dune
Благодаря открытости и прозрачности данных блокчейна любой может получить прямой доступ к данным блокчейна, но необработанные данные часто трудно идентифицировать, и непрофессиональным программистам сложно понять их значение. Однако данные на них содержат огромную экономическую ценность, поэтому появились различные инструменты анализа данных, чтобы обеспечить косвенный доступ и инструменты глубокого анализа для различных аналитиков, исследователей и обычных розничных инвесторов.
Dune — самый привлекательный, потому что он предоставляет действительно бесплатный и мощный инструмент анализа. Любой может запрашивать, делиться и отображать данные с помощью операторов SQL. Некоторые проекты даже напрямую выбирают Dune в качестве своей официальной платформы отображения информации.
Однако функция SQL-запроса Dune, по-видимому, является моделью UGC, которая дает каждому пользователю равные права на выполнение задач запроса. Но на самом деле модель SQL, принятая Dune, имеет две проблемы. Одна из них заключается в том, что порог слишком высок. SQL — это аббревиатура Structured Query Language. Например, чтобы запросить количество DAI как торговую пару на Uniswap, требуется всего 5 строк кода. Однако как только логика выполнения запроса становится сложной, объем кода может значительно возрасти, и непрофессиональным программистам становится сложно писать его самостоятельно, что приводит к тому, что за процессом вынуждено наблюдать большое количество пользователей.
Например, официальный упрощенный процесс запроса "nft.trades" включает в себя около 200 000 строк преобразования SQL-выражений, 100 000 строк тестового кода и участие 55 членов сообщества. Один пользователь не может справиться с такой масштабной задачей.
Во-вторых, стандарты SQL, поддерживаемые Dune V1 и V2, не унифицированы. V1 и V2 используют PostgreSQL и Spark SQL соответственно, и Dune SQL планирует унифицировать их в будущем.
Перед обновлением функции LLM компания Dune уже готовила унифицированный механизм запросов и планировала перенести его полностью на Dune SQL после июля этого года, чтобы обеспечить единообразие логики продукта. Обновленный Dune SQL основан на открытом исходном коде движка запросов Trino. Dune оптимизирует его под свои нужды. Он не имеет существенных отличий от популярного Spark SQL, и есть больше улучшений в конкретных функциях и синтаксисе. Например, Dune SQL предоставляет больше операторов для облегчения быстрых вычислений дат и времени и ограничивает разрешения на управление. Все операции, включающие удаление, обновление и т. д. исходных данных, не могут быть выполнены для обеспечения безопасности данных.
Однако проблема высокого порога SQL-запроса все еще не может быть решена путем изменения парадигмы SQL, что означает, что большинству пользователей и программистов придется адаптироваться к новому формату синтаксиса. Например, новым пользователям и программистам придется адаптироваться к определенным операторам запроса. Потребность в автоматизированных инструментах имеет не только практическое значение для обычных пользователей, но и большую выгоду для программистов, не знакомых с новым синтаксисом.
Фактически, в дорожной карте миграции Dune SQL Dune пытается экспериментальные инструменты автоматизации, которые могут единообразно преобразовывать различные форматы синтаксиса в операторы Dune SQL. После того, как GPT-4 использовал LLM для демонстрации своей мощи во взаимодействии человека и компьютера, Dune также запустила свой собственный план LLM.
LLM: Раскрытие возможностей участия обычных пользователей
Типичный процесс Dune заключается в деконструкции данных в цепочке, профессиональные пользователи выполняют запросы через SQL, а затем предоставляют панель управления нуждающимся пользователям. Наиболее важной частью этого процесса является выполнение запроса, но большинство пользователей не могут использовать функцию запроса из-за отсутствия у них знаний в области кодирования.
После введения функции объяснения запроса, вышеописанный процесс подвергся некоторой тонкой настройке. В интерфейсе SQL-запроса, написанном профессиональными пользователями, появится страница объяснения, которая интуитивно сообщит пользователю конкретную функцию кода в формате естественного языка. Это эквивалентно добавлению патча объяснения к SQL-запросу и не изменит текущий рабочий процесс. Это также урок, который команда усвоила при слиянии операторов SQL, то есть, чтобы уменьшить вмешательство в существующие привычки пользователей и максимально оптимизировать опыт в существующем процессе.
После введения степени магистра права (LLM) различия в способностях между профессиональными и обычными пользователями были в определенной степени устранены. Благодаря способности GPT-4 понимать код обычные пользователи могут интуитивно понимать роль операторов запросов, не обладая при этом знаниями SQL. До внедрения этой функции пользователи могли только пассивно читать диаграммы на странице панели мониторинга. После внедрения функции объяснения запроса обычные пользователи также могут понимать конкретное значение кода SQL.
Например, если Алиса хочет запросить соответствующую информацию о транзакциях LayerZero, она может напрямую найти панель инструментов Dune, созданную Бобом, и обнаружить, что 49,4% пользователей сосредоточены в одной транзакции. Тогда у Алисы есть основания сделать вывод, что это ложная транзакция для потенциального экономического стимулирования, но она не может сделать окончательный вывод. Поэтому Алиса решает просмотреть код, чтобы проверить, является ли вывод надежным.
Однако Алиса обнаружила, что, хотя результат содержал всего 5 строк данных, код запроса был длиной в 150 строк. Уровня SQL Алисы было недостаточно, чтобы подтвердить правильность каждого оператора. В это время функция объяснения запроса «переводила» конкретные инструкции кода. Как показано на рисунке, запрос разделен на 3 части: собранные данные охватывают несколько цепочек, таких как Arbitrum, Avalanche, BNB, Ethereum, Optimism, Polygon и Fantom, а вторая часть — подсчет количества транзакций для каждого пользователя (`sender`). Третий шаг — установить пороговые значения на основе количества для классификации пользователей: «1 Tx», «2 ~ 5 Tx», «5 ~ 10 Tx», «10 ~ 20 Tx» и «>= 20 Tx».
На этом этапе Алиса может анализировать и оценивать код, не понимая смысла кода, написанного Бобом. По сути, функция интерпретации запроса эквивалентна экранированию и переводу между кодом и людьми. И наоборот, человеческий язык также может быть переведен в операторы SQL. С поддержкой LLM и массивными данными операторов запроса, накопленными Dune, этого несложно достичь.
Запросы на естественном языке являются важным направлением для последующих улучшений LLM Dune. Запрос на естественном языке позволяет пользователям выполнять задачи по генерации диаграмм, передавая инструкции. Это больше соответствует мышлению обычных людей, чем использование операторов SQL, генерация методом перетаскивания и другие режимы, и устраняет необходимость обращать внимание на детали реализации.
Более того, запрос на естественном языке не является заменой функции для профессиональных пользователей, таких как аналитики, а подкреплением. Существующая Dune имеет около 700 000 диаграмм, и значительное количество аналитических задач перекрывается и конфликтует. Использование запроса на естественном языке также может помочь системе понять взаимосвязь между диаграммами, тем самым еще больше повышая эффективность всей аналитической работы.
После присоединения LLM существующие диаграммы, SpellBook и данные документов также будут реинтегрированы. Следуя примеру чат-бота OpenAI, Dune также разработает разговорного робота, который поможет пользователям понять и использовать существующую систему знаний более простым способом, не отвлекаясь на ненужную информацию.
Например, Алиса может реверсировать вышеуказанный запрос распределения объема транзакций пользователей LayerZero, сначала выдать команду запроса на английском языке и объяснить рабочий процесс каждого шага. Затем Dune поможет Алисе написать 150 строк кода и сгенерировать диаграмму.
Вывод: каждый может стать аналитиком данных
Цель Dune — не создать простую платформу анализа данных на основе блокчейна, а создать конвейер данных, который позволит информации свободно передаваться, давая пользователям возможность собирать, преобразовывать, управлять, запрашивать, визуализировать и использовать данные для принятия мер.
Предпосылка потока данных заключается в том, что он должен быть модульным, произвольно объединенным и настроенным и в конечном итоге формировать набор данных, совместно используемый сообществом, а не концентрироваться в сложных операторах SQL или платных API, в конечном итоге достигая равноправной картины, где каждый может взаимодействовать с данными.
Подводя итог, можно сказать, что план LLM компании Dune — это «переводчик» и помощник, цель которого — позволить обычным пользователям понять все, что представляют собой данные, не только отображать конечные результаты, но и углубиться в процесс генерации, чтобы в конечном итоге каждый мог выполнять анализ данных в цепочке.
