Согласно новостям ChainCatcher, полноценная сеть передачи данных Chainbase объявила, что откроет исходный код своей большой языковой модели Theia-Llama-3.1-8B, специально созданной для области шифрования на HuggingFace. Эта модель превосходит основные модели на рынке с точки зрения сложности и оценки BERT, а ее способность понимать мир шифрования превосходит способность большинства основных больших моделей с открытым исходным кодом.

Команда Chainbase творчески создала первый профессиональный набор данных Web3, который включает различную информацию о 2000 лучших проектах на CoinMarketCap. Наборы данных фильтруются вручную и алгоритмически, чтобы обеспечить точность, разнообразие и профессионализм обучающих данных. На основе этого набора данных команда использовала технологию LoRA для эффективной точной настройки модели и использовала такие инструменты, как DeepSpeed, для ускорения процесса обучения. Модель квантуется в формат Q8 GGUF, что значительно снижает использование памяти и повышает скорость вывода.

Сообщается, что Theia-Llama-3.1-8B — это первая попытка Chainbase создать крупную модель в области шифрования, и эта модель была успешно применена в интерактивном приложении Chainbase DEMO TheiaChat, которое в настоящее время имеет более 300 000 активных пользователей в день.