PANews informó el 11 de octubre que la red de datos de cadena completa Chainbase anunció recientemente que abrirá en HuggingFace su modelo de lenguaje grande Theia-Llama-3.1-8B, que está especialmente diseñado para el campo del cifrado. Este modelo supera a los modelos convencionales del mercado en términos de perplejidad y puntuación BERT, y su capacidad para comprender el mundo de las criptomonedas supera a la de la mayoría de los modelos grandes de código abierto convencionales.
El equipo de Chainbase creó de forma creativa el primer conjunto de datos Web3 profesional, que incluye información diversa sobre los 2000 proyectos principales de CoinMarketCap. Los conjuntos de datos se filtran manual y algorítmicamente para garantizar la precisión, diversidad y profesionalismo de los datos de entrenamiento. Con base en este conjunto de datos, el equipo utilizó la tecnología LoRA para ajustar de manera eficiente el modelo y utilizó herramientas como DeepSpeed para acelerar el proceso de capacitación. Además, el modelo está cuantificado en el formato Q8 GGUF, lo que reduce en gran medida el uso de memoria y mejora la velocidad de inferencia.
Se informa que Theia-Llama-3.1-8B es el intento inicial de Chainbase de crear un modelo grande en el campo del cifrado y el modelo se ha aplicado con éxito a la aplicación interactiva DEMO de Chainbase, TheiaChat, que actualmente cuenta con más de 300.000 usuarios activos diarios.