Știri BlockBeats, 11 octombrie, Chainbase, o rețea de date cu lanț complet, a anunțat recent că și-a deschis modelul de limbaj mare Theia-Llama-3.1-8B, care este special conceput pentru domeniul cripto, pe HuggingFace. Acest model depășește modelele de piață mainstream în ceea ce privește perplexitatea și scorurile BERT, iar capacitatea sa de a înțelege lumea cripto depășește majoritatea modelelor mari open-source.
Echipa Chainbase a construit în mod creativ primul set de date profesional Web3, care include diverse materiale din primele 2000 de proiecte pe CoinMarketCap. Setul de date a fost filtrat manual și algoritmic pentru a asigura acuratețea, diversitatea și profesionalismul datelor de formare. Pe baza acestui set de date, echipa folosește tehnologia LoRA pentru a regla eficient modelul și folosește instrumente precum DeepSpeed pentru a accelera procesul de instruire. În plus, modelul este cuantificat în formatul Q8 GGUF, ceea ce reduce foarte mult utilizarea memoriei și îmbunătățește viteza de inferență.
Se raportează că Theia-Llama-3.1-8B este încercarea inițială a Chainbase de a avea un model mare în domeniul criptării, iar modelul a fost aplicat cu succes aplicației interactive Chainbase DEMO TheiaChat, care are în prezent peste 300.000 de utilizatori activi zilnic.