BlockBeatsニュース、10月11日、フルチェーンデータネットワークのChainbaseは最近、暗号分野向けに特別に設計された大規模言語モデルTheia-Llama-3.1-8BをHuggingFaceでオープンソース化したと発表しました。このモデルは、難解度とBERTスコアで主流の市場モデルを上回り、暗号世界を理解する能力はほとんどの主流のオープンソースの大規模モデルを上回っています。
Chainbaseチームは、CoinMarketCapのトップ2000プロジェクトのさまざまな資料を含む、初のプロフェッショナルWeb3データセットを独創的に構築しました。データセットは、トレーニングデータの正確性、多様性、専門性を確保するために、手動およびアルゴリズムでフィルタリングされています。このデータセットに基づいて、チームはLoRAテクノロジーを使用してモデルを効率的に微調整し、DeepSpeedなどのツールを使用してトレーニングプロセスを加速します。さらに、モデルはQ8 GGUF形式に量子化されており、メモリ使用量が大幅に削減され、推論速度が向上します。
Theia-Llama-3.1-8Bは、Chainbaseによる暗号化分野における大規模モデルの最初の試みであり、このモデルはChainbase DEMOインタラクティブアプリケーションTheiaChatに正常に適用されており、現在1日あたり30万人以上のアクティブユーザーがいると報告されています。