Sektor velkých jazykových modelů nadále narůstá, protože StabilityAI, výrobce oblíbeného nástroje pro generování obrázků Stable Diffusion, spustil sadu nástrojů pro modelování jazyků s otevřeným zdrojovým kódem.
Dabované, StableLM, veřejně dostupné alfa verze sady v současné době obsahují modely se třemi a sedmi miliardami parametrů s modely s 15, 30 a 65 miliardami parametrů označenými jako „ve vývoji“ a modelem za 175 miliard plánovaným pro budoucí vývoj.
Oznamujeme StableLM❗Vydáváme první z našich velkých jazykových modelů, počínaje 3B a 7B param modely, s 15-65B následovat. Naše LLM jsou vydávány pod licencí CC BY-SA. Uvolňujeme také modely vyladěné na RLHF pro výzkumné použití. Přečtěte si více→ https://t.co/R66Wa4gbnW pic.twitter.com/gvDDJMFBYJ
— Stability AI (@StabilityAI) 19. dubna 2023
Pro srovnání, GPT-4 má počet parametrů odhadovaný na jeden bilion, šestkrát vyšší než jeho předchůdce GPT-3.
Počet parametrů však nemusí být rovnoměrným měřítkem účinnosti LLM, jak však Stability AI poznamenala ve svém příspěvku na blogu oznamujícím spuštění StableLM:
„StableLM je trénován na nové experimentální datové sadě postavené na The Pile, ale třikrát větší s 1,5 bilionu tokenů obsahu […] Bohatost této datové sady poskytuje StableLM překvapivě vysoký výkon v konverzačních a kódovacích úlohách, a to navzdory jeho malé velikosti 3 až 7 miliard parametrů."
V tuto chvíli není jasné, jak přesně jsou modely StableLM robustní. Tým StabilityAI na stránce Github organizace poznamenal, že další informace o možnostech LM budou k dispozici, včetně specifikací modelu a nastavení školení.
Za předpokladu, že modely fungují dostatečně dobře při testování, příchod výkonné open-source alternativy k ChatGPT od OpenAI by se mohl ukázat jako zajímavý pro svět obchodování s kryptoměnami.
Jak uvedl Cointelegraph, lidé staví pokročilé obchodní roboty nad rozhraním GPT API a novými variantami, které zahrnují přístup k nástrojům třetích stran, jako je BabyAGI a AutoGPT.
Přidání open-source modelů do mixu by mohlo být přínosem pro technicky zdatné obchodníky, kteří nechtějí platit prémie za přístup OpenAI.
Zájemci si mohou vyzkoušet živé rozhraní pro model StableLM se 7B parametry hostovaný na HuggingFace. V době publikování tohoto článku však naše pokusy o to zjistily, že web je přeplněný nebo má kapacitu.
