Sektor model bahasa yang besar terus berkembang seiring StabilityAI, pembuat alat pembuat gambar yang populer, Stable Diffusion, telah meluncurkan serangkaian alat model bahasa sumber terbuka.
Dijuluki StableLM, rangkaian versi alfa yang tersedia untuk umum saat ini berisi model yang menampilkan tiga dan tujuh miliar parameter dengan 15, 30, dan 65 miliar model parameter yang dicatat sebagai “sedang dalam proses” dan 175 miliar model direncanakan untuk pengembangan di masa depan.
Mengumumkan StableLM❗Kami merilis model bahasa besar pertama kami, dimulai dengan model param 3B dan 7B, diikuti dengan 15-65B. LLM kami dirilis di bawah lisensi CC BY-SA. Kami juga merilis model yang disesuaikan dengan RLHF untuk penggunaan penelitian. Baca selengkapnya→ https://t.co/R66Wa4gbnW pic.twitter.com/gvDDJMFBYJ
— Stabilitas AI (@StabilityAI) 19 April 2023
Sebagai perbandingan, GPT-4 memiliki jumlah parameter yang diperkirakan satu triliun, enam kali lebih tinggi dari pendahulunya GPT-3.
Namun, jumlah parameter mungkin bukan ukuran yang tepat untuk menilai keberhasilan LLM, sebagaimana dicatat oleh Stability AI dalam posting blognya yang mengumumkan peluncuran StableLM:
“StableLM dilatih pada kumpulan data eksperimental baru yang dibangun di The Pile, tetapi tiga kali lebih besar dengan 1,5 triliun token konten […] Kekayaan kumpulan data ini memberikan StableLM kinerja yang sangat tinggi dalam tugas percakapan dan pengodean, meskipun ukurannya kecil, yaitu 3 hingga 7 miliar parameter.”
Saat ini belum jelas seberapa tangguh model StableLM. Tim StabilityAI mencatat di halaman Github organisasi tersebut bahwa informasi lebih lanjut tentang kemampuan LM akan segera tersedia, termasuk spesifikasi model dan pengaturan pelatihan.
Asalkan model tersebut berkinerja cukup baik dalam pengujian, kedatangan alternatif open-source yang kuat untuk ChatGPT milik OpenAI dapat terbukti menarik bagi dunia perdagangan mata uang kripto.
Seperti yang dilaporkan Cointelegraph, orang-orang membangun bot perdagangan canggih di atas GPT API dan varian baru yang menggabungkan akses alat pihak ketiga, seperti BabyAGI dan AutoGPT.
Penambahan model sumber terbuka ke dalam campuran bisa menjadi keuntungan bagi pedagang yang paham teknologi yang tidak ingin membayar premi akses OpenAI.
Mereka yang tertarik dapat menguji antarmuka langsung untuk model StableLM 7B-parameter yang dihosting di HuggingFace. Namun, pada saat artikel ini diterbitkan, upaya kami untuk melakukannya mendapati situs web tersebut kewalahan atau mencapai kapasitas maksimal.
