Lĩnh vực mô hình ngôn ngữ lớn tiếp tục phát triển khi StabilityAI, nhà sản xuất công cụ tạo hình ảnh phổ biến Stable Diffusion, đã tung ra một bộ công cụ mô hình ngôn ngữ nguồn mở.

Được đặt tên là StableLM, các phiên bản alpha có sẵn công khai của bộ phần mềm hiện chứa các mô hình có ba và bảy tỷ tham số với các mô hình tham số 15, 30 và 65 tỷ được ghi chú là “đang tiến hành” và một mô hình trị giá 175 tỷ được lên kế hoạch phát triển trong tương lai.

Công bố StableLM❗Chúng tôi đang phát hành mô hình ngôn ngữ lớn đầu tiên, bắt đầu với các mô hình thông số 3B và 7B, tiếp theo là 15-65B. LLM của chúng tôi được phát hành theo giấy phép CC BY-SA. Chúng tôi cũng đang phát hành các mô hình được điều chỉnh RLHF để sử dụng cho nghiên cứu. Đọc thêm→ https://t.co/R66Wa4gbnW pic.twitter.com/gvDDJMFBYJ

— Stability AI (@StabilityAI) ngày 19 tháng 4 năm 2023

Để so sánh, GPT-4 có số lượng tham số ước tính là một nghìn tỷ, cao gấp sáu lần so với người tiền nhiệm GPT-3.

Tuy nhiên, số lượng tham số có thể không phải là thước đo đồng đều về hiệu quả của LLM, như Stability AI đã lưu ý trong bài đăng trên blog thông báo về việc ra mắt StableLM:

“StableLM được đào tạo trên một tập dữ liệu thử nghiệm mới được xây dựng trên The Pile, nhưng lớn hơn gấp ba lần với 1,5 nghìn tỷ mã thông báo nội dung […] Sự phong phú của tập dữ liệu này mang lại cho StableLM hiệu suất cao đáng ngạc nhiên trong các tác vụ đàm thoại và mã hóa, mặc dù có kích thước nhỏ từ 3 đến 7 tỷ tham số.”

Hiện tại vẫn chưa rõ các mô hình StableLM mạnh mẽ đến mức nào. Nhóm StabilityAI đã lưu ý trên trang Github của tổ chức rằng sẽ có thêm thông tin về khả năng của LM, bao gồm thông số kỹ thuật mô hình và cài đặt đào tạo.

Với điều kiện các mô hình hoạt động đủ tốt trong quá trình thử nghiệm, sự ra đời của một giải pháp thay thế mã nguồn mở mạnh mẽ cho ChatGPT của OpenAI có thể rất thú vị đối với thế giới giao dịch tiền điện tử.

Như Cointelegraph đã đưa tin, mọi người đang xây dựng các bot giao dịch tiên tiến dựa trên API GPT và các biến thể mới kết hợp quyền truy cập công cụ của bên thứ ba, chẳng hạn như BabyAGI và AutoGPT.

Việc bổ sung các mô hình nguồn mở vào hỗn hợp có thể là một lợi ích cho các nhà giao dịch am hiểu công nghệ nhưng không muốn trả phí truy cập của OpenAI.

Những người quan tâm có thể thử nghiệm giao diện trực tiếp cho mô hình StableLM 7B-parameter được lưu trữ trên HuggingFace. Tuy nhiên, tính đến thời điểm bài viết này được xuất bản, những nỗ lực của chúng tôi để thực hiện điều đó đã khiến trang web bị quá tải hoặc đạt công suất.