Sau một thời gian dài chờ đợi, OpenAI (https://openai.com/) cuối cùng đã phát hành mẫu GPT-4 mới - một bản cập nhật lớn cho cấu trúc cốt lõi đằng sau hệ thống ChatGPT phổ biến, cũng như API GPT-3.5. Có rất nhiều điều đang diễn ra trong bản phát hành GPT-4 mới.
Dựa trên các ví dụ ban đầu, tài liệu API và mẫu mã do OpenAI cung cấp, đây là những điều quan trọng cần biết về dự án:
Dự án mang tính đa phương thức. Nó có nghĩa là gì?
Trước khi phát hành GPT-4, đã có rất nhiều suy đoán về việc liệu dự án sẽ vẫn là mô hình chỉ có văn bản như ChatGPT hay trở thành đa phương thức. Các mô hình đa phương thức có khả năng xử lý nhiều loại phương tiện, cả đầu ra và đầu vào, từ văn bản đến hình ảnh và cuối cùng là video.
Hiện tại, GPT-4 hỗ trợ cả hình ảnh đầu vào và đầu ra. Ban đầu, khả năng này chỉ dành cho một công ty bên thứ ba đang giúp OpenAI kiểm tra khả năng xử lý hình ảnh. Khi hệ thống trở nên nhanh hơn, hình ảnh làm đầu vào sẽ có sẵn cho nhiều người dùng hơn.
Nhưng OpenAI có một số ví dụ về cách thức hoạt động của điều này. Một ví dụ bao gồm ảnh trứng và bột mì kèm theo truy vấn liên quan đến nấu ăn. GPT-4 đề xuất các công thức nấu ăn có thể được thực hiện bằng các nguyên liệu hiển thị trong ảnh. Mô hình này cũng có thể được sử dụng để tạo chú thích hình ảnh hoặc viết văn bản thay thế tuyệt vời cho hình ảnh trên các trang web. Video vẫn chưa có nhưng có thể sẽ xuất hiện vì GPT-4 là đa phương thức.
OpenAI sẽ cung cấp quyền truy cập API vào mô hình mới gần như ngay lập tức. Nhiều công ty đã tích hợp với các API hiện có từ OpenAI, vì vậy việc chuyển sang GPT-4 thật dễ dàng. Theo mặc định, GPT-4 có thể xử lý 8.000 mã thông báo, tương đương khoảng 50 trang văn bản.
Việc xử lý nhiều dữ liệu hơn sẽ cho phép hệ thống xử lý nhiều hướng dẫn hơn, viết các bài báo dài hơn và thậm chí có thể viết các tài liệu rất dài hoặc các tác phẩm văn học dài. Sự phát triển của mạng lưới thần kinh thực sự đang diễn ra với những bước nhảy vọt và trong tương lai gần, chúng ta sẽ thấy các bản cập nhật lặp đi lặp lại.