GPT-4 có thể làm một số người thất vọng. GPT-4 được nhiều người mong đợi sẽ ra mắt vào tuần tới!

Vào ngày 9 tháng 3 theo giờ địa phương, Andreas Braun, giám đốc công nghệ của Microsoft Đức, đã tiết lộ tin tức này tại một sự kiện mang tên "AI in Focus - Digital Kickoff". Ông nói tại sự kiện:

Chúng tôi sẽ ra mắt GPT-4 vào tuần tới, đây sẽ là mô hình đa phương thức cung cấp các khả năng hoàn toàn khác nhau - chẳng hạn như video.

Theo Braun, công nghệ này đã phát triển đến mức về cơ bản nó "hoạt động cho mọi ngôn ngữ", nghĩa là "bạn có thể đặt câu hỏi bằng tiếng Đức và nhận câu trả lời bằng tiếng Ý".

Tin tức này vừa ra, đã nhanh chóng thu hút sự chú ý của toàn thế giới. Những người trong ngành công nghệ, các nhà đầu tư và thậm chí cả người dùng bình thường đều háo hức muốn biết GPT mới sẽ mạnh mẽ đến mức nào.

GPT-4 là gì?

Mô hình GPT-4 là thế hệ thứ tư của mô hình ngôn ngữ lớn (LLM). Braun gọi LLM là "người thay đổi cuộc chơi". Chúng dạy máy móc hiểu ngôn ngữ tự nhiên, nghĩa là con người sẽ không còn độc quyền với kỹ năng này nữa.

Mô hình này được thực hiện thông qua công nghệ GPT.

GPT, viết tắt của Generative Pre-training Transformer, là một công nghệ học sâu sử dụng mạng thần kinh nhân tạo cho phép máy móc trò chuyện, giao tiếp và sáng tạo giống như con người.

Khi nói về GPT-4, chúng ta phải nhắc đến người chị em GPT-3.5 của nó. Sau khi robot trò chuyện ChatGPT do mẫu này phát triển được ra mắt, nó đã gây ra một cuộc chạy đua vũ trang trong ngành AI và cũng đã cho phép Microsoft, vốn đã được xếp hạng. thứ hai trong nhiều năm, để giành chiến thắng.

Do đó, GPT-4 sẽ cải tiến công nghệ được ChatGPT sử dụng dựa trên GPT-3.5.

Đa phương thức có thể trở thành điểm nhấn lớn nhất

Braun cho biết với đa phương thức, Microsoft (và OpenAI) sẽ làm cho mô hình trở nên "toàn diện". Điều này có nghĩa là đa phương thức có thể trở thành điểm nhấn lớn nhất của mô hình GPT-4.

Tại sự kiện, các chuyên gia kỹ thuật AI của Microsoft Holger Kenn và Clemens Sieber đã giới thiệu các chức năng liên quan của AI đa phương thức.

Theo Kenn, AI đa phương thức không chỉ có thể chuyển đổi văn bản thành hình ảnh, âm nhạc và thậm chí cả video tương ứng. Trước thông báo của Microsoft, chuyên gia máy học Emil Wallner đã dự đoán trên Twitter rằng GPT-4 có thể có khả năng này.

Sieber đã giới thiệu một số trường hợp tiềm năng về công nghiệp hóa AI đa phương thức. Ví dụ: AI đa phương thức có thể ghi âm giọng nói của cuộc gọi điện thoại trực tiếp thành văn bản. Theo ước tính, tính năng này có thể giúp một khách hàng lớn của Microsoft tại Hà Lan tiết kiệm 500 giờ làm việc/ngày.

Triển khai AGI? Thông số tăng lên hàng nghìn tỷ cấp? Tin đồn về GPT đang lan rộng

Mặc dù OpenAI chưa tiết lộ bí ẩn của GPT-4 nhưng những tin đồn về nó đã bay khắp thế giới. Tin đồn thổi phồng nhất là GPT-4 có thể khiến trí tuệ nhân tạo tổng hợp (AGI) có ý thức giống như con người và các thông số của nó. Sẽ Tăng lên cấp độ exascale, một số người tin rằng độ dài xử lý văn bản mà nó hỗ trợ sẽ gấp tới 16 lần so với GPT-3.5.

Thông số nhảy từ hàng trăm tỷ lên hàng trăm tỷ?

Ngay từ tháng 8 năm 2021, đã có thông tin trên các phương tiện truyền thông rằng các chuyên gia trong ngành đã suy đoán rằng GPT-4 sẽ có 100 nghìn tỷ thông số.

Hiện tại, GPT-3 sử dụng 175 tỷ tham số. Nếu báo cáo của phương tiện truyền thông là đúng thì số lượng tham số được GPT-4 sử dụng sẽ cao hơn gấp sáu lần so với con số cơ sở này. Sự tăng trưởng, một số người so sánh nó với việc mở rộng trực tiếp từ một điểm thành một vòng tròn.

Trên thực tế, càng nhiều tham số để xây dựng một sản phẩm AI thì càng tốt. Đôi khi nó có thể ảnh hưởng đến khả năng phản hồi của robot, nhưng càng nhiều tham số sẽ cho phép AI thu được nhiều dữ liệu hơn từ Internet. Về lý thuyết, điều này sẽ cải thiện đáng kể độ chính xác. của AI.

Hỗ trợ xử lý độ dài văn bản tăng gấp 16 lần?

Manh mối về khả năng này đến từ bảng giá được chia sẻ trên Twitter bởi chuyên gia AI Travis Fischer.

Được biết, OpenAI đã âm thầm phát hành một nền tảng dành cho nhà phát triển mới có tên Foundry, chứa hai mô hình DV (có thể là GPT-4) hỗ trợ xử lý ngữ cảnh với độ dài từ tối đa lần lượt là 8.000 và 32.000 từ GPT3. lần 5. Hiện tại GPT3.5 có thể xử lý ngữ cảnh có độ dài 2048 từ.

Microsoft sẽ tích hợp GPT-4 vào Bing?

Là một trong những nhà đầu tư lớn vào OpenAI, Microsoft đã tích hợp công nghệ của ChatGPT vào các sản phẩm ứng dụng của mình.

Trong số đó, phiên bản ChatGPT của Bing đã vượt 100 triệu người dùng hoạt động hàng ngày chỉ một tháng sau khi phát hành, đây là lần đầu tiên trong lịch sử. Với phiên bản ChatGPT của Bing, Microsoft đang bắt kịp Google, công cụ tìm kiếm hàng đầu, ở mức đáng báo động.

Do đó, hầu hết các nhà phân tích đều tin rằng Microsoft, vốn đã hưởng được rất nhiều lợi ích, sẽ tiếp tục tích hợp GPT-4 vào Bing.

GPT-4 liệu có làm thế giới bên ngoài thất vọng?

Đối mặt với nhiều suy đoán khác nhau về GPT-4, OpenAI đang cố gắng xoa dịu chúng.

Trong một cuộc phỏng vấn gần đây với giới truyền thông, CEO OpenAI Sam Altman đã trực tiếp phủ nhận một số tin đồn, chẳng hạn như GPT-4 có thể khiến AGI có ý thức giống như con người.

Altman nhấn mạnh rằng GPT-4 là một sự tiến hóa chứ không phải một công nghệ mang tính cách mạng. Phiên bản tiếp theo của ChatGPT sẽ không phải là AGI, cũng không có 100 nghìn tỷ thông số, điều này là "hoàn toàn vô nghĩa".

Mọi người đang cầu xin để được thất vọng và họ sẽ như vậy.

Về việc GPT-4 có được phát hành vào tuần sau như Microsoft cho biết hay không, OpenAI vẫn chưa đưa ra thông báo chính thức và Altman cũng chưa thông báo khi nào sẽ phát hành. Altman nói:

Điều này sớm hay muộn sẽ xảy ra khi chúng ta cảm thấy tự tin rằng mình có thể thực hiện một cách an toàn và có trách nhiệm.

Mira Murati, giám đốc công nghệ của OpenAI, cho rằng ít công khai hơn là một điều tốt, nhưng cho biết GPT-4 có thể “mở rộng cơ hội phát triển cho mọi người”.