Trái tim nhỏ V màu xanh của dòng VivoX100 là mẫu ngôn ngữ lớn “vừa vặn” nhất mà tôi từng sử dụng.

Nguồn bài viết in lại: AIGC
Nguồn gốc: Đế silicon
Tác giả｜La Nhất Hàng
Nguồn hình ảnh: Được tạo bởi AI‌ không giới hạn
Đây là mẫu ngôn ngữ lớn đầu tiên mà tôi trải nghiệm được phát triển độc lập bởi một nhà sản xuất điện thoại thông minh - "Blue Heart Little V" do vivo ra mắt dựa trên mẫu lớn Blue Heart. Với tư cách là một “Thần Nông người mẫu lớn”, tôi sẽ nhắc nhở bản thân “hạ thấp kỳ vọng của mình” trước khi thử nghiệm bất kỳ dịch vụ người mẫu nào gần đây, đặc biệt là những bản demo có video quá hấp dẫn. Nhưng đối với mẫu trái tim lớn màu xanh lam, cảm nhận của tôi là: đúng như mong đợi. Nó không mát mẻ, nhưng nó có chức năng.
Là một mô hình ngôn ngữ lớn được các nhà sản xuất điện thoại thông minh tung ra, mọi người thường nghĩ rằng nó sẽ không quá lớn, có thông số thấp, hiệu ứng xuất hiện có thể không tốt lắm và sẽ có lỗi trong việc hiểu một số văn bản và ý định phức tạp. Nhưng trải nghiệm tôi nhận được từ Blue Heart Model thì ngược lại: nó thể hiện khả năng suy luận mạnh mẽ trong sáng tạo và tóm tắt, có thể đạt hơn 80 điểm. Ngược lại, hiệu suất tìm kiếm hình ảnh cơ bản và viết thông thường chỉ ở mức trung bình.
Bạn nên biết rằng mẫu trái tim xanh hiện đang được cài đặt trên điện thoại di động dòng vivo X100 là mẫu sử dụng kép cho các kịch bản phía thiết bị và các đám mây được thiết kế đặc biệt cho điện thoại di động. Nó kém "lớn" hơn nhiều so với một mẫu lớn với hàng trăm đám mây. hàng tỷ tham số. Nhưng khi tôi đưa cho nó một bài viết về việc liệu hiện tượng xuất hiện của các mô hình lớn có thực sự tồn tại hay không, nó đã tìm ra rất chính xác lập luận cốt lõi và quan trọng nhất trong đó: sự xuất hiện của khả năng xuất hiện của mô hình lớn là một thước đo được các nhà nghiên cứu lựa chọn chứ không phải là kết quả của mở rộng khả năng của mô hình, vì vậy nó không phải là một "sự xuất hiện trí thông minh" thực sự.
Điều này thực sự làm tôi choáng váng. Vì “đọc tài liệu” là một công việc có phần khó khăn đối với các mô hình ngôn ngữ lớn nên không phải mô hình nào cũng có thể đọc tốt. Ví dụ: khả năng đọc các tệp PDF phức tạp và dài của ChatGPT gần đây đã có sự xuống cấp đáng báo động, đặc biệt là ở khả năng tóm tắt. Nhưng Blue Heart Little V của Blue Heart Big Model có thể ngay lập tức tìm ra lập luận quan trọng nhất. Điều đáng nói là trong quá trình thử nghiệm, tôi đã kiểm tra cụ thể chức năng "tóm tắt cục bộ", chức năng này sử dụng hoàn toàn sức mạnh tính toán của chính máy vivo X100 (MediaTek Dimensity 9300) và khả năng suy luận để tóm tắt lại. "mô hình lớn phải lớn".
Sau đó, tôi phát hiện ra một hiện tượng thú vị hơn: khi bạn tải một bài báo dài hơn lên Mô hình Trái tim xanh, nó vẫn có thể trích xuất được những ý tưởng, phát hiện quan trọng và quan trọng nhất, nhưng phần tường thuật kéo dài thường là vài câu cẩu thả, thế thôi”. đọc hay mà không cần phải giải thích sâu sắc". Nó trái ngược với một số Chat Bot mô hình lớn khác về khả năng đọc hiểu: nhiều mô hình rất mạnh trong việc phân tích thông tin nhưng lại không đủ khả năng sàng lọc và tóm tắt. Mô hình trái tim lớn màu xanh được tóm tắt và tinh chỉnh cực kỳ chính xác, nhưng nó không muốn tháo rời và đọc kỹ, cũng như không muốn lãng phí mã thông báo vào các vấn đề giải thích. Điều này có liên quan chặt chẽ đến kích thước của mô hình.
Về mặt tìm kiếm ảnh cục bộ và tìm kiếm hình ảnh trên điện thoại di động, tốc độ phản hồi của Blue Heart Model mượt mà như lụa. Ví dụ: tất cả "ảnh về Tử Cấm Thành" được lưu trữ cục bộ trên điện thoại di động đều có thể được tìm thấy trong một. thứ hai. Về mặt viết hướng dẫn du lịch và các khía cạnh khác, hiệu suất của nó khá khả quan. Về mặt tạo hình ảnh, các bức tranh về Tử Cấm Thành, Ramen bò và Lẩu cay đều gần ngang tầm với DALL-E của ChatGPT, nhưng nó không giàu trí tưởng tượng như ChatGPT và cũng không thể vẽ đặc biệt điên rồ và giàu trí tưởng tượng. hình ảnh. Tuy nhiên, khi tôi yêu cầu nó vẽ “một AI đang suy nghĩ sâu sắc về tương lai của nhân loại”, nó thực sự đã cho tôi một bức tranh với quan niệm nghệ thuật như vậy.
Ngoài ra, khả năng điều khiển APP thông qua đối thoại tự nhiên của mô hình trái tim xanh là rất đáng chú ý. Tôi nói với nó rằng tôi muốn đặt mua đồ mang đi Mala Xiangguo và nó sẽ cho bạn biết rằng Meituan chưa được cài đặt trên điện thoại mới này. Sau khi bạn đồng ý cài đặt, nó sẽ tự động tải xuống Ứng dụng Meituan từ cửa hàng ứng dụng. Sau đó, tôi sẽ giúp bạn mở trang toàn "Lẩu cay". Tất nhiên, bạn có thể nghĩ rằng Siri của Apple cũng có thể làm được điều đó, bởi vì là một ứng dụng cấp trợ lý ở cuối hệ thống, bạn có thể dễ dàng gọi các quyền trên điện thoại này. Nhưng điểm khác biệt là Siri chỉ có thể chấp nhận các hướng dẫn rất rõ ràng để mở ứng dụng nào. Nó bất lực trước nhu cầu ngôn ngữ tự nhiên chung. Đây là một mô-đun giọng nói thông minh được nhúng, nhưng Lanxin Xiao V nằm trong Lanxin Big Model. may mắn thay, nó đã là một phi công phụ với khả năng hiểu ngôn ngữ tự nhiên.
Tóm lại, sau khi điều chỉnh một số chức năng chính, bạn sẽ có định hướng và nhận định tự tin hơn, tức là mô hình lớn phía cuối đã được thiết lập và đáng tin cậy. Hơn nữa, để mô hình phía khách hàng quy mô lớn hoặc thậm chí toàn bộ mô hình ngôn ngữ quy mô lớn được triển khai ở hàng nghìn hộ gia đình và mọi sinh vật, bạn vẫn có thể phải dựa vào các nhà sản xuất điện thoại di động, dù muốn hay không.
Ở một mức độ nhất định, mô hình lớn thích ứng với điện thoại di động thực sự gần với "mô hình ngôn ngữ nhỏ" mà Microsoft đã nhấn mạnh gần đây. Thông số của nó thường không thể vượt quá 10 tỷ, nếu không bộ nhớ điện thoại di động không thể chạy, điều đó cũng có nghĩa là nó có thể. chỉ thực hiện các khía cạnh cụ thể hoặc đào tạo một mô hình đến một mức đầu ra nhất định rồi dừng lại. Đối với hầu hết mọi người, điều này là đủ. Mistral AI, một công ty khởi nghiệp ở Paris mới nổi gần đây, là một công ty kiểu mẫu nhỏ như vậy.
Đánh giá dựa trên các tham số do Mô hình lớn Blue Heart công bố, mô hình lớn dựa trên đám mây gồm 170 tỷ tham số được sử dụng để chắt lọc và huấn luyện các mô hình cấp tham số thấp, tạo ra mô hình 7 tỷ tham số. Việc tính toán và lý luận được đặt ra. ở cả phía đám mây và phía điện thoại di động, việc tính toán và lý luận của mô hình tham số 1 tỷ chỉ ở phía thiết bị. Đây là điều mà Qualcomm, MediaTek, Intel và AMD đang không ngừng nỗ lực và mày mò để thoát khỏi lời nguyền Nvidia. Nếu các mô hình không được cắm vào điện thoại di động và PC thì không có cơ hội. Tuy nhiên, những mẫu có thể lắp vào điện thoại di động và PC thường không đủ lớn và là những mẫu nhỏ.
Mô hình nhỏ có ưu điểm của mô hình nhỏ: chỉ tập trung làm tốt một số việc, không xuất ra thông tin, code dài dòng, có một vài điểm nổi bật nhưng lại ở mức trung bình ở các khía cạnh khác. Ví dụ: khả năng viết mã của Mistral AI tốt hơn ChatGPT. Một ví dụ khác là mô hình Blue Heart. Nó chính xác hơn các mô hình khác trong việc tinh chỉnh và xử lý tài liệu cục bộ, đồng thời hiệu quả hơn trong việc quản lý tài liệu và lịch trình trên điện thoại di động cá nhân. Các thao tác vẽ, viết và tìm kiếm khác cũng có nhưng không nổi bật. Nhưng vậy thì sao?
Khi Trung Quốc hiện đang thảo luận về tương lai của trí tuệ nhân tạo tạo ra, có một hiện tượng kỳ lạ: những người giơ cao và đánh cao không xuống đất, còn những người xuống đất để sống không có hứng thú với AI. Hầu hết mọi người chưa bao giờ sử dụng ChatGPT. Họ có thể đã nghe nói về Wenxinyiyan, Tongyi Qianwen và ChatGLM và thỉnh thoảng sử dụng chúng, nhưng họ không thấy bất kỳ thay đổi thiết yếu nào đối với những thứ này. Đối với những người chơi bị ám ảnh bởi các thông số mô hình lớn, kết quả đánh giá quy mô và điểm chuẩn, tất cả kết quả của họ đều được đưa lên Hugging Face và GitHub. Họ hầu như không bao giờ quảng bá cho người bình thường và không có hứng thú với người bình thường. Các nhà phát triển và người dùng AI đều thờ ơ với nhau và tình trạng này có thể không thay đổi trong thời gian ngắn.
Nhưng nếu các nhà sản xuất điện thoại thông minh tạo ra các mô hình ngôn ngữ lớn hơn thì có thể sẽ khác. Nguyên nhân chính là: người dùng có cảm xúc. Khi mô hình lớn được tích hợp vào lớp dưới cùng của hệ điều hành, nó có thể gợi lên, hỗ trợ và gọi các chức năng bất cứ lúc nào, giống như mô hình lớn trái tim xanh trên Origin OS4, người dùng sẽ vô tình cần đến nó, cần nó hỗ trợ và kiểm tra. tiềm năng của nó. Thậm chí cần sự đồng hành của nó. Nó có thể không phải là một mô hình lớn phổ quát, có thể là một mô hình nhỏ, nhưng nó hiểu người dùng, quen thuộc với dữ liệu trong thiết bị, hiểu thói quen của người dùng, bảo vệ quyền riêng tư của người dùng và có thể giúp lên lịch, mở menu mang về, tóm tắt tài liệu Chỉ cần chọn những bức ảnh và hoàn thành một số bài viết cơ bản, đó sẽ là một AI “đủ” và “đáng tin cậy” đối với hầu hết mọi người.
Việc thúc đẩy phổ biến các mô hình ngôn ngữ lớn chắc chắn không thể đạt được thông qua lập trình AI, cũng như không chỉ những đột phá công nghệ làm mới các đánh giá SOTA mới có thể mang lại lợi ích cho hầu hết con người. Giống như bạn không biết một chiếc giày có vừa hay không cho đến khi bạn mang nó vào, bạn không biết một mẫu giày có vừa hay không cho đến khi bạn sử dụng nó. Những ngày này, tôi đã "khử ChatGPTing" một cách có ý thức: Tôi dựa vào Kimi Chat để đọc giấy tờ và tài liệu, dựa vào Wen Xinyiyan và ChatGLM cho công việc bàn giấy và dựa vào Vivo Blue Heart Model làm trợ lý cá nhân của tôi, không vì lý do nào khác hơn là "phù hợp". Bạn không mong đợi nó sẽ bắt kịp ChatGPT một cách toàn diện, nhưng tôi thực sự cần một “mô hình lớn” hoặc “mô hình nhỏ” có thể sử dụng trên điện thoại di động, bảo vệ quyền riêng tư cá nhân và bảo mật dữ liệu và có điểm trung bình khá.
Mô hình ngôn ngữ lớn là để mọi người sử dụng chứ không phải để khoe khoang.