Tác giả: Tài chính vàng tiền điện tử

Vào ngày 12 tháng 6 năm 2023, Gensyn, giao thức thị trường điện toán AGI dựa trên blockchain, đã thông báo hoàn thành khoản tài trợ Series A trị giá 43 triệu đô la, do a16z dẫn đầu, với sự tham gia của Eden Block, CoinFund, Galaxy, Protocol Labs, v.v.

Gensyn là loại dự án gì? Tại sao bạn có thể nhận được khoản đầu tư lớn từ các quỹ đầu tư mạo hiểm hàng đầu? Golden Finance sẽ giúp bạn hiểu rõ điều đó trong một bài viết.

a16z: Tại sao bạn dẫn đầu vòng tài trợ Series A trị giá 43 triệu đô la của Gensyn

a16z đã xuất bản một bài báo giải thích lý do tại sao nó dẫn đầu khoản tài trợ Series A trị giá 43 triệu đô la của Gensyn. a16z cho rằng tiến bộ gần đây của trí tuệ nhân tạo là đáng kinh ngạc và có sức mạnh cứu thế giới (xem báo cáo trước đây của Golden Finance “bài viết dài 10.000 từ của người sáng lập a16z: Tại sao AI sẽ cứu thế giới”). Nhưng việc xây dựng hệ thống AI đòi hỏi phải triển khai sức mạnh tính toán lớn hơn để đào tạo và suy ra các mô hình lớn nhất và mạnh nhất hiện nay. Điều này có nghĩa là các công ty công nghệ lớn có lợi thế hơn các công ty khởi nghiệp trong cuộc đua khai thác giá trị từ trí tuệ nhân tạo, nhờ quyền truy cập đặc quyền vào sức mạnh tính toán và tính kinh tế nhờ quy mô của các trung tâm dữ liệu lớn. Để cạnh tranh trên một sân chơi bình đẳng, các công ty khởi nghiệp cần có khả năng sử dụng sức mạnh tính toán quy mô lớn của riêng mình một cách hợp lý.

Điểm độc đáo của blockchain như một loại máy tính mới là các nhà phát triển có thể viết mã và đưa ra cam kết chắc chắn về cách thức hoạt động của nó trong tương lai. Thành phần không cần xin phép này của blockchain có thể tạo ra một thị trường cho người mua và người bán sức mạnh tính toán — hoặc bất kỳ loại tài nguyên kỹ thuật số nào khác như dữ liệu hoặc thuật toán — để giao dịch trên toàn cầu mà không cần trung gian.

Gensyn là một giao thức thị trường năng lực tính toán AGI dựa trên blockchain kết nối các nhà phát triển (bất kỳ ai có thể đào tạo các mô hình học máy) với người giải quyết (bất kỳ ai muốn đào tạo các mô hình học máy bằng máy của riêng họ). Bằng cách tận dụng phần đuôi dài của các thiết bị điện toán nhàn rỗi có khả năng học máy trên khắp thế giới, chẳng hạn như các trung tâm dữ liệu nhỏ, PC chơi game cá nhân, máy Mac M1 và M2, thậm chí cả điện thoại thông minh, Gensyn có thể tăng sức mạnh điện toán khả dụng cho học máy lên 10-100 lần. 

Vấn đề mà AGI (trí tuệ nhân tạo tổng quát) phải đối mặt: mức độ tập trung cao

Sau gần nửa năm phát triển, thị trường nhìn chung đều công nhận AGI chính là tương lai. Tuy nhiên, ngành công nghiệp AGI hiện nay dường như đang bị độc quyền ở mức độ cao. Giữa các quốc gia, đó là cuộc chiến thương mại và nhân tài giữa Trung Quốc và Hoa Kỳ, còn giữa các công ty, đó là cuộc chơi giữa các công ty công nghệ lớn (Microsoft, Google, Meta). Bởi vì ba nguồn lực chính của AGI (sức mạnh tính toán, kiến ​​thức và dữ liệu) hiện đang được tập trung hóa ở mức độ cao.

Sức mạnh tính toán: Các mô hình ngày càng lớn và phức tạp đòi hỏi bộ xử lý có công suất cao để đào tạo. Giữa các quốc gia: Cuộc chiến chip giữa Trung Quốc và Hoa Kỳ, Hoa Kỳ đã tích cực ngăn cản Trung Quốc có được những con chip tính toán cao. Giữa các công ty: Do năng lực sản xuất không đủ, tất cả các chip AI mới nhất của Nvidia đều đã được một số khách hàng lớn mua và các công ty khác không thể mua chúng. Trong nền tảng công nghệ: Một số công ty thậm chí đã tạo ra phần cứng chuyên dụng của riêng mình cho việc học sâu, chẳng hạn như cụm TPU của Google. Chúng vượt trội hơn GPU tiêu chuẩn về khả năng học sâu và không phải để bán mà chỉ để cho thuê.

Kiến thức: Nhiều đột phá được công bố bắt nguồn từ các kiến ​​trúc mô hình lớn mới do các nhà nghiên cứu phát triển, nhưng vẫn còn một cuộc chiến về tài sản trí tuệ và nhân tài cơ bản. Ví dụ, Hoa Kỳ đã thu hút hơn 50% nhân tài AI của Trung Quốc và các công ty lớn sử dụng nhân tài này để phát triển các mô hình lớn đang ngày càng hạn chế khả năng tiếp cận công nghệ này; GPT-3.5 hoặc 4 của OpenAI về cơ bản là có sẵn cho công chúng, nhưng nó nằm sau API và chỉ Microsoft mới có thể truy cập vào mã nguồn của nó.

Dữ liệu: Các mô hình học sâu AGI yêu cầu lượng dữ liệu lớn — cả dữ liệu đã gắn nhãn và chưa gắn nhãn — và nhìn chung sẽ được cải thiện khi lượng dữ liệu tăng lên. GPT-3 được đào tạo trên 300 tỷ từ. Dữ liệu được gắn nhãn đặc biệt quan trọng và các tập dữ liệu cần thiết để đào tạo AGI chỉ tập trung trong tay một số ít công ty lớn. Đây là một sự thật ít người biết: mỗi lần bạn giải quyết reCaptcha để truy cập một trang web, bạn đang gắn nhãn dữ liệu đào tạo để cải thiện Google Maps.

Những khó khăn trong điện toán AGI phi tập trung

Điện toán phi tập trung có thể tạo ra nền tảng rẻ hơn, tự do hơn cho việc nghiên cứu và phát triển AI. Nhưng AGI phi tập trung lại gặp vấn đề về xác minh công việc. Làm sao bạn biết được bên thứ ba đã hoàn tất phép tính mà bạn yêu cầu?

Có hai yếu tố khiến việc chứng minh công việc trở nên khó khăn: sự phụ thuộc vào trạng thái và chi phí tính toán cao.

Phụ thuộc trạng thái: Mỗi lớp trong mạng nơ-ron được kết nối với tất cả các nút trong lớp trước nó. Điều này có nghĩa là nó cần trạng thái của lớp trước đó. Tệ hơn nữa, tất cả trọng số trong mỗi lớp đều được xác định theo bước thời gian trước đó. Vì vậy, nếu bạn muốn xác minh rằng ai đó đã đào tạo một mô hình — chẳng hạn, bằng cách chọn một điểm ngẫu nhiên trong mạng và xem liệu bạn có nhận được cùng trạng thái hay không — bạn cần phải đào tạo mô hình cho đến điểm đó, điều này rất tốn kém về mặt tính toán.

Chi phí tính toán cao: Chi phí đào tạo một phiên GPT-3 duy nhất vào khoảng 12 triệu đô la vào năm 2020, cao hơn 270 lần so với chi phí ước tính để đào tạo một GPT-2 vào năm 2019 là khoảng 43.000 đô la. Nhìn chung, độ phức tạp (kích thước) của mô hình mạng nơ-ron tốt nhất hiện nay tăng gấp đôi sau mỗi ba tháng. Nếu mạng nơ-ron rẻ hơn và/hoặc nếu quá trình đào tạo ít mang tính chất phát triển mô hình hơn thì có lẽ chi phí xác thực phát sinh từ sự phụ thuộc trạng thái sẽ được chấp nhận.

Nếu chúng ta muốn đào tạo học sâu rẻ hơn và phân cấp quyền kiểm soát, chúng ta cần một hệ thống có thể quản lý xác minh liên quan đến trạng thái một cách đáng tin cậy, đồng thời cũng tiết kiệm chi phí và thưởng cho những người đóng góp tính toán.

Gensyn phân cấp máy tính AGI như thế nào

Giao thức Gensyn hợp nhất toàn bộ hoạt động tính toán trên thế giới thành một siêu cụm máy học toàn cầu, có sẵn cho bất kỳ ai vào bất kỳ lúc nào. Nó cho phép đào tạo mạng nơ-ron không cần tin cậy ở quy mô cực lớn và chi phí thấp bằng cách kết hợp hai điều:

1. Hệ thống xác minh sáng tạo

Hệ thống xác minh giải quyết hiệu quả vấn đề phụ thuộc trạng thái trong quá trình đào tạo mạng nơ-ron ở mọi quy mô. Hệ thống kết hợp các điểm kiểm tra đào tạo mô hình với các kiểm tra xác suất kết thúc trên chuỗi. Nó thực hiện tất cả những điều này theo cách không cần tin cậy, với chi phí tăng theo quy mô mô hình (giữ nguyên chi phí xác minh).

Theo Gensyn Litepaper, Gensyn giải quyết vấn đề xác minh chủ yếu thông qua ba khái niệm: bằng chứng học xác suất (sử dụng siêu dữ liệu từ quy trình tối ưu hóa dựa trên gradient để xây dựng chứng chỉ cho công việc đã thực hiện và xác minh nhanh thông qua việc sao chép các giai đoạn nhất định), giao thức định vị chính xác dựa trên đồ thị (sử dụng đa chi tiết, giao thức định vị chính xác dựa trên đồ thị và thực thi nhất quán của người đánh giá chéo để cho phép công việc xác minh được chạy lại và so sánh để đảm bảo tính nhất quán và cuối cùng được xác nhận bởi chính chuỗi), trò chơi khuyến khích theo kiểu Truebit (sử dụng đặt cược và cắt giảm để xây dựng trò chơi khuyến khích nhằm đảm bảo rằng mọi người tham gia hợp lý về mặt tài chính đều hành động trung thực và thực hiện các nhiệm vụ theo dự định của họ)

Hệ thống bao gồm bốn bên tham gia chính: người gửi, người giải quyết, người xác minh và người tố giác. Người nộp: Người dùng cuối của hệ thống, người cung cấp các nhiệm vụ cần tính toán và trả tiền cho các đơn vị công việc đã hoàn thành; Bộ giải: Bộ phận hoạt động chính của hệ thống, thực hiện đào tạo mô hình và tạo ra bằng chứng để người xác minh xác minh; Trình xác minh: Liên kết quy trình đào tạo không xác định với phép tính tuyến tính xác định, sao chép một phần bằng chứng của trình giải và so sánh khoảng cách với ngưỡng dự kiến; Người tố giác: Tuyến phòng thủ cuối cùng, kiểm tra công việc của người xác minh và khiếu nại với hy vọng giành được tiền thưởng tích lũy.

2. Nguồn cung cấp điện toán mới

Tận dụng các tài nguyên thiết bị điện toán chưa được sử dụng hoặc chưa được sử dụng/chưa được tối ưu hóa. Các thiết bị này bao gồm từ GPU chơi game hiện chưa sử dụng đến các máy đào GPU từ kỷ nguyên Ethereum PoW trước đây. Và tính phi tập trung của giao thức có nghĩa là cuối cùng nó sẽ được quản lý bởi đa số cộng đồng và không thể bị "đóng cửa" nếu không có sự đồng ý của cộng đồng; không giống như các đối tác web2 của nó, điều này làm cho nó có khả năng chống kiểm duyệt.

Quy mô lớn + chi phí thấp: Giao thức Gensyn cung cấp chi phí tương tự như GPU do trung tâm dữ liệu sở hữu và quy mô của nó có thể vượt quá AWS