Recomandări principale:
Fascinația tot mai mare pentru inteligența artificială (AI) și entuziasmul pentru potențiala sa sinergie cu Web3 este greu de ignorat. Cu toate acestea, realitatea actuală a acestei integrări în curs de dezvoltare relevă o deconectare între nevoile de infrastructură ale AI și cadrele blockchain existente.
În această serie, vom explora relația dintre AI și Web3, provocările, oportunitățile și aplicațiile verticale din Web3.
Această primă parte a seriei analizează evoluțiile infrastructurii Web3 pentru AI, provocările actuale ale cerințelor de calcul și domeniile de oportunitate.
Inteligența artificială (AI) și tehnologia blockchain sunt două dintre cele mai inovatoare tehnologii care au captat imaginația publicului în ultimul deceniu. Dezvoltarea AI în Web2 a fost incontestabilă, așa cum s-a văzut odată cu creșterea numărului de investiții făcute în acest an de către VC. De la runda de finanțare Inflection AI de 1,3 miliarde de dolari din iunie 2023, cu investiții de la Microsoft și Nvidia, până la concurentul OpenAI, Anthropic, care a strâns 1,25 miliarde de dolari de la Amazon în septembrie 2023.
Cu toate acestea, cazul de utilizare și intersecția Web3 este încă sceptic. Web3 joacă un rol în dezvoltarea AI? Dacă da, cum și de ce avem nevoie de blockchain în AI? O narațiune pe care o vedem este că Web3 are potențialul de a revoluționa relațiile productive, în timp ce AI are puterea de a transforma însăși productivitatea. Cu toate acestea, reunirea acestor tehnologii se dovedește a fi complexă, dezvăluind provocări și oportunități pentru cerințele de infrastructură.
Infrastructura AI și Criza GPU
Principalul blocaj pe care îl vedem în prezent în AI este criza GPU-ului. Modelele de limbaj mari (LLM) precum GPT-3.5 de la OpenAI au deblocat prima aplicație ucigașă pe care o vedem astăzi, ChatGPT. Este cea mai rapidă aplicație care a ajuns la 100M MAU în 6 săptămâni în comparație cu YouTube și Facebook care au durat 4 ani. Acest lucru a deschis porțile noilor aplicații care folosesc modele LLM, câteva exemple fiind Midjourney construit pe StableLM de la Stable Diffusion și PaLM2 care alimentează Bard, API-urile, MakerSuite și Workspaces de la Google.
Învățarea profundă este un proces lung și intensiv din punct de vedere computațional la scară masivă - cu cât LLM-urile au mai mulți parametri, cu atât este nevoie de mai multă memorie GPU pentru a funcționa. Fiecare parametru din model este stocat în memoria GPU și modelul trebuie să încarce acești parametri în memorie în timpul inferenței. Dacă dimensiunea modelului depășește memoria GPU disponibilă, acesta este punctul în care dimensiunea modelului depășește memoria GPU disponibilă și modelul ML nu mai funcționează. Jucătorii de top precum OpenAI se confruntă, de asemenea, cu lipsuri de GPU, ceea ce duce la dificultăți în implementarea modelelor sale multimodale cu modele cu lungime de secvență mai mare (8k VS 32k). Cu o lipsă semnificativă de cipuri de aprovizionare, aplicațiile pe scară largă au atins pragul a ceea ce este posibil cu LLM-urile, lăsând startup-urile AI să concureze pentru puterea GPU-ului pentru a obține avantajul primilor.
Soluții GPU: Abordări centralizate și descentralizate
Pe termen scurt, soluțiile centralizate, cum ar fi lansarea de către Nvidia din august 2023 a tensorRT-LLM, care oferă inferență optimizată și performanță crescută, și anticiparea lansării Nvidia H200 în T2 2024, sunt de așteptat să rezolve constrângerile GPU. În plus, companiile miniere tradiționale, cum ar fi CoreWeave și Lambda Labs, se orientează spre furnizarea de cloud computing centrat pe GPU, pe baza unor taxe de închiriere cuprinse între 2 USD și 2,25 USD/oră pentru Nvidia H100. Companiile miniere utilizează ASIC (Application-Specific Integrated Circuit) deoarece oferă avantaje semnificative față de computerele de uz general sau GPU-urile pentru eficiența minării prin design specific algoritmului și arhitecturi hardware specializate pentru putere hash crescută.
Pe partea Web3, ideea unei piețe de tip Airbnb pentru GPU-uri a fost un concept popular și există câteva proiecte care încearcă să facă acest lucru. Stimulentele în blockchain sunt ideale pentru rețelele de bootstrapping și reprezintă un mecanism eficient pentru a atrage participanți sau entități cu GPU-uri inactive într-un mod descentralizat. În mod obișnuit, obținerea accesului la GPU-uri implică semnarea de contracte pe termen lung cu furnizorii de cloud, iar aplicațiile ar putea să nu utilizeze neapărat GPU-urile pe toată perioada contractului.
O altă abordare numită Petals implică împărțirea unui model LLM în mai multe straturi care sunt găzduite pe diferite servere similare conceptului de sharding. A fost dezvoltat ca parte a colaborării BigScience de ingineri și cercetători de la Hugging Face, Universitatea din Washington și Yandex, pentru a numi câteva. Orice utilizator se poate conecta la rețea într-un mod descentralizat ca client și poate aplica modelul datelor sale.
Oportunități pentru aplicațiile de infrastructură AI X Web3
Deși există încă unele dezavantaje, infrastructura Web3 are potențialul de a aborda provocările generate de integrarea AI și prezintă oportunități pentru soluții inovatoare, așa cum vom explora mai jos.
Rețele de calcul AI descentralizate
Rețelele de calcul descentralizate leagă persoanele care au nevoie de resurse de calcul cu sisteme care posedă capacități de calcul neutilizate. Acest model, în care indivizii și organizațiile își pot contribui cu resursele inactive la rețea fără a suporta cheltuieli suplimentare, permite rețelei să ofere prețuri mai rentabile în comparație cu furnizorii centralizați.
Există posibilități de redare GPU descentralizată facilitată de rețele peer-to-peer bazate pe blockchain pentru a scala crearea de conținut 3D bazată pe inteligență artificială în jocurile Web3. Cu toate acestea, un dezavantaj semnificativ pentru rețelele de calcul descentralizate constă în potențiala încetinire în timpul antrenamentului de învățare automată din cauza supraîncărcării de comunicare între diverse dispozitive de calcul.
Date AI descentralizate
Datele de instruire servesc ca set de date inițial utilizat pentru a învăța aplicațiile de învățare automată să recunoască tipare sau să îndeplinească un anumit criteriu. Pe de altă parte, datele de testare sau validare sunt folosite pentru a evalua acuratețea modelului și este necesar un set de date separat pentru validare, deoarece modelul este deja familiarizat cu datele de antrenament.
Există eforturi continue pentru a crea piețe pentru sursele de date AI și etichetarea datelor AI, în care blockchain-ul servește ca un strat de stimulare pentru companiile și instituțiile mari pentru a îmbunătăți eficiența. Cu toate acestea, în stadiul incipient al dezvoltării actuale, aceste verticale se confruntă cu obstacole, cum ar fi nevoia de revizuire umană și preocupări legate de datele activate de blockchain.
De exemplu, există rețele de calcul SP special concepute pentru antrenamentul modelului ML. Rețelele de calcul SP sunt adaptate pentru cazuri de utilizare specifice, adoptând de obicei o arhitectură care consolidează resursele de calcul într-un pool unificat, asemănător cu un supercomputer. Rețelele de calcul SP determină costul printr-un mecanism de gaz sau un parametru controlat de comunitate.
Solicitări descentralizate
În timp ce descentralizarea completă a LLM-urilor prezintă provocări, proiectele explorează modalități de descentralizare a solicitărilor prin încurajarea contribuțiilor unor tehnici de auto-instruire. Această abordare stimulează creatorii să genereze conținut, oferind structuri de stimulare economică pentru mai mulți participanți la peisaj.
Exemplele timpurii includ platforme de chatbot alimentate cu inteligență artificială, care au stimulente tokenizate pentru creatorii de conținut și creatorii de modele de inteligență artificială pentru a antrena chatbot-uri, care ulterior pot deveni NFT-uri tranzacționabile, oferind acces la datele permise de utilizator pentru formarea modelelor și reglajul fin. Pe de altă parte, piețele descentralizate prompte urmăresc să stimuleze creatorii prompti, permițând ca proprietatea asupra datelor și solicitărilor lor să fie tranzacționate pe piață.
Învățare automată fără cunoștințe (ZKML)
2023 a fost cu adevărat anul în care LLM-urile și-au demonstrat puterea. Pentru ca proiectele blockchain să realizeze întregul potențial al IA, este esențial ca aceste modele să fie rulate în lanț. Cu toate acestea, provocările limitelor de gaz și costurile de calcul încă prezintă complexități pentru integrarea AI.
Ce se întâmplă dacă LLM-urile ar putea fi desfășurate în afara lanțului, iar rezultatele acestora ar putea fi utilizate pentru a conduce decizii și activități în lanț, toate în timp ce generează dovezi că aceste decizii sunt luate de modelul ML AI și nu de rezultate aleatorii? Acesta este în esență ceea ce este ZKML. Odată cu lansarea viitoare a GPT-5 de la OpenAI și Llama3 de la Meta, LLM-urile devin mai mari cu capacități îmbunătățite. Scopul principal al ZKML este de a minimiza dimensiunea dovezilor, ceea ce o face o potrivire naturală pentru combinarea probelor ZK cu tehnologia AI. De exemplu, ZK-proofs ar putea fi aplicate pentru a comprima modele în inferența ML descentralizată sau antrenament prin care utilizatorii contribuie la instruire prin transmiterea datelor la un model public într-o rețea în lanț.
În prezent, ne aflăm în stadiile incipiente ale a ceea ce este practic din punct de vedere computațional să verificăm folosind dovezile cu cunoștințe zero în lanț. Cu toate acestea, progresele în algoritmi lărgesc domeniul de aplicare a ceea ce poate fi realizat prin explorarea cazurilor de utilizare, cum ar fi Integritatea modelului, prin care dovezile ZK ar putea fi folosite pentru a demonstra că același algoritm ML este rulat pe date ale diferiților utilizatori în același mod. evitați prejudecățile. În mod similar, odată cu creșterea portretelor generate algoritmic și a deepfake-urilor, dovezile ZK ar putea fi aplicate în Proof of Personhood pentru a verifica o persoană unică fără a compromite informațiile private ale unei persoane.
În concluzie, integrarea infrastructurii Web3 și AI reprezintă o frontieră interesantă a inovației tehnologice, sporind în același timp contribuția prin stimulente simbolizate. În timp ce Web2 a fost martor la progrese semnificative în AI, intersecția dintre Web3 și AI este încă un subiect de explorare.
Pe măsură ce avansăm, sinergia dintre Web3 și AI are un potențial mare, promițând să remodeleze peisajul tehnologiei și modul în care abordăm infrastructura AI. Rămâneți pe fază pentru următoarea parte a seriei AI X Web3, în care ne aruncăm o privire în cazurile de utilizare a AI în jocurile Web3.
Exonerare de responsabilitate: Conținutul acestui articol a fost pregătit exclusiv în scopuri informative și nu ar trebui să constituie baza pentru luarea deciziilor de investiții sau să fie interpretat ca o recomandare de angajare în tranzacții de investiții sau să sugereze o strategie de investiții cu privire la orice instrumente financiare sau emitenții acestora.
