Chatbot-uri AI precum ChatGPT au întors capetele în întreaga lume datorită capacității lor asemănătoare cu oamenii de a discuta orice subiect.
Cu toate acestea, raportul lui Benj Edwards pentru Ars Technica, publicat joi (6 aprilie), evidențiază un dezavantaj major: acești roboti de chat pot răspândi din neatenție informații false, dar persuasive, făcându-i surse de fapt nesigure și potențiali contribuitori la defăimare.
Edwards explică că chatbot-urile AI, cum ar fi ChatGPT de la OpenAI, utilizează „modele mari de limbaj” (LLM) pentru a genera răspunsuri. LLM-urile sunt programe de calculator instruite pe cantități mari de date text pentru a citi și a produce limbaj natural. Cu toate acestea, ei sunt predispuși la erori, numite în mod obișnuit „halucinații” sau „confabulații” în cercurile academice. Edwards preferă „confabulația”, deoarece sugerează inventii creative, dar neintenționate.
Articolul Ars Technica subliniază problema roboților AI care generează informații înșelătoare, înșelătoare sau defăimătoare. Edwards oferă exemple în care ChatGPT acuză în mod fals un profesor de drept de hărțuire sexuală și susține în mod greșit că un primar australian a fost condamnat pentru luare de mită. În ciuda acestor dezavantaje, ChatGPT este considerat o actualizare de la GPT-3, deoarece poate refuza să răspundă la anumite întrebări sau să avertizeze despre potențiale inexactități.
CEO-ul OpenAI, Sam Altman, a recunoscut limitările ChatGPT, postând pe Twitter despre limitările sale „incredibile” și despre riscurile de a se baza pe el pentru chestiuni cruciale. Altman a remarcat, de asemenea, cunoștințele și înclinația simultană a chatbot-ului pentru a fi „încrezător și greșit”.
Edwards se adâncește în funcționarea lor pentru a înțelege cum se confundă modelele GPT precum ChatGPT. Cercetătorii creează LLM-uri precum GPT-3 și GPT-4 folosind „învățare nesupravegheată”, în care modelul învață să prezică cuvântul următor într-o secvență analizând date vaste de text și rafinându-și predicțiile prin încercare și eroare.
ChatGPT diferă de predecesorii săi, deoarece a fost instruit pe transcrierile conversațiilor scrise de oameni, afirmă Edwards. OpenAI a folosit „învățare prin consolidare din feedbackul uman” (RLHF) pentru a regla ChatGPT, ceea ce duce la răspunsuri mai coerente și la mai puține confabulații. Cu toate acestea, rămân inexactități.
Edwards avertizează împotriva încrederii orboase în rezultatele chatbot-ului AI, dar recunoaște că îmbunătățirile tehnologice pot schimba acest lucru. De la lansare, ChatGPT a suferit mai multe upgrade-uri, sporind acuratețea și capacitatea sa de a refuza să răspundă la întrebări pe care nu le poate răspunde.
Deși OpenAI nu a răspuns direct la întrebările despre acuratețea ChatGPT, Edwards se referă la documentele companiei și rapoartele de știri pentru informații. Omul de știință șef al OpenAI, Ilya Sutskever, consideră că formarea suplimentară RLHF poate aborda problema halucinațiilor. În același timp, cercetătorul șef AI al Meta, Yann LeCun, susține că actualele LLM-uri bazate pe GPT nu vor rezolva problema.
Edwards menționează, de asemenea, metode alternative pentru a îmbunătăți acuratețea LLM folosind arhitecturile existente. Bing Chat și Google Bard utilizează deja căutările pe web pentru a-și rafina rezultatele și este de așteptat ca o versiune a ChatGPT activată pentru browser să urmeze exemplul. În plus, pluginurile ChatGPT plănuiesc să sporească datele de antrenament ale GPT-4 cu surse externe, cum ar fi web și baze de date specializate. După cum subliniază Edwards, acest lucru reflectă sporul de precizie pe care un om îl câștigă din consultarea unei enciclopedii.
În cele din urmă, Edwards sugerează că un model asemănător GPT-4 ar putea fi antrenat să recunoască când fabrică informații și să se ajusteze în consecință. Acest lucru ar putea implica conservarea datelor mai avansate și legarea datelor de antrenament la scoruri de „încredere”, similar cu PageRank. O altă posibilitate este reglarea fină a modelului pentru a fi mai precaut atunci când este mai puțin încrezător în răspunsurile sale.

