Izceļ

  1. GPT-4 atbalsta attēlu un teksta ievadi, savukārt GPT-3.5 pieņem tikai tekstu.

  2. GPT-4 ir salīdzināms ar cilvēkiem dažādos profesionālajos un mācību testos. Piemēram, tas nokārtoja advokāta eksāmenu, ierindojoties labāko 10% testu kārtotāju.

  3. OpenAI pavadīja 6 mēnešus, testējot un konfigurējot GPT-4. Vienkāršā tērzēšanā atšķirība starp GPT-3.5 un GPT-4 nav tik pamanāma, taču sarežģītākos uzdevumos tā kļūst acīmredzama. GPT-4 ir izturīgāks un radošāks nekā GPT-3.5, un tas var apstrādāt sarežģītākus un sarežģītākus pieprasījumus, kā arī sarežģītus attēlus. Tomēr OpenAI atzīst, ka GPT-4 nav ideāls, un tam joprojām ir problēmas ar faktu pārbaudi, argumentāciju un pārmērīgu uzticēšanos.

  4. Lai tagad izmantotu jauno GPT-4 versiju, būs nepieciešams aktīvs ChatGPT Plus abonements (20 $). OpenAI plāno beidzot ieviest maksas abonementu tiem, kas sistēmu izmanto lielos apjomos, taču cer atstāt dažus bezmaksas vaicājumus parastajiem lietotājiem.

Funkcijas un piemēri, kā izmantot jauno modeli

Pēdējo divu gadu laikā komanda ir pārveidojusi visu dziļās apmācības steku un sadarbojusies ar Azure, lai izveidotu superdatoru no paša sākuma. Pirms gada OpenAI apmācīja GPT-3.5 kā pirmo visas sistēmas "pārbaudes darbību", ieskaitot vairāku kļūdu atrašanu un labošanu un iepriekšējās bāzes uzlabošanu. Rezultāts ir GPT-4, kas darbojas stabili un ir pirmais lielais modelis, kura treniņu efektivitāti var precīzi paredzēt iepriekš.

GPT-3.5 un GPT-4 nedaudz atšķiras vienkāršos vaicājumos. Atšķirība ir redzama sarežģītos uzdevumos, kas prasa radošumu, uzticamību un maksimālu atbildes detalizāciju. Piemēram, kontroldarbu un olimpisko uzdevumu risināšana. Zaļās joslas diagrammā norāda, cik daudz labāks jaunais modelis darbojas:

Zemāk esošajā tabulā parādīti punkti, ko GPT-4 ieguva dažādos amerikāņu testos. Mazajā drukā ir norādīti augstākie procentiles rādītāji. Īpašu interesi izraisīja SAT matemātikas eksāmena matemātikas sadaļa, kurā iekļautas problēmas algebrā un ģeometrijā, tostarp tās, kurām nepieciešamas teorētiskas zināšanas par kopu funkcijām un skaitļu moduli, kā arī zināšanas par vienādojumiem, kas satur radikāļus, pakāpes un funkcijas. GPT-4 ieguva 700 punktus no 800 un bija starp 11% labāko šo testu. Un AI īpaši nemācījās veikt SAT testus:

Izstrādātāji arī pārbaudīja, kā AI apstrādā dažādas valodas. Viņi pārbaudīja 26 valodas. Angļu valoda acīmredzami bija saprotamākā valoda ChatGPT ar rezultātu 85,5%, itāļu valoda bija otrajā vietā ar 84,1%, krievu relatīvais vērtējums bija 82,7%, taju ar 71,8%, un telugu (viena no Indijas valodām) ar 62% - minimālais no pārbaudītajiem:

Vizuālā ievade

GPT-4 tagad saprot ne tikai tekstu, bet arī attēlus: dokumentus ar tekstu un fotoattēliem, diagrammas, ekrānuzņēmumus un daudz ko citu.

Šajā attēlā mākslīgais intelekts pareizi atpazina, ka iPhone uzlādes vads ir "stilizēts", lai līdzinātos vecajam VGA savienotājam, un ka tas viss izskatās pēc "vecajiem trikiem":

No šī attēla AI mierīgi ieguva datus un saskaitīja gaļas patēriņu Gruzijā un Rietumāzijā:

AI arī atrisināja un detalizēti aprakstīja franču valodā uzrakstītu fizikas problēmu:

Izspieda no sarežģītas rokasgrāmatas:

Riski un to mazināšanas pasākumi

Komanda stiprina GPT-4 drošību, pirms apmācības pārbaudot un filtrējot datus. Tika nolīgti eksperti, lai pārbaudītu augsta riska vaicājumus. Modeļa uzlabošanai tika izmantotas šo jomu ekspertu atsauksmes un dati. Piemēram, komanda strādāja pie tā, lai GPT-4 noraidītu vaicājumus, piemēram, "bīstamu ķīmisko vielu sintezēšana".

Salīdzinot ar GPT-3.5, izstrādātāji samazināja GPT-4 tieksmi atbildēt uz pieprasījumiem par nelikumīgu saturu par 82%, vienlaikus palielinot atbilžu skaitu uz konfidenciāliem pieprasījumiem (piemēram, medicīniskās konsultācijas un paškaitējums) par 29%, saskaņā ar OpenAI politiku.

Kopumā komandas iejaukšanās ir samazinājusi bīstamo pieprasījumu skaitu, taču joprojām pastāv situācijas, kad lietotāji pārkāpj algoritmu un piekļūst bīstamam saturam. Tā kā ar mākslīgo intelektu saistītie riski pastāvīgi pieaug, šādās situācijās kļūst nepieciešams sasniegt augstu uzticamības pakāpi.

Visticamāk, ka GPT-4 un turpmākie modeļi atstās gan pozitīvu, gan negatīvu ietekmi uz sabiedrību. Komanda iesaista ārējos pētniekus, lai novērtētu iespējamo ietekmi šajā posmā un nākotnē.