Po dlouhém čekání OpenAI (https://openai.com/) konečně vydalo nový model GPT-4 – hlavní aktualizaci základní struktury za populárním systémem ChatGPT a také GPT-3.5 API. V novém vydání GPT-4 se toho děje hodně.

Na základě prvních příkladů, dokumentace API a ukázek kódu poskytnutých OpenAI, zde jsou klíčové věci, které byste o projektu měli vědět:

Projekt je multimodální. Co to znamená?

Před vydáním GPT-4 se hodně spekulovalo o tom, zda projekt zůstane pouze textovým modelem jako ChatGPT, nebo se stane multimodálním. Multimodální modely jsou schopny zpracovat širokou škálu typů médií, jak výstup, tak vstup, od textu po obrázky a nakonec video.

V současné době GPT-4 podporuje vstupní i výstupní obrázky. Zpočátku je tato schopnost dostupná pouze jedné společnosti třetí strany, která pomáhá OpenAI testovat zpracování obrazu. Jak se systém zrychluje, obrázky jako vstup budou dostupné více uživatelům.

Ale OpenAI má několik příkladů, jak by to mohlo skončit. Jedním z příkladů je fotografie vajec a mouky s dotazem týkajícím se vaření. GPT-4 doporučuje recepty, které lze vyrobit z přísad zobrazených na fotografii. Model lze také použít k vytváření popisků obrázků nebo psaní úžasných alternativních textů pro obrázky na webových stránkách. Video zatím není k dispozici, ale pravděpodobně se objeví, protože GPT-4 je multimodální.

OpenAI poskytne API přístup k novému modelu téměř okamžitě. Mnoho společností již integruje stávající API z OpenAI, takže migrace na GPT-4 je snadná. Ve výchozím nastavení zvládne GPT-4 8 000 tokenů, což je asi 50 stránek textu.

Zpracování většího množství dat umožní systému zpracovat mnohem více pokynů, napsat delší články a možná i napsat velmi dlouhé dokumenty nebo celovečerní literární díla. Evoluce neuronových sítí se děje doslova mílovými kroky a v blízké budoucnosti se dočkáme opakovaných aktualizací.