Po długim oczekiwaniu OpenAI (https://openai.com/) w końcu wypuściło nowy model GPT-4 – poważną aktualizację podstawowej struktury popularnego systemu ChatGPT, a także interfejsu API GPT-3.5. Dużo się dzieje w nowej wersji GPT-4.
W oparciu o wczesne przykłady, dokumentację API i próbki kodu dostarczone przez OpenAI, oto najważniejsze rzeczy, które warto wiedzieć o projekcie:
Projekt ma charakter multimodalny. Co to znaczy?
Przed wydaniem GPT-4 było wiele spekulacji na temat tego, czy projekt pozostanie modelem tekstowym, takim jak ChatGPT, czy też stanie się multimodalny. Modele multimodalne są w stanie obsługiwać szeroką gamę typów multimediów, zarówno wyjściowych, jak i wejściowych, od tekstu po obrazy i ostatecznie wideo.
Obecnie GPT-4 obsługuje zarówno obrazy wejściowe, jak i wyjściowe. Początkowo ta funkcja jest dostępna tylko dla jednej firmy zewnętrznej, która pomaga OpenAI w testowaniu przetwarzania obrazów. W miarę przyspieszania systemu obrazy wejściowe będą dostępne dla większej liczby użytkowników.
Jednak OpenAI ma kilka przykładów tego, jak mogłoby to zadziałać. Jednym z przykładów jest zdjęcie jajek i mąki z zapytaniem związanym z gotowaniem. GPT-4 poleca przepisy, które można przygotować ze składników pokazanych na zdjęciu. Modelu można również używać do tworzenia podpisów do obrazów lub pisania niesamowitego tekstu alternatywnego do obrazów na stronach internetowych. Film nie jest jeszcze dostępny, ale prawdopodobnie się pojawi, ponieważ GPT-4 jest multimodalny.
OpenAI niemal natychmiast udostępni API do nowego modelu. Wiele firm integruje się już z istniejącymi interfejsami API OpenAI, więc migracja do GPT-4 jest łatwa. Domyślnie GPT-4 może obsłużyć 8000 tokenów, co stanowi około 50 stron tekstu.
Przetwarzanie większej ilości danych pozwoli systemowi przetworzyć znacznie więcej instrukcji, napisać dłuższe artykuły, a być może nawet napisać bardzo długie dokumenty lub pełnowymiarowe dzieła literackie. Ewolucja sieci neuronowych następuje dosłownie skokowo, a w najbliższej przyszłości będziemy świadkami powtarzających się aktualizacji.