Nach langem Warten hat OpenAI (https://openai.com/) endlich das neue GPT-4-Modell veröffentlicht – ein großes Update der Kernstruktur hinter dem beliebten ChatGPT-System sowie der GPT-3.5-API. In der neuen GPT-4-Version ist viel los.
Basierend auf frühen Beispielen, API-Dokumentation und von OpenAI bereitgestellten Codebeispielen sind hier die wichtigsten Dinge, die Sie über das Projekt wissen sollten:
Das Projekt ist multimodal. Was bedeutet das?
Vor der Veröffentlichung von GPT-4 gab es viele Spekulationen darüber, ob das Projekt ein reines Textmodell wie ChatGPT bleiben oder multimodal werden würde. Multimodale Modelle sind in der Lage, ein breites Spektrum an Medientypen zu verarbeiten, sowohl Ausgabe als auch Eingabe, von Text über Bilder bis hin zu Videos.
Derzeit unterstützt GPT-4 sowohl Eingabe- als auch Ausgabebilder. Diese Funktion steht zunächst nur einem Drittunternehmen zur Verfügung, das OpenAI beim Testen der Bildverarbeitung unterstützt. Je schneller das System wird, desto mehr Benutzern stehen Bilder als Eingabe zur Verfügung.
OpenAI hat jedoch einige Beispiele dafür, wie dies funktionieren könnte. Ein Beispiel ist ein Foto von Eiern und Mehl mit einer Suchanfrage zum Thema Kochen. GPT-4 empfiehlt Rezepte, die mit den auf dem Foto gezeigten Zutaten zubereitet werden können. Das Modell kann auch zum Erstellen von Bildunterschriften oder zum Schreiben erstaunlicher Alternativtexte für Bilder auf Websites verwendet werden. Das Video ist noch nicht verfügbar, wird aber wahrscheinlich erscheinen, da GPT-4 multimodal ist.
OpenAI wird fast sofort API-Zugriff auf das neue Modell bereitstellen. Viele Unternehmen integrieren bereits bestehende APIs von OpenAI, sodass die Migration zu GPT-4 einfach ist. Standardmäßig kann GPT-4 8.000 Token verarbeiten, was etwa 50 Textseiten entspricht.
Durch die Verarbeitung von mehr Daten kann das System viel mehr Anweisungen verarbeiten, längere Artikel schreiben und vielleicht sogar sehr lange Dokumente oder vollständige Literaturwerke schreiben. Die Entwicklung neuronaler Netze vollzieht sich buchstäblich sprunghaft, und in naher Zukunft werden wir wiederholte Aktualisierungen sehen.