OpenAI oznámila, že od 5. prosince 2024 začne 12denní (každý pracovní den jedna) akce na uvedení nových produktů nebo demonstrací. I když zatím není možné přesně vědět, co bude obsahem jednotlivých prezentací, podle mnoha zpráv a spekulací by mohly zahrnovat následující obsah:
1. Veřejné uvedení nástroje pro převod textu na video Sora
Sora je novým produktem OpenAI, který byl na začátku roku veřejně uveden a stále se nachází ve stavu pozvaného testování. Bývalý technický ředitel společnosti Mira Murati uvedla, že Sora by mohla být koncem roku veřejně představena uživatelům, takže v rámci těchto 12 prezentací je velká pravděpodobnost, že Sora bude veřejně uvedena. V oblasti umělé inteligence je technologie převodu textu na video velmi populární výzkumná oblast. Například Google také uvedl svůj nejnovější generativní AI video model Veo. Uvedení Sory poskytne uživatelům nové způsoby tvorby obsahu, například uživatelé mohou zadat scénář příběhu a Sora dokáže generovat odpovídající video obsah, což má široké možnosti využití v oblastech jako je výroba filmů, reklama, výroba vzdělávacích videí atd.
2. Nový model pro odvozování
Podle zpráv z médií jako The Verge obsahuje nový produkt nový model pro odvozování, což by mohl být kompletní model o1 nebo podobný nový model AI pro odvozování. Schopnost odvozování je v umělé inteligenci zásadní, například při řešení složitých vědeckých a matematických problémů, provádění logické analýzy atd. OpenAI již dříve plánovala uvést model zaměřený na odvozování, jako byla dříve zmíněná AI produkt 'jahoda', která se také zaměřuje na odvozování. Nový model pro odvozování by mohl vykazovat vyšší efektivitu a přesnost při zpracování složitých úloh, což by mohlo pomoci zvýšit konkurenceschopnost OpenAI v oblasti AI odvozování a také by mohl být aplikován ve zdravotnictví, výzkumu a dalších oblastech, kde je třeba provádět složité logické odvozování.
3. Nové vylepšení hlasového režimu ChatGPT
1. Nový hlas
OpenAI by mohla přidat speciální hlas (existují zprávy, že by to mohl být hlas Santa Claus) do hlasového režimu ChatGPT. Někteří uživatelé již v kódu objevili, že tlačítko pro hlasový režim může mít tvar sněhové vločky, což by mohlo být náznakem nového hlasu. Přidání nového hlasu může uživatelům poskytnout různorodější interakční zážitek, například během určitých svátků nebo tematických scénářů může speciální hlas zvýšit zábavnost a pocit ponoření.
2. Vylepšení funkcí
Pokročilý hlasový režim ChatGPT má prostor pro zlepšení, možná se podaří připojení k internetu pro vyhledávání v reálném čase a analýzu skutečného světa pomocí kamery. Pokud se podaří připojit k internetu pro vyhledávání v reálném čase, ChatGPT bude moci poskytovat včasnější a přesnější informace, aniž by byl omezen znalostmi z předchozích tréninkových dat; připojení k analýze skutečného světa pomocí kamery může rozšířit jeho aplikace v oblastech jako je IoT, chytré domácnosti atd., například rozpoznávání stavu vnitřního prostředí, zabezpečení a monitorování atd.
4. Další potenciální obsah pro uvedení
1. Odemčení funkce generování obrázků v modelu GPT - 4o
Funkce generování obrázků, která byla v modelu GPT - 4o uzamčena, vykazovala v raných prezentacích působivé výsledky a schopnosti generování. Tento model také má nativní schopnosti analýzy videa. Pokud bude funkce generování obrázků odemčena, GPT - 4o bude mít v oblasti generování multimediálního obsahu komplexnější schopnosti, uživatelé je budou moci využít k vytváření obrázků, designu atd.
2. Náhled na model o2 nebo GPT - 5o
Uživatelé se těší na náhled modelu o2 nebo GPT - 5o. Pokud budeme mít na prezentaci možnost vidět příslušný náhled, pomůže to uživatelům a vývojářům lépe pochopit směr vývoje budoucích modelů OpenAI, a to včetně informací o architektuře modelu, zlepšení výkonu, nových funkcích atd., což bude mít určitý vliv na trendy v průmyslu.
3. Nástroj pro převod textu na řeč a AI agentní rámec s kódovým označením 'operátor' se předčasně objevují
Nástroj pro převod textu na řeč a AI agentní rámec s kódovým označením 'operátor', ačkoli se očekává, že budou uvedeny až příští rok, by se mohly objevit i během příštích dvou týdnů. Nástroj pro převod textu na řeč může hrát roli v oblastech, jako je hlasová interakce a výroba audioknih; AI agentní rámec pomůže vytvořit inteligentnější a efektivnější umělé inteligentní agenty, které mohou být aplikovány v oblasti chytrého zákaznického servisu, automatizace procesního řízení atd.

