GPT-4 は一部の人を失望させるかもしれません。待望の GPT-4 が来週発表されます。
現地時間3月9日、ドイツマイクロソフトの最高技術責任者であるアンドレアス・ブラウン氏が「AI in Focus - Digital Kickoff」と呼ばれるイベントでこのニュースを明らかにした。彼はイベントでこう語った。
私たちは来週 GPT-4 を発売します。これはビデオなど、まったく異なる可能性を提供するマルチモーダル モデルです。
ブラウン氏によると、この技術は基本的に「すべての言語で機能する」ところまで進化しており、これは「ドイツ語で質問してイタリア語で答えを得ることができる」ことを意味するという。
このニュースが発表されるとすぐに、世界中の注目を集めました。テクノロジー業界の人々、投資家、さらには一般ユーザーさえも、新しい GPT がどれほど強力になるかを知りたがっています。
GPT-4とは何ですか?
GPT-4 モデルは、大規模言語モデル (LLM) の第 4 世代であり、ブラウンは LLM を「ゲームチェンジャー」と呼んでいます。これは、人間がこのスキルを独占的に理解できるようにすることを意味します。
このモデルは GPT テクノロジーによって実装されています。
GPT は Generative Pre-trained Transformer の略で、人工ニューラル ネットワークを使用した深層学習テクノロジーで、機械が人間のようにチャット、通信、創造できるようにします。
GPT-4 について話すとき、その姉妹モデルである GPT-3.5 について言及する必要があります。このモデルによって開発されたチャット ロボット ChatGPT が発売されると、AI 業界で軍備競争が始まり、マイクロソフトの地位も向上しました。 Google 検索エンジンに追いつくチャンス。
したがって、GPT-4 は、GPT-3.5 に基づいて ChatGPT で使用されるテクノロジーを進化させます。
マルチモダリティが最大のハイライトになる可能性がある
Braun 氏は、Microsoft (および OpenAI) はマルチモダリティによってモデルを「包括的」にするだろうと述べました。これは、マルチモダリティが GPT-4 モデルの最大のハイライトになる可能性があることを意味します。
イベントでは、Microsoft AI技術専門家のホルガー・ケン氏とクレメンス・シーバー氏がマルチモーダルAIの関連機能を紹介した。
Kenn 氏によると、マルチモーダル AI はテキストを対応する画像、音楽、さらにはビデオに変換できるだけではありません。 Microsoftの発表前に、機械学習の専門家Emil Wallner氏はTwitterでGPT-4にこの機能があるかもしれないと予測していた。
シーバー氏は、マルチモーダル AI の産業化の可能性のある事例をいくつか紹介しました。たとえば、マルチモーダル AI は電話の音声を直接テキストに録音できます。推定によると、この機能により、オランダの大規模な Microsoft 顧客は 1 日あたり 500 時間の労働時間を節約できます。
AGIを実装しますか?パラメータが数兆レベルに増加? GPTの噂が広まっている
OpenAI は GPT-4 の謎を明らかにしていませんが、それに関する噂がすでに世界中で飛び交っています。最も誇張されたものは、GPT-4 が汎用人工知能 (AGI) に人間と同じ意識とそのパラメータを持たせる可能性があるというものです。エクサスケール レベルに達すると、サポートされるテキスト処理の長さは GPT-3.5 の最大 16 倍になると考える人もいます。
パラメータが数千億から数千億に跳ね上がる?
2021 年 8 月の時点で、業界の専門家が GPT-4 には 100 兆のパラメータがあるのではないかと推測しているというメディアの報道がありました。
現在、GPT-3 は 1,750 億個のパラメータを使用しています。メディアの報道が真実であれば、GPT-4 で使用されるパラメータはこの基本数値の 6 倍になるため、GPT-4 に基づくトレーニング製品のデータ量は驚くべきものになります。成長を、点から円へと直接拡大することに例える人もいます。
実際、AI 製品を構築するためのパラメータが多ければ多いほど、ロボットの応答能力に影響を与える可能性がありますが、理論的には、パラメータが多いほど、AI がインターネットからより多くのデータを取得できるようになり、精度が大幅に向上します。 AIの。
16 倍のテキスト長の処理をサポートしますか?
この機能に関する手がかりは、AI 実践者の Travis Fischer が Twitter で共有した価格表から得られます。
OpenAI は、Foundry と呼ばれる新しい開発者プラットフォームを密かにリリースしたと言われています。これには、それぞれ GPT3 の 4 倍と 16 倍の最大語長 8,000 語と 32,000 語のコンテキストの処理をサポートする 2 つの DV モデル (おそらく GPT-4) が含まれています。 5の倍。現在、GPT3.5 は 2048 ワード長のコンテキストを処理できます。

Microsoft は GPT-4 を Bing に統合する予定ですか?
OpenAI への主要投資家の 1 つとして、Microsoft は ChatGPT のテクノロジーを自社のアプリケーション製品に統合しました。
中でもChatGPT版Bingは、リリースからわずか1か月でデイリーアクティブユーザー数が1億人を突破し、史上初の記録となった。 Microsoft は、Bing の ChatGPT バージョンによって、主要な検索エンジンである Google に驚くべき速度で追いつきつつあります。
したがって、ほとんどのアナリストは、すでに多くのメリットを享受している Microsoft が GPT-4 を Bing に統合し続けると信じています。
GPT-4 は外の世界を失望させるでしょうか?
GPT-4に関するさまざまな憶測に直面して、OpenAIはそれらを沈静化させようとしている。
最近のメディアとのインタビューで、OpenAI CEO のサム・アルトマン氏は、GPT-4 によって AGI に人間と同じ意識を持たせる可能性があるなどの一部の噂を真っ向から否定しました。
アルトマン氏は、GPT-4は革新的な技術ではなく進化であると強調した。 ChatGPT の次のバージョンは AGI ではなく、100 兆個のパラメータを持つこともありません。これは「まったくナンセンス」です。
人々は失望することを望んでいますし、きっと失望するでしょう。
Microsoftの言うようにGPT-4が来週リリースされるかどうかについては、OpenAIは公式発表をしておらず、Altmanもいつリリースされるのかを発表していない。アルトマン氏はこう語った。
これは、私たちが安全かつ責任を持って実行できると確信したときに、遅かれ早かれ起こるでしょう。
OpenAIの最高技術責任者であるミラ・ムラティ氏は、宣伝が少なくなるのは良いことだと考えているが、GPT-4は「人々の開発の機会を広げる」可能性があると述べた。
