記事転載元:AIの動向

出典: 新志源

画像ソース: Unbounded AI によって生成‌

ドリームワークスの創設者は、アニメーション業界は3年以内に完全に変わり、コストは90%下がるだろうと断言した。 Pika1.0 のリリースは、その日が近いことを示しています。

最近、ドリームワークスの創設者ジェフリー・カッツェンバーグは、生成 AI がメディアとエンターテイメント業界に完全な破壊をもたらすため、生成 AI によって今後 3 年間でアニメーション映画のコストが 90% 削減されるだろうと予測しました。

「歴史的な観点から見てみると、ペン、絵筆、印刷機、スチールカメラ、ムービーカメラ、これらは驚くべき方法で創造性とストーリーテリングを拡張し、人類はその軌跡を目撃してきました。」

同氏は「メディア、エンターテインメント、創作ほど生成AIの影響を受ける業界を私は知らない」と述べた。

「一方で、それは破壊的であり、今日のアーティストやストーリーテラーにとってアクセスできないものを商品化するものになると思います。」

「私がアニメーション映画を制作していた頃は、世界クラスのアニメーション映画を作るのに 500 人のアーティストが 5 年かかりました。今後 3 年間で、このコストは 10% に削減されると思います。」

「私の意見では、個人の創造性が将来のすべてを決定します。」

AIビデオの分野では、彼が言ったように、技術は10年前と同じように日々飛躍的に進歩しています。

Pika 1.0、ユーザーはわずか数分でディズニーレベルのアニメーション短編映画を作成できます

数日前にインターネット上で人気を博した Pika Labs が、正式バージョン 1.0 をリリースしました。

最初の公式ビデオで示されたアニメーション効果は、誇張することなく、ディズニーなどのアニメーション映画会社の品質に達します。

ドリームワークスの創設者がそのような予測をしたのも不思議ではありません。おそらく、Pika のような未来志向のアニメーション ツールのおかげで、彼は業界 (ベイ) 革命の夜明けを見ることができました。

ビデオを見ると、各ショットの長さはそれほど長くありませんが、アニメーション キャラクターの一貫性や絵の質感は、大手アニメーション会社が制作するアニメーションとそれほど変わらないことがわかります。

Pika 1.0 で招待エクスペリエンスがオープンになって以来、オンラインでリリースされるケースがますます増えています。 Pika 1.0 で作成されたこれらのアニメーションを見た後、誰もが 3 年後に 90% という予測は少し保守的だと考えるようです。カメラの切り替えがわずかに頻繁であることを除けば、クリスマスを祝うこのロボットのアニメーションに明らかな欠陥を見つけるのはほとんど困難です。ロボットが行ったり来たりする数ショットは非常に安定しており、これまでのAIアニメーションのように1カット変わると主人公がガラリと変わってしまうという欠点はありません。ロボットにはセリフが1本もありませんでしたが、それでも観客にシンプルなストーリーを伝えました。これをもとに良質なストーリーを展開し、AI短編アニメーションが完成します。作者によると、このアニメーションは Pika 1.0 のリリースを記念するものであるとのこと。アニメではシンプルな夜のシーンしかありませんが、花火の効果は非常に安定しており、夜の街の光と影も多様で豪華な効果です。また、各ショットのバランスも良く、雰囲気もとても良く表現されています。アニメーションのこのセクションでは、顔の歪みの問題がピカによってほぼ解決されたことがわかります。

キャラクターの顔の動きは明確ではありませんが、非常に良好な一貫性を維持しており、これにより、以前の AI アニメーションの最大の欠点が大幅に改善されました。このアニメーションは「AIショートムービー」とも言えます。

ジャックは夕暮れのタイタニック号に立っており、その隣にいるローズが素朴なジャイアントパンダに置き換えられており、その効果はまったく矛盾していません。その後ろに大きく「To Be Continued」と書かれているのも、未来のAIアニメーション業界の物語が始まったばかりであることを暗示しています。おそらく、アニメーション制作の敷居が下がり続ければ、美しいストーリーを持つすべてのクリエイターがその創造性を完全に発揮し、素晴らしいストーリーを表現できるほど洗練されたビデオを制作できるようになるでしょう。 Gen-2 はダイナミック ブラシを起動し、ユーザーがより詳細に制御できるようにします

Gen-2では、動画のダイナミックな効果をユーザーが自由に決定できる「ダイナミックブラシ」を発売。あるツイートはわずか数日で 160 万回以上読まれました。

伝説の「マジックペン馬良」のように、マウスをドラッグするだけで静止画を思い通りに動かすことができます。

背景の動きでも、写真の中の特定の風景や人物でも、自然な動きの効果を生み出すことができます。

車、煙、滝、炎、あるいは絵の中の人物など、すべて自然に動かすことができます。

湖面も船も人影も水槽の金魚も動き出す。

ユーザーが動的効果をこれほど強力に制御できるようになると、アニメーションやビデオの制作コストが大幅に削減されると考えられます。おそらく将来的には、すべての普通の人が、文章を書くのと同じように、数枚の写真と数時間を使って、自分の作品のビデオを動的に生成できるようになるでしょう。 3D 素材は 5 秒で生成可能 アニメーション コンテンツ制作のもう 1 つの分野である 3D モデリングも、AI テクノロジーによって常に革新されています。 Adobe とオーストラリア国立大学の研究者が最近発表した論文では、2D 画像から 3D 素材を直接生成する技術が提案され、業界に大きな衝撃を与えました。

プロジェクトのアドレス: https://yiconghong.me/LRM/ 作者らによると、モデルはわずか 5 秒で、指定された 2D 画像を 3D マテリアルに変換できるとのことです。

通常の3D素材に加え、モデルを利用したインタラクティブな3D素材も生成できます。

Transformer アーキテクチャに基づくこの 3D モデルには 5 億個のパラメータがあり、入力画像から 3D モデルをわずか 5 秒で予測でき、データセットから直接神経放射野 (NeRF) を予測できます。

研究者らは、Objaverse からの合成レンダリングや MVImgNet からの実際のキャプチャなど、約 100 万個のオブジェクトを含む大規模なマルチビュー データを使用してモデルをエンドツーエンドでトレーニングしました。

大容量モデルと大規模なトレーニング データを組み合わせることで、モデルの汎用性が高まります。

3D モデリング技術の継続的な開発により、Pika 1.0 の瞬間もそう遠くないと私は信じています。その頃にはソーシャルメディアの登場でセルフメディアや情報発信のあり方が大きく変わったように、AIアニメーションによってアニメーション制作の敷居が大きく下がり、映像メディア爆発の時代が到来します。参考文献: https://twitter.com/pika_labs/status/1722817227664306636https://twitter.com/runwayml/status/1723033256067489937https://arxiv.org/abs/2311.04400https://yiconghong.me/LRM/