穩定性 AI 爲文字到影片生成引入穩定的視訊擴散

根據 Decrypt 報導，Stability AI 宣佈發佈 Stable Video Diffusion，這是一款專爲高解析度文字到影片和影像到影片生成而設計的文字到影片工具。該公司的研究論文強調了其適應性和開源技術，可用於廣告、教育和娛樂領域的各種應用。穩定視訊擴散目前已在研究預覽中提供，並聲稱其計算預算的一小部分優於基於影像的方法。
Stability AI 在 Stable Video Diffusion 旗下開發了兩種模型：SVD 和 SVD-XT。SVD 模型將靜態圖像轉換爲 14 幀的 576x1024 視頻，而 SVD-XT 使用相同的架構，但擴展到 24 幀。這兩種模型都提供每秒 3 到 30 幀的視頻生成，展示了開源文本到視頻技術的前沿。在快速發展的 AI 視頻生成領域，Stable Video Diffusion 與 Pika Labs、Runway 和 Meta 的創新模型展開競爭。
儘管取得了技術成就，Stability AI 仍面臨挑戰，包括在 AI 訓練中使用受版權保護的數據的道德考量。該公司強調，該模型目前不適用於現實世界或商業應用，而是專注於根據社區反饋和安全問題對其進行改進。

穩定性 AI 爲文字到影片生成引入穩定的視訊擴散

相關創作者

實時新聞

穩定性 AI 爲文字到影片生成引入穩定的視訊擴散

相關創作者

實時新聞

熱門文章