2D画像から奥行きのある3D動画を生成!Stability AIの新技術「Stable Virtual Camera」が登場
画像から3D動画を生成する技術が進化している。英Stability AIが発表した「Stable Virtual Camera」は、1枚から最大32枚の2D画像を入力し、遠近感のある3D動画を作成するAIモデルだ。カメラアングルを自由に設定でき、ズーム、回転、パンなどの動きを組み込める。
この技術の特徴は、従来の3D動画生成に必要だった複雑なデータ処理を簡略化し、手軽にリアルな映像を作成できる点にある。一般的な3DCGツールでは、仮想カメラを使ってシーンの構図や動きを指定するが、「Stable Virtual Camera」も同様の機能を持ち、AIによる自動処理を組み合わせている。これにより、特別な技術を持たなくても直感的に3D動画を作成できるようになった。
研究プレビュー段階のため、動物や水のような動的なテクスチャを含む画像では品質が低下することがある。また、複雑なカメラ軌道ではちらつきが発生する可能性があるが、一定の条件下ではスムーズな3D動画が得られる。現在は非商用ライセンスのもとで研究目的の利用が可能で、Hugging FaceやGitHubからアクセスできる。
映像表現の幅を拡張する技術とは
「Stable Virtual Camera」が登場したことで、映像制作の手法にも変化が生まれるかもしれない。例えば、映画やアニメの制作現場では、3Dシーンを作る際に複雑なモデリング作業が必要だったが、この技術を活用すれば、2D画像から手軽に3D動画を作成できる。特に、短時間で試作映像を作る場合に有効だ。
また、メタバースやゲーム業界でも応用が考えられる。仮想空間の背景やオブジェクトを手軽に作成し、自由なカメラワークを設定することで、リアルな視点移動が可能になる。さらに、広告やプロモーション動画にも活用できる。1枚の画像からダイナミックな動画を作れるため、商品の魅力を視覚的に伝えやすくなる。
技術的な課題として、品質の安定性が挙げられる。特定のシーンではアーティファクト(映像の乱れ)が発生することがあり、リアルな映像表現には改良の余地がある。しかし、Stability AIは以前にも3D生成モデル「Stable Video 3D」などを開発しており、今回の技術も発展が期待される分野のひとつだ。
現在は研究目的の利用に限られているが、今後、商用利用が可能になれば、映像制作の効率化が進むだろう。Stability AIは音声生成AIの開発やチップメーカーArmとの提携も進めており、AI技術を活用した映像制作の分野は、さらに広がることが考えられる。
【関連リンク】
・Stability AI、静止画から指定したカメラワークのビデオが生成できる技術(PC Watch)
https://pc.watch.impress.co.jp/docs/news/1671336.html
TEXT:PreBell編集部
PHOTO:iStock
この記事を気にいったらいいね!しよう
PreBellの最新の話題をお届けします。
