
動画生成AIで実験!静止画を動画に!〜Luma Dream Machine〜
生成AIを使って、動画を作ってみました。
2024年11月現在、こんなことを言うと「なにを今さら…」と言われると思います。
ここまでAIが高速で進化してくると、どれだけ凄くてもふーんと納得しちゃうような、そんな世の中になってきました。
ですが、あえてフツーのサラリーマン・デザイナーの立場からの印象で言わせていただくと、2024年になってからの生成AIの超高速進化って、さらにとんでもなくライトスピード!凄まじいレベルに達していると思うのです。
目次
実際どうなの?動画生成AIって。
でもやはりこれは、実際タッチしてみないとなかなか実感できないもので、実感できなければ今後業務のなかでどれだけ身近な存在になっていくのかも、はっきりつかめないと思います。
そしてまた一方で、著作権はどうなるのかとか商用利用できるのかとか、そういう整理しなければいけない情報もありますが、その辺りは一切触れずに、ここでは、実際に生成してみた結果を並べて、そのクオリティを精査してみようと思います。
「プロンプトを入力すると動画が生成される」っていうのをストレートに試してみるだけだと、生成される動画はおそらくそこそこにクオリティ的にも低く、分かり易い納得感は得られないケースが多いと思います。
なので今回は「静止画(有料素材)」→「プロンプト入力」→「動画生成」の流れのなかで、その進化の凄み、あるいはまだまだ行き届かない歯がゆさを共有できたらなと思います。
まず、やってみる。
というわけで、実際やってみましょう。
今回使用する動画生成AIは、Luma Dream Machine。
https://dream-machine.lumalabs.ai/
自分が確認できた概要をササッと。
- AIスタートアップ企業Luma Labsが2024年6月に発表した動画生成AIモデル
- 生成動画時間 = 5秒
- アカウント登録で即動画生成可能
- 有料プラン/無料プラン
- 無料版は動画30個/月 制限
- 無料版は右上にウォーターマーク付き
- アプリ版/ブラウザ版
- 延長機能(Extend)有
- ループ機能有
【テスト:1】人物

プロンプト:
An office worker holding a laptop computer. Eventually, he looks into the laptop, types a text, and smiles with pride when he presses the enter key.
(ノートパソコンを手にするサラリーマン。やがてノートパソコンを覗き込み、テキストを打ち込み、エンターキーを押すと誇らしげに微笑む。)
〈ショートレビュー〉
このビジネスマンは「誇らしげに微笑ん」ではいますが、モニタも見ていないし、テキストやエンターキーを打っている仕草はみられず、このあたりのプロンプトは無視されているようです。
しかし、指示にはないのにカメラを回り込ませ、背景が流れていく様を描写していて臨場感を出しています。
【テスト:2】人物(カメラ:ズーム)

プロンプト:
The camera zooms in gradually and the two look at each other.
(カメラは徐々にズームアップし、2人は見つめ合う。)
〈ショートレビュー〉
カメラのズームアップはいいと思います。表情は変わらないものの、動画ならではの生き生きとした佇まいを表現できています。
でも、2人は見つめ合わないし、ズームした最後のあたりの2人の顔は、元の画像とは別人かのような、コントラストを強調された怖いデフォルメになってしまっています。
【テスト:3】建物(カメラ:ドリー)

プロンプト:
The drone with the camera on it flies to a slightly lower height on the far left toward the building and approaches the building.
(カメラを搭載したドローンは、ビルに向かって左端のやや低い高さまで飛行し、ビルに近づく。)
〈ショートレビュー〉
要素の多い街の風景ながら、カメラの動きに対応した不自然感の少ない映像を作り出せています。
しかしながら「やや低い高さまで飛行」がうまく理解されていないかも。プロンプトに工夫が必要ですね。
【テスト:4】風景(屋内)

プロンプト:
As the camera pans around the office, we see many employees busily at work, some typing on computers, others making phone calls.
(カメラがオフィス内をパンすると、ある者はコンピューターに向かい、ある者は電話をかけながら、多くの従業員が忙しく働いている。)
〈ショートレビュー〉
まずは違和感の少ない屋内空間描写に感心。こういうのが一番得意なのかもしれません。もちろんよく見ると変なところはありますが、プロンプトの再考で調整できそうです。
【テスト:5】手元

プロンプト:
The beautifully finished nails. The way they stretch their fingers, change the angle, and check the finished product.
(美しく仕上がったネイル。指を伸ばし、角度を変え、仕上がりを確認する姿。)
〈ショートレビュー〉
意味も無く動いているピンセットは気になるところ。とはいえ、指示もないのに自然なカメラワークやズームしているのに綺麗な画面をキープしているのには興味をそそられます。
【テスト:6】抽象(キーフレーム)


プロンプト:
The white fluid moves and is captured in a tunnel of radiation.
(白い流体が動き、放射線のトンネルの中に取り込まれる。)
〈ショートレビュー〉
キーフレームというのは写真を2枚チョイスして、アニメーションで言う中割り的に映像化する機能。抽象イメージを無理なくシームレスに生成できています。
まとめ
以上、種類の違う6つの例を見てきましたが、これだけでもそれなりの動画が生成できることが分かったかと思います。
では、権利問題をクリアしていると仮定して、実務で使うとなるとどうなのか。
無料プランでもExtend機能(さらに追加の静止画やプロンプトの追加によって、続きのシーンを生成する)を使うことはできます。それでももちろん長いシーンをきっちり作りこむのは難しいとは思います。
とはいえ、短いシーンのカット割り・編集によっては、例えばちょっとしたMVにインサートする素材として使用することは不可能ではないと思います。
この「Luma Dream Machine」。恐ろしいのは、今年の6月にデビューしたこのサービスが、今現在も次々進化し続けているということです。「キーフレーム」や「Extend」は後から追加された機能なのです。
さらに来年の今頃には、今感じる不満点がすべて解消されていても不思議ではありません。もちろん競合のサービスも切磋琢磨するように驚くべき進化を遂げていくことでしょう。
気が遠くなる…笑。
そんなわけで、今さらながら、楽しみながらオペレートしてみた動画生成AI「Luma Dream Machine」の生成例の紹介でした。
(元素材画像:PIXTA、写真AC)