はじめに
最近のAI動画生成の進化は目覚ましいものがあります。CMや映画に近いクオリティの映像が生成可能になり、映画制作や漫画制作の在り方さえも変えてしまうほどのインパクトを持っています。音楽生成AIと同様、クリエイティブの世界に大きな変革をもたらしつつあります。
そんな中、個人的に最も印象的だったのが「フルーツが動物に変化する動画」でした。これは順当な進化というよりも、誰も想像していなかった新しい表現方法であり、とても新鮮な驚きがありました。この興味深い表現に触発され、自分でも試してみることにしました。
特に無料枠が充実しているLuma AI (Dream Machine)を中心に、各サービスを比較検証した結果をご紹介します。
サマリ動画を作成したのでこちらを見て頂くのが早いかもしれません。
考察:AI動画生成における変化表現について
実験を通じて見えてきた一つの仮説は、「5秒間で完結しうる変化」を意識することです。
現時点での限られた試行からの考察ではありますが、フルーツから動物への変化という非現実的な表現であっても、その変化の過程に一定の「ありえなさの中にある自然さ」を持たせることが重要かもしれません。例えば、鳥の卵に見える果物から、カラフルな鳥への変化というように、全く異なる物体間でも、その中間点に視覚的な繋がりを見出せる可能性があります。
ただし、これはあくまで初期的な試行からの考察であり、より多くの検証が必要です。
失敗パターン
プロンプトは保存されてないので、正確なプロンプトは書いてませんが雰囲気だけでもわかればと思います。
最初と最後のフレームを入れたパターン
画像生成AIで最後の画像をつくってもらい、それをバナナが変化するという文言でやってみると、こんな感じでした。最初と最後の映像が違いすぎて、一旦、中間画像を生成してるのが分かると思います。あまりに違いすぎるとダメということと、変化の滑らか感はあるのですが、本物感はないので、終端フレームを持ってくるものは今回は使わないことにします。
変化にならなかった例
これはリンゴからアニマルというプロンプトだったと思います。変化ではなく、追加になって失敗してました。対象物を指定しないため、アニマルが追加だけが生成された感じです。
こちらはリンゴから羽だけ生えて失敗した例です。プロンプトが難しいところではあります。
成功した例をサービスごとに比較
これはtiktokで使われてたものをそのまま参照してます。
【使用した画像】
【使用したプロンプト】
Turn this photo into a group of reddish-yellow chicks wagging their tails, waking up from their slumber and jumping out
(この写真を尻尾を振りながら眠りから目覚めて飛び出す赤黄色のヒナの群れに変えて)
Dream Machine
果物がほぼ写ってないので失敗に近いかもしれませんが、一見すれば割と自然だとおもいます。
Pika 1.5
1.5なのでちょっと品質が悪い気がしますね。もう少し頑張れば鳥にはなりそう。
Runway Gen-3
鳥の精度は断トツですね。自然を通り越して活力すら感じてしまう。
Kling
一番よくできてると思います。果物がドンと登場する演出も良い感じですし、少しずつ変化している感じもとても良い。
プロンプトを変えてみる
プロンプト例1:変化の段階を強調する
さきほどDream Machineだと一瞬で卵が鳥になったので、変化部分を丁寧に記載したプロンプトです。これもなかなか良い気がします。
A vibrant red and yellow fruit slowly cracks open, revealing fluffy reddish-yellow chicks inside. The chicks gradually emerge, their tiny wings unfolding and tails starting to wag. They shake off sleep, chirping softly, and one by one jump out, leaving the remnants of the fruit behind.
(鮮やかな赤と黄色の果物がゆっくりとひび割れて開き、中からふわふわの赤みがかった黄色のヒヨコが現れます。ヒヨコたちは徐々に姿を現し、小さな翼を広げ、尾を振り始めます。眠気から覚め、優しくさえずり、一匹ずつ飛び出し、果物の残骸を残していきます。)
プロンプト例2:時間経過を意識させる
これはプロンプトの中に”slowly revealing the fuzzy heads”これがあり、少し強調され過ぎてますね。鳥も違和感が残ってしまった。
Start with a close-up of a ripe reddish-yellow fruit. Over time, subtle movements appear within the fruit. The skin begins to bulge and crack, slowly revealing the fuzzy heads of reddish-yellow chicks. They stretch and wake, their tails beginning to wag, and eventually burst forth, jumping out with playful energy.
(熟した赤みがかった黄色の果物のクローズアップから始まります。時間が経つにつれて、果物の中にわずかな動きが現れます。皮が膨らみ始め、ひび割れ、ゆっくりと赤みがかった黄色のヒヨコのふわふわの頭が現れます。彼らは伸びをして目を覚まし、尾を振り始め、最終的には遊び心のあるエネルギーで飛び出します。)
無料枠の比較
5秒動画を無料で何本生成できるかを表にしています。
2025年1月時点で調べたものですが、無料枠がはっきり記載されてないものもあるので参考にしてください。
- Dream Machineだと5本、Runwayだと2本、無料枠が生成できます。
- Pikaは最新の2.0は使えませんが、1.5であれば10本ほど練習には良いと思います。
- Klingは無料枠は群を抜いてますが、生成時間が無料枠だと1,2時間かかるので練習には向いてないです。(他のサービスは1,2分程度でした)
サービス名 | 初回無料枠 | 初回以降の無料枠 | 最小課金プラン |
Luma AI (Dream Machine) | 5本 (400クレジット) | なし | 40本/9.99$ ・1動画80クレジット ・3200クレジット毎月付与 |
Runway Gen-3 | 2本 (125クレジット) | なし | 12本/15$ ・1動画50クレジット ・625クレジット毎月付与 |
Pika 1.5 | 10本 (150クレジット) | 10本/月 (150クレジット) | -(pika2.0が使用可能) |
Kling | 18本 (366クレジット/日) | 18本 /月 (366クレジット/日) | ・120本/29.99$ |
以下は今回使用していませんが、有料プランのみが存在するサービスです。
これだけみると、Dream Machineが最小課金で良さそうですが、LLMも併用するならOpenAIが一番安くなりそうです。
Pika 2.0
月額29.99ドルで14本分の動画を生成可能
(1動画50クレジット、毎月700クレジット付与)。
Sora
月額20ドルで50本分の動画を生成可能。
ChatGPT Plusのサブスクリプションが必要ですが、LLM分も入ってるので一番お得。
まとめ
- Dream Machineは無料枠が最も充実しており、初心者におすすめ
- 課金するならDream MachineかOpen AI
- 自然な変化を意識したプロンプト設計が重要
- 5秒という時間枠を考慮した変化シナリオの設計がポイント