今回Veo3を使った映像制作をやってみたのでその体験記です。何かの参考になればと思います。
Veo3とは?そして利用条件について
米Googleは5月20日(現地時間)、AIモデル「Veo 3」と画像生成AI「Imagen 4」を発表した最新の動画生成AIです。Veo 3は業界初の音声付き動画生成AIで、リップシンク機能も完璧という触れ込みで、話題になっています。
使用できるモデルは以下の4つになります。
- Veo 2 – Fast ・・・ 10クレジット
- Veo 3 – Fast (Text to Video) Beta Audio ・・・20区ジレット
- Veo 2 – Quality ・・・100クレジット
- Veo 3 – Quality Beta Audio ・・・100クレジット
利用プラン詳細:(Qualityを何回作成できるか?)
- Google AI Pro:月額2,900円(月10回まで利用可能)
- Google AI Ultra:月額36,400円(もらえるクレジット数は1万2500クレジットなので、「Veo 3- Quality」では月に125回しか生成できません)
現在、3ヵ月間限定の半額セールもされていますが、それでも月額1万8000円となります。
1回の生成当たりのコストは288円(キャンペーンで半額と計算すると144円)かかる計算になりますため、現時点はとても高価です。
Google AI Proの一か月キャンペーンをやってるので、是非使ってみてください。
なぜVeo3を選んだのか
これまでKlingやDream Machineなどで動画制作を試してきましたが、Veo3の音声付き動画生成という新機能に魅力を感じました。特に、街中の交通音、公園の鳥のさえずり、キャラクター同士の対話なども生成できますという点が、従来の動画生成AIにはない特徴でした。
幸い、現在3,000円プランが1か月無料だったので、実験してみることにしました。すでにClaudeを課金しているので、二重の支払いはきついですが、動画制作の可能性を探るため挑戦しました。
参考までに、サブスクするとGemini上で以下の動画ボタンが出てくるのでそれを押した状態で動画生成してというと、動画が作成されます。一日数回が上限で、作成はVeo2になります。Veo3の場合はFlowを使うことになります。後述。

プロジェクト概要:釣り潮スカウターの格言動画化
今回の題材として、以前作成したアプリ「釣り潮スカウター」の格言表示機能を映像化することにしました。この機能、全く使われていない様子ですが、動画にすれば面白いコンテンツになるかもと考えました。
制作プロセス
ストーリー作成
最初に全体のストーリーを考える必要がありました。これはGemini 2.5 Proを使っています。
以下がプロンプトです。
エビで鯛を釣るという格言がある。それをわかりやすく生成AIで伝えたつつ、落ちのあるショートムービーを作りたい。
1.魚から学べ!格言シリーズというのが出る。
背景はざっぱーんとして波が登場し、面白おかしな魚が集まってくる。
2.エビで鯛を釣る。これが黒い背景で白文字で出る。太鼓の音。よくあるドドン
3.次に格言についての説明。「小さなことから大きなたいかをえる?という言葉をショートムービーで。わかりやすいムービー
4.釣り人からの本音は。。。というシーンを一つ入れる。文言は何か良い感じ
5.そりゃエサだもの。という悲観的な画像。
ルアーだと1円もかからない感じの画像
タイは養殖されて価格が安く、エビは高くなってる。文字でいくつかポップアップ
こんな流れ。絵コンテを作れるか?
そうすると、以下のような絵コンテが生成されます。ここからイメージを膨らませつつ、シーンごとに動画を作っていきます。






シーンごとのプロンプト作成(Veo3用)
AI Studio vs Gemini(有料版)の比較
シーンについては、AI Studio にあるPreviewモデルの方が、Geminiの有料版より優れた絵コンテを生成してくれました。おそらく、Geminiが安定板なので少し古いモデルだからと思いますので、うまく作れなそうならPreviewを検討してみても良いかも。
シーンのコマ割り
Veo3では最大8秒間の動画生成なので、コマ割りが必要なります。
Veo3プロンプトを作成して。
シーンの狙いは以下。
このエビがエビを売っているシーンの動画を生成したい。まず、ベース絵を考えて、ベース絵が再現できるようにする必要がある。
次に動画の部分だが、 少し立体感のある絵にしてほしい。魚は複数いるがそれもやり取りに注目している。尾ひれなどで泳いでいる。
エビがエビを「安いよ安いよ」というセリフを吐くリップシンクで、鯛が「最近ちょっと高いわねー、騙されないわよ」という感じの怪訝な顔をして、顔をプイとカメラ側に向ける。
以下のようなプロンプトと画像帰ってきます。V
eo3は英語のみなので、英語版をコピペすることになります。
Veo向けに最適化したプロンプト案
以下に、元のプロンプトの意図をすべて含みつつ、AIが解釈しやすいように調整したプロンプトを提案します。
日本語版プロンプト:
[全体的なスタイルと雰囲気]
添付画像を忠実に再現したアートスタイルで、高品質で鮮やかな2.5Dセルルックアニメーション。コミカルで活気のある雰囲気。[シーン設定]
水中にある活気のある市場。水面から差し込む暖かく明るい太陽光がキラキラと揺れている。背景には小さな気泡が時折ゆっくりと昇っていく。[キャラクター]
- 主人公1(売り手): 陽気な表情のエビ。小さな木製の手押し車(屋台)でたくさんのエビを売っている。
- 主人公2(客): 大きく、女王のような風格がある真鯛。少し疑い深い表情。
- 背景キャラクター: 色とりどりの様々な魚たち。売り手と客のやり取りを興味深そうに眺めており、尾ひれをゆっくりと揺らしてその場で静かに泳いでいる。
[アクションの流れ(時系列順)]
- [0-2秒] エビの売り手が、手押し車の商品を指差しながら、満面の笑みで熱心にアピールする。
- [2-3秒] エビの口が「安いよ、安いよ!」というセリフに合わせて完璧にリップシンクする。
- [3-4秒] 女王の真鯛が、商品をじっと品定めするように見る。
- [4-5秒] 真鯛の表情が、一転して疑いの表情に変わる。
- [5-6秒] 真鯛は「フンッ」という感じで、素早く顔を売り手からそむける。そして、カメラをまっすぐに見つめ、第四の壁を破る。
- [6-7秒] カメラ目線のまま、「(心の声:最近は物価が高いのよ、そんな口車には乗らないわ)」とでも言いたげな、不信感に満ちた顔でクローズアップになる。
英語版プロンプト(上記を英訳したもの):
[Overall Style and Atmosphere]
A high-quality, vibrant 2.5D cel-look animation, faithfully recreating the art style of the attached image. The atmosphere is comical and lively.[Scene Setting]
A bustling underwater marketplace. Warm, bright sun rays filter down from the surface, shimmering in the water. Small air bubbles occasionally float up in the background.[Characters]
- Main Character 1 (Vendor): A cheerful shrimp pushing a small wooden cart filled with a bounty of shrimp.
- Main Character 2 (Customer): A large, queenly sea bream with a slightly skeptical expression.
- Background Characters: Various colorful fish curiously watching the interaction, gently swaying their tail fins to swim in place.
[Action Sequence (Chronological)]
- [0-2s] The shrimp vendor gestures enthusiastically towards his cart with a huge smile.
- [2-3s] The shrimp’s mouth moves in perfect lip-sync, saying, “Yasui yo, yasui yo!”
- [3-4s] The queenly sea bream inspects the shrimp on the cart.
- [4-5s] The sea bream’s expression shifts to suspicion.
- [5-6s] With a “hmph” motion, the sea bream sharply turns her head away from the vendor, and then looks directly into the camera, breaking the fourth wall.
- [6-7s] The shot becomes a close-up on her face as she maintains eye contact with the camera, her expression full of distrust, as if to say, “(Internal thought: Prices are so high these days, I won’t be fooled by your sweet talk.)”
このプロンプトのポイント
- 構造化: [スタイル], [設定], [キャラクター], [アクション] のようにセクション分けすることで、AIが各要素を整理しやすくなります。
- 具体的な用語: 「少し3D」を**「2.5Dセルルックアニメーション (2.5D cel-look animation)」**とすることで、手描きアニメの質感と立体感を両立させたいという意図をより正確に伝えます。
- 時系列とカメラワーク: アクションを時系列のリストにし、秒数の目安を入れることで、シーンのペースをコントロールしやすくなります。また、「カメラをまっすぐに見つめ、第四の壁を破る (looks directly into the camera, breaking the fourth wall)」や「クローズアップになる (becomes a close-up)」といったカメラワークの指示は、動画生成において非常に重要です。
- 感情の明記: 鯛の表情について、セリフにはない**「心の声」**を補足することで、AIが表現すべき感情(不信感、呆れ)をより深く理解し、的確な表情を生成する助けになります。

Flowツールで動画生成
映像制作者向けに新しい AI 映像制作ツール Flow の提供を開始しました。Flowは複数の動画を繋げて連続した映像を作るツールです。

Veo3 Qualityを選択し、先ほどのプロンプトをコピペして生成します。

生成された動画下記になります。
Flowでの課題と思ったこと。
- Veo3はフレーム対応していないため、思ったような連続性が出ませんでした。Veo2は対応してます。
- 同じプロジェクトで再生成するより、新しくプロジェクトを起こした方が良い結果が得られました。
音声に関する発見:
- 背景音、リップシンクが自動で生成されます
- 字幕を入れて空耳効果を使えば十分実用的です
制作のコツとポイント
効果的なプロンプト作成
- 曖昧な指示の方がAIが良い感じに解釈してくれる
- 細かすぎる指示は映像の崩れを招く
- 「場所」+「人物・対象」+「動作」+「雰囲気」の組み合わせが効果的
コスト管理
- 100クレジット(約288円)で1回の生成なので、事前の画像確認が重要
- シーンごとに新しいプロジェクトを作成する方が良い結果が得られる
- Flow機能は魅力的だが、Veo3の制限により期待通りの結果は得にくい
音声活用
- 日本語での音声生成は不完全だが、字幕と組み合わせれば実用的
- 背景音やリップシンクは自動生成されるため、追加作業が不要
最終的な成果
個人的には非常に満足のいく動画が完成しました。シリーズ化していても面白そうで、ネタは以前アプリ作ったので100個以上ありそうです。ただし、クレジット代金の捻出が課題となっています。
こちらに動画を置いておきます。
まとめ
シナリオを意識した動画品質は圧倒的で音声付き生成は革新的だと思いました。価格がちょっと高いので好き放題とはなりませんが、ショート動画や説明動画制作には十分価値がある。
短尺動画制作者や、商品・サービスの説明動画を作りたい人、動画編集スキルがないけど高品質動画が欲しい人には特におすすめです。1か月無料キャンペーンで試してみてはどうでしょう。