Seedance 2.0 画像から動画への変換チュートリアル（2026年版）

Q: 画像がどのフレームに表示されるか制御できますか？

はい。プロンプトに「@Image1 as the first frame」と書くことで、ファーストフレーム手法を使えます。これにより画像が冒頭のフレームとして固定され、AIがそこから前方へアニメーションさせます。

Seedance 2.0の画像から動画への変換機能は、最も強力な機能の1つです。テキストでシーンをゼロから記述する代わりに、静止画をアップロードし、それをどう動かすか——何が動き、カメラがどう振る舞い、どんなスタイルを適用するか——をAIに正確に伝えます。その結果、元画像の構図・色・ディテールを保ちながら、自然でシネマティックな動きを加えた、最大2K解像度の4〜15秒の動画が得られます。

このチュートリアルでは、素材画像の準備から効果的なモーションプロンプトの作成まで、画像から動画への一連のワークフローを解説します。コピー＆ペーストできるプロンプト例、ファーストフレーム固定やキャラクターアニメーションなどの高度なテクニック、そしてクリエイターが最もよく遭遇する問題の解決策を紹介します。

なぜ画像から動画なのか（テキストから動画ではなく）

テキストから動画は強力ですが、開始時の構図に対する制御は弱くなります。特定のルック、キャラクター、商品ショット、シーンがすでに頭にある場合、画像から動画の方が次の3つの理由で優れたワークフローになります。

視覚的な精度。 画像が構図、配色、照明、被写体の見た目を固定します。AIはキャラクターがどう見えるか、シーンがどうフレーミングされるかを推測する必要がなく、あなたの正確なビジュアルから始めます。

キャラクターの一貫性。 AI動画で最も難しい問題の1つは、フレーム間でキャラクターを同じに保つことです。参照画像を提供し@mentionシステムを使うと、Seedance 2.0はその画像を真実のアンカーとして扱い、クリップ全体を通して顔の特徴、服装、体のプロポーションを維持します。

より速い反復。 複雑なビジュアル記述を書き直す代わりに、画像を1枚入れ替えるだけです。プロンプトは動きとカメラワークに集中でき、調整がより簡単になります。

画像から動画は、商品デモ、コンセプトアートからのキャラクターアニメーション、既存写真からのSNSコンテンツ、絵コンテから動画への変換、そしてビジュアルアイデンティティがすでに確立されているあらゆるワークフローに最適です。

始める前に必要なもの

Dreaminaを開く前に、以下を準備しましょう。

Dreaminaアカウント

Seedance 2.0は、ByteDanceのDreaminaプラットフォーム dreamina.capcut.com で動作します。CapCutまたはByteDanceアカウントでサインアップしてください。新規アカウントには無料トライアルクレジットが付与され、数回のテスト生成に十分です。

高品質な素材画像

画像の品質は出力品質を直接左右します。以下のガイドラインに従ってください。

解像度：2K（2048x1152）以上。Seedance 2.0は最大2Kで出力するため、720pの素材画像を与えるとAIがディテールをアップスケールして推測しなければなりません。
形式：JPG、PNG、またはWebP。透明部分や細かいディテールがある画像にはPNGが推奨されます。
被写体の鮮明さ：主な被写体がシャープにフォーカスされ、照明が良いこと。強い圧縮ノイズ、モーションブラー、低コントラストのシーンは避けましょう。
構図の余白：加える予定の動きのための視覚的な余白を残します。キャラクターを前に歩かせたいなら、フレームの端で見切れないようにしましょう。

明確なモーションプラン

プロンプトを書く前に、次の3つを決めましょう。

何が動くか？ ——被写体、背景、それとも両方？
カメラはどう動くか？ ——パン、オービット、ドリー、ティルト、固定、それとも手持ち？
ムード／ペースは？ ——ゆっくりでシネマティック、それとも速くてエネルギッシュ？

始める前にこれらの答えを用意しておくと、平凡な結果しか生まない曖昧で焦点のないプロンプトを防げます。

ステップバイステップ：Seedance 2.0の画像から動画

ステップ1：Dreaminaを開いてモデルを選択する

dreamina.capcut.com にアクセスする
アカウントにログインする
メインナビゲーションで AI Video をクリックする
モデル選択ドロップダウンから Seedance 2.0 を選ぶ

ステップ2：参照画像をアップロードする

リファレンスパネル（インターフェイス左側のアップロードエリア）をクリックして画像をアップロードします。ドラッグ＆ドロップ、またはクリックして参照できます。

アップロードした各ファイルには自動的に@タグが割り当てられます。

1枚目の画像：@Image1
2枚目の画像：@Image2
以降、@Image9 まで

1回の生成につき、最大9枚の画像、3本の動画クリップ（合計15秒）、3つの音声ファイル（合計15秒）——最大12ファイルまでアップロードできます。

ヒント：基本的な画像から動画への変換なら、画像1枚で十分です。異なるショット間でキャラクターの一貫性が必要な場合や、被写体とスタイル参照を別々に定義したい場合に複数の画像を使いましょう。

ステップ3：モーションプロンプトを書く

ここが画像から動画とテキストから動画の違いです。画像がすでにビジュアルシーンを確立しているため、プロンプトはシーンの記述ではなく、動きとカメラワークに集中すべきです。

@タグを明示的に使います。

@Image1 is the first frame. The woman's hair blows gently
in the wind. She slowly turns her head to the right and
smiles. Camera holds steady in a medium close-up.
Soft natural lighting, shallow depth of field.

完全なプロンプトの公式とさらなる例は次のセクションで扱います。

ステップ4：出力設定を構成する

以下のパラメータを設定します。

設定	選択肢	推奨
アスペクト比	16:9、9:16、4:3、3:4、1:1	素材画像の比率に合わせる
長さ	4〜15秒	テストには5秒から始める
解像度	最大2K（2048x1152）	最終出力は2Kを使う

アスペクト比の一致が重要です。 素材画像が16:9なのに出力を9:16に設定すると、AIは構図をクロップまたは変形させ、しばしば重要なディテールを失います。常に素材画像のアスペクト比を出力設定に合わせましょう。

ステップ5：生成する

Generate をクリックして待ちます。2K解像度の5秒クリップは通常約60秒かかります。

ステップ6：確認して反復する

結果を注意深く見ます。以下をチェックしましょう。

動きの品質：動きは滑らかで自然か？
キャラクターの一貫性：被写体は全体を通して見た目を保っているか？
カメラの挙動：カメラは指示に従っているか？
アーティファクト：ちらつき、ゆがみ、不自然な歪み、特に手や顔の周りを確認します。

何かおかしい場合は、プロンプトの要素を一度に1つずつ調整します。複数を同時に変えると、何が結果を改善（または悪化）させたか判断できなくなります。プロンプトごとに2〜4種類のバリエーションを生成して結果を比較しましょう。

画像から動画へのプロンプト公式

画像から動画では、画像がビジュアル構図を担当し、プロンプトが動きを担当します。次の公式を使いましょう。

被写体 + 動き、背景 + 動き、カメラ + 動き

これを3つのレイヤーに分解します。

レイヤー1：被写体の動き

主な被写体が何をするかを記述します。具体的な動作動詞を使いましょう。

“The knight raises his sword slowly above his head”
“The cat stretches and yawns”
“The woman turns to face the camera”
“The product rotates 180 degrees on the table”

“the subject moves” のような曖昧な指示は避けましょう——動作動詞が具体的であるほど、結果は良くなります。

レイヤー2：背景／環境の動き

被写体の周囲のシーンで何が起こるかを記述します。

“Leaves fall gently in the background”
“Rain streaks across the window”
“City lights pulse and flicker in the distance”
“Clouds drift slowly across the sky”

背景を静止させたい場合は、明示的にそう述べましょう：“The background remains still.”

レイヤー3：カメラの動き

1クリップにつきカメラの動きは正確に1つだけ指定します。短いクリップで複数のカメラの動きを組み合わせると、不安定な結果になりがちです。

カメラの方向	効果
`Slow pan left/right`	シーンを水平に横切る
`Dolly in/out`	カメラが被写体に近づく／遠ざかる
`Orbit left/right`	カメラが被写体の周りを回る
`Tilt up/down`	カメラの垂直回転
`Tracking shot`	カメラが被写体の動きを追う
`Static shot`	カメラは位置を保ち、動かない
`Handheld`	ドキュメンタリー風の微妙な自然な揺れ

組み合わせる

ポートレート写真に公式を適用した例です。

@Image1 is the first frame. The woman slowly lifts her chin
and looks directly into the camera [subject motion]. A gentle
breeze moves the curtains behind her [background motion].
Camera slowly dollies in from a medium shot to a close-up
[camera motion]. Warm golden-hour lighting, cinematic color
grading, shallow depth of field [style].

スタイルと制約タグ

プロンプトの末尾にスタイルキーワードを加えて、ビジュアル処理を制御します。

シネマティック（Cinematic）：“cinematic lighting, shallow depth of field, film grain, 24fps”
コマーシャル（Commercial）：“clean studio lighting, product photography, crisp focus”
ドラマチック（Dramatic）：“high contrast, dramatic shadows, moody atmosphere”
滑らかな動き（Smooth motion）：“smooth continuous motion, no jump cuts”
スローモーション（Slow motion）：“slow-motion movement, 120fps look”

コピー＆ペーストできるプロンプト例 7選

これらのプロンプトは画像から動画への生成用に設計されています。画像をアップロードし、プロンプトを貼り付け（@Image1の記述を実際の被写体に置き換え）、生成します。

例1：ポートレートアニメーション

@Image1 as the first frame. The person blinks naturally and
turns their head slightly to the left. A faint smile appears.
Hair moves gently as if caught by a light breeze. Camera
holds steady in a medium close-up. Soft natural lighting,
cinematic color grading, shallow depth of field.

最適な用途：ヘッドショット、プロフィール写真、キャラクターポートレート。

例2：商品ショーケースの回転

@Image1 as the first frame. The product slowly rotates 180
degrees on a reflective surface. Soft highlights glide across
the surface as it turns. Camera holds static at eye level.
Clean studio lighting, commercial product photography style,
crisp focus throughout.

最適な用途：ECの商品ショット、マーケティング素材。

例3：風景に命を吹き込む

@Image1 as the first frame. Clouds drift slowly from left to
right across the sky. Water ripples gently in the foreground.
Grass sways in a light breeze. Camera executes a slow dolly
forward into the scene. Golden-hour lighting, nature
documentary style, wide dynamic range.

最適な用途：旅行コンテンツ、不動産、自然写真。

例4：キャラクターのアクションシーン

@Image1 is a warrior in full armor. The warrior raises their
sword overhead with both hands, then brings it down in a
powerful swing. Cape billows with the motion. Camera orbits
slowly to the right during the swing. Dramatic side lighting,
cinematic atmosphere, epic fantasy style.

最適な用途：コンセプトアートのアニメーション、ゲームマーケティング、ファンタジーコンテンツ。

例5：ファッション＆スタイル動画

@Image1 as the first frame. The model takes two confident
steps forward on the runway. Fabric of the outfit flows and
catches the light with each step. Camera tracks backward,
keeping the model centered. Bright fashion show lighting,
high-contrast, editorial photography style.

最適な用途：ファッションルックブック、SNSリール、ブランドコンテンツ。

例6：飲食

@Image1 as the first frame. Steam rises gently from the
surface of the coffee cup. A hand slowly reaches in from the
right side and lifts the cup. Liquid shifts naturally inside
the cup. Camera remains static, medium close-up. Warm
cafe lighting, cozy atmosphere, food photography style
with rich warm tones.

最適な用途：レストランのマーケティング、フードブログのコンテンツ、飲料広告。

例7：建築ビジュアライゼーション

@Image1 as the first frame. Sunlight slowly shifts across the
building facade, casting moving shadows. People walk past in
the foreground as small blurred silhouettes. Trees sway
gently. Camera slowly pans right along the building exterior.
Clean architectural photography style, natural daylight,
realistic atmosphere.

最適な用途：不動産、建築ポートフォリオ、都市コンテンツ。

高度なテクニック

基本的な画像から動画に慣れたら、これらのテクニックでより洗練された結果を生み出せます。

ファーストフレーム固定

画像から動画を使う最も信頼できる方法は、画像を生成動画のファーストフレームとして固定することです。これにより、動画は画像とまったく同じように始まり、AIがその時点から前方へアニメーションします。

プロンプトでこのフレーズを使います。

@Image1 as the first frame.

これはSeedance 2.0に対して、画像を単なるスタイルやキャラクターの参照ではなく、文字どおりの開始フレームとして扱うよう伝えます。画像の構図、色、被写体の位置、全体のレイアウトが1フレーム目に保持され、そこから動きが構築されます。

ラストフレーム指定

2枚の画像をアップロードして終点を定義することもできます——1枚を開始用、もう1枚を終了用に。

@Image1 as the first frame, @Image2 as the last frame.
The character smoothly transitions from the sitting position
to standing. Camera holds steady. Continuous smooth motion.

Seedance 2.0は、@Image1の構図から@Image2の構図へ自然に遷移する動画を生成します。これは次のような場面で強力です。

ビフォー／アフターの変化
キャラクターのポーズ遷移
シーン遷移（昼から夜、無人から人で賑わう）
商品リビールのシーケンス

ヒント：最も滑らかな遷移のために、両方の画像を同じアスペクト比とほぼ同じフレーミングに保ちましょう。最初と最後のフレーム間で構図を劇的に変えると、不安定な結果になることがあります。

複数画像によるキャラクターの一貫性

マルチショットのコンテンツ（短編映画や広告キャンペーンなど）を作るときは、すべての生成で同じキャラクター参照画像を使います。

ショット1：

@Image1 is the main character. She walks through a busy
market street. Camera tracks alongside her. Daytime,
natural lighting.

ショット2：

@Image1 is the main character. She stops at a fruit stand and
picks up an apple. Camera holds static, medium shot.
Same daytime lighting as previous scene.

両方のショットで同じ@Image1参照を使うことで、キャラクターの顔、服装、体のプロポーションがカット間で一貫します。

2枚目の画像からのスタイル転送

1枚を被写体として、もう1枚をスタイル参照としてアップロードします。

@Image1 is the main subject. Apply the visual style, color
palette, and lighting from @Image2. The subject walks forward
slowly. Camera dollies in. Match the mood and atmosphere
of @Image2 exactly.

写真を絵画のように見せたり、スケッチを3Dレンダリングのように見せたり、動きを維持しながらあらゆるスタイル間変換を行いたいときに便利です。

画像と動画の参照を組み合わせる

最大限の制御のために、画像参照（見た目用）と動画参照（動き用）を組み合わせます。

@Image1 is the character. Replicate the exact camera movement
and action choreography from @Video1. Maintain the character's
appearance from @Image1 throughout. Cinematic lighting.

これにより見た目の制御と動きの制御が分離されます——画像が物事の見た目を定義し、動画参照が物事の動き方を定義します。

反復調整のためのシード固定

Dreaminaのインターフェイスがシード値を提供している場合、部分的に気に入った生成のシードを記録しておきます。同じシードと少し調整したプロンプトで再実行すると、全体の構図を変えずに特定の要素を調整できます。動きは良いがスタイルを調整したい場合、またはその逆の場合に特に便利です。

画像準備のベストプラクティス

出力の品質は入力の品質に直結します。最良の結果を得るために以下のルールに従いましょう。

解像度が重要

入力解像度	期待される出力品質
720p未満	不良——目立つアーティファクト、ぼやけたディテール
1080p（1920x1080）	良好——SNSには十分
2K（2048x1152）	優秀——ネイティブ出力解像度に一致
4K（3840x2160）	優秀——AIに最大限のディテールを与える

常に2K以上を目指しましょう。素材画像が1080p未満の場合は、Seedance 2.0で使う前にAIアップスケーラーで拡大することを検討してください。

アスペクト比の整合

素材画像のアスペクト比を希望する出力比率に合わせます。

プラットフォーム	推奨比率	画像サイズ例
YouTube / Vimeo	16:9	2048 x 1152
TikTok / Reels / Shorts	9:16	1152 x 2048
Instagramフィード	1:1	1440 x 1440
Instagram縦型	4:5 または 3:4	1152 x 1536

比率の不一致はAIに画像のクロップやパディングを強制し、意図しないフレーミングの変化を招きます。

被写体の配置

クリップ全体を通して被写体が留まる位置に配置します。キャラクターが中央にあれば、AIは中央に保とうとします。
意図する動きの方向にヘッドルームとネガティブスペースを残します。右に歩こうとするキャラクターには、フレームの右側にスペースが必要です。
意図的に部分的なフレーミングを望む場合を除き、フレームの端で見切れた被写体は避けましょう。

照明の一貫性

AIは素材画像の照明を維持しようとします。画像が平坦で均一な照明なら、動画も平坦で均一な照明になります。よりダイナミックな結果を得るには：

方向性のある照明の画像を使います（サイドライトやバックライトの被写体はより視覚的な奥行きを生みます）。
それが望む効果でない限り、混在した色温度の照明は避けましょう。
画像の照明を上書きまたは強調したい場合は、プロンプトで指定します：“warm golden-hour lighting” または “dramatic rim lighting.”

避けるべきもの

大量のテキストや透かし：AIがそれらをアニメーションさせようとし、歪んだテキストを生みます。
顔の極端なクローズアップ：生成された動きで不気味の谷効果を生むことがあります。
コラージュや複数パネルの画像：AIがどの要素が被写体かを判断するのに苦労することがあります。
非常に暗いまたは非常に明るい画像：低コントラストの画像はAIに与える情報が少なくなります。

よくある問題のトラブルシューティング

キャラクターのドリフト（被写体の見た目が変わる）

症状：キャラクターの顔、服装、体型がクリップ中に顕著に変化する。

対処：

プロンプトを単一の被写体と1つの主要なアクションに簡素化します。
シーンの変化や新しいキャラクターの登場を示唆する指示をすべて削除します。
最大限の一貫性のために “as the first frame” 固定を使います。
参照画像に鮮明で照明の良い顔があることを確認します。

モーションブラーやガタつく動き

症状：動画が揺れて見える、または不自然なモーションブラーがある。

対処：

速いアクションの動詞を滑らかな代替に置き換えます。“runs” の代わりに “slowly walks” を使います。
滑らかさの制約を加えます：“smooth continuous motion, no sudden movements.”
クリップの長さを短くします。1つの動きの5秒クリップは、複数のアクションの15秒クリップより滑らかです。
1クリップで複数のカメラの動きを組み合わせるのを避けます。

誤ったフレーミングや被写体のクロップ

症状：出力が被写体をクロップする、または素材画像と異なるフレーミングになる。

対処：

出力アスペクト比を素材画像の比率と正確に一致させます。
フレーミングを明示します：“medium close-up” または “wide shot” または “full body shot.”
構図を固定するために “as the first frame” を使います。

静止した出力（何も動かない）

症状：生成された動画が、ほとんど動きのない静止画のように見える。

対処：

何が動くかをより具体的にします。“the scene comes to life” ではなく、正確なアクションを記述します：“hair blows in the wind, leaves fall in the background, clouds drift across the sky.”
少なくともいくらかの視覚的ダイナミズムを生むために、カメラの動きを加えます。
AIにより多くのフレームを与えるために長さを増やします。

クリップ途中での照明の変化

症状：照明や色温度が動画の途中で顕著に変化する。

対処：

照明の一貫性を明示します：“maintain consistent warm lighting throughout.”
それが意図でない限り、時間帯の変化を示唆するプロンプトは避けます。
短いクリップの長さを使います——照明は15秒クリップより4〜5秒クリップの方が安定します。

不自然な手や顔の動き

症状：手が変形する、余分な指が現れる、または表情が不気味に見える。

対処：

クローズアップの手のジェスチャーや極端な表情をプロンプトに含めるのを避けます。
カメラを被写体からミディアムショット以上の距離に保ちます。
よりシンプルな手の動作を使います：“holds the cup” は “picks up the cup while gesturing” よりうまくいきます。
手がシーンに重要でない場合は、フォーカスを外すかフレーム外に保ちます。

FAQ

Seedance 2.0は画像から動画への変換でどの画像形式に対応していますか？

Seedance 2.0はJPG、PNG、WebP画像に対応しています。最良の結果を得るには、被写体が鮮明で照明の良い2K解像度（2048x1152）以上の画像を使用してください。

一度に何枚の参照画像をアップロードできますか？

1回の生成につき最大9枚の参照画像をアップロードでき、さらに最大3本の動画クリップと3つの音声ファイル、合計最大12ファイルまで追加できます。

画像がどのフレームに表示されるか制御できますか？

はい。プロンプトに “@Image1 as the first frame” と書くことで、ファーストフレーム手法を使えます。これにより画像が冒頭のフレームとして固定され、AIがそこから前方へアニメーションさせます。

なぜ生成された動画でキャラクターの見た目が変わってしまうのですか？

キャラクターのドリフトは、プロンプトが多すぎる動作やシーンの変化を記述している場合によく起こります。単一の被写体と1つの主要な動きに簡素化してください。また、参照画像が高解像度で照明が良いことを確認しましょう。

画像から動画への生成にはどのくらい時間がかかりますか？

2K解像度の典型的な5秒クリップの生成には約60秒かかります。より長い長さや複雑な参照設定では、比例してより多くの時間がかかる場合があります。

Seedance 2.0の画像から動画への変換を商用プロジェクトに使えますか？

はい。有料のDreaminaサブスクリプションで生成したコンテンツは、ByteDanceの利用規約に従って商用利用できます。具体的な用途については最新の規約を確認してください。