Seedance 2.0 图生视频教程（2026 最新）

Q: 我能控制图片出现在哪一帧吗？

可以。在提示词中写「@Image1 as the first frame」即可使用首帧技巧。这会把你的图片锁定为开头帧，让 AI 从该帧向后开始动画。

Q: 为什么我的角色在生成的视频里看起来变了样？

角色漂移通常发生在提示词描述了过多动作或场景变化时。请简化为单一主体和一个主要运动。同时确保参考图片是高分辨率且光线充足的。

Seedance 2.0 的图生视频能力是它最强大的功能之一。你无需用文字从零描述一个场景，而是上传一张静态图片，告诉 AI 该如何让它动起来——什么在动、镜头如何运作、应用什么风格。最终得到一段 4-15 秒、最高 2K 分辨率的视频，它在保留原图构图、色彩和细节的同时，加入自然而富有电影感的运动。

本教程将带你走完整个图生视频流程，从准备素材图片到撰写有效的运动提示词。你会看到可复制粘贴的提示词示例、首帧锁定和角色动画等进阶技巧，以及创作者最常遇到问题的解决方案。

为什么选图生视频（而不是文生视频）

文生视频很强大，但它对起始构图的控制较弱。当你心中已有特定的画面、角色、产品镜头或场景时，图生视频是更好的工作流，原因有三：

视觉精度。 你的图片锁定了构图、配色、光照和主体外观。AI 无需猜测你的角色长什么样、场景如何取景——它从你提供的精确画面出发。

角色一致性。 AI 视频中最难的问题之一就是让角色在各帧之间保持一致。当你提供参考图片并使用 @mention 系统时，Seedance 2.0 会把该图片当作真实基准锚点，在整个片段中维持面部特征、服装和身体比例。

更快迭代。 你无需重写复杂的视觉描述，只需更换一张图片。你的提示词可以专注于运动和镜头调度，这更容易调整。

图生视频非常适合产品演示、从概念图生成角色动画、用现有照片制作社媒内容、分镜转视频，以及任何视觉身份已经确立的工作流。

开始前你需要准备什么

打开 Dreamina 之前，请先准备好以下内容：

一个 Dreamina 账户

Seedance 2.0 运行在 ByteDance 的 Dreamina 平台上，地址为 dreamina.capcut.com。用 CapCut 或 ByteDance 账户注册。新账户会获得免费试用额度——足够进行几次测试生成。

高质量的素材图片

图片质量直接决定输出质量。请遵循以下准则：

分辨率：2K（2048x1152）或更高。Seedance 2.0 输出最高 2K，所以给它一张 720p 的素材图意味着 AI 必须放大并猜测细节。
格式：JPG、PNG 或 WebP。对于含透明通道或精细细节的图片，推荐使用 PNG。
主体清晰度：主体应锐利对焦、光线良好。避免严重的压缩瑕疵、运动模糊或低对比度场景。
构图留白：为你计划添加的运动留出视觉空间。如果你想让角色向前走，就别把他裁在画面边缘。

一份清晰的运动方案

撰写提示词前，先决定三件事：

什么在动？ ——主体、背景，还是两者都动？
镜头如何移动？ ——平移、环绕、推拉、俯仰、固定，还是手持？
氛围/节奏如何？ ——缓慢而有电影感，还是快速而有活力？

在开始前先想清楚这些答案，能避免模糊、缺乏焦点的提示词产出平庸的结果。

手把手：Seedance 2.0 图生视频

第 1 步：打开 Dreamina 并选择模型

访问 dreamina.capcut.com
登录你的账户
在主导航中点击 AI Video
在模型选择下拉菜单中选择 Seedance 2.0

第 2 步：上传参考图片

点击参考面板（界面左侧的上传区域）并上传图片。你可以拖放，也可以点击浏览。

每个上传的文件会自动分配一个 @标签：

第一张图片：@Image1
第二张图片：@Image2
以此类推，直到 @Image9

每次生成最多可上传 9 张图片、3 段视频片段（共 15 秒）和 3 个音频文件（共 15 秒）——最多 12 个文件。

提示：进行基础的图生视频转换时，一张图片就够了。当你需要在不同镜头间保持角色一致，或想分别定义主体和风格参考时，再使用多张图片。

第 3 步：撰写运动提示词

这正是图生视频与文生视频的不同之处。由于你的图片已经确立了视觉场景，你的提示词应专注于运动和镜头调度，而非场景描述。

明确使用你的 @标签：

@Image1 is the first frame. The woman's hair blows gently
in the wind. She slowly turns her head to the right and
smiles. Camera holds steady in a medium close-up.
Soft natural lighting, shallow depth of field.

我们将在下一节介绍完整的提示词公式和更多示例。

第 4 步：配置输出设置

设置以下参数：

设置	选项	推荐
画面比例	16:9、9:16、4:3、3:4、1:1	匹配你的素材图比例
时长	4-15 秒	测试时从 5 秒开始
分辨率	最高 2K（2048x1152）	最终输出使用 2K

画面比例匹配很重要。 如果你的素材图是 16:9 而你把输出设为 9:16，AI 会裁剪或重塑构图，常常会丢失重要细节。务必让素材图的画面比例与输出设置保持一致。

第 5 步：生成

点击 Generate 并等待。一段 5 秒、2K 分辨率的片段通常约需 60 秒。

第 6 步：检查与迭代

仔细观看结果。检查以下方面：

运动质量：动作是否流畅自然？
角色一致性：主体在全程是否保持外观一致？
镜头表现：镜头是否遵循了你的指令？
瑕疵：留意闪烁、扭曲或不自然的变形，尤其是手部和面部周围。

如果有问题，每次只在提示词中调整一个元素。同时改动多处会让你无法判断是什么改善（或恶化）了结果。每条提示词生成 2-4 个变体来对比效果。

图生视频提示词公式

在图生视频中，你的图片负责视觉构图，提示词负责运动。请使用这个公式：

主体 + 运动，背景 + 运动，镜头 + 运动

把它拆成三层：

第 1 层：主体运动

描述主体在做什么。使用具体的动作动词：

“The knight raises his sword slowly above his head”
“The cat stretches and yawns”
“The woman turns to face the camera”
“The product rotates 180 degrees on the table”

避免像 “the subject moves” 这样模糊的指令——动作动词越具体，结果越好。

第 2 层：背景/环境运动

描述主体周围的场景发生了什么：

“Leaves fall gently in the background”
“Rain streaks across the window”
“City lights pulse and flicker in the distance”
“Clouds drift slowly across the sky”

如果你想让背景保持静止，请明确说明：“The background remains still.”

第 3 层：镜头运动

每个片段只指定一个镜头运动。在短片段中组合多个镜头移动往往会产生不稳定的结果。

镜头方向	作用
`Slow pan left/right`	在场景中水平横扫
`Dolly in/out`	镜头朝主体推进或拉远
`Orbit left/right`	镜头环绕主体旋转
`Tilt up/down`	镜头垂直俯仰
`Tracking shot`	镜头跟随主体移动
`Static shot`	镜头保持不动
`Handheld`	轻微自然抖动，营造纪录片感

组合起来

下面是把公式应用于一张人像照片：

@Image1 is the first frame. The woman slowly lifts her chin
and looks directly into the camera [subject motion]. A gentle
breeze moves the curtains behind her [background motion].
Camera slowly dollies in from a medium shot to a close-up
[camera motion]. Warm golden-hour lighting, cinematic color
grading, shallow depth of field [style].

风格与约束标签

在提示词末尾添加风格关键词，以控制视觉处理：

电影感（Cinematic）：“cinematic lighting, shallow depth of field, film grain, 24fps”
商业感（Commercial）：“clean studio lighting, product photography, crisp focus”
戏剧化（Dramatic）：“high contrast, dramatic shadows, moody atmosphere”
流畅运动（Smooth motion）：“smooth continuous motion, no jump cuts”
慢动作（Slow motion）：“slow-motion movement, 120fps look”

7 个可复制粘贴的提示词示例

这些提示词专为图生视频生成而设计。上传你的图片，粘贴提示词（把 @Image1 的描述替换成你的实际主体），然后生成。

示例 1：人像动画

@Image1 as the first frame. The person blinks naturally and
turns their head slightly to the left. A faint smile appears.
Hair moves gently as if caught by a light breeze. Camera
holds steady in a medium close-up. Soft natural lighting,
cinematic color grading, shallow depth of field.

最适合：证件照、头像照、角色肖像。

示例 2：产品展示旋转

@Image1 as the first frame. The product slowly rotates 180
degrees on a reflective surface. Soft highlights glide across
the surface as it turns. Camera holds static at eye level.
Clean studio lighting, commercial product photography style,
crisp focus throughout.

最适合：电商产品图、营销素材。

示例 3：风景动起来

@Image1 as the first frame. Clouds drift slowly from left to
right across the sky. Water ripples gently in the foreground.
Grass sways in a light breeze. Camera executes a slow dolly
forward into the scene. Golden-hour lighting, nature
documentary style, wide dynamic range.

最适合：旅行内容、房产、自然摄影。

示例 4：角色动作场景

@Image1 is a warrior in full armor. The warrior raises their
sword overhead with both hands, then brings it down in a
powerful swing. Cape billows with the motion. Camera orbits
slowly to the right during the swing. Dramatic side lighting,
cinematic atmosphere, epic fantasy style.

最适合：概念图动画、游戏营销、奇幻内容。

示例 5：时尚与风格视频

@Image1 as the first frame. The model takes two confident
steps forward on the runway. Fabric of the outfit flows and
catches the light with each step. Camera tracks backward,
keeping the model centered. Bright fashion show lighting,
high-contrast, editorial photography style.

最适合：时尚画册、社媒短视频、品牌内容。

示例 6：餐饮与饮品

@Image1 as the first frame. Steam rises gently from the
surface of the coffee cup. A hand slowly reaches in from the
right side and lifts the cup. Liquid shifts naturally inside
the cup. Camera remains static, medium close-up. Warm
cafe lighting, cozy atmosphere, food photography style
with rich warm tones.

最适合：餐厅营销、美食博客内容、饮品广告。

示例 7：建筑可视化

@Image1 as the first frame. Sunlight slowly shifts across the
building facade, casting moving shadows. People walk past in
the foreground as small blurred silhouettes. Trees sway
gently. Camera slowly pans right along the building exterior.
Clean architectural photography style, natural daylight,
realistic atmosphere.

最适合：房产、建筑作品集、城市内容。

进阶技巧

一旦你熟练掌握了基础图生视频，这些技巧将帮你产出更精致的结果。

首帧锁定

使用图生视频最可靠的方式，是把你的图片锁定为生成视频的首帧。这能确保视频起始画面与你的图片完全一致，AI 从该点向后展开动画。

在提示词中使用这个短语：

@Image1 as the first frame.

这会告诉 Seedance 2.0 把你的图片当作字面意义上的起始帧，而不仅仅是风格或角色参考。你图片的构图、色彩、主体位置和整体布局都会在第一帧中被保留，运动从那里开始构建。

末帧目标定位

你也可以通过上传两张图片来定义终点——一张作为起点，一张作为终点：

@Image1 as the first frame, @Image2 as the last frame.
The character smoothly transitions from the sitting position
to standing. Camera holds steady. Continuous smooth motion.

Seedance 2.0 会生成一段视频，从 @Image1 的构图自然过渡到 @Image2 的构图。这对以下场景很有用：

前后对比变换
角色姿态过渡
场景过渡（白天到黑夜、空旷到人群）
产品揭示序列

提示：让两张图片保持相同的画面比例和大致相同的取景，能获得最平滑的过渡。首末帧之间剧烈的构图变化可能产生不稳定的结果。

多图角色一致性

构建多镜头内容时（如短片或广告系列），在所有生成中使用同一张角色参考图：

镜头 1：

@Image1 is the main character. She walks through a busy
market street. Camera tracks alongside her. Daytime,
natural lighting.

镜头 2：

@Image1 is the main character. She stops at a fruit stand and
picks up an apple. Camera holds static, medium shot.
Same daytime lighting as previous scene.

通过在两个镜头中都使用相同的 @Image1 参考，角色的面部、服装和身体比例可以在剪辑之间保持一致。

从第二张图片进行风格迁移

上传一张图片作为主体，再上传第二张图片作为风格参考：

@Image1 is the main subject. Apply the visual style, color
palette, and lighting from @Image2. The subject walks forward
slowly. Camera dollies in. Match the mood and atmosphere
of @Image2 exactly.

当你想让一张照片看起来像油画、让一张素描看起来像 3D 渲染，或在保持运动的同时进行任何跨风格转换时，这很有用。

结合图片与视频参考

为了获得最大控制力，将图片参考（用于外观）与视频参考（用于运动）结合起来：

@Image1 is the character. Replicate the exact camera movement
and action choreography from @Video1. Maintain the character's
appearance from @Image1 throughout. Cinematic lighting.

这把外观控制与运动控制分开了——你的图片定义事物看起来如何，你的视频参考定义事物如何运动。

锁定种子进行迭代优化

如果 Dreamina 界面提供了种子值，记下一个你部分满意的生成结果的种子。用相同的种子和略微调整的提示词重新运行，就能在不改变整体构图的情况下优化特定元素。当运动很好但风格需要调整、或反之时，这尤其有用。

图片准备最佳实践

输出质量与输入质量直接挂钩。遵循以下规则可获得最佳结果。

分辨率很重要

输入分辨率	预期输出质量
低于 720p	差——可见瑕疵、细节模糊
1080p（1920x1080）	良好——适合社媒
2K（2048x1152）	优秀——与原生输出分辨率匹配
4K（3840x2160）	优秀——为 AI 提供最大化的可用细节

始终力求 2K 或更高。如果你的素材图低于 1080p，请考虑先用 AI 放大工具处理，再用于 Seedance 2.0。

画面比例对齐

让素材图的画面比例与你想要的输出比例匹配：

平台	推荐比例	图片尺寸示例
YouTube / Vimeo	16:9	2048 x 1152
TikTok / Reels / Shorts	9:16	1152 x 2048
Instagram 信息流	1:1	1440 x 1440
Instagram 竖版	4:5 或 3:4	1152 x 1536

比例不匹配会迫使 AI 裁剪或填充你的图片，从而引入意外的取景变化。

主体定位

把主体放在它将贯穿整个片段停留的位置。如果角色居中，AI 会试图让其保持居中。
在预定运动方向上留出顶部空间和负空间。一个即将向右走的角色需要在画面右侧留出空间。
除非你有意要部分取景，否则避免主体被裁在画面边缘。

光照一致性

AI 会试图保持你素材图中的光照。如果你的图片是平淡均匀的光照，视频也会是平淡均匀的光照。要获得更有动感的结果：

使用具有方向性光照的图片（侧光或逆光的主体能营造更强的视觉层次）。
避免混合色温的光照，除非那正是你想要的效果。
如果你想覆盖或增强图片中的光照，请在提示词中指定：“warm golden-hour lighting” 或 “dramatic rim lighting.”

应避免什么

大量文字或水印：AI 会试图让它们动起来，造成扭曲的文字。
面部极端特写：在生成的运动中可能产生恐怖谷效应。
拼贴或多格图片：AI 可能难以判断哪个元素是主体。
过暗或过亮的图片：低对比度图片给 AI 的可用信息更少。

常见问题排查

角色漂移（主体外观改变）

症状：角色的面部、服装或体型在片段中明显变化。

解决：

把提示词简化为单一主体加一个主要动作。
移除任何暗示场景变化或新角色进入的指令。
使用 “as the first frame” 锁定以获得最大一致性。
确保你的参考图片有清晰、光线充足的面部。

运动模糊或抖动

症状：视频看起来抖动，或有不自然的运动模糊。

解决：

用更平滑的替代词替换快速动作动词。用 “slowly walks” 而非 “runs.”
添加平滑约束：“smooth continuous motion, no sudden movements.”
缩短片段时长。一段含单一运动的 5 秒片段，比含多个动作的 15 秒片段更平滑。
避免在一个片段中组合多个镜头移动。

取景错误或主体被裁

症状：输出裁剪了你的主体，或取景方式与你的素材图不同。

解决：

把输出画面比例设置为与素材图比例完全一致。
明确说明取景：“medium close-up” 或 “wide shot” 或 “full body shot.”
使用 “as the first frame” 锁定构图。

静态输出（什么都不动）

症状：生成的视频看起来像一张几乎没有运动的静态图。

解决：

更具体地说明什么在动。与其说 “the scene comes to life”，不如描述确切动作：“hair blows in the wind, leaves fall in the background, clouds drift across the sky.”
添加一个镜头运动，至少创造一些视觉动感。
增加时长，给 AI 更多帧来发挥。

片段中途光照变化

症状：光照或色温在视频中途明显变化。

解决：

明确说明光照一致性：“maintain consistent warm lighting throughout.”
避免暗示一天中时间变化的提示词，除非那正是你的意图。
使用更短的片段时长——光照在 4-5 秒片段中比在 15 秒片段中更稳定。

不自然的手部或面部运动

症状：手部变形、出现多余手指，或面部表情诡异。

解决：

避免提示特写手势或极端面部表情。
让镜头与主体保持中景或更远的距离。
使用更简单的手部动作：“holds the cup” 比 “picks up the cup while gesturing” 效果更好。
如果手部对场景不关键，就让它们虚焦或移出画面。

常见问题（FAQ）

Seedance 2.0 的图生视频接受哪些图片格式？

Seedance 2.0 接受 JPG、PNG 和 WebP 图片。为获得最佳效果，请使用 2K 分辨率（2048x1152）或更高、主体清晰且光线良好的图片。

一次最多能上传多少张参考图片？

每次生成最多可上传 9 张参考图片，外加最多 3 段视频片段和 3 个音频文件，总计最多 12 个文件。

我能控制图片出现在哪一帧吗？

可以。在提示词中写 “@Image1 as the first frame” 即可使用首帧技巧。这会把你的图片锁定为开头帧，让 AI 从该帧向后开始动画。

为什么我的角色在生成的视频里看起来变了样？

角色漂移通常发生在提示词描述了过多动作或场景变化时。请简化为单一主体和一个主要运动。同时确保你的参考图片是高分辨率且光线充足的。

图生视频生成需要多长时间？

一段典型的 5 秒、2K 分辨率片段大约需要 60 秒生成。更长的时长和更复杂的参考设置可能会按比例花费更多时间。

我能把 Seedance 2.0 图生视频用于商业项目吗？

可以。使用付费 Dreamina 订阅生成的内容可用于商业用途，但须遵守 ByteDance 的服务条款。请针对你的具体使用场景查阅最新条款。