Tutorial de Imagem para Vídeo com Seedance 2.0 (2026)

By Equipe SeedanceTips 19 min read

A capacidade de imagem para vídeo do Seedance 2.0 é um de seus recursos mais poderosos. Em vez de descrever uma cena do zero com texto, você envia uma imagem estática e diz à IA exatamente como dar vida a ela — o que se move, como a câmera se comporta e qual estilo aplicar. O resultado é um vídeo de 4 a 15 segundos em resolução de até 2K que preserva a composição, as cores e os detalhes da sua imagem original, ao mesmo tempo em que adiciona um movimento natural e cinematográfico.

Este tutorial guia você por todo o fluxo de trabalho de imagem para vídeo, desde a preparação das imagens de origem até a escrita de prompts de movimento eficazes. Você encontrará exemplos de prompts prontos para copiar e colar, técnicas avançadas como travamento do primeiro quadro e animação de personagens, além de soluções para os problemas mais comuns que os criadores enfrentam.


Por Que Imagem para Vídeo (em Vez de Texto para Vídeo)

Texto para vídeo é poderoso, mas oferece menos controle sobre a composição inicial. Quando você já tem em mente um visual específico, um personagem, uma foto de produto ou uma cena, imagem para vídeo é o melhor fluxo de trabalho por três motivos:

Precisão visual. Sua imagem fixa a composição, a paleta de cores, a iluminação e a aparência do elemento. A IA não precisa adivinhar como é o seu personagem ou como a cena está enquadrada — ela parte exatamente do seu visual.

Consistência do personagem. Um dos problemas mais difíceis na geração de vídeo por IA é manter os personagens com a mesma aparência ao longo dos quadros. Quando você fornece uma imagem de referência e usa o sistema de @menção, o Seedance 2.0 trata essa imagem como uma âncora de referência confiável, mantendo traços faciais, roupas e proporções corporais durante todo o clipe.

Iteração mais rápida. Em vez de reescrever descrições visuais complexas, você troca uma imagem por outra. Seu prompt permanece focado no movimento e no trabalho de câmera, o que é mais fácil de ajustar.

Imagem para vídeo é ideal para demonstrações de produtos, animação de personagens a partir de arte conceitual, conteúdo de redes sociais a partir de fotos existentes, conversão de storyboard em vídeo e qualquer fluxo de trabalho em que a identidade visual já esteja estabelecida.


O Que Você Precisa Antes de Começar

Antes de abrir o Dreamina, prepare o seguinte:

Uma Conta no Dreamina

O Seedance 2.0 funciona na plataforma Dreamina da ByteDance, em dreamina.capcut.com. Cadastre-se com uma conta CapCut ou ByteDance. Novas contas recebem créditos de teste gratuitos — suficientes para várias gerações de teste.

Imagens de Origem de Alta Qualidade

A qualidade da imagem determina diretamente a qualidade do resultado. Siga estas diretrizes:

  • Resolução: 2K (2048x1152) ou superior. O Seedance 2.0 gera saída de até 2K, então alimentá-lo com uma imagem de origem em 720p significa que a IA terá que fazer upscale e adivinhar os detalhes.
  • Formato: JPG, PNG ou WebP. PNG é preferível para imagens com transparência ou detalhes finos.
  • Nitidez do elemento: O elemento principal deve estar bem nítido e com boa iluminação. Evite artefatos de compressão pesada, desfoque de movimento ou cenas de baixo contraste.
  • Espaço de composição: Deixe espaço visual para o movimento que você planeja adicionar. Se quiser que um personagem caminhe para frente, não o recorte na borda do quadro.

Um Plano de Movimento Claro

Antes de escrever seu prompt, decida três coisas:

  1. O que se move? — O elemento, o fundo ou ambos?
  2. Como a câmera se move? — Pan, órbita, dolly, tilt, estática ou handheld?
  3. Qual é o clima/ritmo? — Lento e cinematográfico, ou rápido e enérgico?

Ter essas respostas antes de começar evita prompts vagos e sem foco, que produzem resultados genéricos.


Passo a Passo: Imagem para Vídeo no Seedance 2.0

Passo 1: Abra o Dreamina e Selecione o Modelo

  1. Acesse dreamina.capcut.com
  2. Faça login na sua conta
  3. Clique em AI Video na navegação principal
  4. No menu suspenso de seleção de modelos, escolha Seedance 2.0

Passo 2: Faça o Upload das Suas Imagens de Referência

Clique no Reference Panel (a área de upload no lado esquerdo da interface) e faça o upload das suas imagens. Você pode arrastar e soltar ou clicar para procurar.

Cada arquivo enviado recebe automaticamente uma @tag:

  • Primeira imagem: @Image1
  • Segunda imagem: @Image2
  • E assim por diante, até @Image9

Você pode enviar até 9 imagens, 3 clipes de vídeo (15 segundos no total) e 3 arquivos de áudio (15 segundos no total) — máximo de 12 arquivos por geração.

Dica: Para uma conversão básica de imagem para vídeo, uma imagem é suficiente. Use várias imagens quando precisar de consistência de personagem entre diferentes tomadas ou quando quiser definir separadamente um elemento e uma referência de estilo.

Passo 3: Escreva Seu Prompt de Movimento

É aqui que imagem para vídeo difere de texto para vídeo. Como sua imagem já estabelece a cena visual, seu prompt deve focar em movimento e trabalho de câmera, não na descrição da cena.

Use suas @tags explicitamente:

@Image1 is the first frame. The woman's hair blows gently
in the wind. She slowly turns her head to the right and
smiles. Camera holds steady in a medium close-up.
Soft natural lighting, shallow depth of field.

Abordamos a fórmula completa de prompt e mais exemplos na próxima seção.

Passo 4: Configure as Opções de Saída

Defina os seguintes parâmetros:

ConfiguraçãoOpçõesRecomendação
Proporção de Tela16:9, 9:16, 4:3, 3:4, 1:1Combine com a proporção da imagem de origem
Duração4-15 segundosComece com 5s para testar
ResoluçãoAté 2K (2048x1152)Use 2K para a saída final

Combinar a proporção de tela é importante. Se sua imagem de origem é 16:9 e você define a saída como 9:16, a IA vai recortar ou remodelar a composição, frequentemente perdendo detalhes importantes. Sempre combine a proporção de tela da imagem de origem com a configuração de saída.

Passo 5: Gere

Clique em Generate e aguarde. Um clipe de 5 segundos em resolução 2K normalmente leva cerca de 60 segundos.

Passo 6: Revise e Itere

Assista ao resultado com atenção. Verifique:

  • Qualidade do movimento: O movimento é suave e natural?
  • Consistência do personagem: O elemento mantém sua aparência o tempo todo?
  • Comportamento da câmera: A câmera segue suas instruções?
  • Artefatos: Procure por tremulações, distorções ou deformações não naturais, especialmente ao redor das mãos e do rosto.

Se algo estiver errado, ajuste um elemento de cada vez no seu prompt. Mudar várias coisas ao mesmo tempo torna impossível saber o que melhorou (ou piorou) o resultado. Gere de 2 a 4 variações por prompt para comparar os resultados.


A Fórmula de Prompt para Imagem para Vídeo

Para imagem para vídeo, sua imagem cuida da composição visual enquanto seu prompt cuida do movimento. Use esta fórmula:

Elemento + Movimento, Fundo + Movimento, Câmera + Movimento

Divida em três camadas:

Camada 1: Movimento do Elemento

Descreva o que o elemento principal faz. Use verbos de ação específicos:

  • “The knight raises his sword slowly above his head”
  • “The cat stretches and yawns”
  • “The woman turns to face the camera”
  • “The product rotates 180 degrees on the table”

Evite instruções vagas como “o elemento se move” — quanto mais específico o verbo de ação, melhor o resultado.

Camada 2: Movimento do Fundo/Ambiente

Descreva o que acontece na cena ao redor do elemento:

  • “Leaves fall gently in the background”
  • “Rain streaks across the window”
  • “City lights pulse and flicker in the distance”
  • “Clouds drift slowly across the sky”

Se quiser que o fundo permaneça estático, diga isso explicitamente: “The background remains still.”

Camada 3: Movimento de Câmera

Especifique exatamente um movimento de câmera por clipe. Combinar vários movimentos de câmera em um clipe curto frequentemente produz resultados instáveis.

Direção de CâmeraO Que Faz
Slow pan left/rightVarredura horizontal pela cena
Dolly in/outA câmera se aproxima ou se afasta do elemento
Orbit left/rightA câmera circula ao redor do elemento
Tilt up/downRotação vertical da câmera
Tracking shotA câmera acompanha o movimento do elemento
Static shotA câmera mantém a posição, sem movimento
HandheldTremor natural sutil para uma sensação de documentário

Juntando Tudo

Aqui está a fórmula aplicada a uma foto de retrato:

@Image1 is the first frame. The woman slowly lifts her chin
and looks directly into the camera [subject motion]. A gentle
breeze moves the curtains behind her [background motion].
Camera slowly dollies in from a medium shot to a close-up
[camera motion]. Warm golden-hour lighting, cinematic color
grading, shallow depth of field [style].

Tags de Estilo e Restrição

Adicione palavras-chave de estilo no final do seu prompt para controlar o tratamento visual:

  • Cinematográfico: “cinematic lighting, shallow depth of field, film grain, 24fps”
  • Comercial: “clean studio lighting, product photography, crisp focus”
  • Dramático: “high contrast, dramatic shadows, moody atmosphere”
  • Movimento suave: “smooth continuous motion, no jump cuts”
  • Câmera lenta: “slow-motion movement, 120fps look”

7 Exemplos de Prompts Prontos para Copiar e Colar

Esses prompts foram criados para a geração de imagem para vídeo. Faça o upload da sua imagem, cole o prompt (substituindo as descrições de @Image1 pelo seu elemento real) e gere.

Exemplo 1: Animação de Retrato

@Image1 as the first frame. The person blinks naturally and
turns their head slightly to the left. A faint smile appears.
Hair moves gently as if caught by a light breeze. Camera
holds steady in a medium close-up. Soft natural lighting,
cinematic color grading, shallow depth of field.

Ideal para: Fotos de rosto, fotos de perfil, retratos de personagens.

Exemplo 2: Rotação de Vitrine de Produto

@Image1 as the first frame. The product slowly rotates 180
degrees on a reflective surface. Soft highlights glide across
the surface as it turns. Camera holds static at eye level.
Clean studio lighting, commercial product photography style,
crisp focus throughout.

Ideal para: Fotos de produtos de e-commerce, materiais de marketing.

Exemplo 3: Paisagem Ganhando Vida

@Image1 as the first frame. Clouds drift slowly from left to
right across the sky. Water ripples gently in the foreground.
Grass sways in a light breeze. Camera executes a slow dolly
forward into the scene. Golden-hour lighting, nature
documentary style, wide dynamic range.

Ideal para: Conteúdo de viagem, imobiliário, fotografia de natureza.

Exemplo 4: Cena de Ação de Personagem

@Image1 is a warrior in full armor. The warrior raises their
sword overhead with both hands, then brings it down in a
powerful swing. Cape billows with the motion. Camera orbits
slowly to the right during the swing. Dramatic side lighting,
cinematic atmosphere, epic fantasy style.

Ideal para: Animação de arte conceitual, marketing de jogos, conteúdo de fantasia.

Exemplo 5: Vídeo de Moda e Estilo

@Image1 as the first frame. The model takes two confident
steps forward on the runway. Fabric of the outfit flows and
catches the light with each step. Camera tracks backward,
keeping the model centered. Bright fashion show lighting,
high-contrast, editorial photography style.

Ideal para: Lookbooks de moda, reels para redes sociais, conteúdo de marca.

Exemplo 6: Comida e Bebida

@Image1 as the first frame. Steam rises gently from the
surface of the coffee cup. A hand slowly reaches in from the
right side and lifts the cup. Liquid shifts naturally inside
the cup. Camera remains static, medium close-up. Warm
cafe lighting, cozy atmosphere, food photography style
with rich warm tones.

Ideal para: Marketing de restaurantes, conteúdo de blog de culinária, anúncios de bebidas.

Exemplo 7: Visualização Arquitetônica

@Image1 as the first frame. Sunlight slowly shifts across the
building facade, casting moving shadows. People walk past in
the foreground as small blurred silhouettes. Trees sway
gently. Camera slowly pans right along the building exterior.
Clean architectural photography style, natural daylight,
realistic atmosphere.

Ideal para: Imobiliário, portfólios de arquitetura, conteúdo urbano.


Técnicas Avançadas

Assim que você se sentir confortável com o básico de imagem para vídeo, essas técnicas ajudarão a produzir resultados mais sofisticados.

Travamento do Primeiro Quadro

A maneira mais confiável de usar imagem para vídeo é travar sua imagem como o primeiro quadro do vídeo gerado. Isso garante que o vídeo comece exatamente como sua imagem aparece e que a IA anime a partir desse ponto.

Use esta frase no seu prompt:

@Image1 as the first frame.

Isso diz ao Seedance 2.0 para tratar sua imagem como o quadro inicial literal, não apenas como uma referência de estilo ou personagem. A composição, as cores, a posição do elemento e o layout geral da sua imagem serão preservados no primeiro quadro, e o movimento se desenvolverá a partir daí.

Definição do Último Quadro

Você também pode definir um ponto final enviando duas imagens — uma para o início e outra para o fim:

@Image1 as the first frame, @Image2 as the last frame.
The character smoothly transitions from the sitting position
to standing. Camera holds steady. Continuous smooth motion.

O Seedance 2.0 vai gerar um vídeo que faz a transição naturalmente da composição em @Image1 para a composição em @Image2. Isso é poderoso para:

  • Transformações de antes/depois
  • Transições de pose de personagem
  • Transições de cena (dia para noite, vazio para populado)
  • Sequências de revelação de produto

Dica: Mantenha ambas as imagens na mesma proporção de tela e com enquadramento aproximadamente igual para a transição mais suave. Mudanças dramáticas de composição entre o primeiro e o último quadro podem produzir resultados instáveis.

Consistência de Personagem com Múltiplas Imagens

Ao construir conteúdo com várias tomadas (como um curta-metragem ou uma campanha publicitária), use a mesma imagem de referência do personagem em todas as gerações:

Tomada 1:

@Image1 is the main character. She walks through a busy
market street. Camera tracks alongside her. Daytime,
natural lighting.

Tomada 2:

@Image1 is the main character. She stops at a fruit stand and
picks up an apple. Camera holds static, medium shot.
Same daytime lighting as previous scene.

Ao usar a mesma referência @Image1 em ambas as tomadas, o rosto, as roupas e as proporções corporais do personagem permanecem consistentes entre os cortes.

Transferência de Estilo a Partir de uma Segunda Imagem

Faça o upload de uma imagem como seu elemento e de uma segunda imagem como sua referência de estilo:

@Image1 is the main subject. Apply the visual style, color
palette, and lighting from @Image2. The subject walks forward
slowly. Camera dollies in. Match the mood and atmosphere
of @Image2 exactly.

Isso é útil quando você quer que uma fotografia pareça uma pintura, que um esboço pareça uma renderização 3D, ou qualquer transformação entre estilos mantendo o movimento.

Combinando Referências de Imagem e Vídeo

Para o máximo de controle, combine uma referência de imagem (para a aparência) com uma referência de vídeo (para o movimento):

@Image1 is the character. Replicate the exact camera movement
and action choreography from @Video1. Maintain the character's
appearance from @Image1 throughout. Cinematic lighting.

Isso separa o controle da aparência do controle do movimento — sua imagem define como as coisas se parecem, e sua referência de vídeo define como as coisas se movem.

Travamento de Seed para Refinamento Iterativo

Se a interface do Dreamina fornecer um valor de seed, anote o seed de uma geração de que você gostou parcialmente. Execute novamente com o mesmo seed e o prompt levemente ajustado para refinar elementos específicos sem mudar a composição geral. Isso é especialmente útil quando o movimento está bom, mas o estilo precisa de ajuste, ou vice-versa.


Boas Práticas de Preparação de Imagem

A qualidade da sua saída está diretamente ligada à qualidade da sua entrada. Siga estas regras para os melhores resultados.

A Resolução Importa

Resolução de EntradaQualidade de Saída Esperada
Abaixo de 720pRuim — artefatos visíveis, detalhes suaves
1080p (1920x1080)Boa — aceitável para redes sociais
2K (2048x1152)Excelente — corresponde à resolução de saída nativa
4K (3840x2160)Excelente — fornece à IA o máximo de detalhes para trabalhar

Sempre busque 2K ou superior. Se sua imagem de origem estiver abaixo de 1080p, considere fazer upscale com um upscaler de IA antes de usá-la no Seedance 2.0.

Alinhamento da Proporção de Tela

Combine a proporção de tela da sua imagem de origem com a proporção de saída desejada:

PlataformaProporção RecomendadaExemplo de Tamanho de Imagem
YouTube / Vimeo16:92048 x 1152
TikTok / Reels / Shorts9:161152 x 2048
Feed do Instagram1:11440 x 1440
Instagram Retrato4:5 ou 3:41152 x 1536

Proporções incompatíveis forçam a IA a recortar ou preencher sua imagem, o que introduz mudanças de enquadramento não intencionais.

Posicionamento do Elemento

  • Coloque seu elemento onde ele permanecerá durante todo o clipe. Se o personagem estiver centralizado, a IA tentará mantê-lo centralizado.
  • Deixe espaço acima da cabeça e espaço negativo na direção do movimento pretendido. Um personagem prestes a caminhar para a direita precisa de espaço no lado direito do quadro.
  • Evite elementos cortados nas bordas do quadro, a menos que você intencionalmente queira um enquadramento parcial.

Consistência da Iluminação

A IA tentará manter a iluminação da sua imagem de origem. Se sua imagem tiver iluminação plana e uniforme, o vídeo terá iluminação plana e uniforme. Para resultados mais dinâmicos:

  • Use imagens com iluminação direcional (elementos iluminados de lado ou em contraluz criam mais profundidade visual).
  • Evite temperaturas de iluminação mistas, a menos que esse seja o efeito desejado.
  • Especifique a iluminação no seu prompt se quiser substituir ou realçar o que está na imagem: “warm golden-hour lighting” ou “dramatic rim lighting.”

O Que Evitar

  • Texto pesado ou marcas d’água: A IA tentará animá-los, criando texto distorcido.
  • Closes extremos de rostos: Podem produzir efeitos de vale da estranheza no movimento gerado.
  • Colagens ou imagens com vários painéis: A IA pode ter dificuldade em determinar qual elemento é o assunto.
  • Imagens muito escuras ou muito claras: Imagens de baixo contraste oferecem à IA menos informações para trabalhar.

Solução de Problemas Comuns

Desvio de Personagem (O Elemento Muda de Aparência)

Sintoma: O rosto, as roupas ou o formato do corpo do personagem mudam visivelmente durante o clipe.

Solução:

  • Simplifique seu prompt para um único elemento com uma ação principal.
  • Remova qualquer instrução que implique mudanças de cena ou entrada de novos personagens.
  • Use o travamento “as the first frame” para máxima consistência.
  • Garanta que sua imagem de referência tenha um rosto nítido e bem iluminado.

Desfoque de Movimento ou Movimento Trêmulo

Sintoma: O vídeo parece tremido ou tem desfoque de movimento não natural.

Solução:

  • Substitua verbos de ação rápida por alternativas mais suaves. Use “slowly walks” em vez de “runs.”
  • Adicione restrições de suavidade: “smooth continuous motion, no sudden movements.”
  • Reduza a duração do clipe. Um clipe de 5 segundos com um movimento é mais suave do que um clipe de 15 segundos com várias ações.
  • Evite combinar vários movimentos de câmera em um clipe.

Enquadramento Errado ou Elemento Cortado

Sintoma: A saída recorta seu elemento ou enquadra a cena de forma diferente da sua imagem de origem.

Solução:

  • Defina a proporção de tela de saída para corresponder exatamente à proporção da imagem de origem.
  • Indique explicitamente o enquadramento: “medium close-up” ou “wide shot” ou “full body shot.”
  • Use “as the first frame” para travar a composição.

Saída Estática (Nada se Move)

Sintoma: O vídeo gerado parece uma imagem estática com pouco ou nenhum movimento.

Solução:

  • Seja mais específico sobre o que se move. Em vez de “the scene comes to life,” descreva ações exatas: “hair blows in the wind, leaves fall in the background, clouds drift across the sky.”
  • Adicione um movimento de câmera para criar ao menos algum dinamismo visual.
  • Aumente a duração para dar à IA mais quadros para trabalhar.

Mudanças de Iluminação no Meio do Clipe

Sintoma: A iluminação ou a temperatura de cor muda visivelmente durante o vídeo.

Solução:

  • Indique explicitamente a consistência da iluminação: “maintain consistent warm lighting throughout.”
  • Evite prompts que impliquem mudanças de horário do dia, a menos que essa seja sua intenção.
  • Use durações de clipe mais curtas — a iluminação é mais estável em clipes de 4 a 5 segundos do que em clipes de 15 segundos.

Movimentos Não Naturais das Mãos ou do Rosto

Sintoma: As mãos se deformam, surgem dedos extras ou as expressões faciais parecem estranhas.

Solução:

  • Evite solicitar gestos de mão em close ou expressões faciais extremas.
  • Mantenha a câmera em plano médio ou a uma distância maior do elemento.
  • Use ações de mão mais simples: “holds the cup” funciona melhor do que “picks up the cup while gesturing.”
  • Se as mãos não forem essenciais para a cena, mantenha-as desfocadas ou fora do quadro.

FAQ

Quais formatos de imagem o Seedance 2.0 aceita para imagem para vídeo?

O Seedance 2.0 aceita imagens JPG, PNG e WebP. Para melhores resultados, use imagens em resolução 2K (2048x1152) ou superior, com elementos nítidos e boa iluminação.

Quantas imagens de referência posso enviar de uma vez?

Você pode enviar até 9 imagens de referência por geração, junto com até 3 clipes de vídeo e 3 arquivos de áudio, totalizando no máximo 12 arquivos.

Posso controlar em qual quadro minha imagem aparece?

Sim. Use a técnica de primeiro quadro escrevendo “@Image1 as the first frame” no seu prompt. Isso fixa sua imagem como o quadro de abertura e permite que a IA anime a partir dele.

Por que meu personagem parece diferente no vídeo gerado?

O desvio de personagem geralmente acontece quando o seu prompt descreve ações ou mudanças de cena em excesso. Simplifique para um único elemento e um movimento principal. Garanta também que sua imagem de referência esteja em alta resolução e bem iluminada.

Quanto tempo leva a geração de imagem para vídeo?

Um clipe típico de 5 segundos em resolução 2K leva aproximadamente 60 segundos para ser gerado. Durações mais longas e configurações de referência mais complexas podem levar proporcionalmente mais tempo.

Posso usar a função de imagem para vídeo do Seedance 2.0 em projetos comerciais?

Sim. O conteúdo gerado com uma assinatura paga do Dreamina pode ser usado comercialmente, sujeito aos termos de serviço da ByteDance. Verifique os termos mais recentes para o seu caso de uso específico.


Conteúdo Relacionado

  • Seedance 2.0: O Guia Completo — Detalhamento completo de recursos, preços, comparações e mais de 20 exemplos de prompts para cada capacidade do Seedance 2.0.
  • Mais de 50 Prompts para o Seedance 2.0 — Biblioteca de prompts pronta para usar, organizada por categoria, incluindo prompts dedicados de imagem para vídeo.
  • Análise do Seedance 2.0 — Análise honesta e independente cobrindo pontos fortes, limitações e como o Seedance 2.0 se compara ao Sora 2, ao Kling 3.0 e ao Veo 3.1.

SeedanceTips é um recurso independente e não é afiliado, endossado ou oficialmente conectado à ByteDance ou à equipe de desenvolvimento do Seedance. Todos os nomes de produtos, logotipos e marcas registradas são propriedade de seus respectivos donos. As informações neste site são fornecidas para fins educacionais e informativos, com base em dados disponíveis publicamente.