Tutoriel Seedance 2.0 image vers vidéo (2026)

By Équipe SeedanceTips 20 min read

La capacité image vers vidéo de Seedance 2.0 est l’une de ses fonctionnalités les plus puissantes. Au lieu de décrire une scène à partir de zéro avec du texte, vous importez une image fixe et indiquez à l’IA exactement comment lui donner vie : ce qui bouge, comment la caméra se comporte et quel style appliquer. Le résultat est une vidéo de 4 à 15 secondes pouvant atteindre une résolution 2K, qui préserve la composition, les couleurs et les détails de votre image d’origine tout en ajoutant un mouvement naturel et cinématographique.

Ce tutoriel vous guide à travers l’ensemble du workflow image vers vidéo, de la préparation de vos images source à la rédaction de prompts de mouvement efficaces. Vous y trouverez des exemples de prompts à copier-coller, des techniques avancées comme le verrouillage de la première image et l’animation de personnages, ainsi que des solutions aux problèmes les plus courants rencontrés par les créateurs.


Pourquoi l’image vers vidéo (plutôt que le texte vers vidéo)

Le texte vers vidéo est puissant, mais il offre moins de contrôle sur la composition de départ. Lorsque vous avez déjà en tête un look spécifique, un personnage, une prise de vue produit ou une scène, l’image vers vidéo est le meilleur workflow pour trois raisons.

Précision visuelle. Votre image verrouille la composition, la palette de couleurs, l’éclairage et l’apparence du sujet. L’IA n’a pas à deviner à quoi ressemble votre personnage ni comment la scène est cadrée : elle part de votre visuel exact.

Cohérence des personnages. L’un des problèmes les plus difficiles en vidéo IA est de conserver une apparence identique des personnages d’une image à l’autre. Lorsque vous fournissez une image de référence et utilisez le système de @mention, Seedance 2.0 traite cette image comme un ancrage de vérité de référence, en préservant les traits du visage, les vêtements et les proportions du corps tout au long du clip.

Itération plus rapide. Au lieu de réécrire des descriptions visuelles complexes, vous remplacez une image par une autre. Votre prompt reste centré sur le mouvement et le travail de caméra, ce qui est plus facile à ajuster.

L’image vers vidéo est idéale pour les démonstrations de produits, l’animation de personnages à partir de concept art, le contenu pour réseaux sociaux à partir de photos existantes, la conversion de storyboard en vidéo, et tout workflow où l’identité visuelle est déjà établie.


Ce dont vous avez besoin avant de commencer

Avant d’ouvrir Dreamina, préparez les éléments suivants.

Un compte Dreamina

Seedance 2.0 fonctionne sur la plateforme Dreamina de ByteDance, sur dreamina.capcut.com. Inscrivez-vous avec un compte CapCut ou ByteDance. Les nouveaux comptes reçoivent des crédits d’essai gratuits, suffisants pour plusieurs générations de test.

Des images source de haute qualité

La qualité de l’image détermine directement la qualité du résultat. Suivez ces recommandations :

  • Résolution : 2K (2048x1152) ou plus. Seedance 2.0 produit jusqu’à du 2K, donc lui fournir une image source en 720p signifie que l’IA doit faire de l’upscaling et deviner les détails.
  • Format : JPG, PNG ou WebP. Le PNG est préférable pour les images avec transparence ou détails fins.
  • Netteté du sujet : le sujet principal doit être parfaitement net avec un bon éclairage. Évitez les artefacts de compression marqués, le flou de mouvement ou les scènes à faible contraste.
  • Espace de composition : laissez de l’espace visuel pour le mouvement que vous prévoyez d’ajouter. Si vous voulez qu’un personnage avance, ne le recadrez pas au bord de l’image.

Un plan de mouvement clair

Avant de rédiger votre prompt, décidez de trois choses :

  1. Qu’est-ce qui bouge ? — Le sujet, l’arrière-plan ou les deux ?
  2. Comment la caméra se déplace-t-elle ? — Pan, orbite, travelling, inclinaison, statique ou caméra à l’épaule ?
  3. Quelle est l’ambiance / le rythme ? — Lent et cinématographique, ou rapide et énergique ?

Avoir ces réponses avant de commencer évite les prompts vagues et flous qui produisent des résultats génériques.


Étape par étape : de l’image à la vidéo dans Seedance 2.0

Étape 1 : Ouvrez Dreamina et sélectionnez le modèle

  1. Rendez-vous sur dreamina.capcut.com
  2. Connectez-vous à votre compte
  3. Cliquez sur AI Video dans la navigation principale
  4. Dans le sélecteur de modèles déroulant, choisissez Seedance 2.0

Étape 2 : Importez vos images de référence

Cliquez sur le panneau de référence (la zone d’import sur le côté gauche de l’interface) et importez vos images. Vous pouvez les glisser-déposer ou cliquer pour parcourir.

Chaque fichier importé reçoit automatiquement un @tag :

  • Première image : @Image1
  • Deuxième image : @Image2
  • Et ainsi de suite, jusqu’à @Image9

Vous pouvez importer jusqu’à 9 images, 3 clips vidéo (15 secondes au total) et 3 fichiers audio (15 secondes au total), soit 12 fichiers maximum par génération.

Astuce : pour une conversion image vers vidéo basique, une seule image suffit. Utilisez plusieurs images lorsque vous avez besoin de cohérence de personnage sur différentes prises, ou que vous souhaitez définir séparément un sujet et une référence de style.

Étape 3 : Rédigez votre prompt de mouvement

C’est là que l’image vers vidéo diffère du texte vers vidéo. Comme votre image établit déjà la scène visuelle, votre prompt doit se concentrer sur le mouvement et le travail de caméra, et non sur la description de la scène.

Utilisez vos @tags de manière explicite :

@Image1 is the first frame. The woman's hair blows gently
in the wind. She slowly turns her head to the right and
smiles. Camera holds steady in a medium close-up.
Soft natural lighting, shallow depth of field.

Nous détaillons la formule complète des prompts ainsi que d’autres exemples dans la section suivante.

Étape 4 : Configurez les réglages de sortie

Définissez les paramètres suivants :

RéglageOptionsRecommandation
Format d’image16:9, 9:16, 4:3, 3:4, 1:1Faites correspondre au ratio de votre image source
Durée4 à 15 secondesCommencez par 5 s pour les tests
RésolutionJusqu’à 2K (2048x1152)Utilisez le 2K pour le rendu final

La correspondance des formats d’image est importante. Si votre image source est en 16:9 et que vous réglez la sortie sur 9:16, l’IA recadrera ou remodèlera la composition, perdant souvent des détails importants. Faites toujours correspondre le format d’image de votre source au réglage de sortie.

Étape 5 : Générez

Cliquez sur Generate et patientez. Un clip de 5 secondes en résolution 2K prend généralement environ 60 secondes.

Étape 6 : Examinez et itérez

Regardez le résultat attentivement. Vérifiez :

  • La qualité du mouvement : le mouvement est-il fluide et naturel ?
  • La cohérence des personnages : le sujet conserve-t-il son apparence tout du long ?
  • Le comportement de la caméra : la caméra suit-elle vos instructions ?
  • Les artefacts : recherchez les scintillements, les déformations ou les distorsions non naturelles, en particulier autour des mains et des visages.

Si quelque chose ne va pas, ajustez un seul élément à la fois dans votre prompt. Modifier plusieurs choses simultanément rend impossible de savoir ce qui a amélioré (ou détérioré) le résultat. Générez 2 à 4 variations par prompt pour comparer les résultats.


La formule de prompt image vers vidéo

Pour l’image vers vidéo, votre image gère la composition visuelle tandis que votre prompt gère le mouvement. Utilisez cette formule :

Sujet + Mouvement, Arrière-plan + Mouvement, Caméra + Mouvement

Décomposez-la en trois couches :

Couche 1 : Mouvement du sujet

Décrivez ce que fait le sujet principal. Utilisez des verbes d’action spécifiques :

  • « The knight raises his sword slowly above his head »
  • « The cat stretches and yawns »
  • « The woman turns to face the camera »
  • « The product rotates 180 degrees on the table »

Évitez les instructions vagues comme « the subject moves » : plus le verbe d’action est précis, meilleur sera le résultat.

Couche 2 : Mouvement de l’arrière-plan / environnement

Décrivez ce qui se passe dans la scène autour du sujet :

  • « Leaves fall gently in the background »
  • « Rain streaks across the window »
  • « City lights pulse and flicker in the distance »
  • « Clouds drift slowly across the sky »

Si vous voulez que l’arrière-plan reste statique, dites-le explicitement : « The background remains still. »

Couche 3 : Mouvement de la caméra

Spécifiez exactement un seul mouvement de caméra par clip. Combiner plusieurs mouvements de caméra dans un clip court produit souvent des résultats instables.

Direction de caméraCe que cela fait
Slow pan left/rightBalayage horizontal à travers la scène
Dolly in/outLa caméra se rapproche ou s’éloigne du sujet
Orbit left/rightLa caméra tourne autour du sujet
Tilt up/downRotation verticale de la caméra
Tracking shotLa caméra suit le mouvement du sujet
Static shotLa caméra reste en place, sans mouvement
HandheldLégère secousse naturelle pour un rendu documentaire

Mise en pratique

Voici la formule appliquée à une photo de portrait :

@Image1 is the first frame. The woman slowly lifts her chin
and looks directly into the camera [subject motion]. A gentle
breeze moves the curtains behind her [background motion].
Camera slowly dollies in from a medium shot to a close-up
[camera motion]. Warm golden-hour lighting, cinematic color
grading, shallow depth of field [style].

Tags de style et de contrainte

Ajoutez des mots-clés de style à la fin de votre prompt pour contrôler le traitement visuel :

  • Cinématographique : « cinematic lighting, shallow depth of field, film grain, 24fps »
  • Commercial : « clean studio lighting, product photography, crisp focus »
  • Dramatique : « high contrast, dramatic shadows, moody atmosphere »
  • Mouvement fluide : « smooth continuous motion, no jump cuts »
  • Ralenti : « slow-motion movement, 120fps look »

7 exemples de prompts à copier-coller

Ces prompts sont conçus pour la génération image vers vidéo. Importez votre image, collez le prompt (en remplaçant les descriptions @Image1 par votre sujet réel) et générez.

Exemple 1 : Animation de portrait

@Image1 as the first frame. The person blinks naturally and
turns their head slightly to the left. A faint smile appears.
Hair moves gently as if caught by a light breeze. Camera
holds steady in a medium close-up. Soft natural lighting,
cinematic color grading, shallow depth of field.

Idéal pour : portraits d’identité, photos de profil, portraits de personnages.

Exemple 2 : Rotation de présentation produit

@Image1 as the first frame. The product slowly rotates 180
degrees on a reflective surface. Soft highlights glide across
the surface as it turns. Camera holds static at eye level.
Clean studio lighting, commercial product photography style,
crisp focus throughout.

Idéal pour : photos produit e-commerce, supports marketing.

Exemple 3 : Paysage qui prend vie

@Image1 as the first frame. Clouds drift slowly from left to
right across the sky. Water ripples gently in the foreground.
Grass sways in a light breeze. Camera executes a slow dolly
forward into the scene. Golden-hour lighting, nature
documentary style, wide dynamic range.

Idéal pour : contenu voyage, immobilier, photographie de nature.

Exemple 4 : Scène d’action de personnage

@Image1 is a warrior in full armor. The warrior raises their
sword overhead with both hands, then brings it down in a
powerful swing. Cape billows with the motion. Camera orbits
slowly to the right during the swing. Dramatic side lighting,
cinematic atmosphere, epic fantasy style.

Idéal pour : animation de concept art, marketing de jeux vidéo, contenu fantasy.

Exemple 5 : Vidéo mode et style

@Image1 as the first frame. The model takes two confident
steps forward on the runway. Fabric of the outfit flows and
catches the light with each step. Camera tracks backward,
keeping the model centered. Bright fashion show lighting,
high-contrast, editorial photography style.

Idéal pour : lookbooks mode, reels pour réseaux sociaux, contenu de marque.

Exemple 6 : Alimentation et boissons

@Image1 as the first frame. Steam rises gently from the
surface of the coffee cup. A hand slowly reaches in from the
right side and lifts the cup. Liquid shifts naturally inside
the cup. Camera remains static, medium close-up. Warm
cafe lighting, cozy atmosphere, food photography style
with rich warm tones.

Idéal pour : marketing de restaurants, contenu de blogs culinaires, publicités de boissons.

Exemple 7 : Visualisation architecturale

@Image1 as the first frame. Sunlight slowly shifts across the
building facade, casting moving shadows. People walk past in
the foreground as small blurred silhouettes. Trees sway
gently. Camera slowly pans right along the building exterior.
Clean architectural photography style, natural daylight,
realistic atmosphere.

Idéal pour : immobilier, portfolios d’architecture, contenu urbain.


Techniques avancées

Une fois à l’aise avec l’image vers vidéo de base, ces techniques vous aideront à produire des résultats plus sophistiqués.

Verrouillage de la première image

La manière la plus fiable d’utiliser l’image vers vidéo est de verrouiller votre image comme première image de la vidéo générée. Cela garantit que la vidéo démarre exactement comme votre image et que l’IA anime la scène à partir de ce point.

Utilisez cette phrase dans votre prompt :

@Image1 as the first frame.

Cela indique à Seedance 2.0 de traiter votre image comme la véritable image de départ, et non simplement comme une référence de style ou de personnage. La composition, les couleurs, la position du sujet et la mise en page globale de votre image seront préservées dans la première image, et le mouvement se construira à partir de là.

Ciblage de la dernière image

Vous pouvez aussi définir un point final en important deux images : une pour le début et une pour la fin :

@Image1 as the first frame, @Image2 as the last frame.
The character smoothly transitions from the sitting position
to standing. Camera holds steady. Continuous smooth motion.

Seedance 2.0 générera une vidéo qui passe naturellement de la composition de @Image1 à celle de @Image2. C’est puissant pour :

  • Les transformations avant/après
  • Les transitions de pose de personnage
  • Les transitions de scène (jour vers nuit, vide vers peuplé)
  • Les séquences de révélation de produit

Astuce : conservez les deux images au même format d’image et avec un cadrage à peu près identique pour la transition la plus fluide. Des changements de composition spectaculaires entre la première et la dernière image peuvent produire des résultats instables.

Cohérence de personnage multi-images

Lorsque vous créez du contenu multi-plans (comme un court-métrage ou une campagne publicitaire), utilisez la même image de référence du personnage dans toutes les générations :

Plan 1 :

@Image1 is the main character. She walks through a busy
market street. Camera tracks alongside her. Daytime,
natural lighting.

Plan 2 :

@Image1 is the main character. She stops at a fruit stand and
picks up an apple. Camera holds static, medium shot.
Same daytime lighting as previous scene.

En utilisant la même référence @Image1 dans les deux plans, le visage, les vêtements et les proportions du personnage restent cohérents d’un montage à l’autre.

Transfert de style depuis une seconde image

Importez une image comme votre sujet et une seconde image comme référence de style :

@Image1 is the main subject. Apply the visual style, color
palette, and lighting from @Image2. The subject walks forward
slowly. Camera dollies in. Match the mood and atmosphere
of @Image2 exactly.

C’est utile lorsque vous voulez qu’une photographie ressemble à une peinture, qu’un croquis ressemble à un rendu 3D, ou toute transformation inter-styles tout en conservant le mouvement.

Combiner les références image et vidéo

Pour un contrôle maximal, combinez une référence image (pour l’apparence) avec une référence vidéo (pour le mouvement) :

@Image1 is the character. Replicate the exact camera movement
and action choreography from @Video1. Maintain the character's
appearance from @Image1 throughout. Cinematic lighting.

Cela sépare le contrôle de l’apparence du contrôle du mouvement : votre image définit l’apparence des choses, et votre référence vidéo définit la façon dont les choses bougent.

Verrouillage de seed pour l’affinage itératif

Si l’interface Dreamina fournit une valeur de seed, notez le seed d’une génération qui vous plaît partiellement. Relancez avec le même seed et un prompt légèrement ajusté pour affiner des éléments spécifiques sans changer la composition globale. C’est particulièrement utile lorsque le mouvement est bon mais que le style nécessite un ajustement, ou inversement.


Bonnes pratiques de préparation des images

La qualité de votre résultat est directement liée à la qualité de votre source. Suivez ces règles pour de meilleurs résultats.

La résolution compte

Résolution d’entréeQualité de sortie attendue
En dessous de 720pMédiocre — artefacts visibles, détails flous
1080p (1920x1080)Bonne — acceptable pour les réseaux sociaux
2K (2048x1152)Excellente — correspond à la résolution de sortie native
4K (3840x2160)Excellente — donne à l’IA un maximum de détails à exploiter

Visez toujours le 2K ou plus. Si votre image source est en dessous de 1080p, envisagez de l’upscaler avec un upscaler IA avant de l’utiliser dans Seedance 2.0.

Alignement du format d’image

Faites correspondre le format d’image de votre source au ratio de sortie souhaité :

PlateformeRatio recommandéExemple de taille d’image
YouTube / Vimeo16:92048 x 1152
TikTok / Reels / Shorts9:161152 x 2048
Fil Instagram1:11440 x 1440
Portrait Instagram4:5 ou 3:41152 x 1536

Des ratios non concordants obligent l’IA à recadrer ou compléter votre image, ce qui introduit des changements de cadrage involontaires.

Positionnement du sujet

  • Placez votre sujet là où il restera tout au long du clip. Si le personnage est centré, l’IA tentera de le garder centré.
  • Laissez de l’espace au-dessus de la tête et un espace négatif dans la direction du mouvement prévu. Un personnage sur le point de marcher vers la droite a besoin d’espace sur le côté droit de l’image.
  • Évitez les sujets coupés aux bords de l’image, sauf si vous souhaitez intentionnellement un cadrage partiel.

Cohérence de l’éclairage

L’IA tentera de conserver l’éclairage de votre image source. Si votre image a un éclairage plat et uniforme, la vidéo aura un éclairage plat et uniforme. Pour des résultats plus dynamiques :

  • Utilisez des images avec un éclairage directionnel (les sujets éclairés de côté ou à contre-jour créent plus de profondeur visuelle).
  • Évitez les températures d’éclairage mixtes, sauf si c’est l’effet recherché.
  • Spécifiez l’éclairage dans votre prompt si vous voulez remplacer ou renforcer ce qui se trouve dans l’image : « warm golden-hour lighting » ou « dramatic rim lighting ».

Ce qu’il faut éviter

  • Texte ou filigranes marqués : l’IA tentera de les animer, créant un texte déformé.
  • Gros plans extrêmes de visages : peuvent produire des effets de vallée de l’étrange dans le mouvement généré.
  • Collages ou images multi-panneaux : l’IA peut avoir du mal à déterminer quel élément est le sujet.
  • Images très sombres ou très lumineuses : les images à faible contraste donnent moins d’informations à l’IA.

Résolution des problèmes courants

Dérive de personnage (le sujet change d’apparence)

Symptôme : le visage, les vêtements ou la forme du corps du personnage changent de façon notable pendant le clip.

Solution :

  • Simplifiez votre prompt en un seul sujet avec une seule action principale.
  • Supprimez toute instruction impliquant des changements de scène ou l’arrivée de nouveaux personnages.
  • Utilisez le verrouillage « as the first frame » pour une cohérence maximale.
  • Assurez-vous que votre image de référence présente un visage net et bien éclairé.

Flou de mouvement ou mouvement saccadé

Symptôme : la vidéo semble tremblante ou présente un flou de mouvement non naturel.

Solution :

  • Remplacez les verbes d’action rapides par des alternatives plus douces. Utilisez « slowly walks » au lieu de « runs ».
  • Ajoutez des contraintes de fluidité : « smooth continuous motion, no sudden movements ».
  • Réduisez la durée du clip. Un clip de 5 secondes avec un seul mouvement est plus fluide qu’un clip de 15 secondes avec plusieurs actions.
  • Évitez de combiner plusieurs mouvements de caméra dans un même clip.

Mauvais cadrage ou sujet recadré

Symptôme : le résultat recadre votre sujet ou cadre la scène différemment de votre image source.

Solution :

  • Réglez le format d’image de sortie pour qu’il corresponde exactement au ratio de votre image source.
  • Indiquez explicitement le cadrage : « medium close-up », « wide shot » ou « full body shot ».
  • Utilisez « as the first frame » pour verrouiller la composition.

Résultat statique (rien ne bouge)

Symptôme : la vidéo générée ressemble à une image fixe avec peu ou pas de mouvement.

Solution :

  • Soyez plus précis sur ce qui bouge. Au lieu de « the scene comes to life », décrivez des actions exactes : « hair blows in the wind, leaves fall in the background, clouds drift across the sky ».
  • Ajoutez un mouvement de caméra pour créer au moins un peu de dynamisme visuel.
  • Augmentez la durée pour donner à l’IA davantage d’images à exploiter.

Changements d’éclairage en cours de clip

Symptôme : l’éclairage ou la température de couleur change de façon notable pendant la vidéo.

Solution :

  • Indiquez explicitement la cohérence de l’éclairage : « maintain consistent warm lighting throughout ».
  • Évitez les prompts impliquant des changements d’heure de la journée, sauf si c’est votre intention.
  • Utilisez des durées de clip plus courtes — l’éclairage est plus stable dans des clips de 4 à 5 secondes que dans des clips de 15 secondes.

Mouvements de mains ou de visage non naturels

Symptôme : les mains se déforment, des doigts supplémentaires apparaissent, ou les expressions faciales semblent étranges.

Solution :

  • Évitez de demander des gestes de mains en gros plan ou des expressions faciales extrêmes.
  • Gardez la caméra à distance moyenne ou plus large du sujet.
  • Utilisez des actions de main plus simples : « holds the cup » fonctionne mieux que « picks up the cup while gesturing ».
  • Si les mains ne sont pas essentielles à la scène, gardez-les hors de la mise au point ou hors champ.

FAQ

Quels formats d’image Seedance 2.0 accepte-t-il pour l’image vers vidéo ?

Seedance 2.0 accepte les images JPG, PNG et WebP. Pour de meilleurs résultats, utilisez des images en résolution 2K (2048x1152) ou supérieure, avec des sujets nets et un bon éclairage.

Combien d’images de référence puis-je importer à la fois ?

Vous pouvez importer jusqu’à 9 images de référence par génération, en plus de 3 clips vidéo et 3 fichiers audio, soit un maximum de 12 fichiers au total.

Puis-je contrôler dans quelle image apparaît ma photo ?

Oui. Utilisez la technique de la première image en écrivant « @Image1 as the first frame » dans votre prompt. Cela verrouille votre image comme image d’ouverture et permet à l’IA d’animer la scène à partir de celle-ci.

Pourquoi mon personnage a-t-il un aspect différent dans la vidéo générée ?

La dérive de personnage survient généralement lorsque votre prompt décrit trop d’actions ou de changements de scène. Simplifiez en un seul sujet et un seul mouvement principal. Veillez également à ce que votre image de référence soit haute résolution et bien éclairée.

Combien de temps prend la génération image vers vidéo ?

Un clip type de 5 secondes en résolution 2K prend environ 60 secondes à générer. Des durées plus longues et des configurations de référence plus complexes peuvent prendre proportionnellement plus de temps.

Puis-je utiliser l’image vers vidéo de Seedance 2.0 pour des projets commerciaux ?

Oui. Le contenu généré avec un abonnement Dreamina payant peut être utilisé à des fins commerciales, sous réserve des conditions d’utilisation de ByteDance. Vérifiez les conditions les plus récentes pour votre cas d’usage spécifique.


Contenu connexe

  • Seedance 2.0 : le guide complet — Présentation détaillée des fonctionnalités, tarifs, comparaisons et plus de 20 exemples de prompts pour chaque capacité de Seedance 2.0.
  • Plus de 50 prompts Seedance 2.0 — Bibliothèque de prompts prêts à l’emploi organisée par catégorie, incluant des prompts dédiés à l’image vers vidéo.
  • Test de Seedance 2.0 — Test honnête et indépendant couvrant les points forts, les limites et la façon dont Seedance 2.0 se compare à Sora 2, Kling 3.0 et Veo 3.1.

SeedanceTips est une ressource indépendante qui n’est ni affiliée, ni approuvée, ni officiellement liée à ByteDance ou à l’équipe de développement de Seedance. Tous les noms de produits, logos et marques commerciales sont la propriété de leurs détenteurs respectifs. Les informations de ce site sont fournies à des fins éducatives et informatives, sur la base de données accessibles au public.