Seedance 2.0 Bild-till-video-handledning (2026)

By SeedanceTips Team 16 min read

Seedance 2.0:s bild-till-video-funktion är en av dess mest kraftfulla egenskaper. Istället för att beskriva en scen från grunden med text laddar du upp en stillbild och talar om för AI:n exakt hur den ska väckas till liv – vad som rör sig, hur kameran beter sig och vilken stil som ska tillämpas. Resultatet är en 4–15 sekunder lång video i upp till 2K-upplösning som bevarar din ursprungliga bilds komposition, färger och detaljer samtidigt som den lägger till naturlig, filmisk rörelse.

Den här handledningen går igenom hela bild-till-video-arbetsflödet, från att förbereda dina källbilder till att skriva effektiva rörelseprompter. Du hittar promptexempel att kopiera och klistra in, avancerade tekniker som låsning av första bildruta och karaktärsanimering, samt lösningar på de vanligaste problemen som kreatörer stöter på.


Varför bild-till-video (istället för text-till-video)

Text-till-video är kraftfullt, men ger dig mindre kontroll över den inledande kompositionen. När du redan har ett specifikt utseende, en karaktär, en produktbild eller en scen i åtanke är bild-till-video det bättre arbetsflödet av tre skäl:

Visuell precision. Din bild låser kompositionen, färgpaletten, ljussättningen och motivets utseende. AI:n behöver inte gissa hur din karaktär ser ut eller hur scenen är inramad – den utgår från din exakta bild.

Karaktärskonsistens. Ett av de svåraste problemen inom AI-video är att hålla karaktärer likadana mellan bildrutor. När du tillhandahåller en referensbild och använder @mention-systemet behandlar Seedance 2.0 den bilden som ett tillförlitligt ankare och bibehåller ansiktsdrag, kläder och kroppsproportioner genom hela klippet.

Snabbare iteration. Istället för att skriva om komplexa visuella beskrivningar byter du ut en bild mot en annan. Din prompt förblir fokuserad på rörelse och kameraarbete, vilket är enklare att justera.

Bild-till-video är idealiskt för produktdemonstrationer, karaktärsanimering från konceptkonst, innehåll för sociala medier från befintliga foton, konvertering av storyboard till video och alla arbetsflöden där den visuella identiteten redan är etablerad.


Vad du behöver innan du börjar

Innan du öppnar Dreamina, förbered följande:

Ett Dreamina-konto

Seedance 2.0 körs på ByteDances Dreamina-plattform på dreamina.capcut.com. Registrera dig med ett CapCut- eller ByteDance-konto. Nya konton får gratis provkrediter – tillräckligt för flera testgenereringar.

Källbilder av hög kvalitet

Bildkvaliteten avgör direkt utdatakvaliteten. Följ dessa riktlinjer:

  • Upplösning: 2K (2048x1152) eller högre. Seedance 2.0 ger ut upp till 2K, så att mata den med en 720p-källbild innebär att AI:n måste skala upp och gissa sig till detaljer.
  • Format: JPG, PNG eller WebP. PNG föredras för bilder med transparens eller fina detaljer.
  • Motivets tydlighet: Huvudmotivet bör vara skarpt i fokus med bra ljussättning. Undvik kraftiga komprimeringsartefakter, rörelseoskärpa eller scener med låg kontrast.
  • Kompositionsutrymme: Lämna visuellt utrymme för den rörelse du planerar att lägga till. Om du vill att en karaktär ska gå framåt, beskär dem inte vid bildkanten.

En tydlig rörelseplan

Innan du skriver din prompt, bestäm tre saker:

  1. Vad rör sig? – Motivet, bakgrunden eller båda?
  2. Hur rör sig kameran? – Panorering, kretsning, dolly, lutning, statisk eller handhållen?
  3. Vilken stämning/takt? – Långsam och filmisk, eller snabb och energisk?

Att ha dessa svar innan du börjar förhindrar vaga, ofokuserade prompter som ger generiska resultat.


Steg för steg: Bild till video i Seedance 2.0

Steg 1: Öppna Dreamina och välj modellen

  1. Gå till dreamina.capcut.com
  2. Logga in på ditt konto
  3. Klicka på AI Video i huvudnavigeringen
  4. Välj Seedance 2.0 i modellväljarens rullgardinsmeny

Steg 2: Ladda upp dina referensbilder

Klicka på referenspanelen (uppladdningsområdet till vänster i gränssnittet) och ladda upp dina bilder. Du kan dra och släppa eller klicka för att bläddra.

Varje uppladdad fil tilldelas automatiskt en @tagg:

  • Första bilden: @Image1
  • Andra bilden: @Image2
  • Och så vidare, upp till @Image9

Du kan ladda upp upp till 9 bilder, 3 videoklipp (totalt 15 sekunder) och 3 ljudfiler (totalt 15 sekunder) – högst 12 filer per generering.

Tips: För en enkel bild-till-video-konvertering räcker det med en bild. Använd flera bilder när du behöver karaktärskonsistens mellan olika tagningar eller vill definiera både ett motiv och en stilreferens separat.

Steg 3: Skriv din rörelseprompt

Det är här bild-till-video skiljer sig från text-till-video. Eftersom din bild redan etablerar den visuella scenen bör din prompt fokusera på rörelse och kameraarbete, inte scenbeskrivning.

Använd dina @taggar uttryckligen:

@Image1 is the first frame. The woman's hair blows gently
in the wind. She slowly turns her head to the right and
smiles. Camera holds steady in a medium close-up.
Soft natural lighting, shallow depth of field.

Vi går igenom den fullständiga promptformeln och fler exempel i nästa avsnitt.

Steg 4: Konfigurera utdatainställningar

Ställ in följande parametrar:

InställningAlternativRekommendation
Bildförhållande16:9, 9:16, 4:3, 3:4, 1:1Matcha din källbilds förhållande
Längd4–15 sekunderBörja med 5 s för testning
UpplösningUpp till 2K (2048x1152)Använd 2K för slutgiltig utdata

Matchning av bildförhållande är viktigt. Om din källbild är 16:9 och du ställer in utdata till 9:16 kommer AI:n att beskära eller omforma kompositionen, vilket ofta gör att viktiga detaljer går förlorade. Matcha alltid källbildens bildförhållande med utdatainställningen.

Steg 5: Generera

Klicka på Generera och vänta. Ett 5-sekunders klipp i 2K-upplösning tar vanligtvis cirka 60 sekunder.

Steg 6: Granska och iterera

Titta noga på resultatet. Kontrollera:

  • Rörelsekvalitet: Är rörelsen mjuk och naturlig?
  • Karaktärskonsistens: Behåller motivet sitt utseende genomgående?
  • Kamerabeteende: Följer kameran dina instruktioner?
  • Artefakter: Leta efter flimmer, förvrängningar eller onaturliga distorsioner, särskilt kring händer och ansikten.

Om något är fel, justera ett element i taget i din prompt. Att ändra flera saker samtidigt gör det omöjligt att veta vad som förbättrade (eller försämrade) resultatet. Generera 2–4 variationer per prompt för att jämföra utfall.


Promptformeln för bild-till-video

För bild-till-video hanterar din bild den visuella kompositionen medan din prompt hanterar rörelsen. Använd denna formel:

Motiv + Rörelse, Bakgrund + Rörelse, Kamera + Rörelse

Dela upp det i tre lager:

Lager 1: Motivets rörelse

Beskriv vad huvudmotivet gör. Använd specifika aktiva verb:

  • “Riddaren höjer långsamt sitt svärd över huvudet”
  • “Katten sträcker på sig och gäspar”
  • “Kvinnan vänder sig mot kameran”
  • “Produkten roterar 180 grader på bordet”

Undvik vaga instruktioner som “motivet rör sig” – ju mer specifikt det aktiva verbet är, desto bättre resultat.

Lager 2: Bakgrunds-/miljörörelse

Beskriv vad som händer i scenen runt motivet:

  • “Löv faller försiktigt i bakgrunden”
  • “Regn streckar över fönstret”
  • “Stadsljus pulserar och flimrar i fjärran”
  • “Moln driver långsamt över himlen”

Om du vill att bakgrunden ska vara statisk, säg det uttryckligen: “Bakgrunden förblir stilla.”

Lager 3: Kamerarörelse

Ange exakt en kamerarörelse per klipp. Att kombinera flera kamerarörelser i ett kort klipp ger ofta instabila resultat.

KamerariktningVad den gör
Slow pan left/rightHorisontell svepning över scenen
Dolly in/outKameran rör sig mot eller bort från motivet
Orbit left/rightKameran kretsar runt motivet
Tilt up/downVertikal kamerarotation
Tracking shotKameran följer motivets rörelse
Static shotKameran håller positionen, ingen rörelse
HandheldSubtil naturlig skakning för dokumentärkänsla

Sätt ihop det

Här är formeln tillämpad på ett porträttfoto:

@Image1 is the first frame. The woman slowly lifts her chin
and looks directly into the camera [subject motion]. A gentle
breeze moves the curtains behind her [background motion].
Camera slowly dollies in from a medium shot to a close-up
[camera motion]. Warm golden-hour lighting, cinematic color
grading, shallow depth of field [style].

Stil- och begränsningstaggar

Lägg till stilnyckelord i slutet av din prompt för att styra den visuella behandlingen:

  • Filmisk: “cinematic lighting, shallow depth of field, film grain, 24fps”
  • Kommersiell: “clean studio lighting, product photography, crisp focus”
  • Dramatisk: “high contrast, dramatic shadows, moody atmosphere”
  • Mjuk rörelse: “smooth continuous motion, no jump cuts”
  • Slow motion: “slow-motion movement, 120fps look”

7 promptexempel att kopiera och klistra in

Dessa prompter är utformade för bild-till-video-generering. Ladda upp din bild, klistra in prompten (ersätt @Image1-beskrivningarna med ditt faktiska motiv) och generera.

Exempel 1: Porträttanimering

@Image1 as the first frame. The person blinks naturally and
turns their head slightly to the left. A faint smile appears.
Hair moves gently as if caught by a light breeze. Camera
holds steady in a medium close-up. Soft natural lighting,
cinematic color grading, shallow depth of field.

Bäst för: Porträttbilder, profilfoton, karaktärsporträtt.

Exempel 2: Produktvisning med rotation

@Image1 as the first frame. The product slowly rotates 180
degrees on a reflective surface. Soft highlights glide across
the surface as it turns. Camera holds static at eye level.
Clean studio lighting, commercial product photography style,
crisp focus throughout.

Bäst för: E-handelsproduktbilder, marknadsföringsmaterial.

Exempel 3: Landskap som väcks till liv

@Image1 as the first frame. Clouds drift slowly from left to
right across the sky. Water ripples gently in the foreground.
Grass sways in a light breeze. Camera executes a slow dolly
forward into the scene. Golden-hour lighting, nature
documentary style, wide dynamic range.

Bäst för: Reseinnehåll, fastigheter, naturfotografi.

Exempel 4: Karaktärsactionscen

@Image1 is a warrior in full armor. The warrior raises their
sword overhead with both hands, then brings it down in a
powerful swing. Cape billows with the motion. Camera orbits
slowly to the right during the swing. Dramatic side lighting,
cinematic atmosphere, epic fantasy style.

Bäst för: Animering av konceptkonst, spelmarknadsföring, fantasyinnehåll.

Exempel 5: Mode- och stilvideo

@Image1 as the first frame. The model takes two confident
steps forward on the runway. Fabric of the outfit flows and
catches the light with each step. Camera tracks backward,
keeping the model centered. Bright fashion show lighting,
high-contrast, editorial photography style.

Bäst för: Mode-lookbooks, reels för sociala medier, varumärkesinnehåll.

Exempel 6: Mat och dryck

@Image1 as the first frame. Steam rises gently from the
surface of the coffee cup. A hand slowly reaches in from the
right side and lifts the cup. Liquid shifts naturally inside
the cup. Camera remains static, medium close-up. Warm
cafe lighting, cozy atmosphere, food photography style
with rich warm tones.

Bäst för: Restaurangmarknadsföring, matbloggsinnehåll, dryckesannonser.

Exempel 7: Arkitekturvisualisering

@Image1 as the first frame. Sunlight slowly shifts across the
building facade, casting moving shadows. People walk past in
the foreground as small blurred silhouettes. Trees sway
gently. Camera slowly pans right along the building exterior.
Clean architectural photography style, natural daylight,
realistic atmosphere.

Bäst för: Fastigheter, arkitekturportföljer, urbant innehåll.


Avancerade tekniker

När du känner dig bekväm med grundläggande bild-till-video hjälper dessa tekniker dig att producera mer sofistikerade resultat.

Låsning av första bildruta

Det mest tillförlitliga sättet att använda bild-till-video är att låsa din bild som den första bildrutan i den genererade videon. Detta säkerställer att videon börjar exakt som din bild ser ut och att AI:n animerar framåt från den punkten.

Använd denna fras i din prompt:

@Image1 as the first frame.

Detta talar om för Seedance 2.0 att behandla din bild som den bokstavliga startbildrutan, inte bara som en stil- eller karaktärsreferens. Kompositionen, färgerna, motivets position och den övergripande layouten i din bild bevaras i bildruta ett, och rörelsen byggs upp därifrån.

Inriktning på sista bildrutan

Du kan också definiera en slutpunkt genom att ladda upp två bilder – en för början och en för slutet:

@Image1 as the first frame, @Image2 as the last frame.
The character smoothly transitions from the sitting position
to standing. Camera holds steady. Continuous smooth motion.

Seedance 2.0 genererar en video som naturligt övergår från kompositionen i @Image1 till kompositionen i @Image2. Detta är kraftfullt för:

  • Före/efter-förvandlingar
  • Övergångar mellan karaktärsposer
  • Scenövergångar (dag till natt, tom till befolkad)
  • Sekvenser för produktavslöjande

Tips: Håll båda bilderna i samma bildförhållande och ungefär samma inramning för den mjukaste övergången. Dramatiska kompositionsförändringar mellan första och sista bildrutan kan ge instabila resultat.

Karaktärskonsistens med flera bilder

När du bygger innehåll med flera tagningar (som en kortfilm eller annonskampanj), använd samma karaktärsreferensbild i alla genereringar:

Tagning 1:

@Image1 is the main character. She walks through a busy
market street. Camera tracks alongside her. Daytime,
natural lighting.

Tagning 2:

@Image1 is the main character. She stops at a fruit stand and
picks up an apple. Camera holds static, medium shot.
Same daytime lighting as previous scene.

Genom att använda samma @Image1-referens i båda tagningarna förblir karaktärens ansikte, kläder och kroppsproportioner konsekventa mellan klippen.

Stilöverföring från en andra bild

Ladda upp en bild som ditt motiv och en andra bild som din stilreferens:

@Image1 is the main subject. Apply the visual style, color
palette, and lighting from @Image2. The subject walks forward
slowly. Camera dollies in. Match the mood and atmosphere
of @Image2 exactly.

Detta är användbart när du vill att ett foto ska se ut som en målning, en skiss ska se ut som en 3D-rendering, eller vilken stilövergripande förvandling som helst samtidigt som rörelsen bibehålls.

Att kombinera bild- och videoreferenser

För maximal kontroll, kombinera en bildreferens (för utseende) med en videoreferens (för rörelse):

@Image1 is the character. Replicate the exact camera movement
and action choreography from @Video1. Maintain the character's
appearance from @Image1 throughout. Cinematic lighting.

Detta separerar kontroll av utseende från kontroll av rörelse – din bild definierar hur saker ser ut, och din videoreferens definierar hur saker rör sig.

Seed-låsning för iterativ förfining

Om Dreamina-gränssnittet tillhandahåller ett seed-värde, notera seed för en generering du delvis gillar. Kör om med samma seed och en något justerad prompt för att förfina specifika element utan att ändra den övergripande kompositionen. Detta är särskilt användbart när rörelsen är bra men stilen behöver justeras, eller tvärtom.


Bästa praxis för bildförberedelse

Kvaliteten på din utdata är direkt kopplad till kvaliteten på din indata. Följ dessa regler för bästa resultat.

Upplösning spelar roll

IndataupplösningFörväntad utdatakvalitet
Under 720pDålig – synliga artefakter, mjuka detaljer
1080p (1920x1080)Bra – acceptabelt för sociala medier
2K (2048x1152)Utmärkt – matchar den ursprungliga utdataupplösningen
4K (3840x2160)Utmärkt – ger AI:n maximalt med detaljer att arbeta med

Sikta alltid på 2K eller högre. Om din källbild är under 1080p, överväg att skala upp den med en AI-uppskalare innan du använder den i Seedance 2.0.

Anpassning av bildförhållande

Matcha din källbilds bildförhållande med ditt önskade utdataförhållande:

PlattformRekommenderat förhållandeExempel på bildstorlek
YouTube / Vimeo16:92048 x 1152
TikTok / Reels / Shorts9:161152 x 2048
Instagram-flöde1:11440 x 1440
Instagram porträtt4:5 eller 3:41152 x 1536

Felaktiga förhållanden tvingar AI:n att beskära eller fylla ut din bild, vilket introducerar oavsiktliga inramningsförändringar.

Motivets placering

  • Placera ditt motiv där det kommer att stanna genom hela klippet. Om karaktären är centrerad kommer AI:n att försöka hålla den centrerad.
  • Lämna utrymme ovanför huvudet och negativt utrymme i den riktning rörelsen är tänkt att gå. En karaktär som är på väg att gå åt höger behöver utrymme på höger sida av bilden.
  • Undvik motiv som är avskurna vid bildens kanter om du inte avsiktligt vill ha en delvis inramning.

Konsekvent ljussättning

AI:n kommer att försöka bibehålla ljussättningen från din källbild. Om din bild har platt, jämn ljussättning kommer videon att ha platt, jämn ljussättning. För mer dynamiska resultat:

  • Använd bilder med riktad ljussättning (sidobelysta eller bakgrundsbelysta motiv skapar mer visuellt djup).
  • Undvik blandade ljustemperaturer om det inte är den effekt du vill ha.
  • Ange ljussättning i din prompt om du vill åsidosätta eller förstärka det som finns i bilden: “warm golden-hour lighting” eller “dramatic rim lighting.”

Vad du bör undvika

  • Mycket text eller vattenstämplar: AI:n kommer att försöka animera dem, vilket skapar förvrängd text.
  • Extrema närbilder av ansikten: Kan ge “uncanny valley”-effekter i den genererade rörelsen.
  • Collage eller flerpanelsbilder: AI:n kan ha svårt att avgöra vilket element som är motivet.
  • Mycket mörka eller mycket ljusa bilder: Bilder med låg kontrast ger AI:n mindre information att arbeta med.

Felsökning av vanliga problem

Karaktärsdrift (motivet ändrar utseende)

Symptom: Karaktärens ansikte, kläder eller kroppsform förändras märkbart under klippet.

Lösning:

  • Förenkla din prompt till ett enda motiv med en primär handling.
  • Ta bort alla instruktioner som antyder scenbyten eller nya karaktärer som kommer in.
  • Använd “as the first frame”-låsning för maximal konsistens.
  • Säkerställ att din referensbild har ett tydligt, välbelyst ansikte.

Rörelseoskärpa eller hackig rörelse

Symptom: Videon ser skakig ut eller har onaturlig rörelseoskärpa.

Lösning:

  • Ersätt snabba aktionsverb med mjukare alternativ. Använd “slowly walks” istället för “runs.”
  • Lägg till mjukhetsbegränsningar: “smooth continuous motion, no sudden movements.”
  • Minska klippets längd. Ett 5-sekunders klipp med en rörelse är mjukare än ett 15-sekunders klipp med flera handlingar.
  • Undvik att kombinera flera kamerarörelser i ett klipp.

Felaktig inramning eller beskuret motiv

Symptom: Utdata beskär ditt motiv eller ramar in scenen annorlunda än din källbild.

Lösning:

  • Ställ in utdatans bildförhållande så att det exakt matchar din källbilds förhållande.
  • Ange inramningen uttryckligen: “medium close-up” eller “wide shot” eller “full body shot.”
  • Använd “as the first frame” för att låsa kompositionen.

Statisk utdata (inget rör sig)

Symptom: Den genererade videon ser ut som en stillbild med minimal eller ingen rörelse.

Lösning:

  • Var mer specifik om vad som rör sig. Istället för “the scene comes to life”, beskriv exakta handlingar: “hair blows in the wind, leaves fall in the background, clouds drift across the sky.”
  • Lägg till en kamerarörelse för att skapa åtminstone en viss visuell dynamik.
  • Öka längden för att ge AI:n fler bildrutor att arbeta med.

Ljussättningen förändras mitt i klippet

Symptom: Ljussättningen eller färgtemperaturen förändras märkbart under videon.

Lösning:

  • Ange uttryckligen konsekvent ljussättning: “maintain consistent warm lighting throughout.”
  • Undvik prompter som antyder förändringar i tid på dygnet om inte det är din avsikt.
  • Använd kortare klipplängder – ljussättningen är mer stabil i 4–5 sekunders klipp än i 15-sekunders klipp.

Onaturliga hand- eller ansiktsrörelser

Symptom: Händer deformeras, extra fingrar dyker upp, eller ansiktsuttryck ser kusliga ut.

Lösning:

  • Undvik att be om närbilder av handgester eller extrema ansiktsuttryck.
  • Håll kameran på medelavstånd eller längre bort från motivet.
  • Använd enklare handhandlingar: “holds the cup” fungerar bättre än “picks up the cup while gesturing.”
  • Om händer inte är avgörande för scenen, håll dem ur fokus eller utanför bild.

Vanliga frågor

Vilka bildformat accepterar Seedance 2.0 för bild-till-video?

Seedance 2.0 accepterar bilder i formaten JPG, PNG och WebP. För bästa resultat, använd bilder i 2K-upplösning (2048x1152) eller högre med tydliga motiv och bra ljussättning.

Hur många referensbilder kan jag ladda upp samtidigt?

Du kan ladda upp upp till 9 referensbilder per generering, tillsammans med upp till 3 videoklipp och 3 ljudfiler, för totalt högst 12 filer.

Kan jag styra i vilken bildruta min bild visas?

Ja. Använd första-bildrutan-tekniken genom att skriva “@Image1 som första bildruta” i din prompt. Detta låser din bild som öppningsbildrutan och låter AI:n animera framåt från den.

Varför ser min karaktär annorlunda ut i den genererade videon?

Karaktärsdrift inträffar oftast när din prompt beskriver för många handlingar eller scenbyten. Förenkla till ett enda motiv och en primär rörelse. Säkerställ också att din referensbild är högupplöst och välbelyst.

Hur lång tid tar bild-till-video-generering?

Ett typiskt 5-sekunders klipp i 2K-upplösning tar cirka 60 sekunder att generera. Längre längder och mer komplexa referensuppställningar kan ta proportionellt längre tid.

Kan jag använda Seedance 2.0 bild-till-video för kommersiella projekt?

Ja. Innehåll som genererats med en betald Dreamina-prenumeration kan användas kommersiellt, med förbehåll för ByteDances användarvillkor. Kontrollera de senaste villkoren för ditt specifika användningsfall.


Relaterat innehåll

  • Seedance 2.0: Den kompletta guiden – Fullständig genomgång av funktioner, priser, jämförelser och 20+ promptexempel för varje Seedance 2.0-funktion.
  • 50+ Seedance 2.0-prompter – Färdigt promptbibliotek organiserat efter kategori, inklusive dedikerade bild-till-video-prompter.
  • Seedance 2.0-recension – Ärlig, oberoende recension som täcker styrkor, begränsningar och hur Seedance 2.0 står sig mot Sora 2, Kling 3.0 och Veo 3.1.

SeedanceTips är en oberoende resurs och är inte ansluten till, rekommenderad av eller officiellt kopplad till ByteDance eller Seedance utvecklingsteam. Alla produktnamn, logotyper och varumärken tillhör sina respektive ägare. Informationen på denna webbplats tillhandahålls i utbildnings- och informationssyfte baserat på offentligt tillgängliga data.