Tutorial Seedance 2.0 da immagine a video (2026)
La capacità di conversione da immagine a video di Seedance 2.0 è una delle sue funzionalità più potenti. Invece di descrivere una scena da zero con il testo, carichi un’immagine statica e dici all’AI esattamente come darle vita: cosa si muove, come si comporta la camera e quale stile applicare. Il risultato è un video di 4-15 secondi a risoluzione fino a 2K che preserva la composizione, i colori e i dettagli della tua immagine originale aggiungendo un movimento naturale e cinematografico.
Questo tutorial ti guida attraverso l’intero flusso di lavoro da immagine a video, dalla preparazione delle immagini sorgente alla scrittura di prompt di movimento efficaci. Troverai esempi di prompt pronti da copiare e incollare, tecniche avanzate come il blocco del primo fotogramma e l’animazione dei personaggi, e soluzioni ai problemi più comuni che i creator incontrano.
Perché da immagine a video (invece che da testo a video)
La conversione da testo a video è potente, ma ti dà meno controllo sulla composizione di partenza. Quando hai già in mente un aspetto specifico, un personaggio, uno scatto di prodotto o una scena, la conversione da immagine a video è il flusso di lavoro migliore per tre motivi:
Precisione visiva. La tua immagine blocca la composizione, la palette di colori, l’illuminazione e l’aspetto del soggetto. L’AI non deve indovinare l’aspetto del tuo personaggio o l’inquadratura della scena: parte dalla tua immagine esatta.
Coerenza del personaggio. Uno dei problemi più difficili nel video AI è mantenere i personaggi con lo stesso aspetto attraverso i fotogrammi. Quando fornisci un’immagine di riferimento e usi il sistema @mention, Seedance 2.0 tratta quell’immagine come un’ancora di verità di base, mantenendo i tratti del viso, l’abbigliamento e le proporzioni del corpo per tutta la clip.
Iterazione più rapida. Invece di riscrivere descrizioni visive complesse, sostituisci un’immagine con un’altra. Il tuo prompt resta concentrato sul movimento e sul lavoro di camera, che è più facile da regolare.
La conversione da immagine a video è ideale per demo di prodotti, animazione di personaggi a partire da concept art, contenuti per i social media da foto esistenti, conversione da storyboard a video e qualsiasi flusso di lavoro in cui l’identità visiva è già stabilita.
Cosa ti serve prima di iniziare
Prima di aprire Dreamina, prepara quanto segue:
Un account Dreamina
Seedance 2.0 funziona sulla piattaforma Dreamina di ByteDance all’indirizzo dreamina.capcut.com. Registrati con un account CapCut o ByteDance. I nuovi account ricevono crediti di prova gratuiti, sufficienti per diverse generazioni di test.
Immagini sorgente di alta qualità
La qualità dell’immagine determina direttamente la qualità dell’output. Segui queste linee guida:
- Risoluzione: 2K (2048x1152) o superiore. Seedance 2.0 produce output fino a 2K, quindi fornirgli un’immagine sorgente a 720p significa che l’AI deve fare l’upscaling e indovinare i dettagli.
- Formato: JPG, PNG o WebP. PNG è preferibile per immagini con trasparenza o dettagli fini.
- Nitidezza del soggetto: Il soggetto principale dovrebbe essere a fuoco e ben illuminato. Evita pesanti artefatti di compressione, motion blur o scene a basso contrasto.
- Spazio compositivo: Lascia spazio visivo per il movimento che intendi aggiungere. Se vuoi che un personaggio cammini in avanti, non ritagliarlo al bordo dell’inquadratura.
Un piano di movimento chiaro
Prima di scrivere il tuo prompt, decidi tre cose:
- Cosa si muove? — Il soggetto, lo sfondo o entrambi?
- Come si muove la camera? — Panoramica, orbita, dolly, inclinazione, statica o a mano libera?
- Qual è l’atmosfera/il ritmo? — Lento e cinematografico, oppure veloce ed energico?
Avere queste risposte prima di iniziare evita prompt vaghi e poco mirati che producono risultati generici.
Passo dopo passo: da immagine a video in Seedance 2.0
Passo 1: Apri Dreamina e seleziona il modello
- Vai su dreamina.capcut.com
- Accedi al tuo account
- Clicca su AI Video nella navigazione principale
- Dal menu a tendina di selezione del modello, scegli Seedance 2.0
Passo 2: Carica le tue immagini di riferimento
Clicca sul Reference Panel (l’area di caricamento sul lato sinistro dell’interfaccia) e carica le tue immagini. Puoi trascinarle e rilasciarle oppure cliccare per cercarle.
A ogni file caricato viene assegnato automaticamente un @tag:
- Prima immagine:
@Image1 - Seconda immagine:
@Image2 - E così via, fino a
@Image9
Puoi caricare fino a 9 immagini, 3 clip video (15 secondi totali) e 3 file audio (15 secondi totali): un massimo di 12 file per ogni generazione.
Consiglio: Per una conversione di base da immagine a video, una sola immagine è sufficiente. Usa più immagini quando hai bisogno di coerenza del personaggio tra inquadrature diverse o quando vuoi definire separatamente sia un soggetto che un riferimento di stile.
Passo 3: Scrivi il tuo prompt di movimento
È qui che la conversione da immagine a video si differenzia da quella da testo a video. Poiché la tua immagine stabilisce già la scena visiva, il tuo prompt dovrebbe concentrarsi sul movimento e sul lavoro di camera, non sulla descrizione della scena.
Usa i tuoi @tag in modo esplicito:
@Image1 is the first frame. The woman's hair blows gently
in the wind. She slowly turns her head to the right and
smiles. Camera holds steady in a medium close-up.
Soft natural lighting, shallow depth of field.
Trattiamo la formula completa del prompt e altri esempi nella sezione successiva.
Passo 4: Configura le impostazioni di output
Imposta i seguenti parametri:
| Impostazione | Opzioni | Raccomandazione |
|---|---|---|
| Rapporto d’aspetto | 16:9, 9:16, 4:3, 3:4, 1:1 | Abbina il rapporto dell’immagine sorgente |
| Durata | 4-15 secondi | Inizia con 5s per i test |
| Risoluzione | Fino a 2K (2048x1152) | Usa il 2K per l’output finale |
L’abbinamento del rapporto d’aspetto è importante. Se la tua immagine sorgente è 16:9 e imposti l’output a 9:16, l’AI ritaglierà o rimodellerà la composizione, perdendo spesso dettagli importanti. Abbina sempre il rapporto d’aspetto della tua immagine sorgente all’impostazione di output.
Passo 5: Genera
Clicca su Genera e attendi. Una clip di 5 secondi a risoluzione 2K richiede tipicamente circa 60 secondi.
Passo 6: Valuta e itera
Guarda attentamente il risultato. Controlla:
- Qualità del movimento: Il movimento è fluido e naturale?
- Coerenza del personaggio: Il soggetto mantiene il suo aspetto per tutta la durata?
- Comportamento della camera: La camera segue le tue istruzioni?
- Artefatti: Cerca sfarfallii, deformazioni o distorsioni innaturali, specialmente attorno a mani e volti.
Se qualcosa non va, modifica un elemento alla volta nel tuo prompt. Cambiare più cose contemporaneamente rende impossibile capire cosa ha migliorato (o peggiorato) il risultato. Genera 2-4 varianti per prompt per confrontare gli esiti.
La formula del prompt da immagine a video
Per la conversione da immagine a video, la tua immagine gestisce la composizione visiva mentre il tuo prompt gestisce il movimento. Usa questa formula:
Soggetto + Movimento, Sfondo + Movimento, Camera + Movimento
Suddividila in tre livelli:
Livello 1: Movimento del soggetto
Descrivi cosa fa il soggetto principale. Usa verbi di azione specifici:
- “The knight raises his sword slowly above his head”
- “The cat stretches and yawns”
- “The woman turns to face the camera”
- “The product rotates 180 degrees on the table”
Evita istruzioni vaghe come “the subject moves”: più il verbo di azione è specifico, migliore sarà il risultato.
Livello 2: Movimento dello sfondo/ambiente
Descrivi cosa accade nella scena attorno al soggetto:
- “Leaves fall gently in the background”
- “Rain streaks across the window”
- “City lights pulse and flicker in the distance”
- “Clouds drift slowly across the sky”
Se vuoi che lo sfondo resti statico, dillo esplicitamente: “The background remains still.”
Livello 3: Movimento della camera
Specifica esattamente un solo movimento di camera per clip. Combinare più movimenti di camera in una clip breve produce spesso risultati instabili.
| Direzione della camera | Cosa fa |
|---|---|
Slow pan left/right | Spazzata orizzontale attraverso la scena |
Dolly in/out | La camera si avvicina o si allontana dal soggetto |
Orbit left/right | La camera ruota attorno al soggetto |
Tilt up/down | Rotazione verticale della camera |
Tracking shot | La camera segue il movimento del soggetto |
Static shot | La camera mantiene la posizione, nessun movimento |
Handheld | Leggero tremolio naturale per un effetto documentaristico |
Mettere tutto insieme
Ecco la formula applicata a una foto di ritratto:
@Image1 is the first frame. The woman slowly lifts her chin
and looks directly into the camera [subject motion]. A gentle
breeze moves the curtains behind her [background motion].
Camera slowly dollies in from a medium shot to a close-up
[camera motion]. Warm golden-hour lighting, cinematic color
grading, shallow depth of field [style].
Tag di stile e vincoli
Aggiungi parole chiave di stile alla fine del tuo prompt per controllare il trattamento visivo:
- Cinematografico: “cinematic lighting, shallow depth of field, film grain, 24fps”
- Commerciale: “clean studio lighting, product photography, crisp focus”
- Drammatico: “high contrast, dramatic shadows, moody atmosphere”
- Movimento fluido: “smooth continuous motion, no jump cuts”
- Slow motion: “slow-motion movement, 120fps look”
7 esempi di prompt pronti da copiare e incollare
Questi prompt sono progettati per la generazione da immagine a video. Carica la tua immagine, incolla il prompt (sostituendo le descrizioni di @Image1 con il tuo soggetto reale) e genera.
Esempio 1: Animazione di ritratto
@Image1 as the first frame. The person blinks naturally and
turns their head slightly to the left. A faint smile appears.
Hair moves gently as if caught by a light breeze. Camera
holds steady in a medium close-up. Soft natural lighting,
cinematic color grading, shallow depth of field.
Ideale per: Foto in primo piano, foto profilo, ritratti di personaggi.
Esempio 2: Rotazione per la presentazione di un prodotto
@Image1 as the first frame. The product slowly rotates 180
degrees on a reflective surface. Soft highlights glide across
the surface as it turns. Camera holds static at eye level.
Clean studio lighting, commercial product photography style,
crisp focus throughout.
Ideale per: Scatti di prodotti e-commerce, materiali di marketing.
Esempio 3: Paesaggio che prende vita
@Image1 as the first frame. Clouds drift slowly from left to
right across the sky. Water ripples gently in the foreground.
Grass sways in a light breeze. Camera executes a slow dolly
forward into the scene. Golden-hour lighting, nature
documentary style, wide dynamic range.
Ideale per: Contenuti di viaggio, immobiliare, fotografia naturalistica.
Esempio 4: Scena d’azione di un personaggio
@Image1 is a warrior in full armor. The warrior raises their
sword overhead with both hands, then brings it down in a
powerful swing. Cape billows with the motion. Camera orbits
slowly to the right during the swing. Dramatic side lighting,
cinematic atmosphere, epic fantasy style.
Ideale per: Animazione di concept art, marketing di videogiochi, contenuti fantasy.
Esempio 5: Video di moda e stile
@Image1 as the first frame. The model takes two confident
steps forward on the runway. Fabric of the outfit flows and
catches the light with each step. Camera tracks backward,
keeping the model centered. Bright fashion show lighting,
high-contrast, editorial photography style.
Ideale per: Lookbook di moda, reel per i social media, contenuti di brand.
Esempio 6: Cibo e bevande
@Image1 as the first frame. Steam rises gently from the
surface of the coffee cup. A hand slowly reaches in from the
right side and lifts the cup. Liquid shifts naturally inside
the cup. Camera remains static, medium close-up. Warm
cafe lighting, cozy atmosphere, food photography style
with rich warm tones.
Ideale per: Marketing di ristoranti, contenuti di food blog, pubblicità di bevande.
Esempio 7: Visualizzazione architettonica
@Image1 as the first frame. Sunlight slowly shifts across the
building facade, casting moving shadows. People walk past in
the foreground as small blurred silhouettes. Trees sway
gently. Camera slowly pans right along the building exterior.
Clean architectural photography style, natural daylight,
realistic atmosphere.
Ideale per: Immobiliare, portfolio di architettura, contenuti urbani.
Tecniche avanzate
Una volta che hai familiarità con la conversione di base da immagine a video, queste tecniche ti aiuteranno a produrre risultati più sofisticati.
Blocco del primo fotogramma
Il modo più affidabile di usare la conversione da immagine a video è bloccare la tua immagine come primo fotogramma del video generato. Questo garantisce che il video inizi esattamente come appare la tua immagine e che l’AI animi in avanti a partire da quel punto.
Usa questa frase nel tuo prompt:
@Image1 as the first frame.
Questo dice a Seedance 2.0 di trattare la tua immagine come il fotogramma di partenza letterale, non solo come riferimento di stile o di personaggio. La composizione, i colori, la posizione del soggetto e l’impaginazione complessiva della tua immagine saranno preservati nel primo fotogramma, e il movimento si svilupperà da lì.
Targeting dell’ultimo fotogramma
Puoi anche definire un punto finale caricando due immagini: una per l’inizio e una per la fine:
@Image1 as the first frame, @Image2 as the last frame.
The character smoothly transitions from the sitting position
to standing. Camera holds steady. Continuous smooth motion.
Seedance 2.0 genererà un video che passa naturalmente dalla composizione di @Image1 alla composizione di @Image2. Questo è potente per:
- Trasformazioni prima/dopo
- Transizioni di posa del personaggio
- Transizioni di scena (da giorno a notte, da vuoto a popolato)
- Sequenze di rivelazione di un prodotto
Consiglio: Mantieni entrambe le immagini con lo stesso rapporto d’aspetto e all’incirca la stessa inquadratura per la transizione più fluida. Cambi compositivi drastici tra il primo e l’ultimo fotogramma possono produrre risultati instabili.
Coerenza del personaggio con più immagini
Quando costruisci contenuti a più inquadrature (come un cortometraggio o una campagna pubblicitaria), usa la stessa immagine di riferimento del personaggio in tutte le generazioni:
Inquadratura 1:
@Image1 is the main character. She walks through a busy
market street. Camera tracks alongside her. Daytime,
natural lighting.
Inquadratura 2:
@Image1 is the main character. She stops at a fruit stand and
picks up an apple. Camera holds static, medium shot.
Same daytime lighting as previous scene.
Usando lo stesso riferimento @Image1 in entrambe le inquadrature, il viso, l’abbigliamento e le proporzioni del corpo del personaggio restano coerenti tra i tagli.
Trasferimento di stile da una seconda immagine
Carica un’immagine come tuo soggetto e una seconda immagine come riferimento di stile:
@Image1 is the main subject. Apply the visual style, color
palette, and lighting from @Image2. The subject walks forward
slowly. Camera dollies in. Match the mood and atmosphere
of @Image2 exactly.
Questo è utile quando vuoi che una fotografia sembri un dipinto, che uno schizzo sembri un rendering 3D, o qualsiasi trasformazione cross-style mantenendo il movimento.
Combinare riferimenti di immagine e video
Per il massimo controllo, combina un riferimento di immagine (per l’aspetto) con un riferimento video (per il movimento):
@Image1 is the character. Replicate the exact camera movement
and action choreography from @Video1. Maintain the character's
appearance from @Image1 throughout. Cinematic lighting.
Questo separa il controllo dell’aspetto dal controllo del movimento: la tua immagine definisce l’aspetto delle cose, e il tuo riferimento video definisce come si muovono.
Blocco del seed per il perfezionamento iterativo
Se l’interfaccia di Dreamina fornisce un valore di seed, annota il seed di una generazione che ti piace parzialmente. Rigenera con lo stesso seed e un prompt leggermente modificato per perfezionare elementi specifici senza cambiare la composizione complessiva. Questo è particolarmente utile quando il movimento è buono ma lo stile necessita di regolazioni, o viceversa.
Migliori pratiche per la preparazione delle immagini
La qualità del tuo output è direttamente legata alla qualità del tuo input. Segui queste regole per ottenere i migliori risultati.
La risoluzione conta
| Risoluzione di input | Qualità di output attesa |
|---|---|
| Sotto i 720p | Scarsa — artefatti visibili, dettagli sfocati |
| 1080p (1920x1080) | Buona — accettabile per i social media |
| 2K (2048x1152) | Eccellente — corrisponde alla risoluzione di output nativa |
| 4K (3840x2160) | Eccellente — offre all’AI il massimo dettaglio su cui lavorare |
Punta sempre al 2K o superiore. Se la tua immagine sorgente è sotto i 1080p, considera di farne l’upscaling con un upscaler AI prima di usarla in Seedance 2.0.
Allineamento del rapporto d’aspetto
Abbina il rapporto d’aspetto della tua immagine sorgente al rapporto di output desiderato:
| Piattaforma | Rapporto consigliato | Esempio di dimensione immagine |
|---|---|---|
| YouTube / Vimeo | 16:9 | 2048 x 1152 |
| TikTok / Reels / Shorts | 9:16 | 1152 x 2048 |
| Feed Instagram | 1:1 | 1440 x 1440 |
| Ritratto Instagram | 4:5 o 3:4 | 1152 x 1536 |
Rapporti non corrispondenti costringono l’AI a ritagliare o riempire la tua immagine, il che introduce cambi di inquadratura indesiderati.
Posizionamento del soggetto
- Posiziona il tuo soggetto dove rimarrà per tutta la durata della clip. Se il personaggio è centrato, l’AI tenterà di mantenerlo centrato.
- Lascia spazio sopra la testa e spazio negativo nella direzione del movimento previsto. Un personaggio che sta per camminare verso destra ha bisogno di spazio sul lato destro dell’inquadratura.
- Evita soggetti tagliati ai bordi dell’inquadratura, a meno che tu non voglia intenzionalmente un’inquadratura parziale.
Coerenza dell’illuminazione
L’AI tenterà di mantenere l’illuminazione della tua immagine sorgente. Se la tua immagine ha un’illuminazione piatta e uniforme, il video avrà un’illuminazione piatta e uniforme. Per risultati più dinamici:
- Usa immagini con illuminazione direzionale (soggetti illuminati lateralmente o in controluce creano maggiore profondità visiva).
- Evita temperature di illuminazione miste, a meno che non sia l’effetto desiderato.
- Specifica l’illuminazione nel tuo prompt se vuoi sovrascrivere o migliorare quella presente nell’immagine: “warm golden-hour lighting” o “dramatic rim lighting.”
Cosa evitare
- Testo o filigrane pesanti: L’AI cercherà di animarli, creando testo distorto.
- Primi piani estremi di volti: Possono produrre effetti uncanny valley nel movimento generato.
- Collage o immagini multi-pannello: L’AI potrebbe avere difficoltà a determinare quale elemento sia il soggetto.
- Immagini molto scure o molto luminose: Le immagini a basso contrasto danno all’AI meno informazioni con cui lavorare.
Risoluzione dei problemi comuni
Deriva del personaggio (il soggetto cambia aspetto)
Sintomo: Il viso, l’abbigliamento o la forma del corpo del personaggio cambiano in modo evidente durante la clip.
Soluzione:
- Semplifica il tuo prompt a un singolo soggetto con una sola azione principale.
- Rimuovi qualsiasi istruzione che implichi cambi di scena o l’ingresso di nuovi personaggi.
- Usa il blocco “as the first frame” per la massima coerenza.
- Assicurati che la tua immagine di riferimento abbia un viso nitido e ben illuminato.
Motion blur o movimento a scatti
Sintomo: Il video appare tremolante o ha un motion blur innaturale.
Soluzione:
- Sostituisci i verbi di azione veloce con alternative più fluide. Usa “slowly walks” invece di “runs.”
- Aggiungi vincoli di fluidità: “smooth continuous motion, no sudden movements.”
- Riduci la durata della clip. Una clip di 5 secondi con un solo movimento è più fluida di una clip di 15 secondi con più azioni.
- Evita di combinare più movimenti di camera in una sola clip.
Inquadratura errata o soggetto ritagliato
Sintomo: L’output ritaglia il tuo soggetto o inquadra la scena in modo diverso dalla tua immagine sorgente.
Soluzione:
- Imposta il rapporto d’aspetto di output in modo che corrisponda esattamente al rapporto della tua immagine sorgente.
- Indica esplicitamente l’inquadratura: “medium close-up” o “wide shot” o “full body shot.”
- Usa “as the first frame” per bloccare la composizione.
Output statico (nulla si muove)
Sintomo: Il video generato sembra un’immagine statica con movimento minimo o assente.
Soluzione:
- Sii più specifico su cosa si muove. Invece di “the scene comes to life,” descrivi azioni esatte: “hair blows in the wind, leaves fall in the background, clouds drift across the sky.”
- Aggiungi un movimento di camera per creare almeno un po’ di dinamismo visivo.
- Aumenta la durata per dare all’AI più fotogrammi su cui lavorare.
Variazioni di illuminazione a metà clip
Sintomo: L’illuminazione o la temperatura del colore cambiano in modo evidente durante il video.
Soluzione:
- Indica esplicitamente la coerenza dell’illuminazione: “maintain consistent warm lighting throughout.”
- Evita prompt che implichino cambi di ora del giorno, a meno che non sia il tuo intento.
- Usa durate di clip più brevi: l’illuminazione è più stabile in clip di 4-5 secondi che in clip di 15 secondi.
Movimenti innaturali di mani o volto
Sintomo: Le mani si deformano, appaiono dita in più o le espressioni facciali sembrano innaturali.
Soluzione:
- Evita di richiedere primi piani di gesti delle mani o espressioni facciali estreme.
- Mantieni la camera a un’inquadratura media o a distanza maggiore dal soggetto.
- Usa azioni delle mani più semplici: “holds the cup” funziona meglio di “picks up the cup while gesturing.”
- Se le mani non sono cruciali per la scena, tienile fuori fuoco o fuori inquadratura.
FAQ
Quali formati di immagine accetta Seedance 2.0 per la conversione da immagine a video?
Seedance 2.0 accetta immagini in formato JPG, PNG e WebP. Per ottenere i migliori risultati, usa immagini a risoluzione 2K (2048x1152) o superiore con soggetti nitidi e una buona illuminazione.
Quante immagini di riferimento posso caricare contemporaneamente?
Puoi caricare fino a 9 immagini di riferimento per ogni generazione, insieme a un massimo di 3 clip video e 3 file audio, per un totale massimo di 12 file.
Posso controllare in quale fotogramma appare la mia immagine?
Sì. Usa la tecnica del primo fotogramma scrivendo “@Image1 as the first frame” nel tuo prompt. Questo blocca la tua immagine come fotogramma di apertura e permette all’AI di animare in avanti a partire da essa.
Perché il mio personaggio appare diverso nel video generato?
La deriva del personaggio si verifica di solito quando il tuo prompt descrive troppe azioni o cambi di scena. Semplifica a un singolo soggetto e un solo movimento principale. Assicurati inoltre che la tua immagine di riferimento sia ad alta risoluzione e ben illuminata.
Quanto tempo richiede la generazione da immagine a video?
Una tipica clip di 5 secondi a risoluzione 2K richiede circa 60 secondi per essere generata. Durate più lunghe e configurazioni di riferimento più complesse possono richiedere proporzionalmente più tempo.
Posso usare Seedance 2.0 da immagine a video per progetti commerciali?
Sì. I contenuti generati con un abbonamento Dreamina a pagamento possono essere usati a scopo commerciale, nel rispetto dei termini di servizio di ByteDance. Verifica i termini più recenti per il tuo caso d’uso specifico.
Contenuti correlati
- Seedance 2.0: la guida completa — Analisi completa delle funzionalità, prezzi, confronti e oltre 20 esempi di prompt per ogni capacità di Seedance 2.0.
- Oltre 50 prompt per Seedance 2.0 — Libreria di prompt pronti all’uso organizzata per categoria, inclusi prompt dedicati da immagine a video.
- Recensione di Seedance 2.0 — Recensione onesta e indipendente che copre punti di forza, limiti e come Seedance 2.0 si confronta con Sora 2, Kling 3.0 e Veo 3.1.
SeedanceTips è una risorsa indipendente e non è affiliata, approvata o ufficialmente collegata a ByteDance o al team di sviluppo di Seedance. Tutti i nomi di prodotti, loghi e marchi sono proprietà dei rispettivi titolari. Le informazioni presenti su questo sito sono fornite a scopo educativo e informativo sulla base di dati pubblicamente disponibili.