AI 影片生成 · 進階（Seedance 完整能力 · 管線 · 參考影片 · Blender

本頁主題

Seedance 完整能力
用 API 自動跑這條管線
參考影片（video-to-video）
參考音頻
用 Blender 做 3D 參考
AI 導演：自動產分鏡
電影製作與影像敘事

①Seedance 完整能力

Seedance 2.0 不只「圖 → 影片」。完整能力一覽：

生成模式

模式	怎麼用
文生視頻（text-to-video）	只給文字 prompt，不放圖
圖生視頻（image-to-video）	給參考圖；可指定首幀 first_frame / 尾幀 last_frame，框住開頭或結尾畫面
影生視頻（video-to-video）	給參考影片，照風格重新生成（見 ③）

參考輸入

參考	控制什麼	上限
🖼️ 參考圖片（`image_urls` / `image_with_roles`）	長相、構圖、首/尾幀	9 張
🎞️ 參考影片（`video_urls`）	以整段影片為底換風格（video-to-video）	3 段，1.8–15.2 秒，480–720P，不可真人
🔊 參考音頻（`audio_urls`）	聲音 / 配音參考	3 個，≤ 15 秒

輸出設定

設定	選項
有聲視頻（`generate_audio`）	開 → AI 生成音效 / 環境音 / 聲音
比例（`size`）	橫屏 16:9、竖屏 9:16、方形 1:1、超寬屏 21:9、4:3、3:4、自適應 adaptive
畫質（`resolution`）	480p / 720p / 1080p / 4k
長度（`duration`）	4–15 秒
模型（`model`）	doubao-seedance-2.0 / -fast / -face / -fast-face / -mini

②用 API 自動跑這條管線

真正「把參考圖＋ prompt 自動變成影片」靠的是 apimart.ai 的 API（Seedance 2.0 的服務商）。一支零依賴的 Node 腳本就能跑完四步：

sequenceDiagram
    autonumber
    participant U as seedance.mjs
    participant API as apimart.ai
    U->>API: POST /v1/uploads/images（參考圖）
    API-->>U: 回圖片公開 URL
    U->>API: POST /v1/videos/generations（prompt + 圖 URL + 參數）
    API-->>U: 回 task_id
    loop 每 5 秒輪詢
        U->>API: GET /v1/tasks/{task_id}
        API-->>U: pending → processing → completed
    end
    U->>API: 取影片 URL
    API-->>U: 影片 .mp4

步驟	端點	回傳
上傳參考圖	`POST /v1/uploads/images`	圖片公開 URL（72h）
建生成任務	`POST /v1/videos/generations`	`task_id`
查任務狀態	`GET /v1/tasks/{task_id}`	status / 影片 URL

export APIMART_API_KEY='sk-你的金鑰'
node seedance.mjs \
  --prompt-file my.prompt.txt \
  --ref refs/board.png --ref refs/char.png --ref refs/droid.jpeg \
  --model doubao-seedance-2.0-fast --resolution 720p --duration 15 --audio \
  --out out.mp4

🔐 金鑰只放環境變數，別寫進程式碼或 commit；外流就到 apimart 後台 rotate。

💡 兩個要點① 生成只吃圖片「URL」、不收 base64，所以要先上傳換 URL。② 影片要算幾分鐘 → 非同步 → 拿 task_id 每隔幾秒輪詢，completed 後立刻下載（URL 會過期）。

③參考影片：video-to-video 風格轉換

參考輸入不只圖片。Seedance 也吃參考影片（video_urls）——主要用途是 video-to-video 風格轉換：給一段影片，照你的 prompt 與參考圖把它重新生成成目標樣子（文件範例：把影片轉成動漫風）。

⚠️ 硬限制解析度需 480–720P、總長約 1.8–15.2 秒、最多 3 段，而且 不可出現真人。適合丟「動畫 / CG / 3D render」素材，不是真人實拍。

參考影片可以哪裡來

你已有的動畫 / 生成影片：想換另一種風格時，當 video-to-video 的底。
Blender 粗動畫 render：見 ⑤，CG render 天生沒有「真人」問題。
「用動作驅動角色」是另一條路：像 Viggle 把動作「套」到角色上、自成一套工具；產出（非真人）可當素材，但別跟 Seedance 的 video_urls（做風格轉換、不可有真人）混為一談。

💡 一句話參考圖管「是誰、長怎樣」；參考影片管「以這段影片為底、換風格重演」。

④參考音頻

除了 generate_audio 讓 AI 直接生成聲音，也可以用 audio_urls 丟參考音頻當聲音範本（最多 3 個、總長 ≤ 15 秒）。適合想指定特定音色／節奏／配音感覺時使用。

⑤用 Blender 做 3D 場景與動作參考

想更精準地控制構圖、鏡位、走位與連戲，可以先在 Blender 搭一個 3D 粗模，把「場景、相機、姿勢」render 出來當參考餵給 Seedance——比純文字描述可控得多。

flowchart LR
    BL["🧊 Blender 3D 粗模：場景 + 相機 + 角色 pose/動畫"] --> R1["🖼️ render 場景/鏡位/pose → 參考圖 / first_frame"]
    BL --> R2["🎞️ render 一段動畫 → video-to-video 來源"]
    R1 --> SEED["🎬 Seedance"]
    R2 --> SEED
    SEED --> V["✅ 更可控的影片"]
    style V fill:#16241b,stroke:#8ef6c8,color:#f1e7d0

3D 場景 / 鏡位 / 打光：render 一張 layout，當場景參考圖或起始幀（first_frame），鎖住構圖與相機角度。
角色走位 / pose：擺好姿勢 render 成圖，當參考圖／起始幀，鎖住姿勢與位置。
相機運動：Blender 的攝影機推軌／環繞可當運鏡藍本，寫進 prompt 或用首尾幀框住。
連戲：同一個 3D 場景跨鏡 render，角色／場景／比例自然一致。

📎 對應到哪個輸入場景／鏡位／pose render → 圖片參考（image_urls / first_frame，上限 9 張）；render 一段動畫 → 當 video_urls 做 video-to-video（CG render 沒有「不可有真人」的限制）。粗模＋灰階就夠當藍圖。

⑥AI 導演：自動產分鏡

基礎流程裡「產分鏡圖的 prompt」是人手寫的。再往前加一層 AI 導演，使用者就只要給「參考圖＋想要的敘事／表現」，由 AI 反饋建議、並自動生成分鏡表。

flowchart TD
    U["🧑 使用者：參考圖 ＋ 電影敘事 / 想要的表現"] --> AI["🎩 AI 導演 (LLM)"]
    AI -->|"建議：鏡頭 / 運鏡 / 節奏 / 連戲風險"| U
    AI --> BP["📝 自動產出 分鏡圖 prompt"]
    BP --> IMG["🖼️ 影像模型 如 gpt-image-2"]
    IMG --> BOARD["🗂️ 自動生成 分鏡表"]
    R2["🖼️ 參考圖片"] --> SEED
    BOARD --> SEED["🎬 Seedance 2.0"]
    SEED --> V["✅ 影片"]
    style BOARD fill:#10243a,stroke:#5aa6ff,color:#f1e7d0
    style V fill:#16241b,stroke:#8ef6c8,color:#f1e7d0

使用者給：參考圖＋一段敘事或想要的表現（例：「雨夜、孤獨、最後釋懷的 90 秒」）。
AI 導演反饋：建議鏡頭選擇、運鏡、節奏、連戲風險、分鏡結構，跟你來回確認。
AI 自動產分鏡：把確認後的方向轉成「分鏡圖 prompt」，交影像模型自動畫出分鏡表（可先粗排多格、再細修單格）。
之後接基礎流程：分鏡＋參考圖＋ Seedance prompt → 影片。

🎯 一句話AI 導演的價值不是「聊天」，是把導演的每個決定翻譯成三種東西之一：參考圖的鎖、分鏡圖 prompt（Pass 1）、每鏡 Seedance prompt（Pass 2），並在付費生成前用連戲與就緒度把問題擋下來。

導演的決定 → AI 導演怎麼協助

導演職責	AI 導演在這條管線能做的
劇本／敘事拆解	產 beat 草稿並標敘事功能／情緒／節奏、畫情緒曲線；把段落切成「可生成單位」——一支是 4–15 秒積木，回答這段切幾鏡、各幾秒、哪幾鏡靠首尾幀接、哪幾鏡是剪接點。
分鏡與鏡頭表（景別、鏡位、coverage）	為每個 beat 展開 shot list，補齊缺的 establishing／reaction／insert，標主鏡與備鏡；因重生成便宜，主動建議「關鍵動作生 3 個景別給你剪」。
場面調度 blocking（走位、方向）	在分鏡圖 prompt 寫死版面（主體左／右、面向、前後景），每鏡寫明方位；用 `first_frame`／`last_frame` 鎖走位接續，並主動警示螢幕方向翻面（180 度線）。
攝影機（運鏡、POV）	把運鏡翻成 Seedance 看得懂的詞，每鏡只給一個主運鏡，並校驗運鏡是否配情緒。
節奏與剪輯點	把 4–15 秒預算分到每鏡（緊張短切、抒情長鏡），切點切在動作完成幀；用「上鏡 `last_frame`＝下鏡 `first_frame`」做 match cut；MV 依主歌／副歌／間奏對齊。
表演／角色（情緒、動作意圖）	把「意圖」翻成具體可見動作（不是形容詞，是「拔刀、後退半步、肩膀下沉、眼神收緊」），每鏡附 `ACTION RULE` 鎖死容易漂的點。
連戲與一致性風險	用 9 張參考圖鎖 identity 與構圖、首尾幀鎖接續，自動產連戲檢查清單；偵測數量鎖、道具狀態回跳、螢幕方向翻面並標風險。
美術／光／色的敘事	在場景參考圖鎖光色錨點，prompt 寫明光源方向、key／fill、色溫與情緒色；每鏡重複錨點防止逐鏡飄移。
產出就緒（可生成性檢查）	生成前跑就緒度檢查：參考是否覆蓋角色／對手／場景／分鏡表、每鏡是否有動作＋ACTION RULE＋運鏡＋景別、首尾幀鏈是否連續、比例／畫質／秒數是否設定；輸出 low／medium／high，high 才放行。

AI 導演能輸出的可交付物

Shot list 鏡頭表：每 beat 的景別／鏡位／主鏡＋備鏡
每鏡 Seedance prompt：動作＋ACTION RULE＋運鏡＋景別＋光色＋比例／秒數
分鏡圖 prompt：多格 storyboard sheet 的生成 prompt（含版面與順序）
連戲檢查清單：identity／道具狀態／數量／螢幕方向／首尾幀鏈
運鏡建議：每鏡單一主運鏡＋情緒匹配校驗
風格鎖定指引：9 張參考該放什麼、光色錨點、v2v 不可真人提醒
覆蓋建議：哪個關鍵動作要多生幾個景別留剪接餘地
就緒度報告：low／medium／high ＋還缺什麼

最該優先自動化：首尾幀接續鏈＋ ACTION RULE

這條管線裡，AI 導演層最該優先自動化的不是文采，是這兩個硬骨架：

首尾幀接續鏈：把上鏡 last_frame 設為下鏡 first_frame，角色姿態、位置、光線、構圖全部延續，剪在一起幾乎無縫——這是把一堆 15 秒積木接成連戲作品的關鍵。
ACTION RULE 約束塊：擋住 Seedance 最常見的漂移（變臉、長手、多人、運鏡亂、回鞘）。

其餘（shot list、運鏡、光色、情緒曲線）都是可接受／拒絕的建議層；只有這兩項是讓「很多段 ×（連戲＋剪接）」真的成立的前提。

運鏡詞彙與情緒匹配

不要丟「運鏡有張力」這種空話，給可貼的詞並校驗配不配情緒：

對峙、停頓、蓄力 → locked-off static 或極慢 slow push-in
情緒外放、爆發、追逐 → tracking follow、handheld shake
抒情、展示空間 → slow orbit around subject、crane up
揭示、轉場衝擊 → whip pan、dolly zoom

鐵律：每鏡只給一個主運鏡（多運鏡會讓模型亂掉）；景別走階梯式變化（wide→medium→close），不要大廣角直砍大特寫。

兩段 prompt 的分工：分鏡圖鎖版面、Seedance 鎖動作

Pass 1 分鏡圖 prompt 寫死版面與螢幕方向：

生成 1 張 2×2 黑白分鏡草圖。格1 廣景：兩名持刀者於雨夜廢墟對峙，
C1 在 frame left 面向右、C2 在 frame right 面向左。格2 中景：C1 拔刀起手。
線稿、不上色、不加文字標籤。

Pass 2 每鏡 Seedance prompt 管「這 4–15 秒怎麼動」，動作段＋ACTION RULE：

中景。雨夜廢墟，冷藍光。C1（依參考圖外觀）位於畫面左側面向右，
緩慢拔刀至起手式，肩膀下沉、視線鎖定對手。鏡頭：緩慢 push-in。16:9，6 秒，1080p。

ACTION RULE：只做「拔刀至起手」這一個連續動作；畫面僅 2 人，不得出現第三人或多餘肢體；
刀為 1 把，出鞘後不得回鞘；外觀嚴格依參考圖；鏡頭只做一次 push-in；
最後一幀停在「刀已舉至肩高、刀尖指向 C2」。

把這鏡的 last_frame 設為下個攻擊鏡的 first_frame，就形成 match cut，刀的位置不跳。

MV／直式案例：段落對齊與音訊

MV preset（9:16）把副歌 12 秒切成 3 鏡跟鼓點：

WIDE 歌手走出霓虹後巷（4s，tracking follow，建立空間）
MEDIUM 轉身對鏡演唱（4s，slow orbit，情緒拉高）
CLOSE 仰角臉部＋霓虹反光（4s，locked-off，定格情緒）

音訊：MV 通常先有歌，建議關閉 generate_audio、改用參考音頻對節奏或後製對軌。限制：video-to-video 風格轉換不可用真人素材。

🚧 現況以上是 AI 導演層的能力藍圖（部分尚未內建）。需要的元件都現成：一個懂分鏡語言的 LLM、一個影像生成模型、一個讓你來回給回饋的介面。

⑦電影製作與影像敘事

一支 15 秒片段只是一塊積木。要做更長、更有敘事的作品，就把這條管線當「單鏡產生器」，再往上疊三層：多鏡組裝、連戲、影像敘事技法。

flowchart TD
    STORY["🎬 故事 / 敘事意圖"] --> BOARD["🗂️ 分鏡表 多鏡藍圖"]
    BOARD --> SP["每一鏡：Seedance prompt"]
    SP --> CLIPS["🎞️ 多段片段 各自生成"]
    CLIPS --> EDIT["✂️ 剪接 ＋ 轉場 ＋ 配樂"]
    EDIT --> FILM["🎥 完整作品"]
    style FILM fill:#16241b,stroke:#8ef6c8,color:#f1e7d0
    style BOARD fill:#10243a,stroke:#5aa6ff,color:#f1e7d0

核心心法：開發／前製做不紮實，製作階段的 15 秒積木就接不起來。重點不是拍得多漂亮，是讓很多段能連戲＋剪接成一支完整作品。把傳統四階段映射到這條管線：

1. 開發 Development

目標：把一句概念變成可生成的敘事藍圖，定下全片不變的風格與技術規格。

寫 premise、選 preset，決定比例與畫質並全片鎖死（16:9 或 9:16、1080p–4k，不逐鏡換、避免 adaptive）。
產 beat 草稿並標敘事功能／情緒／節奏，畫情緒曲線，確認高潮與喘息位置。
寫一套 VISUAL STYLE 文字塊（色調、光質、底片／數位質感、年代氛圍），全片逐鏡照貼。
建角色字典與道具字典（C1／C2、P1／P2 代號＋固定描述句）當文字側的身分鎖。

2. 前製 Pre-production

目標：備齊 9 張參考圖、展開 shot list、規劃首尾幀鏈與切點，跑就緒度檢查。

鎖定參考圖（最多 9 張）：角色身分卡、對手、場景定場圖、分鏡表；留 1 張機動，每角色／場景一張固定圖、不中途換。
為每 beat 展開 shot list，補 establishing／reaction／insert，標主鏡與備鏡，排好景別階梯（wide→medium→close）。
生成 Pass 1 分鏡圖 prompt → 多格 storyboard sheet，人工核准版面、走位、螢幕方向（守 180 度線）。
規劃首尾幀鏈與切點：哪幾鏡靠 last_frame→first_frame 接、切點放動作中段；每鏡標目標秒數（抽刀＝3s、對峙凝視＝5s）。
跑就緒度檢查（low／medium／high），high 才進製作。

3. 製作 Production

目標：逐鏡生成 15 秒積木，每鏡帶 ACTION RULE 與單一主運鏡，串好首尾幀。

Pass 2 每鏡 prompt＝固定貼 VISUAL STYLE 塊＋角色／道具字典，再換動作段，附 ACTION RULE。
走圖生視頻＋角色一致性路線（別純文生賭長相）；多角色同框分別給參考圖並用 C1／C2 點名。
同角色同場景沿用同一顆 seed，建 seed 帳本；要比對 take 時一次只改一個變數。
每鏡導出尾幀存檔（shotN_last.png），設為下一鏡 first_frame，串成接續鏈。
首次付費生成前再次人工確認 prompt 與參考圖齊全。

4. 後製 Post-production

目標：依分鏡節奏剪接、統一風格與音軌，輸出成片。

按分鏡標好的秒數與切點剪接：match cut 接在首尾幀對齊處，hard cut 用於刻意斷裂。
需要時用 video-to-video 統一全片風格（真人素材不可進 v2v，真人只靠 prompt 風格塊＋固定畫質比例維持）。
音訊：MV 後製對軌、關 generate_audio；敘事片可用 generate_audio 或參考音頻。
全片過一次連戲檢查清單，補生有漂移的鏡，統一輸出比例／畫質。

跨鏡連戲：技巧與陷阱（這是逐鏡生成最容易崩的地方）

✅ 連戲技巧（做法＋為什麼）

角色一張身分卡圖全片不換：換圖＝換錨點，臉會飄。
固定代號＋固定描述句（C1 = a woman, early 30s, scar over left eyebrow）：文字側與參考圖雙重夾緊身分。
圖生視頻＋臉部／角色一致性模型，不要純文生：純文生每次重新想像一個人，臉穩不住。
同角色同場景沿用同一顆 seed：固定沒寫進 prompt 的細節（膚色、髮流、光感），建 seed 帳本。
上鏡 last_frame → 下鏡 first_frame 串接：用真實尾幀當起點幾乎無縫——逐鏡生成最有效一招。
切點放在動作中段而非做完才切：避免停頓-重啟頓挫與姿態重設，視覺暫留補上連續性。
同場景一張固定定場圖＋固定描述句：鎖格局、牆色、傢俱位置、光源方向。
守 180 度線／screen direction：先定軸線，相機只在同一側，角色左右朝向全片一致。
景別階梯式變化（wide→medium→close）：避免大跳讓背景一致性崩掉。
道具給代號＋固定描述＋數量鎖：敏感鏡寫 exactly three candles, no more。
道具狀態列單向時間線（closed→ajar→open broken lock）：明寫當前狀態防回跳，用尾幀繼承外觀。
一套 VISUAL STYLE 文字塊逐鏡照貼：風格詞每鏡微調，整片就忽冷忽暖。
比例與畫質專案層級鎖死：比例一變、構圖邏輯整個換、剪接出黑邊。
一鏡只給一個主要動作：複合動作拆鏡、用首尾幀串接。

⚠️ 會讓連戲崩掉的陷阱

中途換角色參考圖 → 臉直接變人。
代號／描述每鏡換說法（一下 the woman 一下 the girl）→ 模型當不同人。
純文生扛同一張臉、不帶臉部錨定 → 賭運氣。
seed 亂跳 → 膚色／髮流／光感逐鏡重骰。
不接尾幀、每鏡各自開場 → 剪接處必跳。
每鏡把動作做完才切 → 停頓-重啟頓挫並重設姿態。
跳軸／screen direction 反轉（越過 180 度線）→ 左右突然對調，最刺眼的崩法。
景別／角度每鏡大跳（大廣角直砍大特寫）→ 空間一致性守不住。
換場景參考圖或不給場景圖 → 同一房間逐鏡長不一樣。
道具不鎖、數量不管 → 杯子忽多忽少、刀換把。
道具狀態回跳 → 破了又完好、開了又關。
風格詞逐鏡微調 → 色調忽冷忽暖。
把真人丟進 video-to-video → 違反限制、結果不可用。
比例／畫質逐鏡變、亂用 adaptive → 剪接黑邊、銳糊不一。
一鏡塞多動作 → 壓縮／亂序／省略，時間對不上分鏡。
比對 take 卻同時動 prompt 又動 seed → 無法歸因，一次只改一個變數。

📋 從零到成片 checklist

定 preset、比例、畫質，全片鎖死一組值（避免逐鏡用 adaptive）。
寫 VISUAL STYLE 塊、角色字典、道具字典（含數量鎖與狀態時間線）。
備齊並鎖定 9 張參考圖：角色身分卡／對手／場景定場／分鏡表，留 1 張機動。
產 beat＋情緒曲線，段落切成鏡，標每鏡秒數與切點（切在動作中段）。
Pass 1 生分鏡圖 sheet，人工核准版面、走位、螢幕方向（守 180 度線）。
規劃首尾幀鏈：哪幾鏡 last_frame→first_frame 接（match cut）、哪幾鏡 hard cut。
Pass 2 每鏡 prompt＝VISUAL STYLE＋字典＋單一動作＋ACTION RULE＋單一主運鏡＋景別＋秒數。
跑就緒度檢查，high 才放行；首次付費生成前人工再確認一次。
逐鏡生成：圖生＋一致性模型、固定 seed、每鏡導出尾幀串接。
後製：按分鏡節奏剪接、v2v 統一風格（真人除外）、對音軌、過連戲清單補生漂移鏡。

🎩 接回 AI 導演這正是「AI 導演層」要自動化的：從敘事意圖 → 分鏡＋鏡頭語言＋每鏡 prompt（見 ⑥）。

基礎流程與實際範例見配方版；快速流程見流程速覽版。

①Seedance 完整能力

生成模式

參考輸入

輸出設定

②用 API 自動跑這條管線

③參考影片：video-to-video 風格轉換

參考影片可以哪裡來

④參考音頻

⑤用 Blender 做 3D 場景與動作參考

⑥AI 導演：自動產分鏡

導演的決定 → AI 導演怎麼協助

AI 導演能輸出的可交付物

最該優先自動化：首尾幀接續鏈 ＋ ACTION RULE

運鏡詞彙與情緒匹配

兩段 prompt 的分工：分鏡圖鎖版面、Seedance 鎖動作

MV／直式案例：段落對齊與音訊

⑦電影製作與影像敘事

1. 開發 Development

2. 前製 Pre-production

3. 製作 Production

4. 後製 Post-production

跨鏡連戲：技巧與陷阱（這是逐鏡生成最容易崩的地方）

最該優先自動化：首尾幀接續鏈＋ ACTION RULE