OimiAI
博客公告
··阅读时间 10 分钟·Oimi AI

Seedance 2.0 分镜图工作流:GPT Image 2 生成 AI 视频

Seedance 2.0 StoryboardGPT Image 2Seedance 2.0 WorkflowImage to VideoAI Video WorkflowStoryboard to Video

GPT Image 2 + Seedance 2.0 工作流,是一种先用 GPT Image 2 生成分镜图或关键帧,再用 Seedance 2.0 将其转化为动态视频的 AI 创作流程。这个组合能大幅提升 AI 视频的稳定性和可控性,是目前最实用的 AI 视频创作方法之一。

在 2026 年,AI 内容创作的核心不再是"选哪个模型",而是:如何把多个模型组合成一个工作流

越来越多的创作者正在用 AI 拍短剧、做游戏过场动画、拍教学视频、做品牌广告。最新发布的 GPT Image 2 和 Seedance 2.0 充分说明了这一点——AI 生成的图片和视频,已经好到可以用于真实的创作场景。

你仍然可以组建专业团队来制作,但 AI 现在给了你一种更快的方式去探索创意、测试想法,在投入大量时间和预算进行正式制作之前。

其中一个非常实用且效果突出的组合是:GPT Image 2 + Seedance 2.0

简单理解:

  • GPT Image 2 → 负责生成高质量画面(关键帧 / 分镜)
  • Seedance 2.0 → 负责让画面动起来(视频 / 动作 / 镜头)

把两者结合,你可以从一张分镜图,直接生成完整的视频——广告、短片、教学、游戏过场,都适用。

GPT Image 2 + Seedance 2.0 工作流示意图:从分镜图到视频的完整流程

什么是 GPT Image 2 和 Seedance 2.0?新能力详解

GPT Image 2:更好的图片生成

GPT Image 2 是 OpenAI 最新发布的 AI 图像生成模型,相比上一代有显著提升:

  • 图片内文字更清晰 —— 适合海报、广告、缩略图、社交媒体素材
  • 提示词理解更准确 —— 能更好地遵循复杂的布局、风格和构图要求
  • 图像编辑更精确 —— 可以修改图片的局部,而不影响整体效果
  • 设计感更强 —— 输出结果适合品牌营销、游戏概念图、分镜设计等多种场景
  • 多语言支持更好 —— 图片中的中文、日文等非英文文字渲染更可靠

无论是营销人员、独立游戏开发者、短剧创作者还是教学设计师,GPT Image 2 生成的图片都可以直接作为创作素材

Seedance 2.0:更强的视频生成

Seedance 2.0 是字节跳动旗下豆包推出的 AI 视频生成模型,在 Artificial Analysis 视频竞技场排名全球前列,是目前对创作者最友好的视频模型

  • 提示词遵循更好 —— 更准确地理解详细的场景指令
  • 角色一致性更强 —— 人物、物体和风格在镜头之间保持更稳定
  • 运动更流畅 —— 动作看起来更自然,减少随机抖动
  • 镜头控制更好 —— 支持平移、缩放、跟拍和电影级运镜
  • 图生视频更真实 —— 参考图片可以转化为更可信的运动场景
  • 场景更逼真 —— 光影、物理效果、面部表情和细节都更干净

为什么 GPT Image 2 + Seedance 2.0 比单独使用效果更好?

单独使用的问题:

工具问题
GPT Image 2只能出图,不能动
Seedance 2.0直接生成容易"画面不稳定"、"人物变形"

组合后的优势

  • 画面更稳定 —— 先用 GPT Image 2 定义人物和风格,避免视频中"脸变形"
  • 分镜更可控 —— 你可以提前设计每一帧,而不是让模型随机生成
  • 视频质量更高 —— Seedance 只负责"动",不负责"设计",分工明确效果更好
  • 创作效率更高 —— 你可以快速生成、测试、修改和对比不同创意方向

本质一句话:GPT Image 2 决定"长什么样",Seedance 2.0 决定"怎么动"

GPT Image 2 + Seedance 2.0 vs 其他 AI 视频方案

方案优点缺点
直接用 Seedance 2.0 生成快,一步到位人物易变形、画面不稳定
GPT Image 2 + Seedance 2.0画面稳定、运镜可控、质量高多一步分镜生成
传统视频制作最可控成本高、周期长

实战案例 1:产品广告视频

产品广告短视频是最直接的营销方式。比传统广告更吸睛、更适合社交媒体传播,从一张分镜图就能生成完整广告视频

场景:限量篮球鞋广告


Step 1:GPT Image 2 生成分镜图

提示词

请创作一张限量篮球鞋广告「起飞篇」分镜海报,横版 16:9,3列 × 3行,共9个镜头。 品牌名:凌空 英文名:LIFTOFF 产品:限定配色篮球鞋 人物:青少年亚洲运动员 标语:踩下去,整个球场都是你的 视觉风格:高对比运动感、明亮的荧光橙+电光绿+纯白配色、球场灯光、篮球场木地板纹理、飞溅的汗水、爆发力瞬间、动态模糊、烟雾氛围、聚光灯打光、Nike 级运动广告质感。 产品是一双高帮篮球鞋,鞋面为荧光橙渐变到电光绿,中底白色气垫大底,鞋舌标注"凌空 / LIFTOFF"。 9个镜头顺序: 静场(空旷球场,灯光未亮)→ 开灯(球场灯光瞬间亮起)→ 特写(球鞋正面特写,气垫中底细节)→ 系带(运动员系鞋带特写)→ 起跳(运动员高高跃起扣篮瞬间)→ 悬浮(人物滞空定格,背景动态模糊)→ 落地(球鞋重重落地,地板震起灰尘)→ 庆祝(运动员落地后怒吼庆祝)→ 主镜(品牌 Logo + 标语 + 球鞋侧面全景展示)。

GPT Image 2 的提示词理解能力很强,你只需要描述清楚品牌、产品、视觉风格和分镜顺序,它就能生成一张完整的分镜海报。

生成效果:

GPT Image 2 生成的篮球鞋广告分镜图(3×3 布局,9 个镜头)

Step 2:Seedance 2.0 生成广告视频

提示词

将这张分镜图转化为一条高燃篮球鞋广告。按顺序跟随每个分镜:空旷暗场灯光瞬间亮起,球鞋特写展示气垫细节,运动员系鞋带,爆发力起跳扣篮配合滞空定格,背景动态模糊,球鞋重重落地扬起灰尘,运动员怒吼庆祝,最后以品牌 Logo + 标语 + 球鞋侧面全景收尾。快切节奏,高对比度,顶级运动广告质感。

最终效果:从一张分镜图到完整广告视频,这种效果传统制作需要专业团队数天完成。

现在只需要用 gpt-image-2 (分镜图) + seedance2.0 (图生视频) 一个工作流 就能搞定。

分镜广告模板

打开 AI 分镜篮球运动品牌广告视频案例

查看 gpt-image-2 & seedance2 提示词,并体验工作流

打开模板
打开 AI 分镜篮球运动品牌广告视频案例

案例 2:电影级短片 — 分镜图深度分析

这次分析一个网上爆火的电影级短片:黄昏时分的中世纪市场,镜头穿过人群,最终滑入酒馆,落在角落里一位沉默的铠甲骑士身上。

第一次,创作者@aimikoda 使用常规做法——一张单图 + 提示词直接让 Seedance 2.0 生成视频。结果反复尝试了 5 次,每次都差点意思:人群动作混乱、镜头转移没有逻辑、马车的遮挡衔接丢失、酒馆门打开的时机不对。

第二次,作者换了个思路——先用 GPT Image 2 生成一张带时间轴的分镜图,把 12 个镜头的画面、时间点和运镜动机全部标注清楚,再喂给 Seedance 2.0。一次就成功了


Step 1:GPT Image 2 生成分镜图

提示词

创建一张电影级中世纪市场场景的分镜故事板,使用粗糙石墨铅笔手绘分镜风格。整体画面应像专业电影前期预演分镜图,共 12 个分镜格,每个分镜都包含镜头说明、焦段标注、运动箭头以及电影化调度信息。采用黑白单色铅笔阴影、粗粝纸张纹理、真实中世纪建筑、潮湿鹅卵石街道、人群、马匹、木车、旗帜、酒馆与充满氛围感的光影。 整体节奏应具有沉浸式电影感:从缓慢观察式镜头开始,逐渐升级为穿梭于拥挤市场中的动态跟拍。镜头需要不断通过前景遮挡、移动物体、飘动旗帜与人群流动来重新引导视觉焦点,形成自然的电影化转场。 分镜结构如下: 1. 街道近景,50mm —— 缓慢漂移镜头。年轻的中世纪女性正在与水果摊贩交换苹果,背景是忙碌的市场人群。 2. 中近景,50mm —— 轻微推近。手部交换硬币与水果,背景中不断有人经过。 3. 前景打断镜头,35mm —— 突然横向切入。一匹马快速穿过镜头前方,短暂遮挡整个画面。 4. 中景跟拍,35mm —— 镜头重新跟随一辆穿过泥泞街道的木制货车。 5. 低机位跟拍,28mm —— 带轻微手持晃动,镜头贴近车轮穿过积水。 6. 向前跟拍,28mm —— 镜头继续穿越悬挂旗帜与拥挤人群。 7. 局部遮挡揭示镜头,35mm —— 一块布旗扫过画面,露出四散奔跑的鸡群。 8. 中景镜头,35mm —— 焦点重新转移到一个在鸡群与人群之间奔跑的小孩。 9. 跟拍镜头,28mm —— 镜头穿梭式移动,跟随孩子深入市场。 10. 酒馆接近镜头,35mm —— 轻微推近昏暗的中世纪酒馆入口,孩子冲入其中。 11. 转场镜头,35mm —— 焦点交接。酒馆木门被推开,露出里面一位粗犷的铠甲战士。 12. 室内揭示镜头,35mm —— 平滑向内滑动。疲惫的中世纪骑士独自坐在木桌旁,巨剑靠在身边,温暖烛光与烟雾营造浓厚氛围。 整体电影语言应参考高规格奇幻电影制作使用的专业分镜图。每个分镜顶部都要有手写技术注释、镜头焦段说明、运动方向箭头,以及诸如"tracking(跟拍)"、"push-in(推近)"、"redirect(重新引导)"、"focus handoff(焦点交接)"、"foreground interruption(前景打断)"等电影摄影术语。画风必须保持松散、富有表现力的草图感,而不是精致插画风格。

注意看这个提示词的写法——它不只是描述画面,还为每个镜头之间的转场指定了"动机"

马车遮挡 → 镜头跟随马车 → 横幅摆动 → 露出鸡群 → 男孩追鸡 → 跑过酒馆门 → 镜头滑入酒馆

每个转场都有场景动作驱动,不是硬切。


Step 2:Seedance 2.0 生成电影感视频

提示词

格式 电影式连续镜头 / 动机式运镜 / 15秒 场景 黄昏时分,石城内拥挤的中世纪市场街道。狭窄的鹅卵石路,木制摊位,悬挂的横幅,牲畜在人群中穿行。温暖的火炬光芒映照在潮湿的石头上,轻雾在建筑间飘荡。 摄像机概念 连续的动机式运镜,每个新进入画面的移动主体都会重新引导摄像机的注意力。每一次运动都自然地将焦点传递给下一个主体。 镜头序列 0:00–0:03 市场摊位的街道近景。 摄像机焦点:一名妇女与商贩讨价还价,从木篮中挑选水果,将硬币递给商贩。 0:03–0:05 一匹马拉着沉重的木车突然从相反方向横穿前景,短暂遮挡画面。 摄像机转移:镜头捕捉木车,开始跟踪木车穿过市场。 0:05–0:07 木车挤过摊位之间,擦过一幅悬挂的横幅。横幅猛烈摆动穿过画面。 摄像机转移:横幅移开后露出鸡群在鹅卵石街道上四散奔逃。 0:07–0:09 一个街头男孩追赶逃跑的鸡群,穿过人群追逐它们。 摄像机转移:镜头开始跟随男孩在村民间奔跑。 0:09–0:12 男孩冲过酒馆入口消失在人群中。 摄像机转移:酒馆门突然打开,有人走出来。 0:12–0:15 镜头滑入敞开的门道,进入昏暗的酒馆内部。灯笼光芒在木桌和飘浮的烟雾上闪烁。 最终焦点:一名孤独的铠甲骑士静静坐在角落桌旁,一把巨大的剑倚靠在长凳边,骑士缓缓抬起目光。 风格 层层叠加的中世纪街头生活,自然的人群编舞,连续的动机式运镜。 灯光 外部温暖的火炬光芒,酒馆内部昏暗的灯笼辉光,烟雾和灰尘捕捉光芒。 品质 照片级真实,电影式灯光,稳健的摄像机运动,浓厚的中世纪氛围,高细节。

同一个创意,结果差异巨大:

对比项单张图生成分镜图生成
尝试次数5+ 次1 次成功
镜头衔接❌ 随机跳切✅ 每次转场有自然动机
叙事完整度❌ 场景元素丢失✅ 12 个镜头全部还原
运镜连贯性❌ 镜头随意摆动✅ 每个运镜有动机

为什么分镜图是 Seedance 2.0 成功的关键?

单张图和分镜图差距为什么这么大?因为单张图片的信息量不足以让视频模型理解你的完整意图——你脑子里有运镜顺序、镜头角度、叙事节奏,但这些信息单张图表达不出来。而分镜图把它们全部编码成了一张图,Seedance 2.0 一看就懂。


核心技巧:「动机式连续运镜」

这个技巧来自电影导演斯皮尔伯格的运镜理念——每一次镜头移动都必须有"动机"(Motivated Camera Move)。镜头不是随意摆动,而是跟随场景中的动作自然转移注意力:马车横穿时镜头跟拍马车、横幅摆动后露出逃跑的鸡群、男孩追鸡跑过酒馆门时镜头顺势滑入酒馆。

在分镜图中标注好每个运镜方向和动机,Seedance 2.0 就能精准执行你想要的镜头语言。

最终效果:一段有完整叙事节奏的 15 秒电影级短片——从热闹的市场到安静的酒馆,每个镜头转移都有自然的场景动机,观感远超随机运镜的生成结果。这就是分镜图的威力——它把视频生成从"碰运气"变成了"精准控制"。

GPT Image 2 + Seedance 2.0 标准工作流(4 步)

回顾上面的案例,你会发现两个案例遵循的其实是同一套工作流,只是分镜图的详细程度不同:

步骤案例 1:篮球鞋广告案例 2:中世纪短片
① 定义画面品牌、产品、视觉风格、9 个镜头顺序场景、摄像机概念、6 个镜头 + 时间轴
② 生成分镜图GPT Image 2 生成 3×3 分镜海报GPT Image 2 生成带时间轴的分镜图
③ 生成视频Seedance 2.0 快切节奏广告Seedance 2.0 动机式连续运镜
④ 迭代优化检查品牌文字、产品细节检查转场动机、镜头衔接

提示词写法要点

从案例中可以总结出提示词的关键写法差异:

  • 图像提示词(GPT Image 2) → 越细越好。案例 1 写了品牌名、配色、9 个镜头描述;案例 2 写了时间轴、摄像机概念、每个镜头的转场动机。GPT Image 2 的理解能力很强,不用担心过度描述
  • 视频提示词(Seedance 2.0) → 动作和运镜清晰即可。不需要重复描述画面细节(分镜图已经包含了),重点描述怎么动:镜头方向、运动节奏、转场逻辑

这个工作流还适合哪些场景?

案例 1 是产品广告,案例 2 是电影短片。我们从网上整理了大量案例,发现这个工作流还有非常多的应用场景:

  • 游戏 CG / 过场动画 —— 独立游戏和 indie 工作室的最强工具:用 GPT Image 2 生成游戏角色的多角度设定图、场景概念图、过场分镜,Seedance 2.0 直接生成 CG 过场动画。Boss 登场、技能释放、剧情反转——不用外包动画团队,一个人就能搞定
  • AI 短剧 / 漫剧 —— 用案例 2 的动机式运镜拍连续剧情:先让 GPT Image 2 生成每集的分镜(人物对峙、追逐、反转),角色外观在分镜阶段锁定,Seedance 2.0 负责把每个镜头拍出来。单集 30-60 秒,低成本批量生产
    动漫分镜视频模板

    打开 AI 动漫分镜视频生成器案例

    查看 gpt-image-2 & seedance2 提示词,并体验工作流

    打开模板
    AI 动漫分镜视频工作流模板预览
  • 体育运动教学 —— 网球发球分解动作、篮球三步上篮、瑜伽体式过渡……用 GPT Image 2 生成标准动作分镜(正面 + 侧面多角度),Seedance 2.0 生成慢动作演示视频。比分镜手绘快 100 倍,教练可以直接拿来做教学课件
    动漫运动视频模板

    打开 AI 动漫网球运动视频案例

    查看 gpt-image-2 & seedance2 提示词,并体验工作流

    打开模板
    AI 动漫网球运动视频工作流模板预览
  • UGC 种草视频 —— 用案例 1 的思路,换成手持感、自然光、口语化场景
  • 品牌 Logo 动画 —— 上传 Logo,让 GPT Image 2 生成动画分镜表(标注运动箭头、发光效果、过渡方向),再用 Seedance 2.0 生成动画
  • 美食 / 旅行 Vlog —— GPT Image 2 生成"摆盘特写→刀叉切开→蒸汽升腾→第一口"的美食分镜,Seedance 2.0 把静态食物拍出纪录片质感
    动漫料理视频模板

    打开 AI 动漫料理分镜视频案例

    查看 gpt-image-2 和 seedance 2.0 提示词,并体验工作流。

    打开模板
    AI 动漫料理分镜视频工作流模板预览
  • 房地产 / 室内设计漫游 —— GPT Image 2 生成不同角度的室内效果图,Seedance 2.0 生成从客厅推到阳台的连续漫游视频,比静态效果图有说服力得多
  • 创意 A/B 测试 —— 同一个产品,生成多个不同风格的分镜图,快速对比哪个方向效果更好

GPT Image 2 + Seedance 2.0 进阶技巧

  • 分镜图比关键帧更强大 —— 案例 2 证明,带时间轴和运镜动机的分镜图远比单张关键帧效果好。不要只用一张图,至少做一个 3 格分镜
  • 为转场指定"动机" —— 不要说"镜头平移",而是说"马车横穿画面,镜头跟随马车"(参见案例 2)。场景动作驱动的运镜比随机运镜自然得多
  • 先静后动 —— 先把分镜图做到极致,再加动画。画面质量决定视频质量上限(案例 1 的分镜海报就是先花时间打磨画面)
  • 多次迭代 —— 案例 1 和案例 2 都是迭代后的结果。先生成、看效果、改提示词、再生成——AI 的优势就是快速迭代,不要期望一次就完美
  • 提示词优化 —— 如果你想继续优化提示词,可以进一步阅读 Seedance 2.0 提示词指南ChatGPT Images 2 热门提示词合集。前者适合提升视频动作、镜头和节奏控制,后者适合提升 GPT Image 2 的画面设计、构图和风格表达

GPT Image 2 + Seedance 2.0 是目前最强 AI 视频工作流吗?

是的,GPT Image 2 + Seedance 2.0 是目前最强、也最实用的 AI 视频工作流。它强的地方不只是模型本身,而是把“画面设计”和“视频运动”拆成两个最擅长的步骤:先用 GPT Image 2 把角色、构图、风格和分镜定准,再用 Seedance 2.0 负责动作、镜头和连续性。

在这个组合中:

  • GPT Image 2 → 负责画面(关键帧 / 分镜 / 概念图)
  • Seedance 2.0 → 负责运动(视频 / 动作 / 镜头)

这套工作流比单独使用任一模型更稳定、更可控,也更接近真实创作流程:先有分镜和视觉资产,再进入视频生成。两者结合,你可以快速制作产品广告、电影级短片、游戏 CG 过场、AI 短剧、体育教学视频等多种内容。你不需要一开始就锁定一个创意方向——你可以快速生成、测试、修改和对比不同的创意方向,比传统制作流程快得多。

这正是 AI 对创作的真正价值:不只是帮你更快地制作内容,而是帮你在投入大量时间和预算之前,探索更多创意可能

GPT Image 2 + Seedance 2.0 常见问题

什么是 GPT Image 2 + Seedance 2.0 工作流?

这是一个两步 AI 创作工作流:先用 GPT Image 2 生成高质量关键帧或分镜图,再用 Seedance 2.0 将它们动画化为视频。GPT Image 2 决定画面长什么样,Seedance 2.0 决定画面怎么动。

为什么要组合使用 GPT Image 2 和 Seedance 2.0,而不是单独用 Seedance?

直接生成视频时,人物容易变形、画面容易不稳定。先用 GPT Image 2 生成分镜图或关键帧,可以锁定人物外观和画面风格,再交给 Seedance 2.0 生成运动,质量和可控性会更好。

Seedance 生成不稳定怎么办?

优先使用分镜图而不是单张图,标注运镜动机,明确运动方向和速度,并多次微调提示词。视觉信息越充分,Seedance 2.0 越容易理解生成目标。

先用英文还是中文提示词?

GPT Image 2 和 Seedance 2.0 对英文提示词的理解通常更精准。如果追求最佳效果,可以先用英文写提示词,再按需要翻译或调整成中文。

推荐阅读