教程 03

视频信息


引言

如何生成一段 44 秒的逼真打斗场景,或者一部 71 秒的完整短片?答案是:把长视频拆解成故事板,再用 AI 逐段拼接。这是目前生成长篇 AI 视频最简单、最容易的方法,核心工具只有两个:GPT Image 2(负责故事板生成)和 Seedance 2.0(负责视频动画化)。

“这是目前为止生成长篇 AI 视频最简单、最容易的方法。”


第一阶段:用 GPT Image 2 生成故事板

1.1 为什么需要故事板

Seedance 2.0 每次视频生成的最长时长为 15 秒。要制作更长的视频,必须将整个故事拆分成多个独立片段,再拼接起来。故事板就是这个拆分的蓝图。

1.2 生成故事板的步骤

  1. 前往 Higgsfield AI 网站,选择 GPT Image 2 模型
  2. 上传角色的两张参考图像
  3. 写一句话描述故事内容(简单提示即可)
  4. 设置宽高比为 16:9
  5. 生成包含 12 个完整镜头的故事板

示例:科学家穿着防护服与机器人伙伴探索有毒森林——一句话描述,GPT Image 2 自动生成 12 格完整故事板,每格下方附有文字说明。

1.3 处理重复镜头

生成大量独立面板时,可能出现重复。处理方法:

  1. 在 Higgsfield 中点击”引用”,将故事板添加为图像参考
  2. 修改提示,告诉 AI 调整重复的那一格
  3. 例如:“调整第 11 张照片,使其与第 3 张照片不同”

第二阶段:创建角色参考表

2.1 为什么需要角色参考表

直接用故事板生成视频时,角色外观会出现漂移——机器人的腿可能变得异常长,不同视频版本中角色外观差异明显。角色参考表是保持一致性的关键。

2.2 生成角色参考表

  1. 仍使用 GPT Image 2 模型
  2. 上传角色的原始照片(如机器人在森林中的照片)
  3. 提示:要求创建一个角色参考表(提示模板可在视频描述中找到)
  4. 生成包含多角度、多姿态的角色参考图

“我们需要一份额外的角色参考表,以便在生成他们的长 AI 视频序列时,他们能够在整个场景中保持一致。”


第三阶段:将故事板动画化(核心工作流)

3.1 拆分故事板

由于 Seedance 2.0 单次最长 15 秒,需要将 12 格故事板拆分为三行,每行 4 个镜头:

技术要点:裁剪后的行需要叠加在 16:9 的图像之上,确保 Higgsfield 能正确识别图片参考。

3.2 提示语结构

使用上传的电影故事板中的镜头生成一个场景。

镜头1(0-4秒):[直接复制故事板中的文字描述]
镜头2(4-8秒):[直接复制故事板中的文字描述]
镜头3(8-12秒):[直接复制故事板中的文字描述]
镜头4(12-15秒):[直接复制故事板中的文字描述]

无音乐,无字幕。

关键细节: - 在提示中用 @ 标记引用不同的图像参考 - 在角色名称旁添加额外标签,引用角色参考表 - 在底部添加”无音乐,无字幕”——方便后期整合

3.3 上传顺序

每次生成时需上传: 1. 裁剪后的故事板行(当前 4 个镜头) 2. 角色参考表


第四阶段:无限延伸故事板

4.1 生成续集故事板

用 GPT Image 2 可以无限续写故事板:

  1. 上传原始故事板(已完成的 12 个镜头)
  2. 上传科学家和机器人的角色参考表
  3. 提示示例:

“根据第一张图片生成故事板的下一页,该页将使用上传的图片继续讲述故事,共 12 个分镜。机器人揭示了森林中隐藏的知识,引导科学家前往更深、更危险的核心区域,那里是毒性爆发的源头。”

4.2 理论上的视频长度

故事板页数 视频片段数 总时长
1 页(12 镜头) 3 个 15 秒片段 45 秒
2 页(24 镜头) 6 个 15 秒片段 90 秒
N 页 N×3 个片段 N×45 秒

实际案例:2 页故事板生成 6 个片段,剪辑后得到 71 秒成片(去掉部分重复内容)。


第五阶段:解决无缝过渡难题

5.1 问题所在

对于动作场景(如打斗),将故事板每行单独动画化后,片段之间的过渡会出现跳跃感:

两段单独看都很好,但拼接时过渡不自然。

5.2 解决方案:末帧作为首帧

  1. 使用视频帧提取器工具,保存上一个视频序列的最后一帧图像
  2. 生成下一段视频时,将这张截图作为第一帧上传
  3. 在提示中明确说明:从这帧图像开始,生成接下来的四个镜头

提示示例

使用上传的电影故事板打斗序列生成一个场景,
从女性角色被攻击的这帧图像开始。
[后续镜头描述...]

“利用这种方法,你可以为你的 AI 影片生成无穷无尽的连续镜头。”


第六阶段:Higgsfield 平台使用注意事项

6.1 图像合规性检查

Higgsfield 会检查每张上传图片的合格性,以避免版权问题:

6.2 被拒绝时的处理方法

如果上传自己的角色图片被拒绝,多次重新上传即可——通常第二次或第三次就会通过。这是平台的随机性问题,不是内容问题。


核心概念速查表

概念 解释
GPT Image 2 OpenAI 的图像生成模型,擅长推理和文本生成,适合生成带文字说明的故事板
Seedance 2.0 顶级 AI 视频生成模型,单次最长 15 秒
Higgsfield AI 集成 GPT Image 2 和 Seedance 2.0 的平台,支持多图像参考
故事板 将长视频拆分为多个分镜的规划图,每格附有文字说明
角色参考表 包含角色多角度、多姿态的参考图,用于保持跨片段的角色一致性
末帧作为首帧 将上一片段的最后一帧作为下一片段的第一帧,实现无缝过渡
视频帧提取器 从视频中提取特定帧的工具,用于获取末帧图像
@标记引用 Higgsfield 中引用特定图像参考的方式,在提示中用 @ 标记

8个 AI 长视频创作启示

  1. 拆分是关键:任何长视频都可以拆分为 15 秒片段,关键是规划好故事板
  2. 故事板文字说明是免费提示:GPT Image 2 自动生成的文字说明可以直接复制到视频提示中
  3. 角色参考表不可省略:没有角色参考表,角色外观会在不同片段间漂移
  4. 末帧首帧技巧解决过渡问题:这是实现无缝长视频的核心技巧
  5. 无音乐无字幕声明很重要:在提示末尾加上这句话,后期整合会容易得多
  6. 重复内容要剪掉:AI 生成的序列可能有重复,最终剪辑时去掉重复内容
  7. 图像合规性是随机的:被拒绝不代表内容有问题,多试几次即可
  8. 故事板可以无限续写:用已完成的故事板作为参考,GPT Image 2 可以无限续写下一页

10个常见误区

  1. 误区:AI 视频只能生成短片段 → 用故事板拆分 + 拼接,可以生成任意长度的视频
  2. 误区:直接用提示就能生成长视频 → 没有故事板规划,长视频会缺乏叙事连贯性
  3. 误区:不需要角色参考表 → 没有参考表,角色外观会在不同片段间出现明显漂移
  4. 误区:故事板需要手动绘制 → GPT Image 2 可以根据一句话描述自动生成 12 格故事板
  5. 误区:片段之间的过渡无法控制 → 末帧作为首帧的技巧可以实现完全无缝的过渡
  6. 误区:被平台拒绝就无法继续 → Higgsfield 的合规检查有随机性,多次上传通常可以解决
  7. 误区:故事板只能用一次 → 可以用已完成的故事板作为参考,无限续写下一页
  8. 误区:每个片段都需要重新写提示 → 直接复制故事板中的文字说明即可,无需重新创作
  9. 误区:16:9 裁剪只是格式问题 → 这是 Higgsfield 正确识别图片参考的技术要求
  10. 误区:长视频制作需要专业技能 → 整个流程只需要一句话描述 + 复制粘贴,门槛极低

12个关键要点

  1. 核心工具组合:GPT Image 2(故事板)+ Seedance 2.0(视频)+ Higgsfield(平台)
  2. Seedance 2.0 单次上限:每次视频生成最长 15 秒
  3. 故事板标准格式:12 格,每格附文字说明,16:9 宽高比
  4. 拆分方式:12 格故事板拆为 3 行,每行 4 个镜头,生成 3 个 15 秒片段
  5. 角色参考表必须上传:每次生成视频时都需要同时上传角色参考表
  6. 提示结构:镜头描述 + 时间范围 + 角色引用 + 无音乐无字幕
  7. 无缝过渡技巧:提取上一片段末帧,作为下一片段的首帧
  8. 故事板续写:上传原始故事板 + 角色参考表,GPT Image 2 自动生成续集
  9. 实际案例:2 页故事板 → 6 个片段 → 剪辑后 71 秒成片
  10. 合规问题处理:被拒绝时多次重新上传,通常可以解决
  11. 重复内容处理:最终剪辑时去掉重复镜头,保留精华
  12. 理论上无限延伸:通过不断续写故事板,视频长度没有上限

额外资源

推荐深入学习

相关关键词


结论

制作长篇 AI 视频的核心不是找到一个能生成长视频的工具,而是建立一套拆分-生成-拼接的工作流。GPT Image 2 负责将故事拆解为有序的故事板,Seedance 2.0 负责将每个片段动画化,末帧首帧技巧负责将片段无缝连接。这套流程理论上可以生成任意长度的 AI 影片。

“利用这种方法,你可以为你的 AI 影片生成无穷无尽的连续镜头。”

掌握这套工作流,长度不再是 AI 视频创作的限制。


本教程基于 YouTube 视频内容整理,仅供学习参考。