教程 02

视频信息


引言

如果你只是通过编写提示语来创建 AI 视频,那么你只使用了 AI 视频实际功能的 16% 左右。这句话来自一位从事 AI 视频研究和创作超过 5 年的创作者,他在本视频中揭示了普通 AI 垃圾和电影级 AI 影片之间的真正差距——六个核心功能。

掌握这六种技巧,你制作 AI 视频的方式将彻底改变。

“普通人工智能垃圾和电影级人工智能影片之间的区别在于以下六个核心人工智能视频功能。一旦你掌握了这六种技巧,你制作人工智能视频的方式将彻底改变。”


第一阶段:功能一 - 图像转视频(Image-to-Video)

1.1 基础原理

图像转视频是最基本的功能,也是所有其他功能的基础:将参考图像上传到 AI 视频生成器,用作第一帧,再配合提示信息引导场景内容。

为什么不能只用文字提示: - 不使用图像参考 = 放弃大量控制权 - 基本上是在求随机结果 - 无法控制场景构图和视觉风格

1.2 图像参考能控制什么

1.3 实战工作流

  1. 准备角色设计图(角色卡)
  2. 准备环境参考图
  3. 上传到 AI 图像生成器,写提示将两者结合
  4. 生成多张固定角色的不同图像
  5. 用这些图像通过图像转视频功能制作动画

“不同镜头之间的一致性,才能让你的 AI 场景真正感觉像一部电影,而不是随机片段的蒙太奇。”


第二阶段:功能二 - 多镜头生成(Multi-Shot Generation)

2.1 什么是多镜头生成

多镜头生成允许在同一个视频片段中同时生成多个镜头,而不是一次只生成一个场景。这让你可以:

2.2 提示语写法

多镜头视频的关键在于提示语结构:

  1. 定义具体镜头:明确说明出现哪些不同镜头
  2. 描述每个镜头内容:每个镜头中发生什么
  3. 添加时间戳:指定每次拍摄的时间(有助于控制节奏)

2.3 故事板进阶技巧

用故事板作为图像参考,可以进一步提升多镜头控制精度:

“分镜头脚本可以让你更好地控制场景中出现的具体镜头。”


第三阶段:功能三 - 首尾帧动画(First & Last Frame Animation)

3.1 核心原理

使用两个图像参考: - 第一张:AI 视频的第一帧 - 第二张:AI 视频的最后一帧

这样就能掌控方向,而不是寄希望于 AI 随机生成有用内容。

3.2 能实现的效果

3.3 操作步骤

  1. 上传视频第一帧画面
  2. 上传视频结尾的画面
  3. 添加提示将两张图片连接起来
  4. 在两个不同镜头之间添加关键帧

第四阶段:功能四 - 运动迁移(Motion Transfer)

4.1 什么是运动迁移

借鉴真实视频中的动作,将其转移到 AI 视频中:

4.2 近期改进

这项功能已经存在一段时间,但最近得到了极大改进,现在甚至可以用于更具动态性的动作场景(如打斗、追逐等)。

4.3 创意应用


第五阶段:功能五 - 对话创建(Dialogue Creation)

5.1 两种实现方式

方式一:直接提示法 - 在提示中直接要求 AI 角色说话 - 自定义每个角色需要说的具体词语 - 与多镜头生成结合,可生成多角色对话场景

方式二:AI 唇形同步法 - 使用 Eleven Labs 等工具生成 AI 对话音频 - 将生成的音频与图像参考结合 - 使用唇形同步工具制作角色说话动画

5.2 工具推荐

“你还可以使用 AI 唇形同步功能,即使用与 AI 视频生成器不同的工具直接生成 AI 对话的声音。”


第六阶段:功能六 - AI 视频编辑(AI Video Editing)

6.1 核心能力

获取现有视频片段,使用 AI 对其进行修改:

6.2 操作方法

  1. 将现有视频片段直接上传到 AI 视频模型
  2. 在提示中直接告诉 AI 希望如何修改视频

6.3 视频延伸技巧


推荐工具汇总

用途 推荐工具
AI 图像生成 GPT Image 2、Nano Banana Pro
AI 视频生成 Seedance 2.0、Kling 3.0
多模型访问平台 OpenArt
AI 对话音频生成 Eleven Labs

核心概念速查表

概念 解释
图像转视频 用参考图像作为第一帧,控制视觉风格和角色外观
多镜头生成 在同一视频片段中同时生成多个镜头,控制节奏和角度
首尾帧动画 用两张图像定义视频的开头和结尾,控制过渡效果
运动迁移 将真实视频中的动作映射到 AI 生成的角色上
对话创建 生成会说话的 AI 角色,支持直接提示或唇形同步两种方式
AI 视频编辑 修改现有视频的背景、光线等元素,或延伸视频片段
角色卡 角色设计参考图,用于保持不同镜头间的角色一致性
故事板 多格分镜图,用于精确控制多镜头视频的镜头顺序
唇形同步 将音频与角色嘴型动画匹配的技术

8个 AI 视频创作启示

  1. 提示语只是起点:仅靠文字提示只能发挥 AI 视频 16% 的潜力,图像参考才是关键
  2. 一致性决定电影感:不同镜头间的角色和风格一致性,是区分电影级作品和随机片段的核心
  3. 故事板是专业工具:用故事板作为参考,可以将多镜头控制精度提升到专业水准
  4. 首尾帧是创意利器:定义开头和结尾,让 AI 填充中间,可以创造出极具创意的过渡效果
  5. 运动迁移解放创作:不需要专业演员,自己演绎后转移到 AI 角色,大幅降低制作门槛
  6. 对话创建有两条路:直接提示适合简单场景,Eleven Labs + 唇形同步适合高质量对话
  7. AI 视频编辑是特效工具:不要只把 AI 视频当生成工具,它同样是强大的后期特效工具
  8. 工具组合胜过单一工具:OpenArt 这样的平台让你在一处访问多个顶级模型,效率更高

10个常见误区

  1. 误区:写好提示就够了 → 提示只是 16%,图像参考、运动迁移等功能才是真正的差距所在
  2. 误区:AI 视频只能生成单个片段 → 多镜头生成可以在一个片段中包含完整的镜头序列
  3. 误区:角色一致性很难保持 → 使用角色卡 + 图像转视频,可以在不同镜头间保持一致
  4. 误区:AI 视频无法控制摄像机运动 → 首尾帧动画可以精确控制摄像机的运动轨迹
  5. 误区:运动迁移只适合简单动作 → 最新版本已经支持打斗等高动态场景
  6. 误区:AI 角色对话效果很差 → 结合 Eleven Labs 和唇形同步,可以实现相当自然的对话
  7. 误区:AI 视频编辑只能改背景 → 还可以改变光线、延伸视频、添加视觉特效
  8. 误区:需要专业设备才能做运动迁移 → 用手机拍摄自己的动作就可以转移到 AI 角色上
  9. 误区:故事板只是规划工具 → 故事板可以直接作为图像参考上传,精确控制镜头顺序
  10. 误区:一个工具就能搞定所有需求 → 不同功能需要不同工具组合,OpenArt 这类平台可以简化流程

12个关键要点

  1. 16% 原则:只用提示语只发挥了 AI 视频 16% 的潜力
  2. 六大核心功能:图像转视频、多镜头生成、首尾帧动画、运动迁移、对话创建、AI 视频编辑
  3. 图像参考是基础:所有高级功能都建立在图像参考的基础上
  4. 角色卡保证一致性:角色设计图是保持跨镜头角色一致性的关键工具
  5. 时间戳控制节奏:在多镜头提示中添加时间戳,可以精确控制每个镜头的时长
  6. 故事板提升精度:12 格故事板可以精确定义镜头顺序和场景内容
  7. 首尾帧创造过渡:两张图像定义开头和结尾,AI 自动填充中间的过渡动画
  8. 运动迁移近期大幅改进:现在支持更复杂的动态场景
  9. Eleven Labs 是对话音频首选:生成高质量 AI 对话音频的主流工具
  10. AI 视频编辑 = 视觉特效工具:不只是生成,也是强大的后期处理工具
  11. 推荐图像模型:GPT Image 2 和 Nano Banana Pro
  12. 推荐视频模型:Seedance 2.0 和 Kling 3.0,通过 OpenArt 平台访问

额外资源

推荐深入学习

相关关键词


结论

从”只会写提示”到”电影级 AI 影片创作者”,差距不在于工具,而在于是否掌握了这六个核心功能。图像参考建立基础,多镜头生成构建叙事,首尾帧动画创造过渡,运动迁移带来真实感,对话创建赋予角色生命,AI 视频编辑完成最后的打磨。

“一旦你不再抗拒,那些看似不可能的事情会多么迅速地变得习以为常。”

这六个功能不是孤立的技巧,而是一套完整的创作体系。 将它们组合使用,你制作的 AI 视频将真正超越 99% 的人。


本教程基于 YouTube 视频内容整理,仅供学习参考。