← 返回博客

案例10:脚本自动生成

📑 目录

  1. 确定主题与视频参数
  2. 生成分镜脚本
  3. 生成旁白文案
  4. 生成字幕内容
  5. 多风格适配
  6. 一键生成全套脚本
  7. 技能沉淀与批量生产

步骤1:确定主题与视频参数

定义视频参数

在 OpenClaw 对话中输入:

请基于以下参数生成视频脚本:

【主题】[填写视频主题]

【基本信息】
- 视频时长:[60秒 / 120秒 / 300秒]
- 视频类型:[口播 / 资讯播报 / 案例解读 / 教程 / 评测]
- 目标平台:[抖音 / 视频号 / B站 / 小红书 / YouTube]
- 画面比例:[9:16竖屏 / 16:9横屏 / 1:1正方]

【目标受众】
- 受众群体:[如:职场人士/学生/企业决策者]
- 受众痛点:[他们关心什么?]
- 受众知识水平:[小白/有一定基础/专业]

【风格要求】
- 整体风格:[轻松幽默 / 严肃专业 / 情感故事 / 快节奏资讯]
- 语速:[快 / 中 / 慢]
- 语言风格:[口语化 / 书面化 / 网感强]

【特殊要求】
- 必须包含的关键词/数据/案例
- 必须避免的内容

让 AI 检查参数完整性

请检查我提供的视频参数是否完整:

1. 哪些参数已经明确?
2. 哪些参数缺失或模糊?
3. 对于缺失的参数,你有什么建议?

列出需要你确认或补充的信息。

📌 说明:生成脚本前需要明确视频参数。参数越具体,生成的脚本越精准。

步骤2:生成分镜脚本

60秒短视频分镜脚本

请根据以下参数生成分镜脚本:

主题:[填写]
时长:60秒
平台:抖音(竖屏9:16)
风格:[填写]

分镜脚本格式(JSON数组):
[
  {
    "scene_id": 1,
    "start_time": "00:00",
    "end_time": "00:05",
    "duration_seconds": 5,
    "scene_type": "hook",
    "visual_description": "画面描述(具体、可执行)",
    "visual_prompt_en": "AI视频生成英文提示词",
    "narration": "旁白文案",
    "subtitle": "字幕文字",
    "on_screen_text": "画面叠加文字",
    "bgm_mood": "背景音乐情绪建议",
    "transition": "转场效果",
    "notes": "制作备注"
  },
  ...
]

要求:
- 共8-12个分镜
- 开头5秒必须有强钩子(hook类型)
- 每15秒设置一个节奏点
- 结尾5秒为行动引导(cta类型)
- 总时长严格控制在60秒

保存到 ./scripts/[主题]/storyboard-60s.json

120秒中视频分镜脚本

请生成分镜脚本:

主题:[填写]
时长:120秒
平台:视频号(竖屏9:16)
风格:[填写]

要求:
- 共15-20个分镜
- 开头5-8秒为钩子
- 分为2-3个内容段落,每段有小标题
- 每30秒设置一个节奏点
- 结尾10秒为行动引导

保存到 ./scripts/[主题]/storyboard-120s.json

300秒长视频分镜脚本

请生成分镜脚本:

主题:[填写]
时长:300秒
平台:B站(横屏16:9)
风格:[填写]

要求:
- 共25-40个分镜
- 开头30秒为钩子+引言
- 分为3-5个章节,每章有小标题
- 设置2-3个互动引导点
- 结尾30秒为总结+下期预告

保存到 ./scripts/[主题]/storyboard-300s.json

分镜脚本验证

请检查刚生成的分镜脚本:

1. 各分镜时长之和是否等于总时长?
2. 是否包含所有必需类型(hook/body/cta)?
3. 每个分镜的画面描述是否具体可执行?
4. 旁白字数是否与时长匹配?(中文约4字/秒)
5. 节奏是否合理?
6. 是否有内容跳跃或逻辑断层?

列出所有问题。

步骤3:生成旁白文案

生成口播稿(含节奏标注)

请读取 ./scripts/[主题]/storyboard-60s.json,生成口播旁白文案:

格式要求:
- 按分镜分段,每段标注场景编号
- 标注情感基调(兴奋/严肃/轻松/悬念)
- 标注重读关键词(**加粗**)
- 标注停顿点(/ = 短停顿,// = 长停顿)
- 标注语速变化(快速/正常/慢速)

示例:
【场景1-钩子 | 0-5秒 | 情感:悬念】
你知道吗?// **就在今年**,/ AI已经能够...

【场景2-引入 | 5-15秒 | 情感:兴奋】
...

总字数:60秒约240字 / 120秒约480字 / 300秒约1200字

保存到 ./scripts/[主题]/narration.md

口播稿节奏检查

请检查口播文案:

1. 每段字数是否与分镜时长匹配?
   (正常语速约4字/秒,快节奏约5字/秒)
2. 是否有读起来不顺口的句子?
3. 是否有过于书面化的表达?
4. 重读标记是否合理?
5. 停顿标记是否自然?
6. 整体情感曲线是否合理?

列出需要调整的地方。

提取纯口播文本(提词器用)

请从口播文案中提取纯文本版本:

要求:
- 去除所有情感标注、停顿标记、重读标记
- 只保留要说的文字
- 按场景分段
- 适合直接复制到提词器

保存到 ./scripts/[主题]/narration-clean.txt

示例:
你知道吗?就在今年,AI已经能够独立诊断疾病了。
今天带你看看最新的AI医疗应用进展。
...

步骤4:生成字幕内容

生成标准 SRT 字幕

请根据口播文案生成 SRT 格式字幕:

SRT 格式要求:
- 每段字幕不超过2行
- 每行不超过20个中文字符
- 时间戳按口播节奏标注
- 序号从1开始连续编号

SRT 格式示例:
1
00:00:00,000 --> 00:00:04,000
你知道吗?就在今年,

2
00:00:04,000 --> 00:00:07,000
AI已经能够独立诊断疾病了

时间戳计算规则:
- 每句话约3-5秒
- 长句子拆分为2行
- 两句话之间留0.5秒间隔
- 总时长严格匹配视频总时长

保存到 ./scripts/[主题]/subtitle.srt

生成平台适配版字幕

请为以下平台生成适配版字幕:

版本A — 抖音版
- 每行不超过15个字符(手机屏幕小)
- 关键信息标注(用于后期加粗显示)
- 节奏快,每段时长偏短(2-3秒)

版本B — B站版
- 每行不超过22个字符(横屏较宽)
- 可包含较长的专业术语
- 节奏适中,每段3-4秒

版本C — 小红书版
- 每行不超过14个字符
- 口语化,可适当使用emoji
- 节奏快,段落短

每个版本独立保存到 ./scripts/[主题]/ 目录。

生成提词器文本

请生成不带时间戳的纯文本字幕:

要求:
- 不带时间戳
- 按口播节奏分行
- 每行10-15个字符
- 适合提词器逐行滚动显示

保存到 ./scripts/[主题]/teleprompter.txt

示例:
你知道吗?
就在今年,
AI已经能够
独立诊断疾病了。
今天带你看看
最新的AI医疗
应用进展。

字幕质量检查

请检查字幕文件:

1. 总段数是否合理?(60秒约15-25段)
2. 每段是否不超过2行?
3. 每行是否不超过字符限制?
4. 时间戳是否连续且无重叠?
5. 最后一段的结束时间是否等于视频总时长?
6. 是否有断句不当?(不应在词组中间断行)
7. 是否有标点符号缺失?

列出所有问题。

步骤5:多风格适配

定义5种风格模板

请基于同一主题,定义以下5种风格的具体参数:

风格1 — 轻松幽默型
- 适用平台:抖音/小红书
- 语速:快
- 语言:口语化、有梗、网络热词
- 情感:轻松、活泼
- 钩子类型:反差/悬念/搞笑

风格2 — 严肃专业型
- 适用平台:B站/知乎/视频号
- 语速:中
- 语言:严谨、数据驱动、专业术语
- 情感:客观、权威
- 钩子类型:数据/趋势/问题

风格3 — 情感故事型
- 适用平台:视频号/抖音
- 语速:中偏慢
- 语言:感性、有温度、故事化
- 情感:温暖、共鸣、励志
- 钩子类型:人物故事/情感冲突

风格4 — 快节奏资讯型
- 适用平台:抖音/视频号
- 语速:快
- 语言:简洁、直接、信息密度高
- 情感:紧迫、兴奋
- 钩子类型:突发/最新/重磅

风格5 — 教程科普型
- 适用平台:B站/YouTube
- 语速:中
- 语言:清晰、结构化、举例说明
- 情感:耐心、友好
- 钩子类型:痛点问题/承诺解决方案

保存到 ./scripts/style-templates.md

一键生成多风格版本

请基于主题 "[填写]",生成5种风格的完整脚本包:

对每种风格,生成:
1. 分镜脚本(JSON格式)
2. 口播文案(标注风格参数)
3. SRT字幕文件
4. 提词器文本

文件命名规范:
- ./scripts/[主题]/storyboard-[风格].json
- ./scripts/[主题]/narration-[风格].md
- ./scripts/[主题]/subtitle-[风格].srt
- ./scripts/[主题]/teleprompter-[风格].txt

风格代号:humorous / professional / emotional / news / tutorial

生成完成后,列出所有文件清单。

多风格对比报告

请对比5种风格的脚本,生成对比报告:

1. 钩子差异:每种风格的开头5秒分别是什么?
2. 信息密度差异:各版本包含多少条核心信息?
3. 语言风格差异:举例说明同一信息的不同表述
4. 节奏差异:各版本分镜数量和时长分布
5. 情感曲线差异:各版本的情感变化趋势

输出对比表格,帮助选择最适合的版本。

保存到 ./scripts/[主题]/style-comparison.md

📌 说明:同一主题,用不同风格生成多版本,适配不同平台和受众。

步骤6:一键生成全套脚本

全能生成指令

请基于以下参数,生成完整的视频脚本包:

主题:[填写]
时长:[60秒/120秒/300秒]
平台:[填写]
风格:[填写]
比例:[9:16/16:9]

需要生成:
1. 分镜脚本(JSON,含AI视频提示词)
   → ./scripts/[主题]/storyboard.json
2. 口播文案(标注版 + 纯文本版)
   → ./scripts/[主题]/narration.md
   → ./scripts/[主题]/narration-clean.txt
3. SRT字幕文件
   → ./scripts/[主题]/subtitle.srt
4. 提词器文本
   → ./scripts/[主题]/teleprompter.txt
5. 视频标题候选(3个)
6. 视频简介/描述(200字以内)
7. 话题标签(10个)
8. 封面图设计建议

所有文件保存到 ./scripts/[主题]/ 目录。
生成完成后,列出所有文件并说明每个的用途。

生成发布元数据

请为以下视频生成标题和简介:

主题:[填写]
风格:[填写]
平台:[填写]

标题(3个候选):
- A(悬念型):制造悬念,引发好奇
- B(数据型):用数字吸引注意
- C(直接型):直接说明内容价值

简介(200字以内):
- 概括视频核心内容
- 包含2-3个关键词
- 引导观众互动

话题标签(8-10个):
- 按热度排序

保存到 ./scripts/[主题]/publish-meta.md

生成封面图设计建议

请为视频设计封面图方案:

主题:[填写]
平台:[填写]
比例:[填写]

需要生成:
1. 封面图文字方案(3个候选标题)
2. 封面图视觉描述(用于AI生成)
   - 英文提示词(用于 Midjourney/DALL-E)
   - 配色方案
   - 构图建议
3. 不同平台的封面图尺寸要求
   - 抖音:1080×1920
   - B站:1146×717
   - 视频号:1080×1260
   - 小红书:1080×1440

保存到 ./scripts/[主题]/cover-guide.md

步骤7:技能沉淀与批量生产

沉淀视频脚本生成技能

请帮我创建技能文件 workspace/skills/video-script-gen/SKILL.md:

## 触发条件
用户要求生成分镜脚本/旁白文案/字幕/视频脚本

## 输入参数
- 主题(必须)
- 时长(60秒/120秒/300秒,默认120秒)
- 平台(抖音/视频号/B站/小红书,默认抖音)
- 风格(humorous/professional/emotional/news/tutorial)
- 比例(9:16/16:9,默认9:16)

## 输出内容
1. 分镜脚本(JSON,含AI视频提示词)
2. 口播文案(标注版 + 纯文本版)
3. SRT字幕文件
4. 提词器文本
5. 发布元数据(标题/简介/标签)
6. 封面图设计建议

## 输出目录
./scripts/[主题]/
├── storyboard.json
├── narration.md
├── narration-clean.txt
├── subtitle.srt
├── teleprompter.txt
├── publish-meta.md
└── cover-guide.md

创建后,下次只需说:
"用视频脚本生成技能,主题:[主题]"
即可一键生成全套脚本。

批量脚本生成

请帮我批量生成以下主题的视频脚本:

主题列表:
1. "[主题1]"
2. "[主题2]"
3. "[主题3]"
4. "[主题4]"
5. "[主题5]"

统一参数:
- 时长:60秒
- 平台:抖音
- 风格:news
- 比例:9:16

对每个主题生成:
1. 分镜脚本
2. 口播文案
3. 字幕文件
4. 发布元数据

输出目录:
./scripts/batch-[日期]/
├── topic-01/
│   ├── storyboard.json
│   ├── narration.md
│   ├── subtitle.srt
│   └── publish-meta.md
├── topic-02/
└── ...

逐个主题执行,每完成一个报告进度。

TTS 语音合成对接

请读取 ./scripts/[主题]/narration-clean.txt,
生成语音合成配置:

方式1 — 阿里云 TTS
{
  "text": "[口播文案全文]",
  "voice": "xiaoyun",
  "format": "mp3",
  "sample_rate": 48000
}

方式2 — 本地 Edge TTS(免费,中文效果好)
edge-tts \
  --text "$(cat ./scripts/[主题]/narration-clean.txt)" \
  --voice zh-CN-XiaoxiaoNeural \
  --write-media ./scripts/[主题]/audio.mp3 \
  --write-subtitles ./scripts/[主题]/audio-subtitles.vtt

方式3 — ElevenLabs TTS(英文/多语言)
{
  "text": "[文案]",
  "voice": "Rachel",
  "model": "eleven_monolingual_v1"
}

保存到 ./scripts/[主题]/tts-config.json

完整项目目录参考

scripts/
├── [主题A]/                       ← 单个主题完整脚本包
│   ├── storyboard.json            ← 分镜脚本
│   ├── narration.md               ← 口播文案(标注版)
│   ├── narration-clean.txt        ← 口播文案(纯文本/TTS)
│   ├── subtitle.srt               ← SRT字幕
│   ├── teleprompter.txt           ← 提词器文本
│   ├── publish-meta.md            ← 标题/简介/标签
│   ├── cover-guide.md             ← 封面图建议
│   ├── tts-config.json            ← TTS配置
│   └── audio.mp3                  ← TTS音频
├── [主题B]/
├── batch-20260602/                ← 批量生成
│   ├── topic-01/
│   ├── topic-02/
│   └── ...
└── style-templates.md             ← 风格定义