案例10：脚本自动生成 —

📑 目录

确定主题与视频参数
生成分镜脚本
生成旁白文案
生成字幕内容
多风格适配
一键生成全套脚本
技能沉淀与批量生产

步骤1：确定主题与视频参数

定义视频参数

在 OpenClaw 对话中输入：

请基于以下参数生成视频脚本：

【主题】[填写视频主题]

【基本信息】
- 视频时长：[60秒 / 120秒 / 300秒]
- 视频类型：[口播 / 资讯播报 / 案例解读 / 教程 / 评测]
- 目标平台：[抖音 / 视频号 / B站 / 小红书 / YouTube]
- 画面比例：[9:16竖屏 / 16:9横屏 / 1:1正方]

【目标受众】
- 受众群体：[如：职场人士/学生/企业决策者]
- 受众痛点：[他们关心什么？]
- 受众知识水平：[小白/有一定基础/专业]

【风格要求】
- 整体风格：[轻松幽默 / 严肃专业 / 情感故事 / 快节奏资讯]
- 语速：[快 / 中 / 慢]
- 语言风格：[口语化 / 书面化 / 网感强]

【特殊要求】
- 必须包含的关键词/数据/案例
- 必须避免的内容

让 AI 检查参数完整性

请检查我提供的视频参数是否完整：

1. 哪些参数已经明确？
2. 哪些参数缺失或模糊？
3. 对于缺失的参数，你有什么建议？

列出需要你确认或补充的信息。

📌 说明：生成脚本前需要明确视频参数。参数越具体，生成的脚本越精准。

步骤2：生成分镜脚本

60秒短视频分镜脚本

请根据以下参数生成分镜脚本：

主题：[填写]
时长：60秒
平台：抖音（竖屏9:16）
风格：[填写]

分镜脚本格式（JSON数组）：
[
  {
    "scene_id": 1,
    "start_time": "00:00",
    "end_time": "00:05",
    "duration_seconds": 5,
    "scene_type": "hook",
    "visual_description": "画面描述（具体、可执行）",
    "visual_prompt_en": "AI视频生成英文提示词",
    "narration": "旁白文案",
    "subtitle": "字幕文字",
    "on_screen_text": "画面叠加文字",
    "bgm_mood": "背景音乐情绪建议",
    "transition": "转场效果",
    "notes": "制作备注"
  },
  ...
]

要求：
- 共8-12个分镜
- 开头5秒必须有强钩子（hook类型）
- 每15秒设置一个节奏点
- 结尾5秒为行动引导（cta类型）
- 总时长严格控制在60秒

保存到 ./scripts/[主题]/storyboard-60s.json

120秒中视频分镜脚本

请生成分镜脚本：

主题：[填写]
时长：120秒
平台：视频号（竖屏9:16）
风格：[填写]

要求：
- 共15-20个分镜
- 开头5-8秒为钩子
- 分为2-3个内容段落，每段有小标题
- 每30秒设置一个节奏点
- 结尾10秒为行动引导

保存到 ./scripts/[主题]/storyboard-120s.json

300秒长视频分镜脚本

请生成分镜脚本：

主题：[填写]
时长：300秒
平台：B站（横屏16:9）
风格：[填写]

要求：
- 共25-40个分镜
- 开头30秒为钩子+引言
- 分为3-5个章节，每章有小标题
- 设置2-3个互动引导点
- 结尾30秒为总结+下期预告

保存到 ./scripts/[主题]/storyboard-300s.json

分镜脚本验证

请检查刚生成的分镜脚本：

1. 各分镜时长之和是否等于总时长？
2. 是否包含所有必需类型（hook/body/cta）？
3. 每个分镜的画面描述是否具体可执行？
4. 旁白字数是否与时长匹配？（中文约4字/秒）
5. 节奏是否合理？
6. 是否有内容跳跃或逻辑断层？

列出所有问题。

步骤3：生成旁白文案

生成口播稿（含节奏标注）

请读取 ./scripts/[主题]/storyboard-60s.json，生成口播旁白文案：

格式要求：
- 按分镜分段，每段标注场景编号
- 标注情感基调（兴奋/严肃/轻松/悬念）
- 标注重读关键词（**加粗**）
- 标注停顿点（/ = 短停顿，// = 长停顿）
- 标注语速变化（快速/正常/慢速）

示例：
【场景1-钩子 | 0-5秒 | 情感：悬念】
你知道吗？// **就在今年**，/ AI已经能够...

【场景2-引入 | 5-15秒 | 情感：兴奋】
...

总字数：60秒约240字 / 120秒约480字 / 300秒约1200字

保存到 ./scripts/[主题]/narration.md

口播稿节奏检查

请检查口播文案：

1. 每段字数是否与分镜时长匹配？
   （正常语速约4字/秒，快节奏约5字/秒）
2. 是否有读起来不顺口的句子？
3. 是否有过于书面化的表达？
4. 重读标记是否合理？
5. 停顿标记是否自然？
6. 整体情感曲线是否合理？

列出需要调整的地方。

提取纯口播文本（提词器用）

请从口播文案中提取纯文本版本：

要求：
- 去除所有情感标注、停顿标记、重读标记
- 只保留要说的文字
- 按场景分段
- 适合直接复制到提词器

保存到 ./scripts/[主题]/narration-clean.txt

示例：
你知道吗？就在今年，AI已经能够独立诊断疾病了。
今天带你看看最新的AI医疗应用进展。
...

步骤4：生成字幕内容

生成标准 SRT 字幕

请根据口播文案生成 SRT 格式字幕：

SRT 格式要求：
- 每段字幕不超过2行
- 每行不超过20个中文字符
- 时间戳按口播节奏标注
- 序号从1开始连续编号

SRT 格式示例：
1
00:00:00,000 --> 00:00:04,000
你知道吗？就在今年，

2
00:00:04,000 --> 00:00:07,000
AI已经能够独立诊断疾病了

时间戳计算规则：
- 每句话约3-5秒
- 长句子拆分为2行
- 两句话之间留0.5秒间隔
- 总时长严格匹配视频总时长

保存到 ./scripts/[主题]/subtitle.srt

生成平台适配版字幕

请为以下平台生成适配版字幕：

版本A — 抖音版
- 每行不超过15个字符（手机屏幕小）
- 关键信息标注（用于后期加粗显示）
- 节奏快，每段时长偏短（2-3秒）

版本B — B站版
- 每行不超过22个字符（横屏较宽）
- 可包含较长的专业术语
- 节奏适中，每段3-4秒

版本C — 小红书版
- 每行不超过14个字符
- 口语化，可适当使用emoji
- 节奏快，段落短

每个版本独立保存到 ./scripts/[主题]/ 目录。

生成提词器文本

请生成不带时间戳的纯文本字幕：

要求：
- 不带时间戳
- 按口播节奏分行
- 每行10-15个字符
- 适合提词器逐行滚动显示

保存到 ./scripts/[主题]/teleprompter.txt

示例：
你知道吗？
就在今年，
AI已经能够
独立诊断疾病了。
今天带你看看
最新的AI医疗
应用进展。

字幕质量检查

请检查字幕文件：

1. 总段数是否合理？（60秒约15-25段）
2. 每段是否不超过2行？
3. 每行是否不超过字符限制？
4. 时间戳是否连续且无重叠？
5. 最后一段的结束时间是否等于视频总时长？
6. 是否有断句不当？（不应在词组中间断行）
7. 是否有标点符号缺失？

列出所有问题。

步骤5：多风格适配

定义5种风格模板

请基于同一主题，定义以下5种风格的具体参数：

风格1 — 轻松幽默型
- 适用平台：抖音/小红书
- 语速：快
- 语言：口语化、有梗、网络热词
- 情感：轻松、活泼
- 钩子类型：反差/悬念/搞笑

风格2 — 严肃专业型
- 适用平台：B站/知乎/视频号
- 语速：中
- 语言：严谨、数据驱动、专业术语
- 情感：客观、权威
- 钩子类型：数据/趋势/问题

风格3 — 情感故事型
- 适用平台：视频号/抖音
- 语速：中偏慢
- 语言：感性、有温度、故事化
- 情感：温暖、共鸣、励志
- 钩子类型：人物故事/情感冲突

风格4 — 快节奏资讯型
- 适用平台：抖音/视频号
- 语速：快
- 语言：简洁、直接、信息密度高
- 情感：紧迫、兴奋
- 钩子类型：突发/最新/重磅

风格5 — 教程科普型
- 适用平台：B站/YouTube
- 语速：中
- 语言：清晰、结构化、举例说明
- 情感：耐心、友好
- 钩子类型：痛点问题/承诺解决方案

保存到 ./scripts/style-templates.md

一键生成多风格版本

请基于主题 "[填写]"，生成5种风格的完整脚本包：

对每种风格，生成：
1. 分镜脚本（JSON格式）
2. 口播文案（标注风格参数）
3. SRT字幕文件
4. 提词器文本

文件命名规范：
- ./scripts/[主题]/storyboard-[风格].json
- ./scripts/[主题]/narration-[风格].md
- ./scripts/[主题]/subtitle-[风格].srt
- ./scripts/[主题]/teleprompter-[风格].txt

风格代号：humorous / professional / emotional / news / tutorial

生成完成后，列出所有文件清单。

多风格对比报告

请对比5种风格的脚本，生成对比报告：

1. 钩子差异：每种风格的开头5秒分别是什么？
2. 信息密度差异：各版本包含多少条核心信息？
3. 语言风格差异：举例说明同一信息的不同表述
4. 节奏差异：各版本分镜数量和时长分布
5. 情感曲线差异：各版本的情感变化趋势

输出对比表格，帮助选择最适合的版本。

保存到 ./scripts/[主题]/style-comparison.md

📌 说明：同一主题，用不同风格生成多版本，适配不同平台和受众。

步骤6：一键生成全套脚本

全能生成指令

请基于以下参数，生成完整的视频脚本包：

主题：[填写]
时长：[60秒/120秒/300秒]
平台：[填写]
风格：[填写]
比例：[9:16/16:9]

需要生成：
1. 分镜脚本（JSON，含AI视频提示词）
   → ./scripts/[主题]/storyboard.json
2. 口播文案（标注版 + 纯文本版）
   → ./scripts/[主题]/narration.md
   → ./scripts/[主题]/narration-clean.txt
3. SRT字幕文件
   → ./scripts/[主题]/subtitle.srt
4. 提词器文本
   → ./scripts/[主题]/teleprompter.txt
5. 视频标题候选（3个）
6. 视频简介/描述（200字以内）
7. 话题标签（10个）
8. 封面图设计建议

所有文件保存到 ./scripts/[主题]/ 目录。
生成完成后，列出所有文件并说明每个的用途。

生成发布元数据

请为以下视频生成标题和简介：

主题：[填写]
风格：[填写]
平台：[填写]

标题（3个候选）：
- A（悬念型）：制造悬念，引发好奇
- B（数据型）：用数字吸引注意
- C（直接型）：直接说明内容价值

简介（200字以内）：
- 概括视频核心内容
- 包含2-3个关键词
- 引导观众互动

话题标签（8-10个）：
- 按热度排序

保存到 ./scripts/[主题]/publish-meta.md

生成封面图设计建议

请为视频设计封面图方案：

主题：[填写]
平台：[填写]
比例：[填写]

需要生成：
1. 封面图文字方案（3个候选标题）
2. 封面图视觉描述（用于AI生成）
   - 英文提示词（用于 Midjourney/DALL-E）
   - 配色方案
   - 构图建议
3. 不同平台的封面图尺寸要求
   - 抖音：1080×1920
   - B站：1146×717
   - 视频号：1080×1260
   - 小红书：1080×1440

保存到 ./scripts/[主题]/cover-guide.md

步骤7：技能沉淀与批量生产

沉淀视频脚本生成技能

请帮我创建技能文件 workspace/skills/video-script-gen/SKILL.md：

## 触发条件
用户要求生成分镜脚本/旁白文案/字幕/视频脚本

## 输入参数
- 主题（必须）
- 时长（60秒/120秒/300秒，默认120秒）
- 平台（抖音/视频号/B站/小红书，默认抖音）
- 风格（humorous/professional/emotional/news/tutorial）
- 比例（9:16/16:9，默认9:16）

## 输出内容
1. 分镜脚本（JSON，含AI视频提示词）
2. 口播文案（标注版 + 纯文本版）
3. SRT字幕文件
4. 提词器文本
5. 发布元数据（标题/简介/标签）
6. 封面图设计建议

## 输出目录
./scripts/[主题]/
├── storyboard.json
├── narration.md
├── narration-clean.txt
├── subtitle.srt
├── teleprompter.txt
├── publish-meta.md
└── cover-guide.md

创建后，下次只需说：
"用视频脚本生成技能，主题：[主题]"
即可一键生成全套脚本。

批量脚本生成

请帮我批量生成以下主题的视频脚本：

主题列表：
1. "[主题1]"
2. "[主题2]"
3. "[主题3]"
4. "[主题4]"
5. "[主题5]"

统一参数：
- 时长：60秒
- 平台：抖音
- 风格：news
- 比例：9:16

对每个主题生成：
1. 分镜脚本
2. 口播文案
3. 字幕文件
4. 发布元数据

输出目录：
./scripts/batch-[日期]/
├── topic-01/
│   ├── storyboard.json
│   ├── narration.md
│   ├── subtitle.srt
│   └── publish-meta.md
├── topic-02/
└── ...

逐个主题执行，每完成一个报告进度。

TTS 语音合成对接

请读取 ./scripts/[主题]/narration-clean.txt，
生成语音合成配置：

方式1 — 阿里云 TTS
{
  "text": "[口播文案全文]",
  "voice": "xiaoyun",
  "format": "mp3",
  "sample_rate": 48000
}

方式2 — 本地 Edge TTS（免费，中文效果好）
edge-tts \
  --text "$(cat ./scripts/[主题]/narration-clean.txt)" \
  --voice zh-CN-XiaoxiaoNeural \
  --write-media ./scripts/[主题]/audio.mp3 \
  --write-subtitles ./scripts/[主题]/audio-subtitles.vtt

方式3 — ElevenLabs TTS（英文/多语言）
{
  "text": "[文案]",
  "voice": "Rachel",
  "model": "eleven_monolingual_v1"
}

保存到 ./scripts/[主题]/tts-config.json

完整项目目录参考

scripts/
├── [主题A]/                       ← 单个主题完整脚本包
│   ├── storyboard.json            ← 分镜脚本
│   ├── narration.md               ← 口播文案（标注版）
│   ├── narration-clean.txt        ← 口播文案（纯文本/TTS）
│   ├── subtitle.srt               ← SRT字幕
│   ├── teleprompter.txt           ← 提词器文本
│   ├── publish-meta.md            ← 标题/简介/标签
│   ├── cover-guide.md             ← 封面图建议
│   ├── tts-config.json            ← TTS配置
│   └── audio.mp3                  ← TTS音频
├── [主题B]/
├── batch-20260602/                ← 批量生成
│   ├── topic-01/
│   ├── topic-02/
│   └── ...
└── style-templates.md             ← 风格定义