案例10:脚本自动生成
📑 目录
步骤1:确定主题与视频参数
定义视频参数
在 OpenClaw 对话中输入:
请基于以下参数生成视频脚本:
【主题】[填写视频主题]
【基本信息】
- 视频时长:[60秒 / 120秒 / 300秒]
- 视频类型:[口播 / 资讯播报 / 案例解读 / 教程 / 评测]
- 目标平台:[抖音 / 视频号 / B站 / 小红书 / YouTube]
- 画面比例:[9:16竖屏 / 16:9横屏 / 1:1正方]
【目标受众】
- 受众群体:[如:职场人士/学生/企业决策者]
- 受众痛点:[他们关心什么?]
- 受众知识水平:[小白/有一定基础/专业]
【风格要求】
- 整体风格:[轻松幽默 / 严肃专业 / 情感故事 / 快节奏资讯]
- 语速:[快 / 中 / 慢]
- 语言风格:[口语化 / 书面化 / 网感强]
【特殊要求】
- 必须包含的关键词/数据/案例
- 必须避免的内容
让 AI 检查参数完整性
请检查我提供的视频参数是否完整:
1. 哪些参数已经明确?
2. 哪些参数缺失或模糊?
3. 对于缺失的参数,你有什么建议?
列出需要你确认或补充的信息。
📌 说明:生成脚本前需要明确视频参数。参数越具体,生成的脚本越精准。
步骤2:生成分镜脚本
60秒短视频分镜脚本
请根据以下参数生成分镜脚本:
主题:[填写]
时长:60秒
平台:抖音(竖屏9:16)
风格:[填写]
分镜脚本格式(JSON数组):
[
{
"scene_id": 1,
"start_time": "00:00",
"end_time": "00:05",
"duration_seconds": 5,
"scene_type": "hook",
"visual_description": "画面描述(具体、可执行)",
"visual_prompt_en": "AI视频生成英文提示词",
"narration": "旁白文案",
"subtitle": "字幕文字",
"on_screen_text": "画面叠加文字",
"bgm_mood": "背景音乐情绪建议",
"transition": "转场效果",
"notes": "制作备注"
},
...
]
要求:
- 共8-12个分镜
- 开头5秒必须有强钩子(hook类型)
- 每15秒设置一个节奏点
- 结尾5秒为行动引导(cta类型)
- 总时长严格控制在60秒
保存到 ./scripts/[主题]/storyboard-60s.json
120秒中视频分镜脚本
请生成分镜脚本:
主题:[填写]
时长:120秒
平台:视频号(竖屏9:16)
风格:[填写]
要求:
- 共15-20个分镜
- 开头5-8秒为钩子
- 分为2-3个内容段落,每段有小标题
- 每30秒设置一个节奏点
- 结尾10秒为行动引导
保存到 ./scripts/[主题]/storyboard-120s.json
300秒长视频分镜脚本
请生成分镜脚本:
主题:[填写]
时长:300秒
平台:B站(横屏16:9)
风格:[填写]
要求:
- 共25-40个分镜
- 开头30秒为钩子+引言
- 分为3-5个章节,每章有小标题
- 设置2-3个互动引导点
- 结尾30秒为总结+下期预告
保存到 ./scripts/[主题]/storyboard-300s.json
分镜脚本验证
请检查刚生成的分镜脚本:
1. 各分镜时长之和是否等于总时长?
2. 是否包含所有必需类型(hook/body/cta)?
3. 每个分镜的画面描述是否具体可执行?
4. 旁白字数是否与时长匹配?(中文约4字/秒)
5. 节奏是否合理?
6. 是否有内容跳跃或逻辑断层?
列出所有问题。
步骤3:生成旁白文案
生成口播稿(含节奏标注)
请读取 ./scripts/[主题]/storyboard-60s.json,生成口播旁白文案:
格式要求:
- 按分镜分段,每段标注场景编号
- 标注情感基调(兴奋/严肃/轻松/悬念)
- 标注重读关键词(**加粗**)
- 标注停顿点(/ = 短停顿,// = 长停顿)
- 标注语速变化(快速/正常/慢速)
示例:
【场景1-钩子 | 0-5秒 | 情感:悬念】
你知道吗?// **就在今年**,/ AI已经能够...
【场景2-引入 | 5-15秒 | 情感:兴奋】
...
总字数:60秒约240字 / 120秒约480字 / 300秒约1200字
保存到 ./scripts/[主题]/narration.md
口播稿节奏检查
请检查口播文案:
1. 每段字数是否与分镜时长匹配?
(正常语速约4字/秒,快节奏约5字/秒)
2. 是否有读起来不顺口的句子?
3. 是否有过于书面化的表达?
4. 重读标记是否合理?
5. 停顿标记是否自然?
6. 整体情感曲线是否合理?
列出需要调整的地方。
提取纯口播文本(提词器用)
请从口播文案中提取纯文本版本:
要求:
- 去除所有情感标注、停顿标记、重读标记
- 只保留要说的文字
- 按场景分段
- 适合直接复制到提词器
保存到 ./scripts/[主题]/narration-clean.txt
示例:
你知道吗?就在今年,AI已经能够独立诊断疾病了。
今天带你看看最新的AI医疗应用进展。
...
步骤4:生成字幕内容
生成标准 SRT 字幕
请根据口播文案生成 SRT 格式字幕:
SRT 格式要求:
- 每段字幕不超过2行
- 每行不超过20个中文字符
- 时间戳按口播节奏标注
- 序号从1开始连续编号
SRT 格式示例:
1
00:00:00,000 --> 00:00:04,000
你知道吗?就在今年,
2
00:00:04,000 --> 00:00:07,000
AI已经能够独立诊断疾病了
时间戳计算规则:
- 每句话约3-5秒
- 长句子拆分为2行
- 两句话之间留0.5秒间隔
- 总时长严格匹配视频总时长
保存到 ./scripts/[主题]/subtitle.srt
生成平台适配版字幕
请为以下平台生成适配版字幕:
版本A — 抖音版
- 每行不超过15个字符(手机屏幕小)
- 关键信息标注(用于后期加粗显示)
- 节奏快,每段时长偏短(2-3秒)
版本B — B站版
- 每行不超过22个字符(横屏较宽)
- 可包含较长的专业术语
- 节奏适中,每段3-4秒
版本C — 小红书版
- 每行不超过14个字符
- 口语化,可适当使用emoji
- 节奏快,段落短
每个版本独立保存到 ./scripts/[主题]/ 目录。
生成提词器文本
请生成不带时间戳的纯文本字幕:
要求:
- 不带时间戳
- 按口播节奏分行
- 每行10-15个字符
- 适合提词器逐行滚动显示
保存到 ./scripts/[主题]/teleprompter.txt
示例:
你知道吗?
就在今年,
AI已经能够
独立诊断疾病了。
今天带你看看
最新的AI医疗
应用进展。
字幕质量检查
请检查字幕文件:
1. 总段数是否合理?(60秒约15-25段)
2. 每段是否不超过2行?
3. 每行是否不超过字符限制?
4. 时间戳是否连续且无重叠?
5. 最后一段的结束时间是否等于视频总时长?
6. 是否有断句不当?(不应在词组中间断行)
7. 是否有标点符号缺失?
列出所有问题。
步骤5:多风格适配
定义5种风格模板
请基于同一主题,定义以下5种风格的具体参数:
风格1 — 轻松幽默型
- 适用平台:抖音/小红书
- 语速:快
- 语言:口语化、有梗、网络热词
- 情感:轻松、活泼
- 钩子类型:反差/悬念/搞笑
风格2 — 严肃专业型
- 适用平台:B站/知乎/视频号
- 语速:中
- 语言:严谨、数据驱动、专业术语
- 情感:客观、权威
- 钩子类型:数据/趋势/问题
风格3 — 情感故事型
- 适用平台:视频号/抖音
- 语速:中偏慢
- 语言:感性、有温度、故事化
- 情感:温暖、共鸣、励志
- 钩子类型:人物故事/情感冲突
风格4 — 快节奏资讯型
- 适用平台:抖音/视频号
- 语速:快
- 语言:简洁、直接、信息密度高
- 情感:紧迫、兴奋
- 钩子类型:突发/最新/重磅
风格5 — 教程科普型
- 适用平台:B站/YouTube
- 语速:中
- 语言:清晰、结构化、举例说明
- 情感:耐心、友好
- 钩子类型:痛点问题/承诺解决方案
保存到 ./scripts/style-templates.md
一键生成多风格版本
请基于主题 "[填写]",生成5种风格的完整脚本包:
对每种风格,生成:
1. 分镜脚本(JSON格式)
2. 口播文案(标注风格参数)
3. SRT字幕文件
4. 提词器文本
文件命名规范:
- ./scripts/[主题]/storyboard-[风格].json
- ./scripts/[主题]/narration-[风格].md
- ./scripts/[主题]/subtitle-[风格].srt
- ./scripts/[主题]/teleprompter-[风格].txt
风格代号:humorous / professional / emotional / news / tutorial
生成完成后,列出所有文件清单。
多风格对比报告
请对比5种风格的脚本,生成对比报告:
1. 钩子差异:每种风格的开头5秒分别是什么?
2. 信息密度差异:各版本包含多少条核心信息?
3. 语言风格差异:举例说明同一信息的不同表述
4. 节奏差异:各版本分镜数量和时长分布
5. 情感曲线差异:各版本的情感变化趋势
输出对比表格,帮助选择最适合的版本。
保存到 ./scripts/[主题]/style-comparison.md
📌 说明:同一主题,用不同风格生成多版本,适配不同平台和受众。
步骤6:一键生成全套脚本
全能生成指令
请基于以下参数,生成完整的视频脚本包:
主题:[填写]
时长:[60秒/120秒/300秒]
平台:[填写]
风格:[填写]
比例:[9:16/16:9]
需要生成:
1. 分镜脚本(JSON,含AI视频提示词)
→ ./scripts/[主题]/storyboard.json
2. 口播文案(标注版 + 纯文本版)
→ ./scripts/[主题]/narration.md
→ ./scripts/[主题]/narration-clean.txt
3. SRT字幕文件
→ ./scripts/[主题]/subtitle.srt
4. 提词器文本
→ ./scripts/[主题]/teleprompter.txt
5. 视频标题候选(3个)
6. 视频简介/描述(200字以内)
7. 话题标签(10个)
8. 封面图设计建议
所有文件保存到 ./scripts/[主题]/ 目录。
生成完成后,列出所有文件并说明每个的用途。
生成发布元数据
请为以下视频生成标题和简介:
主题:[填写]
风格:[填写]
平台:[填写]
标题(3个候选):
- A(悬念型):制造悬念,引发好奇
- B(数据型):用数字吸引注意
- C(直接型):直接说明内容价值
简介(200字以内):
- 概括视频核心内容
- 包含2-3个关键词
- 引导观众互动
话题标签(8-10个):
- 按热度排序
保存到 ./scripts/[主题]/publish-meta.md
生成封面图设计建议
请为视频设计封面图方案:
主题:[填写]
平台:[填写]
比例:[填写]
需要生成:
1. 封面图文字方案(3个候选标题)
2. 封面图视觉描述(用于AI生成)
- 英文提示词(用于 Midjourney/DALL-E)
- 配色方案
- 构图建议
3. 不同平台的封面图尺寸要求
- 抖音:1080×1920
- B站:1146×717
- 视频号:1080×1260
- 小红书:1080×1440
保存到 ./scripts/[主题]/cover-guide.md
步骤7:技能沉淀与批量生产
沉淀视频脚本生成技能
请帮我创建技能文件 workspace/skills/video-script-gen/SKILL.md:
## 触发条件
用户要求生成分镜脚本/旁白文案/字幕/视频脚本
## 输入参数
- 主题(必须)
- 时长(60秒/120秒/300秒,默认120秒)
- 平台(抖音/视频号/B站/小红书,默认抖音)
- 风格(humorous/professional/emotional/news/tutorial)
- 比例(9:16/16:9,默认9:16)
## 输出内容
1. 分镜脚本(JSON,含AI视频提示词)
2. 口播文案(标注版 + 纯文本版)
3. SRT字幕文件
4. 提词器文本
5. 发布元数据(标题/简介/标签)
6. 封面图设计建议
## 输出目录
./scripts/[主题]/
├── storyboard.json
├── narration.md
├── narration-clean.txt
├── subtitle.srt
├── teleprompter.txt
├── publish-meta.md
└── cover-guide.md
创建后,下次只需说:
"用视频脚本生成技能,主题:[主题]"
即可一键生成全套脚本。
批量脚本生成
请帮我批量生成以下主题的视频脚本:
主题列表:
1. "[主题1]"
2. "[主题2]"
3. "[主题3]"
4. "[主题4]"
5. "[主题5]"
统一参数:
- 时长:60秒
- 平台:抖音
- 风格:news
- 比例:9:16
对每个主题生成:
1. 分镜脚本
2. 口播文案
3. 字幕文件
4. 发布元数据
输出目录:
./scripts/batch-[日期]/
├── topic-01/
│ ├── storyboard.json
│ ├── narration.md
│ ├── subtitle.srt
│ └── publish-meta.md
├── topic-02/
└── ...
逐个主题执行,每完成一个报告进度。
TTS 语音合成对接
请读取 ./scripts/[主题]/narration-clean.txt,
生成语音合成配置:
方式1 — 阿里云 TTS
{
"text": "[口播文案全文]",
"voice": "xiaoyun",
"format": "mp3",
"sample_rate": 48000
}
方式2 — 本地 Edge TTS(免费,中文效果好)
edge-tts \
--text "$(cat ./scripts/[主题]/narration-clean.txt)" \
--voice zh-CN-XiaoxiaoNeural \
--write-media ./scripts/[主题]/audio.mp3 \
--write-subtitles ./scripts/[主题]/audio-subtitles.vtt
方式3 — ElevenLabs TTS(英文/多语言)
{
"text": "[文案]",
"voice": "Rachel",
"model": "eleven_monolingual_v1"
}
保存到 ./scripts/[主题]/tts-config.json
完整项目目录参考
scripts/
├── [主题A]/ ← 单个主题完整脚本包
│ ├── storyboard.json ← 分镜脚本
│ ├── narration.md ← 口播文案(标注版)
│ ├── narration-clean.txt ← 口播文案(纯文本/TTS)
│ ├── subtitle.srt ← SRT字幕
│ ├── teleprompter.txt ← 提词器文本
│ ├── publish-meta.md ← 标题/简介/标签
│ ├── cover-guide.md ← 封面图建议
│ ├── tts-config.json ← TTS配置
│ └── audio.mp3 ← TTS音频
├── [主题B]/
├── batch-20260602/ ← 批量生成
│ ├── topic-01/
│ ├── topic-02/
│ └── ...
└── style-templates.md ← 风格定义