Use when adding new error messages to React, or seeing "unknown error code" warnings.
npx skills add zrt-ai-lab/opencode-skills --skill "videocut-clip-oral"
Install specific skill from multi-skill repository
# Description
口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误
# SKILL.md
name: videocut-clip-oral
description: 口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误
metadata:
version: "1.0.0"
alias: "videocut:剪口播"
剪口播
转录 + 口误/静音识别 → 生成审查稿
快速使用
用户: 帮我剪这个口播视频
用户: 处理一下这个视频
流程
1. FunASR 30s 分段转录(字符级时间戳)
↓
2. 识别口误(逐句检查)
↓
3. 识别微口误(VAD 检测短片段)
↓
4. 识别语气词(嗯/哎/诶 等)
↓
5. 识别静音(≥1s)
↓
6. 生成审查稿(时间戳驱动)
↓
7. 输出删除任务 TodoList
↓
【等待用户确认】→ 用户确认后,执行 /videocut:剪辑
⚠️ 为什么用 30s 分段
FunASR 长视频有时间戳漂移,30s 分段可避免。
进度 TodoList
启动时创建:
- [ ] 读取「转录最佳实践」→ 转录视频
- [ ] 读取「口误识别方法论」→ 识别口误
- [ ] VAD 检测微口误(短片段 < 0.5s)
- [ ] 扫描语气词(嗯/哎/诶 等)
- [ ] 识别静音(≥1s)
- [ ] 生成审查稿
- [ ] 输出删除任务清单
⚠️ 必须先读方法论再执行
| 阶段 | 先读 | 再执行 |
|---|---|---|
| 转录 | tips/转录最佳实践.md |
调用ASR |
| 识别口误 | tips/口误识别方法论.md |
逐句分析 |
核心:时间戳驱动
删除任务格式
每项必须标注精确时间戳 (start-end):
口误(N处):
- [ ] 1. `(start-end)` 删"错误文本" → 保留"正确文本"
语气词(N处):
- [ ] 1. `(前字end-后字start)` 删"嗯" 上下文: XX【嗯】YY
静音(N处):
- [ ] 1. `(start-end)` 静音Xs
口误类型
| 类型 | 示例 | 删除策略 |
|---|---|---|
| 重复型 | 拉满新拉满 |
只删差异("新") |
| 替换型 | AI就是AI就会 |
删第一个完整版本("AI就是") |
| 卡顿型 | 听会会 |
删第一个重复字 |
⚠️ 关键规则
- 时间戳驱动:审查稿直接标注时间戳,剪辑不再搜索文本
- 逐token分析:对于"删前面保后面"的口误,必须逐token查时间戳
- 检查时间跨度:如果口误时间跨度 > 2秒,必有静音,需拆分
输出文件
01-xxx-v1_transcript.json # 转录结果(含时间戳)
01-xxx-v1_审查稿.md # 口误审查稿
展示要求
生成审查稿后,必须展示给用户:
1. 写入文件 01-xxx-v1_审查稿.md
2. 读取并展示内容
3. 等待用户确认要删除哪些项目
方法论
详见 tips/口误识别方法论.md:
- 口误识别方法(逐句检查)
- "删前面保后面"的精确处理
- FunASR 时间戳对齐规则
# Supported AI Coding Agents
This skill is compatible with the SKILL.md standard and works with all major AI coding agents:
Learn more about the SKILL.md standard and how to use these skills with your preferred AI coding agent.