videocut-clip-oral

by @zrt-ai-lab in Development

# Install this skill:

npx skills add zrt-ai-lab/opencode-skills --skill "videocut-clip-oral"

Install specific skill from multi-skill repository

# Description

口播视频转录和口误识别。生成审查稿和删除任务清单。触发词：剪口播、处理视频、识别口误

# SKILL.md

name: videocut-clip-oral
description: 口播视频转录和口误识别。生成审查稿和删除任务清单。触发词：剪口播、处理视频、识别口误
metadata:
version: "1.0.0"
alias: "videocut:剪口播"

剪口播

转录 + 口误/静音识别 → 生成审查稿

快速使用

用户: 帮我剪这个口播视频
用户: 处理一下这个视频

流程

1. FunASR 30s 分段转录（字符级时间戳）
    ↓
2. 识别口误（逐句检查）
    ↓
3. 识别微口误（VAD 检测短片段）
    ↓
4. 识别语气词（嗯/哎/诶 等）
    ↓
5. 识别静音（≥1s）
    ↓
6. 生成审查稿（时间戳驱动）
    ↓
7. 输出删除任务 TodoList
    ↓
【等待用户确认】→ 用户确认后，执行 /videocut:剪辑

⚠️ 为什么用 30s 分段

FunASR 长视频有时间戳漂移，30s 分段可避免。

进度 TodoList

启动时创建：

- [ ] 读取「转录最佳实践」→ 转录视频
- [ ] 读取「口误识别方法论」→ 识别口误
- [ ] VAD 检测微口误（短片段 < 0.5s）
- [ ] 扫描语气词（嗯/哎/诶 等）
- [ ] 识别静音（≥1s）
- [ ] 生成审查稿
- [ ] 输出删除任务清单

⚠️ 必须先读方法论再执行

阶段	先读	再执行
转录	`tips/转录最佳实践.md`	调用ASR
识别口误	`tips/口误识别方法论.md`	逐句分析

核心：时间戳驱动

删除任务格式

每项必须标注精确时间戳 (start-end)：

口误（N处）：
- [ ] 1. `(start-end)` 删"错误文本" → 保留"正确文本"

语气词（N处）：
- [ ] 1. `(前字end-后字start)` 删"嗯" 上下文: XX【嗯】YY

静音（N处）：
- [ ] 1. `(start-end)` 静音Xs

口误类型

类型	示例	删除策略
重复型	`拉满新拉满`	只删差异（"新"）
替换型	`AI就是AI就会`	删第一个完整版本（"AI就是"）
卡顿型	`听会会`	删第一个重复字

⚠️ 关键规则

时间戳驱动：审查稿直接标注时间戳，剪辑不再搜索文本
逐token分析：对于"删前面保后面"的口误，必须逐token查时间戳
检查时间跨度：如果口误时间跨度 > 2秒，必有静音，需拆分

输出文件

01-xxx-v1_transcript.json  # 转录结果（含时间戳）
01-xxx-v1_审查稿.md        # 口误审查稿

展示要求

生成审查稿后，必须展示给用户：
1. 写入文件 01-xxx-v1_审查稿.md
2. 读取并展示内容
3. 等待用户确认要删除哪些项目

方法论

详见 tips/口误识别方法论.md：
- 口误识别方法（逐句检查）
- "删前面保后面"的精确处理
- FunASR 时间戳对齐规则

# Supported AI Coding Agents

This skill is compatible with the SKILL.md standard and works with all major AI coding agents:

⚡ Amp 🚀 Antigravity 🤖 Claude Code 🦀 Clawdbot 📝 Codex ▶️ Cursor 🤖 Droid 💎 Gemini CLI 🐙 GitHub Copilot 🪿 Goose 📊 Kilo Code 🔧 Kiro CLI 💻 OpenCode 🦘 Roo Code 🌲 Trae 🏄 Windsurf

Learn more about the SKILL.md standard and how to use these skills with your preferred AI coding agent.