notedit

tts-skill

287
34
# Install this skill:
npx skills add notedit/happy-skills --skill "tts-skill"

Install specific skill from multi-skill repository

# Description

MiniMax TTS API - 文本转语音、声音克隆、声音设计

# SKILL.md


name: tts-skill
description: MiniMax TTS API - 文本转语音、声音克隆、声音设计
metadata:
tags: minimax, tts, voice, audio, speech


MiniMax TTS Skill

这个 Skill 提供 MiniMax TTS API 的完整封装,支持文本转语音、声音克隆和声音设计功能。

快速开始

1. 环境配置

确保已设置环境变量:

export MINIMAX_API_KEY="your-api-key"

详细配置说明见 setup.md

2. 使用 Python 模块

import sys
import os

# 获取 skill 目录路径
skill_dir = os.path.dirname(os.path.abspath(__file__))
sys.path.insert(0, os.path.join(skill_dir, "assets"))

from minimax_tts import text_to_audio, list_voices, voice_clone, voice_design, play_audio

功能概览

功能 函数 说明
文本转语音 text_to_audio() 将文本转换为语音文件
列出声音 list_voices() 获取可用的声音列表
声音克隆 voice_clone() 基于音频文件克隆声音
声音设计 voice_design() 根据文字描述生成声音
播放音频 play_audio() 播放音频文件

详细文档

快速示例

文本转语音

text_to_audio(
    text="你好,欢迎使用 MiniMax TTS 服务!",
    voice_id="female-shaonv",
    output_path="./hello.mp3"
)

列出可用声音

voices = list_voices(voice_type="system")
for voice in voices:
    print(f"{voice['voice_id']}: {voice['name']}")

声音克隆

voice_clone(
    voice_id="my-custom-voice",
    audio_file="./sample.mp3",
    voice_name="我的声音"
)

声音设计

voice_design(
    prompt="一个温柔的年轻女性声音,带有轻微的南方口音",
    preview_text="你好,这是我的声音"
)

支持的模型

模型 说明
speech-02-hd 高清版本,音质最佳
speech-02-turbo 快速版本,延迟低
speech-01-hd 旧版高清
speech-01-turbo 旧版快速
speech-2.6-hd 2.6 版高清
speech-2.6-turbo 2.6 版快速

常用声音 ID

系统预设声音

  • female-shaonv - 少女音
  • female-yujie - 御姐音
  • female-chengshu - 成熟女声
  • male-qingnian - 青年男声
  • male-chengshu - 成熟男声

更多声音请使用 list_voices() 查询。

# Supported AI Coding Agents

This skill is compatible with the SKILL.md standard and works with all major AI coding agents:

Learn more about the SKILL.md standard and how to use these skills with your preferred AI coding agent.