Search: audio | AgentSkillsRepo

brave-search 0.14

Mucho-G / pi-skills-brave-search exact

Web search and content extraction via Brave Search API. Use for searching documentation, facts, or any web content. Lightweight, no browser required.

★ 1 web

action-quality-assessment alexa alexa-skill audio-analysis

gmcli 0.14

Mucho-G / pi-skills-gmcli exact

Gmail CLI for searching emails, reading threads, sending messages, managing drafts, and handling labels/attachments.

★ 1 development

action-quality-assessment alexa alexa-skill audio-analysis

gccli 0.14

Mucho-G / pi-skills-gccli exact

Google Calendar CLI for listing calendars, viewing/creating/updating events, and checking availability.

★ 1 development

action-quality-assessment alexa alexa-skill audio-analysis

browser-tools 0.14

Mucho-G / pi-skills-browser-tools exact

Interactive browser automation via Chrome DevTools Protocol. Use when you need to interact with web pages, test frontends, or when user interaction with a visible browser is required.

★ 1 development

action-quality-assessment alexa alexa-skill audio-analysis

youtube-transcript 0.14

Mucho-G / pi-skills-youtube-transcript exact

Fetch transcripts from YouTube videos for summarization and analysis.

★ 1 development

action-quality-assessment alexa alexa-skill audio-analysis

gdcli 0.14

Mucho-G / pi-skills-gdcli exact

Google Drive CLI for listing, searching, uploading, downloading, and sharing files and folders.

★ 1 development

action-quality-assessment alexa alexa-skill audio-analysis

vscode 0.14

Mucho-G / pi-skills-vscode exact

VS Code integration for viewing diffs and comparing files. Use when showing file differences to the user.

★ 1 development

action-quality-assessment alexa alexa-skill audio-analysis

sound-engineer 0.13

erichowens / some-claude-skills-sound-engineer exact

Expert in spatial audio, procedural sound design, game audio middleware, and app UX sound design. Specializes in HRTF/Ambisonics, Wwise/FMOD integration, UI sound design, and adaptive music...

★ 20 devops

media-processing 0.13

samhvw8 / dot-claude-media-processing exact

Video/audio/image processing with FFmpeg and ImageMagick. Tools: FFmpeg (video/audio), ImageMagick (images). Capabilities: format conversion, encoding (H.264/H.265/VP9/AV1), streaming (HLS/DASH),...

★ 5 development

2000s-visualization-expert 0.13

erichowens / some-claude-skills-2000s-visualization-expert exact

Expert in 2000s-era music visualization (Milkdrop, AVS, Geiss) and modern WebGL implementations. Specializes in Butterchurn integration, Web Audio API AnalyserNode FFT data, GLSL shaders for...

★ 20 development

ffmpeg 0.12

digitalsamba / claude-code-video-toolkit-ffmpeg exact

Video and audio processing with FFmpeg. Use for format conversion, resizing, compression, audio extraction, and preparing assets for Remotion. Triggers include converting GIF to MP4, resizing...

★ 23 development

ai-video-generator claude-code developer-tools elevenlabs

gemini-tts 0.12

akrindev / google-studio-skills-gemini-tts exact

Generate speech from text using Google Gemini TTS models via scripts/. Use for text-to-speech, audio generation, voice synthesis, multi-speaker conversations, and creating audio content. Supports...

★ 1 ai

agent agent-skills

openai-whisper-api 0.12

moltbot / moltbot-openai-whisper-api exact

Transcribe audio via OpenAI Audio Transcriptions API (Whisper).

★ 65,001 ai

ai assistant clawd own-your-data

openai-whisper-api 0.12

yueweilu / ai-agent-skills-openai-whisper-api exact

Transcribe audio via OpenAI Audio Transcriptions API (Whisper).

★ 0 ai

ASR 0.12

AnswerZhao / agent-skills-glm-skills-asr exact

Implement speech-to-text (ASR/automatic speech recognition) capabilities using the z-ai-web-dev-sdk. Use this skill when the user needs to transcribe audio files, convert speech to text, build...

★ 23 tools

Convert PCM to WAV (see scripts/pcm_to_wav.py) 0.12

ngxtm / devkit-convert-pcm-to-wav-see-scripts-pcm-to-wav-py exact

Generate AI-powered podcast-style audio narratives using Azure OpenAI's GPT Realtime Mini model via WebSocket. Use when building text-to-speech features, audio narrative generation, podcast...

★ 0 ai

agent ai automation claude

multimodal-ai 0.12

omer-metin / skills-for-antigravity-multimodal-ai exact

Patterns for building multimodal AI applications that combine text, images, audio, and video. Covers vision APIs, audio transcription, and unified pipelines. Use when "multimodal AI, vision API,...

★ 5 ai

ai-agents antigravity antigravity-ide skills

markitdown 0.12

jackspace / claudeskillz-markitdown exact

Convert various file formats (PDF, Office documents, images, audio, web content, structured data) to Markdown optimized for LLM processing. Use when converting documents to markdown, extracting...

★ 8 ai

agentic-coding ai-skills automation bioinformatics

markitdown 0.12

0xbeedao / agentic-tools-markitdown exact

Convert various file formats (PDF, Office documents, images, audio, web content, structured data) to Markdown optimized for LLM processing. Use when converting documents to markdown, extracting...

★ 0 data

markitdown 0.12

ovachiever / droid-tings-markitdown exact

Convert various file formats (PDF, Office documents, images, audio, web content, structured data) to Markdown optimized for LLM processing. Use when converting documents to markdown, extracting...

★ 19 data

Confirm

Submit a Skill