Search: evaluation | AgentSkillsRepo

ready ~/ agentskillsrepo

login

2145 results (16.9ms) page 5 / 108

skill_evaluator 0.00

vuralserhat86 / antigravity-agentic-skills-skill-evaluator exact

Evaluates agent skills against Anthropic's best practices. Use when asked to review, evaluate, assess, or audit a skill for quality. Analyzes SKILL.md structure, naming conventions, description...

★ 27 ai

writing-skills 0.00

LandonSchropp / agent-toolkit-writing-skills exact

Use when creating, editing, evaluating, testing, or verifying ANY skill or skill-related file (SKILL.md, skill resources, skill scripts, or skill assets). If you're asked to evaluate or test a...

★ 1 ai

agents claude-code codex-cli mcp

architecture 0.00

josavicentevw / ai-agent-skills-architecture exact

Design, evaluate, and document software architectures including system design, design patterns, architecture patterns, scalability planning, and technology selection. Use when designing systems,...

★ 0 devops

multi-agent-orchestrator 0.00

tekliner / improvado-agentic-frameworks-and-skills-multi-agent-orchestrator exact

Orchestrate parallel CLI agents (Claude Code, Codex, Gemini) for competitive evaluation. Use when user says "run multi-agent", "compare agents", "launch competitive evaluation", "use parallel...

★ 4 ai

langfuse 0.00

404kidwiz / agent-skills-backup-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 0 ai

langfuse 0.00

automindtechnologie-jpg / ultimate-skill-md-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 0 ai

langfuse 0.00

cleodin / antigravity-awesome-skills-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 1 ai

agentic-skills ai-agents antigravity antigravity-ide

langfuse 0.00

sickn33 / antigravity-awesome-skills-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 2,844 ai

agentic-skills ai-agents antigravity autonomous-coding

langfuse 0.00

ngxtm / devkit-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 0 ai

agent ai automation claude

langfuse 0.00

halay08 / fullstack-agent-skills-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 0 ai

langfuse 0.00

shishiv / gsd-langfuse exact

Expert in Langfuse - the open-source LLM observability platform. Covers tracing, prompt management, evaluation, datasets, and integration with LangChain, LlamaIndex, and OpenAI. Essential for...

★ 0 ai

startup-ideation 0.00

RefoundAI / lenny-skills-startup-ideation exact

Help users generate and evaluate startup ideas. Use when someone is brainstorming business ideas, trying to find a startup concept, evaluating whether an idea is worth pursuing, or looking for...

★ 30 ai

ai-agents ai-assistant claude claude-code

skill-studio 0.00

lzw12w / agent-skills-studio exact

Comprehensive skill evaluation and debugging framework for testing agent skills. Use when users need to (1) evaluate a skill's recall rate (how often it triggers correctly), (2) test a skill's...

★ 1 ai

cli-ux-tester 0.00

ali5ter / claude-cli-ux-skill-cli-ux-tester exact

Expert UX evaluator for command-line interfaces, CLIs, terminal tools, shell scripts, and developer APIs. Use proactively when reviewing CLIs, testing command usability, evaluating error messages,...

★ 1 tools

accessibility api-design claude-code claude-skill

zero-to-one 0.00

defi-naly / skillbank-zero-to-one exact

Apply Peter Thiel's Zero to One principles for building new products, evaluating ideas, and strategic thinking. Use when creating something new (not iterating), assessing market opportunities,...

★ 0 development

research-claim-map 0.00

lyndonkl / claude-research-claim-map exact

Use when verifying claims before decisions, fact-checking statements against sources, conducting due diligence on vendor/competitor assertions, evaluating conflicting evidence, triangulating...

★ 15 development

aposd-reviewing-module-design 0.00

ryanthedev / code-foundations-aposd-reviewing-module-design exact

Evaluate module design using APOSD principles with 40-item checklist. Detect complexity symptoms (change amplification, cognitive load, unknown unknowns), shallow modules, information leakage,...

★ 51 development

context-engineering 0.00

siviter-xyz / dot-agent-context-engineering exact

Master context engineering for AI agent systems. Use when designing agent architectures, debugging context failures, optimizing token usage, implementing memory systems, building multi-agent...

★ 1 ai

architecture-design-review 0.00

DauQuangThanh / hanoi-rainbow-architecture-design-review exact

Conducts comprehensive architecture design reviews including system design validation, architecture pattern assessment, quality attributes evaluation, technology stack review, and scalability...

★ 2 ai

agentic-ai ai process software-development

anysite-influencer-discovery 0.00

anysiteio / agent-skills-anysite-influencer-discovery exact

Discover and analyze influencers across Instagram, Twitter/X, LinkedIn, YouTube, and Reddit using anysite MCP server. Find content creators by niche, analyze engagement metrics, evaluate audience...

★ 2 ai