Search: evaluation | AgentSkillsRepo

NTCoding / claude-skillz-lightweight-design-analysis exact

This skill analyzes code for design quality improvements across 8 dimensions: Naming, Object Calisthenics, Coupling & Cohesion, Immutability, Domain Integrity, Type System, Simplicity, and...

★ 138 development

chain-estimation-decision-storytelling 0.00

lyndonkl / claude-chain-estimation-decision-storytelling exact

Use when making high-stakes decisions under uncertainty that require stakeholder buy-in. Invoke when evaluating strategic options (build vs buy, market entry, resource allocation), quantifying...

★ 15 ai

prompt-engineer 0.00

omer-metin / skills-for-antigravity-prompt-engineer exact

Expert in designing effective prompts for LLM-powered applications. Masters prompt structure, context management, output formatting, and prompt evaluation. Use when "prompt engineering, system...

★ 5 ai

ai-agents antigravity antigravity-ide skills

cc-routine-and-class-design 0.00

ryanthedev / code-foundations-cc-routine-and-class-design exact

Evaluate routine and class design quality using Code Complete checklists (43 items). Use when designing routines or classes, reviewing class interfaces, choosing between inheritance and...

★ 51 ai

skin-in-the-game 0.00

defi-naly / skillbank-skin-in-the-game exact

Apply Nassim Taleb's Skin in the Game principles for evaluating trust, designing incentives, and making ethical decisions. Use when assessing advisors, structuring partnerships, evaluating...

★ 0 development

autonomous-agent-readiness 0.00

petekp / agent-skills-autonomous-agent-readiness exact

Assess a codebase's readiness for autonomous agent development and provide tailored recommendations. Use when asked to evaluate how well a project supports unattended agent execution, assess...

★ 1 ai

frontend-design-review 0.00

DauQuangThanh / hanoi-rainbow-frontend-design-review exact

Conducts comprehensive frontend design reviews covering UI/UX design quality, design system validation, accessibility compliance, responsive design patterns, component library architecture, and...

★ 2 tools

agentic-ai ai process software-development

testability-scoring 0.00

proffesor-for-testing / agentic-qe-testability-scoring exact

AI-powered testability assessment using 10 principles of intrinsic testability with Playwright and optional Vibium integration. Evaluates web applications against Observability, Controllability,...

★ 148 ai

agenticsfoundation agents quality-engineering agenticqe

aesthetic 0.00

samhvw8 / dot-claude-aesthetic exact

Visual design intelligence and UI aesthetics. Integrates: chrome-devtools, ai-multimodal, media-processing. Capabilities: design analysis, visual hierarchy, color theory, typography,...

★ 5 tools

ai-observability 0.00

omer-metin / skills-for-antigravity-ai-observability exact

Implement comprehensive observability for LLM applications including tracing (Langfuse/Helicone), cost tracking, token optimization, RAG evaluation metrics (RAGAS), hallucination detection, and...

★ 5 ai

ai-agents antigravity antigravity-ide skills

code-review 0.00

samhvw8 / dot-claude-code-review exact

Code review practices with technical rigor and verification gates. Practices: receiving feedback, requesting reviews, verification gates. Capabilities: technical evaluation, evidence-based claims,...

★ 5 ai

decision-maker 0.00

omer-metin / skills-for-antigravity-decision-maker exact

Technical decision-making frameworks - trade-off evaluation, reversibility analysis, and second-order thinking for better engineering choicesUse when "should we, which is better, trade-off,...

★ 5 ai

ai-agents antigravity antigravity-ide skills

Influencer Finder 0.00

eddiebe147 / claude-settings-influencer-finder exact

Find and evaluate influencers for marketing partnerships

★ 8 tools

phoenix-evals 0.00

Arize-ai / phoenix-phoenix-evals exact

Build and run evaluators for AI/LLM applications using Phoenix.

★ 8,402 ai

llmops ai-monitoring ai-observability llm-eval

context-compression 0.00

shishiv / gsd-context-compression exact

Design and evaluate compression strategies for long-running sessions

★ 0 tools

deepeval 0.00

Hisham-Hussein / claude-forge-deepeval exact

Use when discussing or working with DeepEval (the python AI evaluation framework)

★ 0 ai

Real Estate Analyst 0.00

eddiebe147 / claude-settings-real-estate-analyst exact

Property analysis, investment evaluation, and market research for real estate professionals and investors

★ 8 tools

scikit-learn-best-practices 0.00

mindrally / skills-scikit-learn-best-practices exact

Best practices for scikit-learn machine learning, model development, evaluation, and deployment in Python

★ 3 devops

Insurance Analyst 0.00

eddiebe147 / claude-settings-insurance-analyst exact

Insurance policy analysis, claims evaluation, coverage assessment, and risk management for individuals and businesses

★ 8 ai

good-strategy-bad-strategy 0.00

defi-naly / skillbank-good-strategy-bad-strategy exact

Richard Rumelt's framework for crafting and evaluating strategy through diagnosis, guiding policy, and coherent actions.

★ 0 tools

Confirm

Submit a Skill