Search: harness | AgentSkillsRepo

eval-harness 0.30

ValorVie / custom-skills-eval-harness exact

A formal evaluation framework for Claude Code sessions, implementing eval-driven development (EDD) principles.

★ 0 ai

eval-harness 0.30

UrlAudit / claude-toolbox-eval-harness exact

Formal evaluation framework for Claude Code sessions implementing eval-driven development (EDD) principles

★ 0 ai

eval-harness 0.30

secucon / cc-sys-eval-harness exact

Formal evaluation framework for Claude Code sessions implementing eval-driven development (EDD) principles

★ 0 ai

agent-harness-patterns 0.28

imachiever / my-genai-skills-and-agents-agent-harness-patterns exact

|

★ 0 ai

evaluating-llms-harness 0.28

zechenzhangAGI / ai-research-skills-evaluating-llms-harness exact

Evaluates LLMs across 60+ academic benchmarks (MMLU, HumanEval, GSM8K, TruthfulQA, HellaSwag). Use when benchmarking model quality, comparing models, reporting academic results, or tracking...

★ 1,712 ai

ai ai-research claude claude-code

evaluating-llms-harness 0.28

ovachiever / droid-tings-evaluating-llms-harness exact

Evaluates LLMs across 60+ academic benchmarks (MMLU, HumanEval, GSM8K, TruthfulQA, HellaSwag). Use when benchmarking model quality, comparing models, reporting academic results, or tracking...

★ 19 ai

Read documentation (paths shown in RIG.md) 0.15

YPares / rigup-nix-riglets-agent-rig-system exact

AI agents and Nix: parametrable skills/instructions and tools, packaged together in a reproducible and modular fashion

★ 32 ai

ai-agents nix skills riglets

skill-installer 0.14

SkillsCatalog / registry-skill-installer exact

Install Agent Skills to your AI coding agent. Supports Claude Code, Goose, OpenCode, Cursor, and other harnesses.

★ 1 ai

nemo-evaluator-sdk 0.13

zechenzhangAGI / ai-research-skills-nemo-evaluator-sdk exact

Evaluates LLMs across 100+ benchmarks from 18+ harnesses (MMLU, HumanEval, GSM8K, safety, VLM) with multi-backend execution. Use when needing scalable evaluation on local Docker, Slurm HPC, or...

★ 1,712 ai

ai ai-research claude claude-code

grabbit 0.12

colebanman / grabbit-skills exact

Control the Grabbit CLI to record browser interactions (HAR) and generate API workflows. Use this skill when the user wants to: (1) Automate browser actions, (2) Capture web traffic for API...

★ 0 web

angular-testing 0.11

analogjs / angular-skills-angular-testing exact

Write unit and integration tests for Angular v21+ applications using Vitest or Jasmine with TestBed, component harnesses, and modern testing patterns. Use for testing components with signals,...

★ 155 development

braintrust-analyze 0.04

parcadei / continuous-claude-v3-braintrust-analyze exact

Analyze Claude Code sessions via Braintrust

★ 3,433 ai

agents claude-code claude-code-cli claude-code-hooks

braintrust-analyze 0.04

namesreallyblank / clorch-braintrust-analyze exact

Analyze Claude Code sessions via Braintrust

★ 2 ai

pint-compute 0.04

parcadei / continuous-claude-v3-pint-compute exact

Unit-aware computation with Pint - convert units, dimensional analysis, unit arithmetic

★ 3,433 ai

agents claude-code claude-code-cli claude-code-hooks

pint-compute 0.04

namesreallyblank / clorch-pint-compute exact

Unit-aware computation with Pint - convert units, dimensional analysis, unit arithmetic

★ 2 tools

qlty-check 0.04

parcadei / continuous-claude-v3-qlty-check exact

Code quality checks, formatting, and metrics via qlty CLI

★ 3,433 ai

agents claude-code claude-code-cli claude-code-hooks

qlty-check 0.04

namesreallyblank / clorch-qlty-check exact

Code quality checks, formatting, and metrics via qlty CLI

★ 2 development

nia-docs 0.04

namesreallyblank / clorch-nia-docs exact

Search library documentation and code examples via Nia

★ 2 development

nia-docs 0.04

parcadei / continuous-claude-v3-nia-docs exact

Search library documentation and code examples via Nia

★ 3,433 ai

agents claude-code claude-code-cli claude-code-hooks

ast-grep-find 0.04

namesreallyblank / clorch-ast-grep-find exact

AST-based code search and refactoring via ast-grep MCP

★ 2 development

Confirm

Submit a Skill