Search: megatron | AgentSkillsRepo

training-llms-megatron 0.30

zechenzhangAGI / ai-research-skills-training-llms-megatron exact

Trains large language models (2B-462B parameters) using NVIDIA Megatron-Core with advanced parallelism strategies. Use when training models >1B parameters, need maximum GPU efficiency (47% MFU on...

★ 1,712 ai

ai ai-research claude claude-code

training-llms-megatron 0.30

ovachiever / droid-tings-training-llms-megatron exact

Trains large language models (2B-462B parameters) using NVIDIA Megatron-Core with advanced parallelism strategies. Use when training models >1B parameters, need maximum GPU efficiency (47% MFU on...

★ 19 ai

megatron-memory-estimator 0.30

yzlnew / infra-skills-megatron-memory-estimator exact

Estimate GPU memory usage for Megatron-based MoE (Mixture of Experts) and dense models. Use when users need to (1) estimate memory from HuggingFace model configs (DeepSeek-V3, Qwen, etc.), (2)...

★ 51 ai

slime-rl-training 0.15

zechenzhangAGI / ai-research-skills-slime-rl-training exact

Provides guidance for LLM post-training with RL using slime, a Megatron+SGLang framework. Use when training GLM models, implementing custom data generation workflows, or needing tight Megatron-LM...

★ 1,712 ai

ai ai-research claude claude-code

huggingface-accelerate 0.10

ovachiever / droid-tings-huggingface-accelerate exact

Simplest distributed training API. 4 lines to add distributed support to any PyTorch script. Unified API for DeepSpeed/FSDP/Megatron/DDP. Automatic device placement, mixed precision...

★ 19 tools

huggingface-accelerate 0.10

zechenzhangAGI / ai-research-skills-huggingface-accelerate exact

Simplest distributed training API. 4 lines to add distributed support to any PyTorch script. Unified API for DeepSpeed/FSDP/Megatron/DDP. Automatic device placement, mixed precision...

★ 1,712 ai

ai ai-research claude claude-code

slime-user 0.10

yzlnew / infra-skills-slime-user exact

Guide for using SLIME (LLM post-training framework for RL Scaling). Use when working with SLIME for reinforcement learning training of language models, including setup, configuration, training...

★ 51 ai

paper-slide-deck 0.10

Ronitnair / research-skills-paper-slide-deck exact

Generate professional slide deck images from academic papers and content. Creates comprehensive outlines with style instructions, auto-detects figures from PDFs, then generates individual slide...

★ 0 ai

carpentries carpentries-incubator claude-code claude-skills

medical-imaging-review 0.10

Ronitnair / research-skills-medical-imaging-review exact

Write comprehensive literature reviews for medical imaging AI research. Use when writing survey papers, systematic reviews, or literature analyses on topics like segmentation, detection,...

★ 0 ai

carpentries carpentries-incubator claude-code claude-skills

verl-rl-training 0.03

zechenzhangAGI / ai-research-skills-verl-rl-training exact

Provides guidance for training LLMs with reinforcement learning using verl (Volcano Engine RL). Use when implementing RLHF, GRPO, PPO, or other RL algorithms for LLM post-training at scale with...

★ 1,712 ai

ai ai-research claude claude-code

deepspeed 0.03

ovachiever / droid-tings-deepspeed exact

Expert guidance for distributed training with DeepSpeed - ZeRO optimization stages, pipeline parallelism, FP16/BF16/FP8, 1-bit Adam, sparse attention

★ 19 ai

deepspeed 0.03

zechenzhangAGI / ai-research-skills-deepspeed exact

Expert guidance for distributed training with DeepSpeed - ZeRO optimization stages, pipeline parallelism, FP16/BF16/FP8, 1-bit Adam, sparse attention

★ 1,712 ai

ai ai-research claude claude-code

miles-rl-training 0.03

zechenzhangAGI / ai-research-skills-miles-rl-training exact

Provides guidance for enterprise-grade RL training using miles, a production-ready fork of slime. Use when training large MoE models with FP8/INT4, needing train-inference alignment, or requiring...

★ 1,712 ai

ai ai-research claude claude-code

moe-training 0.03

ovachiever / droid-tings-moe-training exact

Train Mixture of Experts (MoE) models using DeepSpeed or HuggingFace. Use when training large-scale models with limited compute (5× cost reduction vs dense models), implementing sparse...

★ 19 ai

moe-training 0.03

zechenzhangAGI / ai-research-skills-moe-training exact

Train Mixture of Experts (MoE) models using DeepSpeed or HuggingFace. Use when training large-scale models with limited compute (5× cost reduction vs dense models), implementing sparse...

★ 1,712 ai

ai ai-research claude claude-code

nanogpt 0.01

ovachiever / droid-tings-nanogpt exact

Educational GPT implementation in ~300 lines. Reproduces GPT-2 (124M) on OpenWebText. Clean, hackable code for learning transformers. By Andrej Karpathy. Perfect for understanding GPT architecture...

★ 19 ai

nanogpt 0.01

zechenzhangAGI / ai-research-skills-nanogpt exact

Educational GPT implementation in ~300 lines. Reproduces GPT-2 (124M) on OpenWebText. Clean, hackable code for learning transformers. By Andrej Karpathy. Perfect for understanding GPT architecture...

★ 1,712 ai

ai ai-research claude claude-code

distributed-llm-pretraining-torchtitan 0.01

zechenzhangAGI / ai-research-skills-distributed-llm-pretraining-torchtitan exact

Provides PyTorch-native distributed LLM pretraining using torchtitan with 4D parallelism (FSDP2, TP, PP, CP). Use when pretraining Llama 3.1, DeepSeek V3, or custom models at scale from 8 to 512+...

★ 1,712 ai

ai ai-research claude claude-code

torchforge-rl-training 0.01

zechenzhangAGI / ai-research-skills-torchforge-rl-training exact

Provides guidance for PyTorch-native agentic RL using torchforge, Meta's library separating infra from algorithms. Use when you want clean RL abstractions, easy algorithm experimentation, or...

★ 1,712 ai

ai ai-research claude claude-code

implementing-llms-litgpt 0.01

zechenzhangAGI / ai-research-skills-implementing-llms-litgpt exact

Implements and trains LLMs using Lightning AI's LitGPT with 20+ pretrained architectures (Llama, Gemma, Phi, Qwen, Mistral). Use when need clean model implementations, educational understanding of...

★ 1,712 ai

ai ai-research claude claude-code

Confirm

Submit a Skill