AI & ML 2026-3-7
NVIDIA推出NeMo评估代理,实现对话式大模型分钟级评测;KernelAgent则通过多智能体协同优化GPU内核,提升硬件级计算效率。
KernelAgent: Hardware-Guided GPU Kernel Optimization via Multi-Agent Orchestration 92
Tags:
TritonGPU优化多智能体系统硬件感知编译自动化内核生成Source:
Pytorch_Blog| 阅读原文
[摘要]
通过引入硬件性能信号的闭环多智能体优化框架,KernelAgent在保持100%正确性的基础上实现平均2.02x加速,显著提升Triton内核性能并逼近H100硬件上限。
Conversational LLM Evaluations in Minutes with NVIDIA NeMo Evaluator Agent Skills 85
Tags:
大模型评估框架Agent Skill自动化配置NVIDIA NeMoSource:
HuggingFace| 阅读原文
[摘要]
通过自然语言交互实现LLM评估的自动化配置,基于NVIDIA NeMo Evaluator构建,显著降低评估流程中的配置复杂度与错误率。