2026-03-07

NVIDIA推出NeMo评估代理，实现对话式大模型分钟级评测；KernelAgent则通过多智能体协同优化GPU内核，提升硬件级计算效率。

KernelAgent: Hardware-Guided GPU Kernel Optimization via Multi-Agent Orchestration 92

Tags: Triton GPU优化 多智能体系统 硬件感知编译 自动化内核生成
Source: Pytorch_Blog | 阅读原文

[摘要]
通过引入硬件性能信号的闭环多智能体优化框架，KernelAgent在保持100%正确性的基础上实现平均2.02x加速，显著提升Triton内核性能并逼近H100硬件上限。

Conversational LLM Evaluations in Minutes with NVIDIA NeMo Evaluator Agent Skills 85

Tags: 大模型 评估框架 Agent Skill 自动化配置 NVIDIA NeMo
Source: HuggingFace | 阅读原文

[摘要]
通过自然语言交互实现LLM评估的自动化配置，基于NVIDIA NeMo Evaluator构建，显著降低评估流程中的配置复杂度与错误率。