Skip to content

AI & ML 2026-3-7

NVIDIA推出NeMo评估代理,实现对话式大模型分钟级评测;KernelAgent则通过多智能体协同优化GPU内核,提升硬件级计算效率。

KernelAgent: Hardware-Guided GPU Kernel Optimization via Multi-Agent Orchestration 92

  • Tags: Triton GPU优化 多智能体系统 硬件感知编译 自动化内核生成

  • Source: Pytorch_Blog | 阅读原文

[摘要]
通过引入硬件性能信号的闭环多智能体优化框架,KernelAgent在保持100%正确性的基础上实现平均2.02x加速,显著提升Triton内核性能并逼近H100硬件上限。


Conversational LLM Evaluations in Minutes with NVIDIA NeMo Evaluator Agent Skills 85

  • Tags: 大模型 评估框架 Agent Skill 自动化配置 NVIDIA NeMo

  • Source: HuggingFace | 阅读原文

[摘要]
通过自然语言交互实现LLM评估的自动化配置,基于NVIDIA NeMo Evaluator构建,显著降低评估流程中的配置复杂度与错误率。