NVIDIA NIM 推出 Agent Runtime,本地 GPU 上跑生产级 Agent

NVIDIA NIM 新增 Agent Runtime 模式,在本地 GPU 集群上运行 Agent 推理和工具调用。

NVIDIA 技术博客·2026年4月16日

要点

  • NIM Agent Runtime 支持 Agent 的完整执行循环
  • 工具调用在本地 GPU 上完成,无需出站到云端
  • 支持多模型编排:不同步骤用不同模型
  • 兼容 MCP Protocol

适用场景

  • 数据隐私要求高的企业
  • 需要低延迟的实时 Agent
  • 云端 API 成本过高的批量任务

本地 Agent 是重要趋势。云端 API 好用但贵且有数据泄露风险,NIM 给了一条折中路径。

查看原文返回资讯列表
API2D🇨🇳 国内推荐

国内直连 OpenAI/Claude API,无需科学上网,按量计费

立即体验 →

推广链接