NVIDIA NIM 推出 Agent Runtime,本地 GPU 上跑生产级 Agent
NVIDIA NIM 新增 Agent Runtime 模式,在本地 GPU 集群上运行 Agent 推理和工具调用。
NVIDIA 技术博客·2026年4月16日
要点
- NIM Agent Runtime 支持 Agent 的完整执行循环
- 工具调用在本地 GPU 上完成,无需出站到云端
- 支持多模型编排:不同步骤用不同模型
- 兼容 MCP Protocol
适用场景
- 数据隐私要求高的企业
- 需要低延迟的实时 Agent
- 云端 API 成本过高的批量任务
本地 Agent 是重要趋势。云端 API 好用但贵且有数据泄露风险,NIM 给了一条折中路径。