NVIDIA NIM Agent Runtime 更新:GPU 加速 Skill 执行
NVIDIA 为 Agent Runtime 新增 GPU 加速模式,图像处理和 RAG 类 Skill 执行速度提升 3-5 倍。
NVIDIA Blog·2026年4月23日
NVIDIA NIM Agent Runtime GPU 加速
更新要点
NVIDIA 最新版 NIM Agent Runtime 新增 GPU 加速执行模式,主要提升两类 Skill 的性能:
-
图像处理 Skill
- 图像识别和分类:速度提升 3-5x
- OCR 和文档解析:速度提升 4x
- 图像生成后处理:速度提升 2-3x
-
RAG 类 Skill
- 向量检索(Embedding 计算):速度提升 5x
- 文档分块和索引:速度提升 3x
- 混合检索(向量+关键词):速度提升 4x
技术实现
- 使用 CUDA 加速核心算子
- TensorRT 优化推理图
- 自动检测 GPU 可用性,无 GPU 时退回 CPU 模式
- 支持 A100/H100/L40S 等主流 GPU
使用方式
# 安装 GPU 版本 pip install nvidia-nim-agent[gpu] # 配置 export NIM_RUNTIME=gpu export CUDA_VISIBLE_DEVICES=0
生态影响
- 自部署 Agent 的企业用户受益最大
- 云端 Agent 平台可选择性启用 GPU 加速
- 对纯文本 Skill 无影响,无需任何改动
这是 Agent 运行时向 GPU 原生加速迈出的重要一步。未来音频和视频处理 Skill 也将获得 GPU 加速支持。