NVIDIA NIM Agent Runtime 更新:GPU 加速 Skill 执行

NVIDIA 为 Agent Runtime 新增 GPU 加速模式,图像处理和 RAG 类 Skill 执行速度提升 3-5 倍。

NVIDIA Blog·2026年4月23日

NVIDIA NIM Agent Runtime GPU 加速

更新要点

NVIDIA 最新版 NIM Agent Runtime 新增 GPU 加速执行模式,主要提升两类 Skill 的性能:

  1. 图像处理 Skill

    • 图像识别和分类:速度提升 3-5x
    • OCR 和文档解析:速度提升 4x
    • 图像生成后处理:速度提升 2-3x
  2. RAG 类 Skill

    • 向量检索(Embedding 计算):速度提升 5x
    • 文档分块和索引:速度提升 3x
    • 混合检索(向量+关键词):速度提升 4x

技术实现

  • 使用 CUDA 加速核心算子
  • TensorRT 优化推理图
  • 自动检测 GPU 可用性,无 GPU 时退回 CPU 模式
  • 支持 A100/H100/L40S 等主流 GPU

使用方式

# 安装 GPU 版本 pip install nvidia-nim-agent[gpu] # 配置 export NIM_RUNTIME=gpu export CUDA_VISIBLE_DEVICES=0

生态影响

  • 自部署 Agent 的企业用户受益最大
  • 云端 Agent 平台可选择性启用 GPU 加速
  • 对纯文本 Skill 无影响,无需任何改动

这是 Agent 运行时向 GPU 原生加速迈出的重要一步。未来音频和视频处理 Skill 也将获得 GPU 加速支持。

查看原文返回资讯列表
API2D🇨🇳 国内推荐

国内直连 OpenAI/Claude API,无需科学上网,按量计费

立即体验 →

推广链接