OWASP 发布 AI Agent 安全框架指南 1.0

OWASP 正式发布 AI Agent 安全评估框架,覆盖 12 类风险和完整审计清单。

OWASP·2026年4月23日

OWASP AI Agent 安全框架 1.0

12 类风险

  1. 提示注入:恶意输入操纵 Agent 行为
  2. 工具越权:Agent 调用超出授权范围的工具
  3. 数据泄露:Agent 输出包含敏感信息
  4. 供应链攻击:恶意 Skill/插件注入
  5. 身份冒充:Agent 被劫持冒充合法用户
  6. 拒绝服务:恶意触发大量工具调用
  7. 记忆投毒:篡改 Agent 长期记忆
  8. 权限提升:利用 Skill 漏洞获取更高权限
  9. 侧信道泄露:通过 Timing/Error 信息推断内部状态
  10. 合规违规:Agent 行为违反法规(GDPR、HIPAA 等)
  11. 模型后门:预训练模型中的恶意触发器
  12. 审计缺失:无法追溯 Agent 的关键决策

审计清单

  • 所有工具调用有权限检查
  • 敏感操作有人工确认环节
  • Agent 输出经过脱敏过滤
  • Skill 来源可信(认证/签名)
  • 完整的决策审计日志

对 OpenClaw 用户的影响

OpenClaw 的 Skill 认证计划与 OWASP 框架高度对齐。建议企业用户对照清单逐项检查。

查看原文返回资讯列表
API2D🇨🇳 国内推荐

国内直连 OpenAI/Claude API,无需科学上网,按量计费

立即体验 →

推广链接