OWASP 发布 AI Agent 安全框架指南 1.0
OWASP 正式发布 AI Agent 安全评估框架,覆盖 12 类风险和完整审计清单。
OWASP·2026年4月23日
OWASP AI Agent 安全框架 1.0
12 类风险
- 提示注入:恶意输入操纵 Agent 行为
- 工具越权:Agent 调用超出授权范围的工具
- 数据泄露:Agent 输出包含敏感信息
- 供应链攻击:恶意 Skill/插件注入
- 身份冒充:Agent 被劫持冒充合法用户
- 拒绝服务:恶意触发大量工具调用
- 记忆投毒:篡改 Agent 长期记忆
- 权限提升:利用 Skill 漏洞获取更高权限
- 侧信道泄露:通过 Timing/Error 信息推断内部状态
- 合规违规:Agent 行为违反法规(GDPR、HIPAA 等)
- 模型后门:预训练模型中的恶意触发器
- 审计缺失:无法追溯 Agent 的关键决策
审计清单
- 所有工具调用有权限检查
- 敏感操作有人工确认环节
- Agent 输出经过脱敏过滤
- Skill 来源可信(认证/签名)
- 完整的决策审计日志
对 OpenClaw 用户的影响
OpenClaw 的 Skill 认证计划与 OWASP 框架高度对齐。建议企业用户对照清单逐项检查。