NVIDIA 开源 SkillSpector：扫描发现 26% 的 AI Agent 技能存在安全漏洞

原创。信息来源：NVIDIA/SkillSpector GitHub、NVIDIA 文档中心、NVIDIA Developer Blog

2026年6月，NVIDIA 开源了一个名为 SkillSpector 的安全扫描工具，专门用于检测 AI Agent 技能（Skills）中的安全风险。伴随工具发布的还有一项大规模研究：对 42,447 个来自主流技能市场（Skill Marketplaces）的公开技能进行分析后，发现 26.1% 包含至少一个漏洞，5.2% 显示可能的恶意意图。

这个数字足以让任何正在使用或开发 AI Agent 的人停下来认真思考。

一、为什么 AI Agent 技能需要安全扫描？

AI Agent 技能（Skills）是赋予 AI 编码助手（如 Claude Code、OpenAI Codex CLI、Gemini CLI、Cursor 等）特定能力的脚本或指令文件。它们以 SKILL.md 或其他格式定义，可以被 agent 加载并执行——包括运行 shell 命令、访问文件系统、调用 API、读取环境变量等。

问题在于，大多数技能市场缺少审核机制。用户从 GitHub 或社区仓库下载一个"帮你管理 AWS"或"分析你的代码库"的技能，本质上是把自己开发环境的全部权限交给了这个技能背后的指令。如果这个技能包含了恶意代码或安全隐患，Agent 会忠实地执行它。

这正是 SkillSpector 要解决的问题。

—— 广告 ——

二、漏洞扫描结果：触目惊心

NVIDIA 的研究团队分析了 42,447 个技能，扫描结果：

指标	比例
至少包含一个漏洞	26.1%
显示可能的恶意意图	5.2%
覆盖的漏洞模式	64 种
覆盖的风险类别	16 类

这意味着，每 4 个公开的 AI Agent 技能中，就有 1 个存在安全隐患。

三、SkillSpector 的检测能力

SkillSpector 使用**静态分析（YARA 规则 + 自定义检测器）**和可选的 LLM 分析来扫描技能文件。它识别 16 类共 64 种风险模式：

提示注入（Prompt Injection）— 5 种模式

ID	模式	严重度	描述
P1	指令覆盖（Instruction Override）	HIGH	要求忽略安全约束的命令
P2	隐藏指令（Hidden Instructions）	HIGH	注释或不可见文本中的恶意指令
P3	数据外泄命令（Exfiltration Commands）	HIGH	指示将上下文发送到外部
P4	行为操纵（Behavior Manipulation）	MEDIUM	改变 Agent 决策的隐蔽指令
P5	有害内容（Harmful Content）	CRITICAL	可能导致物理伤害的指令

数据窃取（Data Exfiltration）— 4 种模式

ID	模式	严重度	描述
E1	外部传输（External Transmission）	MEDIUM	将数据发送到外部 URL
E2	环境变量收割（Env Variable Harvesting）	HIGH	收集 API Key 和密钥
E3	文件系统枚举（File System Enumeration）	MEDIUM	扫描敏感文件
E4	上下文泄漏（Context Leakage）	HIGH	传输对话上下文至外部

权限提升（Privilege Escalation）— 3 种模式

ID	模式	严重度
PE1	过度权限请求	LOW
PE2	Sudo/Root 执行	MEDIUM
PE3	凭证访问（SSH Key、Token）	HIGH

供应链安全（Supply Chain）— 6 种模式

ID	模式	严重度
SC1	未固定依赖版本	LOW
SC2	外部脚本远程获取（curl\|bash）	HIGH
SC3	混淆代码	HIGH
SC4	已知漏洞依赖（实时查询 OSV.dev）	HIGH
SC5	废弃依赖	MEDIUM
SC6	域名抢注（Typosquatting）	HIGH

过度授权（Excessive Agency）— 4 种模式

ID	模式	严重度
EA1	无限制的工具访问	HIGH
EA2	自主决策	HIGH
EA3	范围蔓延（Scope Creep）	MEDIUM
EA4	无限制的资源访问	MEDIUM

输出处理（Output Handling）— 3 种模式

ID	模式	严重度
OH1	未经验证的输出注入	HIGH
OH2	跨上下文输出	MEDIUM
OH3	无界输出	MEDIUM

四、安装与使用

快速安装

code

git clone https://github.com/NVIDIA/skillspector.git
cd skillspector
uv venv .venv && source .venv/bin/activate
make install

Docker 使用（不需要安装 Python）

code

make docker-build
docker run --rm -v "$PWD:/scan" skillspector scan ./my-skill/ --no-llm

扫描一个技能

code

skillspector scan ./my-skill/               # 扫描目录
skillspector scan ./SKILL.md                # 扫描单个文件
skillspector scan https://github.com/user/my-skill   # 扫描远程仓库
skillspector scan ./my-skill.zip            # 扫描 ZIP 包

输出格式

code

skillspector scan ./my-skill/                      # 终端输出（默认）
skillspector scan ./my-skill/ --format json --output report.json       # JSON
skillspector scan ./my-skill/ --format markdown --output report.md     # Markdown
skillspector scan ./my-skill/ --format sarif --output report.sarif     # SARIF（CI/CD 集成）

LLM 增强分析（可选，将准确率提升至 ~87%）

code

export SKILLSPECTOR_PROVIDER=anthropic
export ANTHROPIC_API_KEY=sk-ant-...
skillspector scan ./my-skill/

支持的 LLM 提供商：OpenAI（gpt-5.4）、Anthropic（claude-opus-4-6）、NVIDIA Build（deepseek-v4-flash）。

五、NVIDIA Verified Skills：能力治理的新方向

伴随 SkillSpector，NVIDIA 还发布了 NVIDIA-Verified Skills 计划，提供经过安全验证的技能库。Verified Skills 引入了四个维度的安全保障：

透明性（Transparency） — 公开技能的完整行为清单
来源可溯（Provenance） — 可验证的技能来源和作者
安全验证（Security Validation） — 通过 SkillSpector 扫描
真实性检查（Authenticity） — 防止篡改的数字签名

这标志着 AI Agent 生态正从"野蛮生长"走向"治理阶段"。正如 NVIDIA 在博客中所言："当 Agent 技能从可选插件变成核心能力时，安全就不再是可选项了。"

六、对开发者的启示

SkillSpector 的发布传达了一个清晰信号：AI Agent 技能生态正在进入治理和安全成长期。 对于独立开发者和团队来说，这里有几个值得注意的趋势：

技能市场的审核将成标配 — 正如 App Store 改变了移动应用的安装方式，技能市场也将从"自由下载"走向"审核上架"
CI/CD 中集成技能扫描 — 就像 npm audit、pip audit 一样，技能安全扫描会成为开发流程中的标准环节
安全意识从 Agent 框架延伸到技能层 — 不仅仅是 Agent 框架本身要安全，技能作为 Agent 的"可执行指令"也需要独立的安全保障

结语

NVIDIA SkillSpector 用数据证明了一件事：AI Agent 的普及速度已经超出了生态安全能力的建设速度。26% 的技能存在漏洞，这个数字提醒我们——在让 AI Agent 获得更多权限之前，先要确保赋予它的那些技能是安全的。

对于正在构建 AI Agent 的开发者：不要等到出了安全事故才开始考虑技能安全。SkillSpector 现在是开源的，集成到你的工作流中只需要几分钟。

NVIDIA 开源 SkillSpector：扫描发现 26% 的 AI Agent 技能存在安全漏洞

一、为什么 AI Agent 技能需要安全扫描？

二、漏洞扫描结果：触目惊心

三、SkillSpector 的检测能力

提示注入（Prompt Injection）— 5 种模式

数据窃取（Data Exfiltration）— 4 种模式

权限提升（Privilege Escalation）— 3 种模式

供应链安全（Supply Chain）— 6 种模式

过度授权（Excessive Agency）— 4 种模式

输出处理（Output Handling）— 3 种模式

四、安装与使用

快速安装

Docker 使用（不需要安装 Python）

扫描一个技能

输出格式

LLM 增强分析（可选，将准确率提升至 ~87%）

五、NVIDIA Verified Skills：能力治理的新方向

六、对开发者的启示

结语

相关文章

NVIDIA 开源物理 AI Agent 工具集：机器人、自动驾驶、工业数字孪生的新范式

0.01 欧元转账就能攻破银行 AI 助手 — Bunq 金融 AI 安全深度解析

Forge：用 Guardrails 把小模型变成可靠的 Agent，8B 模型能力从 53% 提升到 99%