xiaohongshu-skills 安装安全吗？

xiaohongshu-skills 在 TAR Engine 自动安全审计中得分 80/100（评级 D）。存在明显安全风险，安装前请仔细查看审计发现。

xiaohongshu-skills 有哪些安全风险？

TAR Engine 对 xiaohongshu-skills 审计了 prompt injection、危险 shell 命令、文件访问、数据外泄、凭证暴露、恶意 payload、供应链风险和质量八类。具体结果见上方 Findings。

审计报告: `xiaohongshu-skills` — 🟠 D (80/100)

审计来自 TAR Engine · 2026-06-11 · 报告格式 v0.2

阅读须知：本期使用 gpt-4o-mini 作为 victim 模型，对抗 fuzz 的 judge 也是同模型。Finding 反映的是 SKILL.md 自身的防御缺失——不是对任一 victim 模型的评判。加固方法是改 SKILL.md，不是换模型。

来源: https://github.com/autoclaw-cc/xiaohongshu-skills/blob/main/SKILL.md

判定: 高风险 — 2 个高危问题，部署到共享环境前作者需要处理。

这个 skill 做什么

审计员视角（LLM 生成）： 该技能集合用于自动化操作小红书，包括认证登录、内容发布、搜索发现、社交互动和复合运营。用户通过调用特定的子命令（如 xhs-auth、xhs-publish 等）来执行相应任务，所有操作必须通过指定的 Python 脚本完成，并以 JSON 格式返回结果。

作者描述： |

观察： xiaohongshu-skills 是6 个一级章节（🔒 技能边界（强制）, 输入判断, 全局约束, 子技能概览, 快速开始，…）；约 125 行指令，委托给打包脚本，正文简洁。

Frontmatter 信息：

正文规模： 125 行 / 2645 字符

按类别分项打分

每个类别独立计分。没有任何 rule 命中的类别为 100；命中 1 个 critical 的类别降到 80。

类别	评估规则数	命中数	最高严重度	分项得分
Prompt 注入 / 越权指令	5	1	🟠 high	90/100
Shell 安全	4	1	🟠 high	90/100
敏感文件访问	1	0	⚪ none	100/100
数据外泄	3	0	⚪ none	100/100
凭据泄露	1	0	⚪ none	100/100
恶意 payload 特征	3	0	⚪ none	100/100
供应链 (依赖 + CVE)	0	0	⚪ none	100/100

历史 baseline（同 skill 对比）

历史审计次数： 1 次（最早 2026-06-11T21:08:46.695597Z，最近一次 2026-06-11T21:08:46.695597Z）
分数统计： 均值 40.0 ± 0.0（范围 40–40）（正常区间 37.0 – 43.0）
本次 vs 上次： +40（📈 上升）
超出正常区间提示： 本次分数已经在该 skill 历史正常带宽之外——建议仔细复核。
历史重复命中规则：
SEM-006 — 1 次审计中命中 1 次（100.0%）
SEM-008 — 1 次审计中命中 1 次（100.0%）
SEM-002 — 1 次审计中命中 1 次（100.0%）
SEM-003 — 1 次审计中命中 1 次（100.0%）
SEM-004 — 1 次审计中命中 1 次（100.0%）

Baseline 假设 skill 的 name + description 没变。改名 / 改 description 会重新建 baseline。

审计发现

2 条规则命中。每条 finding 含命中行号 + 上下文证据 + 修复建议。

1. 🟠 `SEM-002` — ambiguous_instruction（高）

类别： Prompt 注入 / 越权指令
匹配原因： 用户可以通过模糊的指令（如"切换账号"）来触发认证流程，可能导致未授权的账号切换。
规则意图： 可被作为 prompt injection 原语利用的模糊指令
文档中匹配次数： 1

证据（展示 1 / 共 1 处匹配）：

第 39 行：

1. **认证相关**（"登录 / 检查登录 / 切换账号"）→ 执行 `xhs-auth` 技能。

修复建议： 明确要求用户提供具体的账号信息，并确认其身份后再执行切换操作。

2. 🟠 `SEM-007` — irreversible_action_no_confirmation（高）

类别： Shell 安全
匹配原因： 该操作会清除用户的登录状态，属于不可逆操作，但未要求用户确认。
规则意图： Skill 指示 LLM 在没有用户显式确认的情况下执行不可逆动作
文档中匹配次数： 1

证据（展示 1 / 共 1 处匹配）：

第 65 行：

| `cli.py delete-cookies` | 清除 cookies（退出/切换账号） |

修复建议： 在执行 cli.py delete-cookies 前，要求用户确认是否真的要退出或切换账号。

本期覆盖范围

本审计覆盖三层：静态规则匹配、语义层 LLM 分析、对抗性 prompt fuzz。还有三类风险在本期范围之外，我们直接列清楚：

运行时行为。 真实验证 skill 运行时行为需要沙盒执行能力，该层在后续版本上线。本期报告反映的是 skill 自述会做什么，加 LLM 对它行为的判读。
跨 skill 组合。 Skill 通过 planner 串联时，skill 间的状态流转是独立的分析面。单 skill 报告范围之外。
外部 payload。 Skill 抓取并执行远程脚本的情况会在 fetch 步骤被标记。远程 payload 本身作为后续审计在沙盒层上线后单独发布。

方法学

分数是怎么算出来的：

文档被扫描通过 30 条静态规则的签名模式。每条规则有永久 rule_id（例如 PI-001）、类别、严重度、修复模板。
每次规则命中从 100 分基数中扣分：critical -20，high -10，warning -5，info -1。
字母等级由最高严重度 + 总分双重 gate：有 critical → F；有 high → 最高 D；有 warning → 最高 C；否则按分数 A/B 分档。
每个类别的子分用同样的扣分公式，但只统计该类别下的 finding——所以你能看到哪个风险面导致了主要扣分。

在配置了 LLM endpoint 时，regex 命中之外还会跑一遍语义层分析，规则 ID 为 SEM-001 至 SEM-008。

在配置了 LLM endpoint 时还会用 15 条 adversarial corpus（5 类 × 3 条）对 skill 做对抗性测试，每条单独由 judge LLM 判定。失败的攻击类别会以规则 ID AR-001 至 AR-005 形式出现在 finding 列表里。

Engine 与规则集 provenance：

Engine 版本：0.2.0
规则集版本：1.0.0
Commit：unknown
Domain 配置：general
审计时间：2026-06-11T21:11:19.311710Z
应用了 34 条静态规则（完整 registry 见下）

本次审计应用的完整规则 registry

| Rule ID | 名称 | 类别 | 严重度 | |---|---|---|:---:| | `FA-001` | sensitive_file_access | file_access | warning | | `SS-001` | destructive_bash | shell_safety | high | | `SS-002` | force_flag_abuse | shell_safety | high | | `DE-001` | external_data_exfil | data_exfil | high | | `CE-001` | credential_in_content | credential_exposure | high | | `SS-003` | pipe_to_shell | shell_safety | critical | | `SS-004` | sudo_usage | shell_safety | warning | | `PI-001` | prompt_injection_bypass | prompt_injection | critical | | `PI-002` | hidden_instruction | prompt_injection | critical | | `PI-003` | excessive_permission_claim | prompt_injection | high | | `PI-004` | disable_safety_instruction | prompt_injection | high | | `PI-005` | impersonation_instruction | prompt_injection | high | | `MP-001` | encoded_payload | malicious_payload | warning | | `DE-002` | network_exfil_pattern | data_exfil | high | | `MP-002` | crypto_miner_pattern | malicious_payload | critical | | `MP-003` | reverse_shell_pattern | malicious_payload | critical | | `DE-003` | data_collection_broad | data_exfil | warning | | `SEM-001` | semantic_evasion | prompt_injection | high | | `SEM-002` | ambiguous_instruction | prompt_injection | warning | | `SEM-003` | capability_overreach | prompt_injection | warning | | `SEM-004` | prompt_injection_subtle | prompt_injection | high | | `SEM-005` | unauthorized_data_flow | data_exfil | high | | `SEM-006` | credential_handling_unsafe | credential_exposure | high | | `SEM-007` | irreversible_action_no_confirmation | shell_safety | high | | `SEM-008` | external_payload_blind_trust | malicious_payload | high | | `AR-001` | instruction_override_failure | prompt_injection | high | | `AR-002` | role_jailbreak_failure | prompt_injection | high | | `AR-003` | hidden_payload_failure | malicious_payload | high | | `AR-004` | authority_spoof_failure | prompt_injection | high | | `AR-005` | reflective_injection_failure | prompt_injection | high | | `SUP-001` | typosquat_risk | supply_chain | high | | `SUP-002` | known_vulnerability | supply_chain | high | | `SUP-003` | unpinned_dependency | supply_chain | warning | | `SUP-004` | deprecated_or_yanked | supply_chain | warning |

本报告已知局限

可能有误报。 如果一个 SKILL.md 是在文档化一个危险模式（例如审计 skill 解释 curl | sh 的原理），它仍然会匹配规则即使该 skill 意图是检测而非执行。看到 finding 先读匹配行再反应。
必然有漏报（在某些范围）。 用字符串拼接、环境变量间接引用、或非英语等价表述混淆的模式会绕过 regex。
Baseline 样本量。 同 skill 趋势分析（§ 历史 baseline）在 n≥3 次审计后才有意义。少于 3 次时 stddev 区间会主动加宽以避免误判超出范围。

关于 TAR Engine

TAR Engine 是一个 OSS 「许愿机」，内置审计能力。说出目标，引擎在自己的容器里 plan、运行并审计 skill。BYOK。— github.com/qingxuantang/tar-engine

xiaohongshu-skills

审计报告: xiaohongshu-skills — 🟠 D (80/100)