核心概念

三阶段渐进式加载

Hive-Mind 的核心创新是将技能加载拆分为三个阶段，避免在每次请求中将所有技能内容塞入 system prompt。

阶段 1: 发现 (Discovery)   → 仅加载 name + description（~100 tokens/技能）
阶段 2: 激活 (Activation)  → 路由匹配，仅加载 Top-K 技能完整内容
阶段 3: 执行 (Execution)   → LLM 驱动，按需调用脚本工具

阶段 1 — 发现

启动时扫描所有技能目录，仅解析 SKILL.md 的 frontmatter（name、description、tags），构建轻量索引并常驻内存。

50 个技能仅消耗 ~5,000 tokens
索引带 LRU 缓存，热路径无 IO

阶段 2 — 激活

用户消息到达时，关键词路由器在 LLM 调用之前匹配 Top-K 技能（<10ms，零 token 开销），仅对匹配到的 1-5 个技能加载完整 SKILL.md 内容。

路由纯本地计算，不消耗 LLM token
同时发现 scripts/、references/、assets/ 目录

阶段 3 — 执行

将匹配技能的指令注入 system prompt，调用 LLM。LLM 可以调用 run_script、call_skill 等工具完成任务。

Token 节省效果

注册技能数	传统方式 prompt/请求	渐进式 prompt/请求	节省
10	~1,700	~340	80%
20	~3,400	~340	90%
50	~8,500	~340	96%
100	~17,000	~340	98%

实测数据（6 技能，OpenRouter）：传统模式 prompt 3,249 tokens → 渐进式 836 tokens，节省 74.3%。

技能目录结构

my-skill/
├── SKILL.md              # 必需：元数据 + LLM 指令
├── scripts/              # 可选：可执行脚本
│   ├── run.sh
│   └── analyze.py
├── references/           # 可选：参考文档
│   └── guide.md
└── assets/               # 可选：模板和静态资源
    └── config.json

跨技能文件引用

技能的 SKILL.md body 中可以通过 markdown 链接引用其他目录的文件：

markdown

## 工作流

1. 加载通用规则 → [common-rules.md](../shared-standards/common-rules.md)
2. 加载框架规则 → [react-rules.md](../shared-standards/react-rules.md)

引擎在加载技能时自动提取这些链接，将目标文件加入 read_resource 工具的访问白名单。LLM 按照 body 中的工作流指示按需读取。无需额外配置，技能作者只需正常写 markdown 链接即可。

仅识别相对路径的本地文件链接（排除 http://、#anchor 等）
自动验证文件存在性，不存在的链接静默忽略
安全可控——只有 body 中明确写出的路径才被放行

技能路由

关键词路由（progressive 默认）

使用 KeywordAdapter（关键词匹配），支持：

完全匹配 / 部分匹配 / CJK 子串匹配
技能的 name、description、tags 均参与评分
中文、日文、韩文字符逐字提取 + 双字组合分词

架构预留了 BM25 路由接口（通过 @skill-tools/router 适配器），可在需要时启用。

LLM 驱动路由（llm-routed）

llm-routed 策略将路由决策交给 LLM，在技能数量多或用户意图模糊时效果显著优于关键词匹配。

工作流程采用两阶段 LLM 调用：

Phase 2a — LLM 路由：所有技能的 name + description 作为目录注入 system prompt，LLM 通过 activate_skill 工具选择需要的技能。引擎负责加载完整内容、安全校验、工具注册。
Phase 3 — 执行：如果有技能被激活，引擎发起第二次 LLM 调用，携带技能 body 和工具（run_script / read_resource 等）。如果 LLM 判断不需要技能，直接返回第一次调用的回答。

typescript

const hive = createHiveMind({
  models: { default: openai('gpt-4o') },
  skills: [{ type: 'local', path: './skills' }],
  loading: { strategy: 'llm-routed', maxActivatedSkills: 3 },
});

关键设计：

引擎保持对激活和执行的完全控制——activate_skill 仅是路由工具，不授予 LLM 文件系统访问权
支持单次对话中激活多个技能（多次 activate_skill 调用）
内置去重和数量限制（maxActivatedSkills）
显式指定 options.skills 时跳过 LLM 路由，走标准路径
可通过 catalogueTokenBudget 限制技能目录的 token 预算

技能链调用

技能在执行过程中可以通过 call_skill 工具调用其他技能：

用户输入 "翻译并总结这段文字"
  → smart-assistant 技能被激活
    → call_skill(translator, "翻译...")
    → call_skill(summarizer, "总结...")
  → 返回组合结果

内置防护：

递归深度限制（默认 5 层，可配置 maxCallDepth）
调用去重缓存（相同技能 + 相同消息自动返回缓存）
调用序号追踪（日志中 call_skill #N 便于排查）

MCP Client 集成

Hive-Mind 可以作为 MCP Client 连接外部 MCP Server，将 MCP 工具自动注入到 LLM 的工具链中。

配置

typescript

const hive = createHiveMind({
  models: { default: openai('gpt-4o') },
  skills: [{ type: 'local', path: './skills' }],
  mcp: {
    servers: [
      {
        name: 'filesystem',
        transport: { type: 'stdio', command: 'npx', args: ['-y', '@modelcontextprotocol/server-filesystem', '/tmp'] },
      },
      {
        name: 'github',
        transport: { type: 'streamable-http', url: 'http://localhost:3001/mcp' },
      },
    ],
    timeout: 30_000,
  },
});

支持的传输方式

传输方式	说明	适用场景
`stdio`	启动本地子进程，通过 stdin/stdout 通信	本地 MCP Server（文件系统、数据库等）
`sse`	HTTP + Server-Sent Events（旧版）	兼容旧版 MCP Server
`streamable-http`	HTTP 流式请求（推荐）	远程 MCP Server

工具命名约定

MCP 工具以 mcp__<serverName>__<toolName> 格式命名，与技能工具（run_script、call_skill）互不冲突：

mcp__filesystem__read_file
mcp__github__create_issue
mcp__database__query

惰性连接

MCP 连接在首次 run() / stream() 时自动建立，不在 createHiveMind() 时阻塞。后续调用复用已缓存的连接和工具列表。

资源释放

使用完毕后调用 dispose() 关闭 MCP 连接：

typescript

await hive.dispose();

错误处理

MCP Server 连接失败时不阻塞引擎，仅记录 warn 日志
工具调用超时返回 { error: "MCP tool call timed out" }
@modelcontextprotocol/sdk 未安装时给出明确安装提示

核心概念 ​

三阶段渐进式加载 ​

阶段 1 — 发现 ​

阶段 2 — 激活 ​

阶段 3 — 执行 ​

Token 节省效果 ​

技能目录结构 ​

跨技能文件引用 ​

技能路由 ​

关键词路由（progressive 默认） ​

LLM 驱动路由（llm-routed） ​

技能链调用 ​

MCP Client 集成 ​

配置 ​

支持的传输方式 ​

工具命名约定 ​

惰性连接 ​

资源释放 ​

错误处理 ​

核心概念

三阶段渐进式加载

阶段 1 — 发现

阶段 2 — 激活

阶段 3 — 执行

Token 节省效果

技能目录结构

跨技能文件引用

技能路由

关键词路由（progressive 默认）

LLM 驱动路由（llm-routed）

技能链调用

MCP Client 集成

配置

支持的传输方式

工具命名约定

惰性连接

资源释放

错误处理