
OpenRouter Fusion:让多个 AI 模型「陪审团」共同为你决策
OpenRouter 在 2026 年 6 月发布 Fusion 功能,让用户一次调用即可自动召集多个顶尖 AI 模型并行分析同一问题,再由判官模型输出共识、分歧和盲点分析。这标志着 LLM 使用从「单模型对话」迈向「多模型协作」的关键转变。
2026 年 6 月中旬,OpenRouter 正式发布了 Fusion 功能。这不是一个简单的"多模型代理"轮询工具,而是一套精心设计的多模型协作机制:你向一个端点发出请求,Fusion 会自动召集一组专家模型并行分析你的问题,一个判官模型比较所有答案,输出结构化分析报告——共识在哪、分歧在哪、谁遗漏了什么、谁有独特洞见——最后你的外层模型基于这份分析写出最终答案。
从本质上说,Fusion 把 LLM 的使用从"单模型问答"升级成了"多模型陪审团决策"。
为什么要做多模型陪审团?
先想一个问题:当你问一个模型"气候税的最有力支持和反对论点是什么"时,你得到的是这个模型自己认为最好的答案。但如果同时让 5 个不同的模型各自回答,然后比较它们的答案呢?
你得到的不再是"一个模型认为的最佳答案",而是:
- 共识区域:大多数模型都认同的内容——通常置信度更高
- 分歧区域:模型之间意见不一的地方——往往是最值得展开讨论的部分
- 覆盖缺口:某些模型覆盖了而其他模型遗漏的关键点
- 盲点:所有模型都没有涉及的内容
这就是 Fusion 的设计思想。对于研究类问题、需要专家级评判的任务、或者"错了代价很高"的决策场景,这种多模型协作的方式比依赖单一模型要可靠得多。
—— 广告 ——
工作原理
Fusion 的工作流程分三步:
第一步:你发送请求到 model: "openrouter/fusion"。OpenRouter 自动注入一个工具 openrouter:fusion 到你的模型中。
第二步:你的外层模型决定是否需要"陪审团"参与。如果需要,它调用该工具。此时:
- Panel(专家组):一组模型(默认是 Claude Opus、GPT、Gemini Pro)并行回答你的问题,每个模型都启用了网页搜索和网页抓取能力
- Judge(判官):收到所有 Panel 的响应后,判官模型(默认使用你正在用的外层模型)进行比较分析,输出结构化的 JSON 报告
第三步:你的外层模型收到这份分析报告,基于共识、矛盾和独特见解写出最终答案。
有意思的是,Fusion 的设计保证了只有当模型判断"这个问题需要多模型协作"时才会触发陪审团——简单问题模型直接回答,无需耗费额外资源。
两种使用方式
方式一:模型别名(最简单的用法)
{
"model": "openrouter/fusion",
"messages": [
{ "role": "user", "content": "碳税的最有力支持和反对论据是什么?专家们在哪里存在分歧?" }
]
}一行代码都不需要改原有的调用结构,只是把 model 名称改成 openrouter/fusion。OpenRouter 自动帮你完成所有 Panel 调度和 Judge 分析。
方式二:Server Tool(精细控制)
const completion = await openRouter.chat.send({
model: '~anthropic/claude-opus-latest',
messages: [{ role: 'user', content: '比较 Ridge、Lasso 和 Elastic-Net 回归。' }],
tools: [{
type: 'openrouter:fusion',
parameters: {
analysis_models: [
'~anthropic/claude-opus-latest',
'~openai/gpt-latest',
'~google/gemini-pro-latest'
],
model: '~openai/gpt-latest',
},
}],
});这种方式让你可以自定义 Panel 的模型组合,并指定哪个模型作为判官,适合对模型组合有特定要求的场景。
配置选项
| 参数 | 默认值 | 说明 |
|---|---|---|
analysis_models | Claude Opus + GPT + Gemini Pro | Panel 成员(1-8 个),并行回答 |
model | 你的外层模型 | 判官模型,生产结构化分析 JSON |
max_tool_calls | 8 | Panel/Judge 每次调用的最大工具步数 (1-16) |
max_completion_tokens | Provider 默认 | Panel/Judge 每次调用的最大输出 token |
temperature | Provider 默认 | Panel/Judge 的采样温度参数 |
还可以通过 tool_choice: "required" 强制在每次请求中都触发 Fusion 评审——这在你想要始终保持"多模型共识"评估一致性时会很有用。
Fusion 的实际价值与局限
Fusion 最大的价值在于提升了答案的鲁棒性和完整性。单模型受限于其训练数据、偏好校准和推理路径,往往会形成固定的"盲点"。多个模型从不同的训练分布和架构角度分析同一个问题,天然地相互补充。
但也有局限性需要考虑:
- 成本和延迟:每次 Fusion 调用意味着多个模型的并行推理,成本是单模型的数倍,延迟也更长
- 判官偏差:判官模型自身的偏好仍然会影响最终分析的权重分配
- 共识不等于正确:多数模型同意的地方不一定就是正确答案
- 适用场景有限:对于简单问答或代码生成,单模型就足够,Fusion 的多模型协作是"大炮打蚊子"
我的看法
Fusion 的意义不在于"模型轮询"这个技术——模型编排不是什么新鲜事。它的真正价值在于把"多模型协作"降维成了一个 API 端点。以前你要自己写编排逻辑、处理并行请求、解析多个输出再做交叉对比,现在一个 model: "openrouter/fusion" 就解决了。
这种"极简接入"模式意味着多模型协作不再是只有大型团队才承担得起的奢侈,而是任何一个开发者都能用一行配置获得的"基础设施"能力。随着模型越来越多、越来越专,如何选择和组合模型将成为新的核心竞争力——而 Fusion 提供了一个优雅的起点。
原文来源:OpenRouter Fusion 文档 — OpenRouter Fusion 是 2026 年 6 月发布的多模型协作特性,通过一次调用即可实现多模型并行推理与判官分析。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://aprilzz.com/ai/openrouter-fusion
相关文章
MiniMax M3:首个将前沿编码、百万上下文和原生多模态集于一体的开源模型
MiniMax M3 于 2026 年 6 月 1 日正式发布,是首个将前沿级编码能力、百万 token 上下文窗口和原生多模态能力集于一体的开源权重模型。MSA 稀疏注意力架构将超长上下文推理成本降至传统的 1/20。
Code with Claude 2026 大会亲历记:AI 原生的工程组织长什么样
Anthropic 第二届 Code with Claude 开发者大会的完整回顾:上下文窗口的困局、瓶颈的转移、AI 原生团队的重组方式,以及 Robobun 背后工程范式转变的启示。
NVIDIA 开源物理 AI Agent 工具集:机器人、自动驾驶、工业数字孪生的新范式
NVIDIA 在 GTC Taipei 2026 上宣布开源其物理 AI Agent 工具和技能库,覆盖 Omniverse、Cosmos、Isaac、Metropolis 全线产品,让 AI Agent 可以直接操作机器人、自动驾驶和工业数字孪生系统,已有多个企业实战案例验证。