
OpenAI 联手 Broadcom 发布 Jalapeño:首款自研 AI 推理芯片
OpenAI 与 Broadcom 合作推出首款定制 AI 推理芯片 Jalapeño,专为 LLM 推理优化,性能对标 Nvidia Blackwell 和 Google TPU,计划 2026 年底部署。
原文来源:TechCrunch 和 OpenAI Blog — OpenAI 推出首款自研 AI 推理芯片,由 Broadcom 代工设计,计划 2026 年底部署。
2026 年 6 月 24 日,OpenAI 与 Broadcom 联合发布了 Jalapeño——OpenAI 首款自研定制 AI 芯片,专为大规模 LLM 推理场景设计。这是 OpenAI 从模型公司向全栈 AI 基础设施公司转型的关键一步。
芯片定位:纯推理加速器
Jalapeño 被 OpenAI 称为"智能处理器"(Intelligence Processor),是纯推理芯片——专注于运行已训练好的 AI 模型来响应用户请求,而非用于模型训练。训练任务短期内仍将依赖 Nvidia GPU。
这一选择非常务实。推理是 AI 真正触达用户的环节,也是成本大头。每次 ChatGPT 回复、每个 API 调用、每段 Codex 代码补全,背后都是推理计算。即使只降低推理成本的一小部分,对 OpenAI 的运营开支也是巨大改善。
—— 广告 ——
性能与设计
据 Broadcom CEO Hock Tan 透露,Jalapeño 的性能与 Nvidia Blackwell 和 Google TPU 相当。OpenAI 硬件负责人 Richard Ho 表示,芯片在实验室中已成功运行 GPT-5.3-Codex-Spark 模型,达到了目标频率和功耗指标。
OpenAI 强调,Jalapeño 的每瓦性能显著优于当前业界最优方案。它结合了顶级 AI 加速器的吞吐能力与专用推理系统的低延迟特性——这对交互式 LLM 产品的大规模部署非常关键。
芯片设计上有几个值得关注的点:
- 从零开始设计,不是现有加速器的改造版
- 针对现代 LLM 推理工作负载全面优化(计算、内存、网络三者平衡)
- 对 OpenAI 研究者深入洞察 LLM 的运行模式——知道哪些内核、哪些内存访问模式、哪些服务策略最重要
- 减少数据搬运是核心优化思路
开发速度:9 个月从设计到流片
Jalapeño 最令人惊讶的是开发周期——仅 9 个月就从立项走到流片(tape-out)。OpenAI 称之为"高性能先进半导体领域有史以来最快的 ASIC 开发周期"。
这背后有三大因素:
- 深度软硬件协同开发:OpenAI 的工程师团队与 Broadcom 的芯片团队紧密配合
- Broadcom 的硅实现专长:作为定制芯片设计领域的老手,Broadcom 经验丰富
- AI 辅助设计:OpenAI 使用自己的模型来辅助芯片设计流程——"服务于用户的模型也在帮助改进未来模型运行的基础设施"
供应链与部署
- 制造:台积电(TSMC)
- 服务器系统:Celestica 独家集成(板卡、机架、系统)
- 数据中心部署:微软作为数据中心合作伙伴
- 部署时间:2026 年底首批投产
Jalapeño 是一个多代芯片平台的第一代。OpenAI 与 Broadcom 的目标是最终部署吉瓦级的数据中心。
战略意义
Jalapeño 的核心战略价值在于降低对外部 GPU 供应商的依赖。这已是 AI 行业的普遍趋势——Google 有 TPU、Amazon 有 Trainium、Meta 也在自研芯片。
OpenAI 总裁 Greg Brockman 在内部播客中解释了这个决策:
"我们对自己的工作负载有深入理解。我们一直在寻找那些现有方案没有很好服务的工作负载,思考如何构建能加速更多可能性的硬件。"
对 OpenAI 而言,自研芯片强化了它的飞轮效应:更好的基础设施 → 更高的计算效率 → 更好的训练和服务 → 更强大的模型 → 更好的产品 → 更多的使用和收入 → 投资下一代基础设施。
行业反响
芯片行业对这一发布反应积极。Jalapeño 在性能上对标 Nvidia Blackwell,说明定制 ASIC 在推理场景下已能与通用 GPU 正面竞争。而对 Nvidia 而言,虽然训练市场短期内不会受到威胁,但推理市场——这个规模更大的蛋糕——正面临越来越多定制芯片的蚕食。
值得注意的是,Anthropic 也在考虑自研 AI 芯片(Reuters 2026 年 4 月报道)。AI 芯片军备竞赛正在从"谁的 GPU 多"转向"谁的定制芯片好"。
下一步
OpenAI 表示将在未来几个月发布更详细的技术报告。Jalapeño 将在 2026 年底首先部署在 OpenAI 内部生产环境中,为其 ChatGPT、API 和 Codex 等产品提供底层算力。
这场芯片竞赛的最终受益者将是终端用户。当每个大模型公司都在优化自己的推理基础设施,意味着更快、更便宜、更可靠的 AI 服务——这正是全栈垂直整合的终极价值。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://www.aprilzz.com/ai/openai-jalapeno-chip
相关文章
我猜 Anthropic 和 OpenAI 终于找到了产品市场契合点
2026 年 4 月,两大 AI 实验室同步调整企业定价策略,将订阅费与 API 实际用量挂钩。Simon Willison 分析认为,这正是 AI 公司找到产品市场契合点(PMF)的信号——尤其是编程代理产品爆发的时刻。
OpenAI 如何为 9 亿用户构建低延迟语音 AI:WebRTC 架构深度解析
OpenAI 工程博客详解如何在 Kubernetes 上以 Relay + Transceiver 架构支撑 ChatGPT Voice 和 Realtime API 的全球实时语音服务。
2026 年 AI Agent 框架选型指南:8 大框架横向对比
LangGraph、CrewAI、AutoGen、OpenAI Agents SDK、Google ADK、Dify、Mastra、Semantic Kernel — 八款主流 AI Agent 框架深度对比,从架构设计到生产部署,帮你找到最适合你的那一个。