OpenAI 联手 Broadcom 发布 Jalapeño：首款自研 AI 推理芯片

原文来源：TechCrunch 和 OpenAI Blog — OpenAI 推出首款自研 AI 推理芯片，由 Broadcom 代工设计，计划 2026 年底部署。

2026 年 6 月 24 日，OpenAI 与 Broadcom 联合发布了 Jalapeño——OpenAI 首款自研定制 AI 芯片，专为大规模 LLM 推理场景设计。这是 OpenAI 从模型公司向全栈 AI 基础设施公司转型的关键一步。

芯片定位：纯推理加速器

Jalapeño 被 OpenAI 称为"智能处理器"（Intelligence Processor），是纯推理芯片——专注于运行已训练好的 AI 模型来响应用户请求，而非用于模型训练。训练任务短期内仍将依赖 Nvidia GPU。

这一选择非常务实。推理是 AI 真正触达用户的环节，也是成本大头。每次 ChatGPT 回复、每个 API 调用、每段 Codex 代码补全，背后都是推理计算。即使只降低推理成本的一小部分，对 OpenAI 的运营开支也是巨大改善。

—— 广告 ——

性能与设计

据 Broadcom CEO Hock Tan 透露，Jalapeño 的性能与 Nvidia Blackwell 和 Google TPU 相当。OpenAI 硬件负责人 Richard Ho 表示，芯片在实验室中已成功运行 GPT-5.3-Codex-Spark 模型，达到了目标频率和功耗指标。

OpenAI 强调，Jalapeño 的每瓦性能显著优于当前业界最优方案。它结合了顶级 AI 加速器的吞吐能力与专用推理系统的低延迟特性——这对交互式 LLM 产品的大规模部署非常关键。

芯片设计上有几个值得关注的点：

从零开始设计，不是现有加速器的改造版
针对现代 LLM 推理工作负载全面优化（计算、内存、网络三者平衡）
对 OpenAI 研究者深入洞察 LLM 的运行模式——知道哪些内核、哪些内存访问模式、哪些服务策略最重要
减少数据搬运是核心优化思路

开发速度：9 个月从设计到流片

Jalapeño 最令人惊讶的是开发周期——仅 9 个月就从立项走到流片（tape-out）。OpenAI 称之为"高性能先进半导体领域有史以来最快的 ASIC 开发周期"。

这背后有三大因素：

深度软硬件协同开发：OpenAI 的工程师团队与 Broadcom 的芯片团队紧密配合
Broadcom 的硅实现专长：作为定制芯片设计领域的老手，Broadcom 经验丰富
AI 辅助设计：OpenAI 使用自己的模型来辅助芯片设计流程——"服务于用户的模型也在帮助改进未来模型运行的基础设施"

供应链与部署

制造：台积电（TSMC）
服务器系统：Celestica 独家集成（板卡、机架、系统）
数据中心部署：微软作为数据中心合作伙伴
部署时间：2026 年底首批投产

Jalapeño 是一个多代芯片平台的第一代。OpenAI 与 Broadcom 的目标是最终部署吉瓦级的数据中心。

战略意义

Jalapeño 的核心战略价值在于降低对外部 GPU 供应商的依赖。这已是 AI 行业的普遍趋势——Google 有 TPU、Amazon 有 Trainium、Meta 也在自研芯片。

OpenAI 总裁 Greg Brockman 在内部播客中解释了这个决策：

"我们对自己的工作负载有深入理解。我们一直在寻找那些现有方案没有很好服务的工作负载，思考如何构建能加速更多可能性的硬件。"

对 OpenAI 而言，自研芯片强化了它的飞轮效应：更好的基础设施 → 更高的计算效率 → 更好的训练和服务 → 更强大的模型 → 更好的产品 → 更多的使用和收入 → 投资下一代基础设施。

行业反响

芯片行业对这一发布反应积极。Jalapeño 在性能上对标 Nvidia Blackwell，说明定制 ASIC 在推理场景下已能与通用 GPU 正面竞争。而对 Nvidia 而言，虽然训练市场短期内不会受到威胁，但推理市场——这个规模更大的蛋糕——正面临越来越多定制芯片的蚕食。

值得注意的是，Anthropic 也在考虑自研 AI 芯片（Reuters 2026 年 4 月报道）。AI 芯片军备竞赛正在从"谁的 GPU 多"转向"谁的定制芯片好"。

下一步

OpenAI 表示将在未来几个月发布更详细的技术报告。Jalapeño 将在 2026 年底首先部署在 OpenAI 内部生产环境中，为其 ChatGPT、API 和 Codex 等产品提供底层算力。

这场芯片竞赛的最终受益者将是终端用户。当每个大模型公司都在优化自己的推理基础设施，意味着更快、更便宜、更可靠的 AI 服务——这正是全栈垂直整合的终极价值。

OpenAI 联手 Broadcom 发布 Jalapeño：首款自研 AI 推理芯片

芯片定位：纯推理加速器

性能与设计

开发速度：9 个月从设计到流片

供应链与部署

战略意义

行业反响

下一步

相关文章

我猜 Anthropic 和 OpenAI 终于找到了产品市场契合点

OpenAI 如何为 9 亿用户构建低延迟语音 AI：WebRTC 架构深度解析

2026 年 AI Agent 框架选型指南：8 大框架横向对比