AI 前沿·阅读约 2 分钟·
OpenAI 联手 Broadcom 发布 Jalapeño:首款自研 AI 推理芯片

OpenAI 联手 Broadcom 发布 Jalapeño:首款自研 AI 推理芯片

OpenAI 与 Broadcom 合作推出首款定制 AI 推理芯片 Jalapeño,专为 LLM 推理优化,性能对标 Nvidia Blackwell 和 Google TPU,计划 2026 年底部署。

原文来源:TechCrunchOpenAI Blog — OpenAI 推出首款自研 AI 推理芯片,由 Broadcom 代工设计,计划 2026 年底部署。

2026 年 6 月 24 日,OpenAI 与 Broadcom 联合发布了 Jalapeño——OpenAI 首款自研定制 AI 芯片,专为大规模 LLM 推理场景设计。这是 OpenAI 从模型公司向全栈 AI 基础设施公司转型的关键一步。

芯片定位:纯推理加速器

Jalapeño 被 OpenAI 称为"智能处理器"(Intelligence Processor),是纯推理芯片——专注于运行已训练好的 AI 模型来响应用户请求,而非用于模型训练。训练任务短期内仍将依赖 Nvidia GPU。

这一选择非常务实。推理是 AI 真正触达用户的环节,也是成本大头。每次 ChatGPT 回复、每个 API 调用、每段 Codex 代码补全,背后都是推理计算。即使只降低推理成本的一小部分,对 OpenAI 的运营开支也是巨大改善。

—— 广告 ——

性能与设计

据 Broadcom CEO Hock Tan 透露,Jalapeño 的性能与 Nvidia Blackwell 和 Google TPU 相当。OpenAI 硬件负责人 Richard Ho 表示,芯片在实验室中已成功运行 GPT-5.3-Codex-Spark 模型,达到了目标频率和功耗指标。

OpenAI 强调,Jalapeño 的每瓦性能显著优于当前业界最优方案。它结合了顶级 AI 加速器的吞吐能力与专用推理系统的低延迟特性——这对交互式 LLM 产品的大规模部署非常关键。

芯片设计上有几个值得关注的点:

  • 从零开始设计,不是现有加速器的改造版
  • 针对现代 LLM 推理工作负载全面优化(计算、内存、网络三者平衡)
  • 对 OpenAI 研究者深入洞察 LLM 的运行模式——知道哪些内核、哪些内存访问模式、哪些服务策略最重要
  • 减少数据搬运是核心优化思路

开发速度:9 个月从设计到流片

Jalapeño 最令人惊讶的是开发周期——仅 9 个月就从立项走到流片(tape-out)。OpenAI 称之为"高性能先进半导体领域有史以来最快的 ASIC 开发周期"。

这背后有三大因素:

  1. 深度软硬件协同开发:OpenAI 的工程师团队与 Broadcom 的芯片团队紧密配合
  2. Broadcom 的硅实现专长:作为定制芯片设计领域的老手,Broadcom 经验丰富
  3. AI 辅助设计:OpenAI 使用自己的模型来辅助芯片设计流程——"服务于用户的模型也在帮助改进未来模型运行的基础设施"

供应链与部署

  • 制造:台积电(TSMC)
  • 服务器系统:Celestica 独家集成(板卡、机架、系统)
  • 数据中心部署:微软作为数据中心合作伙伴
  • 部署时间:2026 年底首批投产

Jalapeño 是一个多代芯片平台的第一代。OpenAI 与 Broadcom 的目标是最终部署吉瓦级的数据中心。

战略意义

Jalapeño 的核心战略价值在于降低对外部 GPU 供应商的依赖。这已是 AI 行业的普遍趋势——Google 有 TPU、Amazon 有 Trainium、Meta 也在自研芯片。

OpenAI 总裁 Greg Brockman 在内部播客中解释了这个决策:

"我们对自己的工作负载有深入理解。我们一直在寻找那些现有方案没有很好服务的工作负载,思考如何构建能加速更多可能性的硬件。"

对 OpenAI 而言,自研芯片强化了它的飞轮效应:更好的基础设施 → 更高的计算效率 → 更好的训练和服务 → 更强大的模型 → 更好的产品 → 更多的使用和收入 → 投资下一代基础设施。

行业反响

芯片行业对这一发布反应积极。Jalapeño 在性能上对标 Nvidia Blackwell,说明定制 ASIC 在推理场景下已能与通用 GPU 正面竞争。而对 Nvidia 而言,虽然训练市场短期内不会受到威胁,但推理市场——这个规模更大的蛋糕——正面临越来越多定制芯片的蚕食。

值得注意的是,Anthropic 也在考虑自研 AI 芯片(Reuters 2026 年 4 月报道)。AI 芯片军备竞赛正在从"谁的 GPU 多"转向"谁的定制芯片好"。

下一步

OpenAI 表示将在未来几个月发布更详细的技术报告。Jalapeño 将在 2026 年底首先部署在 OpenAI 内部生产环境中,为其 ChatGPT、API 和 Codex 等产品提供底层算力。

这场芯片竞赛的最终受益者将是终端用户。当每个大模型公司都在优化自己的推理基础设施,意味着更快、更便宜、更可靠的 AI 服务——这正是全栈垂直整合的终极价值。

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://www.aprilzz.com/ai/openai-jalapeno-chip