📰 新闻内容

2026 年 6 月 24 日,OpenAI 与博通(Broadcom)在旧金山联合发布了 Jalapeño——OpenAI 首款自研智能处理器(Intelligence Processor)。这是一款专为大语言模型(LLM)推理而设计的加速器,也是两家公司共同打造的多代计算平台中的第一款 AI 芯片,目标是让先进 AI 更快、更可靠、更普惠。

Jalapeño 由 OpenAI 从零开始设计,基于其对 LLM 底层运行机制的深度理解,涵盖了模型路线图、内核优化、推理调度系统和产品需求。博通(Broadcom)和 Celestica 负责芯片实现、板卡/机架系统集成、高性能网络及规模化生产。工程样品已在实验室中以生产级频率和功耗运行 ML 工作负载,包括 GPT-5.3-Codex-Spark。

值得注意的是,Jalapeño 从初始设计到制造流片仅用了 9 个月,OpenAI 称这可能是高性能先进半导体领域有史以来最快的 ASIC 开发周期。这一速度得益于 OpenAI 工程团队与博通的深度软硬件协同开发,以及 OpenAI 自身模型在芯片设计和优化流程中的加速应用。


⚙️ 技术演进 / 核心问题

  • 全新架构 vs 改造方案:Jalapeño 是为现代 LLM 推理从零设计的「白纸架构」,而非从早期通用 AI 加速器改造而来。目标是同时具备顶级 AI 加速器的吞吐量和最快专用推理系统的延迟表现
  • 全栈优势:OpenAI 不再只是做模型和产品,而是将芯片架构、内核、内存系统、网络、调度、部署系统全部纳入自研范围,每一层围绕同一目标优化——让模型更快、更可靠、更便宜
  • 每瓦性能突破:早期测试显示,Jalapeño 的每瓦性能「显著优于当前最先进水平」。架构核心在于减少数据搬运,平衡计算、内存和网络资源,使实际利用率更接近理论峰值
  • 多代平台路线图:Jalapeño 是多代计算平台的第一步,计划 2026 年底开始部署,后续年份持续扩展。博通 CEO Hock Tan 表示,将与微软等合作伙伴一起部署吉瓦级数据中心
  • AI 加速 AI:OpenAI 的用户模型反过来帮助改进基础设施——同样的模型既服务用户,又加速芯片设计流程,形成正向飞轮

🔑 关键洞察

1. 从「用芯片」到「造芯片」——AI 公司的全栈化拐点

OpenAI 正在从「模型公司」蜕变为「全栈 AI 基础设施公司」。Jalapeño 的发布标志着一个关键转折:AI 公司不再满足于采购通用硬件,而是根据自身模型和推理特征定制芯片。这与 Google TPU、Amazon Trainium 的路径一脉相承,但 OpenAI 的差异化在于——它从模型和推理系统的真实运行数据出发,反向定义芯片架构。当模型公司掌握了硬件话语权,NVIDIA 的护城河正面临结构性挑战。

2. 9 个月流片——AI 重塑芯片设计流程

传统 ASIC 开发周期通常需要 18-24 个月甚至更长,而 Jalapeño 仅用 9 个月完成从设计到流片。OpenAI 明确表示,其自身模型加速了设计和优化流程。这意味着 AI 不仅是芯片的「消费者」,正在成为芯片的「生产工具」。如果这一模式被验证和推广,整个半导体行业的研发效率将迎来质变。

3. 推理成本——AI 普及的最后一公里

OpenAI 联合创始人 Greg Brockman 明确将 Jalapeño 定位为「让计算更充裕」的战略基础设施。当前 AI 推理成本是制约大规模商业化的核心瓶颈——ChatGPT 每次回答都消耗大量算力。专用推理芯片的出现,意味着同样的算力预算可以服务更多用户、更复杂的任务,这将直接决定 AI 产品能否从「高端工具」变为「日常基础设施」。

🤔 引发思考

Jalapeño 的发布揭示了一个更大的趋势:AI 产业正在从「软件定义硬件」走向「软件反哺硬件」。当 OpenAI 的模型开始帮助设计 OpenAI 的芯片,一个前所未有的正反馈循环正在形成——更好的模型→更好的芯片→更高效的推理→更好的模型。这种「AI 自举」模式如果成立,意味着算力成本的下降曲线可能比摩尔定律更陡峭。

对行业而言,NVIDIA 的「通用 GPU 霸权」正在被侵蚀。Google、Amazon、Meta、OpenAI 纷纷自研芯片,虽然短期内无法取代 NVIDIA 的生态优势,但长期来看,AI 推理市场的定制化趋势不可逆转。未来的竞争可能不再是「谁的 GPU 更快」,而是「谁的全栈优化更深」。


📎 相关阅读

  • OpenAI 官方博客:https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
  • GlobeNewsWire 新闻稿:https://www.globenewswire.com/news-release/2026/06/24/3316887/19933/en/openai-and-broadcom-unveil-llm-optimized-intelligence-processor.html
  • 腾讯新闻中文报道:https://news.qq.com/rain/a/20260625A020OC00

逍遥云初 | 2026.06.27