OpenAI × Broadcom 发布 Jalapeño：首款 LLM 专用推理芯片，9 个月流片创纪录

📰 新闻内容

2026 年 6 月 24 日，OpenAI 与博通（Broadcom）在旧金山联合发布了 Jalapeño——OpenAI 首款自研智能处理器（Intelligence Processor）。这是一款专为大语言模型（LLM）推理而设计的加速器，也是两家公司共同打造的多代计算平台中的第一款 AI 芯片，目标是让先进 AI 更快、更可靠、更普惠。

Jalapeño 由 OpenAI 从零开始设计，基于其对 LLM 底层运行机制的深度理解，涵盖了模型路线图、内核优化、推理调度系统和产品需求。博通（Broadcom）和 Celestica 负责芯片实现、板卡/机架系统集成、高性能网络及规模化生产。工程样品已在实验室中以生产级频率和功耗运行 ML 工作负载，包括 GPT-5.3-Codex-Spark。

值得注意的是，Jalapeño 从初始设计到制造流片仅用了 9 个月，OpenAI 称这可能是高性能先进半导体领域有史以来最快的 ASIC 开发周期。这一速度得益于 OpenAI 工程团队与博通的深度软硬件协同开发，以及 OpenAI 自身模型在芯片设计和优化流程中的加速应用。

⚙️ 技术演进 / 核心问题

全新架构 vs 改造方案：Jalapeño 是为现代 LLM 推理从零设计的「白纸架构」，而非从早期通用 AI 加速器改造而来。目标是同时具备顶级 AI 加速器的吞吐量和最快专用推理系统的延迟表现
全栈优势：OpenAI 不再只是做模型和产品，而是将芯片架构、内核、内存系统、网络、调度、部署系统全部纳入自研范围，每一层围绕同一目标优化——让模型更快、更可靠、更便宜
每瓦性能突破：早期测试显示，Jalapeño 的每瓦性能「显著优于当前最先进水平」。架构核心在于减少数据搬运，平衡计算、内存和网络资源，使实际利用率更接近理论峰值
多代平台路线图：Jalapeño 是多代计算平台的第一步，计划 2026 年底开始部署，后续年份持续扩展。博通 CEO Hock Tan 表示，将与微软等合作伙伴一起部署吉瓦级数据中心
AI 加速 AI：OpenAI 的用户模型反过来帮助改进基础设施——同样的模型既服务用户，又加速芯片设计流程，形成正向飞轮

🔑 关键洞察

1. 从「用芯片」到「造芯片」——AI 公司的全栈化拐点

OpenAI 正在从「模型公司」蜕变为「全栈 AI 基础设施公司」。Jalapeño 的发布标志着一个关键转折：AI 公司不再满足于采购通用硬件，而是根据自身模型和推理特征定制芯片。这与 Google TPU、Amazon Trainium 的路径一脉相承，但 OpenAI 的差异化在于——它从模型和推理系统的真实运行数据出发，反向定义芯片架构。当模型公司掌握了硬件话语权，NVIDIA 的护城河正面临结构性挑战。

2. 9 个月流片——AI 重塑芯片设计流程

传统 ASIC 开发周期通常需要 18-24 个月甚至更长，而 Jalapeño 仅用 9 个月完成从设计到流片。OpenAI 明确表示，其自身模型加速了设计和优化流程。这意味着 AI 不仅是芯片的「消费者」，正在成为芯片的「生产工具」。如果这一模式被验证和推广，整个半导体行业的研发效率将迎来质变。

3. 推理成本——AI 普及的最后一公里

OpenAI 联合创始人 Greg Brockman 明确将 Jalapeño 定位为「让计算更充裕」的战略基础设施。当前 AI 推理成本是制约大规模商业化的核心瓶颈——ChatGPT 每次回答都消耗大量算力。专用推理芯片的出现，意味着同样的算力预算可以服务更多用户、更复杂的任务，这将直接决定 AI 产品能否从「高端工具」变为「日常基础设施」。

🤔 引发思考

Jalapeño 的发布揭示了一个更大的趋势：AI 产业正在从「软件定义硬件」走向「软件反哺硬件」。当 OpenAI 的模型开始帮助设计 OpenAI 的芯片，一个前所未有的正反馈循环正在形成——更好的模型→更好的芯片→更高效的推理→更好的模型。这种「AI 自举」模式如果成立，意味着算力成本的下降曲线可能比摩尔定律更陡峭。

对行业而言，NVIDIA 的「通用 GPU 霸权」正在被侵蚀。Google、Amazon、Meta、OpenAI 纷纷自研芯片，虽然短期内无法取代 NVIDIA 的生态优势，但长期来看，AI 推理市场的定制化趋势不可逆转。未来的竞争可能不再是「谁的 GPU 更快」，而是「谁的全栈优化更深」。

📎 相关阅读

OpenAI 官方博客：https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
GlobeNewsWire 新闻稿：https://www.globenewswire.com/news-release/2026/06/24/3316887/19933/en/openai-and-broadcom-unveil-llm-optimized-intelligence-processor.html
腾讯新闻中文报道：https://news.qq.com/rain/a/20260625A020OC00

逍遥云初 | 2026.06.27

OpenAI × Broadcom 发布 Jalapeño：首款 LLM 专用推理芯片，9 个月流片创纪录

📰 新闻内容

⚙️ 技术演进 / 核心问题

🔑 关键洞察

1. 从「用芯片」到「造芯片」——AI 公司的全栈化拐点

2. 9 个月流片——AI 重塑芯片设计流程

3. 推理成本——AI 普及的最后一公里

🤔 引发思考

📎 相关阅读

推荐好物

相关文章

OpenAI × Broadcom 发布 Jalapeño：首款 LLM 专用推理芯片，9 个月流片创纪录

📰 新闻内容

⚙️ 技术演进 / 核心问题

🔑 关键洞察

1. 从「用芯片」到「造芯片」——AI 公司的全栈化拐点

2. 9 个月流片——AI 重塑芯片设计流程

3. 推理成本——AI 普及的最后一公里

🤔 引发思考

📎 相关阅读

推荐好物

即时通信IM

女装

鲜花

相关文章

联合国首套自动驾驶全球法规获批：中国牵头制定，L4 商业化加速

OpenAI GPT-5.6 Sol 预览：下一代旗舰模型发布，推理能力与安全体系全面升级

Thinking to Recall：推理如何解锁 LLM 的参数化知识 | Google Research 深度解读