📰 新闻内容
2026 年 6 月 24 日,OpenAI 与博通(Broadcom)在旧金山联合发布了 Jalapeño——OpenAI 首款自研智能处理器(Intelligence Processor)。这是一款专为大语言模型(LLM)推理而设计的加速器,也是两家公司共同打造的多代计算平台中的第一款 AI 芯片,目标是让先进 AI 更快、更可靠、更普惠。
Jalapeño 由 OpenAI 从零开始设计,基于其对 LLM 底层运行机制的深度理解,涵盖了模型路线图、内核优化、推理调度系统和产品需求。博通(Broadcom)和 Celestica 负责芯片实现、板卡/机架系统集成、高性能网络及规模化生产。工程样品已在实验室中以生产级频率和功耗运行 ML 工作负载,包括 GPT-5.3-Codex-Spark。
值得注意的是,Jalapeño 从初始设计到制造流片仅用了 9 个月,OpenAI 称这可能是高性能先进半导体领域有史以来最快的 ASIC 开发周期。这一速度得益于 OpenAI 工程团队与博通的深度软硬件协同开发,以及 OpenAI 自身模型在芯片设计和优化流程中的加速应用。
⚙️ 技术演进 / 核心问题
- 全新架构 vs 改造方案:Jalapeño 是为现代 LLM 推理从零设计的「白纸架构」,而非从早期通用 AI 加速器改造而来。目标是同时具备顶级 AI 加速器的吞吐量和最快专用推理系统的延迟表现
- 全栈优势:OpenAI 不再只是做模型和产品,而是将芯片架构、内核、内存系统、网络、调度、部署系统全部纳入自研范围,每一层围绕同一目标优化——让模型更快、更可靠、更便宜
- 每瓦性能突破:早期测试显示,Jalapeño 的每瓦性能「显著优于当前最先进水平」。架构核心在于减少数据搬运,平衡计算、内存和网络资源,使实际利用率更接近理论峰值
- 多代平台路线图:Jalapeño 是多代计算平台的第一步,计划 2026 年底开始部署,后续年份持续扩展。博通 CEO Hock Tan 表示,将与微软等合作伙伴一起部署吉瓦级数据中心
- AI 加速 AI:OpenAI 的用户模型反过来帮助改进基础设施——同样的模型既服务用户,又加速芯片设计流程,形成正向飞轮
🔑 关键洞察
1. 从「用芯片」到「造芯片」——AI 公司的全栈化拐点
2. 9 个月流片——AI 重塑芯片设计流程
3. 推理成本——AI 普及的最后一公里
🤔 引发思考
Jalapeño 的发布揭示了一个更大的趋势:AI 产业正在从「软件定义硬件」走向「软件反哺硬件」。当 OpenAI 的模型开始帮助设计 OpenAI 的芯片,一个前所未有的正反馈循环正在形成——更好的模型→更好的芯片→更高效的推理→更好的模型。这种「AI 自举」模式如果成立,意味着算力成本的下降曲线可能比摩尔定律更陡峭。
对行业而言,NVIDIA 的「通用 GPU 霸权」正在被侵蚀。Google、Amazon、Meta、OpenAI 纷纷自研芯片,虽然短期内无法取代 NVIDIA 的生态优势,但长期来看,AI 推理市场的定制化趋势不可逆转。未来的竞争可能不再是「谁的 GPU 更快」,而是「谁的全栈优化更深」。
📎 相关阅读
- OpenAI 官方博客:https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
- GlobeNewsWire 新闻稿:https://www.globenewswire.com/news-release/2026/06/24/3316887/19933/en/openai-and-broadcom-unveil-llm-optimized-intelligence-processor.html
- 腾讯新闻中文报道:https://news.qq.com/rain/a/20260625A020OC00
逍遥云初 | 2026.06.27






