hermes-agent量产系统

告别算力“寄人篱下”:OpenAI首款自研芯片Jalapeño来了

长期以来,AI 圈的目光几乎全被大模型的参数规模和算法迭代所吸引,但算力供应链的“隐形卡脖子”问题始终如影随形。当地时间 6 月 24 日,OpenAI 终于按下了向底层硬件延伸的确认键:公司联合半导体巨头博通(Broadcom),正式揭开了首款定制化 AI 推理芯片的面纱——Jalapeño

这标志着 OpenAI 不再满足于做纯粹的“软件大脑”,而是正式跨界,开始亲手打磨支撑智能运转的“硅基骨架”。

9 个月跑通流片,用 AI 设计 AI

Jalapeño 并非一款试图替代 GPU 的通用芯片,而是精准锚定大语言模型(LLM)推理场景的 ASIC(专用集成电路)。最让人惊叹的是它的研发节奏:从最初的概念蓝图到最终流片交付,整个周期被极限压缩至 9 个月

为了抢时间,OpenAI 甚至玩了一把“自产自销”——直接调用自家的 AI 模型参与芯片设计流程,大幅缩短了架构验证周期。在这场硬核协作中,分工极其明确:OpenAI 把持核心架构的定义权,博通负责攻克复杂的硅片实现与底层网络硬件,而加拿大电子制造服务商 Celestica 则承接了后续的板卡与机架级集成。三方接力,跑出了半导体行业的“OpenAI 速度”。

刀法精准:向每瓦性能要答案

官方目前仍在进行最终的性能评估,但早期实验室数据已经透露出强烈的信号。在运行 GPT-5.3、Codex 和 Spark 等核心工作负载时,Jalapeño 展现出了压倒性的 每瓦性能(Performance-per-Watt) 优势。

它的架构哲学不是盲目堆算力,而是追求极致的资源协同。通过大幅削减冗余的数据传输损耗,Jalapeño 在计算单元、内存带宽与网络吞吐之间实现了罕见的动态平衡。这种底层调优直接让芯片的实际算力利用率跃升至行业通用标准之上,为后续的规模部署打下了扎实的能效基础。

战略转身:推理时代,必须掌握底座

OpenAI 此时亲自下场造芯,背后是算力需求格局的彻底洗牌。过去,公司高度依赖微软 Azure 的云端算力集群;但随着 AI 从实验室走向千万级用户,行业对“推理算力”的需求正以指数级速度反超“训练算力”。继续租用算力,不仅意味着难以承受的天价账单,更会将商业命脉交托他人。

OpenAI 总裁兼联合创始人格雷格·布罗克曼的表态直击要害:在“计算即经济”的新周期里,掌握底层技术栈是构建全栈护城河的必选项。自研硬件不仅能大幅压降运营成本,更能以更高的能效比反哺模型迭代。博通 CEO 陈福阳的发言则暗示了更大的野心:Jalapeño 仅仅是双方跨代研发路线图的序章。

重塑格局的第一块拼图

谷歌 TPU 早已用“软硬协同”验证了底层自研带来的巨大商业红利。如今 OpenAI 带着 Jalapeño 入局,无疑会给全球 AI 基础设施市场投下一枚深水炸弹。按照规划,这款芯片将作为 OpenAI 多代计算平台的首发拼图,目标在 2026 年底前完成首轮商业部署

当软件巨头开始向硅片要效率,算力供应链的话语权争夺战已经进入深水区。未来的 AI 竞赛,拼的早已不只是谁的模型更聪明,而是谁的算力底座更硬核、更自主。Jalapeño 的诞生,或许正是这场全栈博弈的又一个分水岭。

类似文章