内容要点:

• 针对推理端硬件级裁剪:OpenAI 与博通联合设计的首款定制 ASIC 芯片“Jalapeño”最新细节流出。该款芯片在架构层砍掉了大量训练用算力单元,专注于优化大模型的端到端低延迟推理,旨在以极低能耗支撑 OpenAI 的大规模在线 API 调用。

• Transformer 注意力引擎加速:Jalapeño 配备了专门针对 Transformer 架构“注意力机制(Attention Mechanism)”优化的定制硬件加速内核,能够将 KV 缓存的存取延迟降低约 45%,在大上下文推理时的整体吞吐量提升显著。

• 破局算力高墙与商业闭环:首批 Jalapeño 芯片已在台积电完成流片并进入试产测试,这表明 OpenAI 正在通过“自研算法 + 定制硬件”的深水区融合,试图打破英伟达的供应链溢价,将多模态推理成本压缩至原先的十分之一。

久湛洞察:

OpenAI 定制推理芯片 Jalapeño 的推出,标志着 AI 算力竞争进入“软硬一体化定制(Co-design)”时代。通用 GPU 虽然强大,但在特定的 Transformer 推理任务中存在严重的功耗与带宽瓶颈。未来,随着自研 ASIC 芯片的规模化部署,AI 推理成本将迎来断崖式下跌,企业级大模型应用将进入“低价、长文本、全量实时”的新阶段。建议技术团队在系统架构设计时保持充分的底层算力适配弹性,拥抱即将到来的低成本推理洪流。

  >  权威源:OpenAI-博通定制硬件开发项目技术白皮书及半导体分析月刊(2026年6月下旬)

  >  关键词:OpenAI、博通、Jalapeño、自研芯片、Transformer加速、AI推理、硬件软件协同

  >  真实链接真实链接