【技术前沿】OpenAI 与博通联合研发首款自研推理芯片 “Jalapeño” 细节曝光：定制加速器深度优化 Transformer 架构

内容要点：

• 针对推理端硬件级裁剪：OpenAI 与博通联合设计的首款定制 ASIC 芯片“Jalapeño”最新细节流出。该款芯片在架构层砍掉了大量训练用算力单元，专注于优化大模型的端到端低延迟推理，旨在以极低能耗支撑 OpenAI 的大规模在线 API 调用。

• Transformer 注意力引擎加速：Jalapeño 配备了专门针对 Transformer 架构“注意力机制（Attention Mechanism）”优化的定制硬件加速内核，能够将 KV 缓存的存取延迟降低约 45%，在大上下文推理时的整体吞吐量提升显著。

• 破局算力高墙与商业闭环：首批 Jalapeño 芯片已在台积电完成流片并进入试产测试，这表明 OpenAI 正在通过“自研算法 + 定制硬件”的深水区融合，试图打破英伟达的供应链溢价，将多模态推理成本压缩至原先的十分之一。

久湛洞察：

OpenAI 定制推理芯片 Jalapeño 的推出，标志着 AI 算力竞争进入“软硬一体化定制（Co-design）”时代。通用 GPU 虽然强大，但在特定的 Transformer 推理任务中存在严重的功耗与带宽瓶颈。未来，随着自研 ASIC 芯片的规模化部署，AI 推理成本将迎来断崖式下跌，企业级大模型应用将进入“低价、长文本、全量实时”的新阶段。建议技术团队在系统架构设计时保持充分的底层算力适配弹性，拥抱即将到来的低成本推理洪流。

> 权威源：OpenAI-博通定制硬件开发项目技术白皮书及半导体分析月刊（2026年6月下旬）

> 关键词：OpenAI、博通、Jalapeño、自研芯片、Transformer加速、AI推理、硬件软件协同

> 真实链接：真实链接