据报道，Nvidia放弃四芯片Rubin Ultra GPU，改为双芯片设计

据台湾媒体报道，Nvidia已放弃四芯片Rubin Ultra GPU计划，在遭遇台积电先进封装工艺的制造障碍后，缩减为双芯片设计。

变更内容

原版Rubin Ultra原定为Nvidia迄今最雄心勃勃的GPU封装方案：通过台积电CoWoS-L封装集成四个光罩尺寸计算芯片，16个HBM4内存堆栈提供约1TB容量，每个封装估计可提供100 FP4 petaflops算力。

台湾《工商时报》和WCCFTech报道称，四芯片设计在封装过程中导致翘曲和热应力问题，基板弯曲并破坏了芯片与基板的接触。

Nvidia并未尝试将四个芯片通过一次封装流程处理，而是转向采用2+2板级排列的双芯片架构，每个封装包含两个相同芯片，单个机架级板卡上放置两个封装。此举在保持每个机架总计算能力和内存容量的同时，大幅降低了制造复杂性，并提升了面向超大规模客户的扩展性。

性能不受影响，理论上

据报道，每个机架的计算性能预计不会下降。单个Kyber刀片仍将搭载四个Rubin Ultra GPU芯片，只是未集成到单一复杂封装中。HBM4e容量和内存带宽目标保持不变。

这一设计转变避免了更为激进的替代方案：转向台积电的Chip-on-Panel-on-Substrate（CoPoS）封装技术。该技术专为更大规模的AI加速器设计，但预计要到2028年底才能实现量产，对于Rubin Ultra原定的2027年部署而言为时过晚。

标准Rubin按计划推进

面向大规模AI训练的标准双芯片Rubin GPU仍按计划于2026年年中开始量产发货。Rubin Ultra变体基于升级版Kyber机架平台，原定于2027年下半年推出。

行业背景

封装策略的收缩凸显了AI芯片行业日益严峻的挑战：虽然晶体管微缩仍在继续，但先进封装已成为关键瓶颈。随着GPU芯片尺寸增大和内存需求飙升，在单个基板上保持多个硅芯片平坦、冷却和连接的物理难题，比芯片设计本身更具挑战性。

Nvidia尚未正式确认这一设计修订。Rubin Ultra平台的最终规格预计将在日后公布。

婷翻译