
据台湾媒体报道,Nvidia已放弃四芯片Rubin Ultra GPU计划,在遭遇台积电先进封装工艺的制造障碍后,缩减为双芯片设计。
变更内容
原版Rubin Ultra原定为Nvidia迄今最雄心勃勃的GPU封装方案:通过台积电CoWoS-L封装集成四个光罩尺寸计算芯片,16个HBM4内存堆栈提供约1TB容量,每个封装估计可提供100 FP4 petaflops算力。
台湾《工商时报》和WCCFTech报道称,四芯片设计在封装过程中导致翘曲和热应力问题,基板弯曲并破坏了芯片与基板的接触。
Nvidia并未尝试将四个芯片通过一次封装流程处理,而是转向采用2+2板级排列的双芯片架构,每个封装包含两个相同芯片,单个机架级板卡上放置两个封装。此举在保持每个机架总计算能力和内存容量的同时,大幅降低了制造复杂性,并提升了面向超大规模客户的扩展性。
性能不受影响,理论上
据报道,每个机架的计算性能预计不会下降。单个Kyber刀片仍将搭载四个Rubin Ultra GPU芯片,只是未集成到单一复杂封装中。HBM4e容量和内存带宽目标保持不变。
这一设计转变避免了更为激进的替代方案:转向台积电的Chip-on-Panel-on-Substrate(CoPoS)封装技术。该技术专为更大规模的AI加速器设计,但预计要到2028年底才能实现量产,对于Rubin Ultra原定的2027年部署而言为时过晚。
标准Rubin按计划推进
面向大规模AI训练的标准双芯片Rubin GPU仍按计划于2026年年中开始量产发货。Rubin Ultra变体基于升级版Kyber机架平台,原定于2027年下半年推出。
行业背景
封装策略的收缩凸显了AI芯片行业日益严峻的挑战:虽然晶体管微缩仍在继续,但先进封装已成为关键瓶颈。随着GPU芯片尺寸增大和内存需求飙升,在单个基板上保持多个硅芯片平坦、冷却和连接的物理难题,比芯片设计本身更具挑战性。
Nvidia尚未正式确认这一设计修订。Rubin Ultra平台的最终规格预计将在日后公布。
婷 翻译

