Nvidia abandonne le GPU Rubin Ultra à quatre dies au profit d’une conception à deux dies, selon des rapports

Nvidia aurait abandonné ses plans pour un GPU Rubin Ultra à quatre dies, revenant à une conception à deux dies après avoir rencontré des obstacles de fabrication liés au packaging avancé de TSMC, selon des rapports de médias taïwanais.

Ce qui a changé

Le Rubin Ultra original était présenté comme le package GPU le plus ambitieux de Nvidia à ce jour : quatre dies de calcul de la taille d’un réticule intégrés via le packaging CoWoS-L de TSMC, 16 piles de mémoire HBM4 offrant environ 1 téraoctet de capacité, et une puissance de calcul estimée à 100 pétaflops FP4 par package.

Le Commercial Times de Taïwan et WCCFTech ont rapporté que la conception à quatre dies provoquait des déformations et des contraintes thermiques lors du packaging, courbant le substrat et perturbant le contact die-substrat.

Plutôt que de tenter de pousser quatre dies à travers un seul processus de packaging, Nvidia serait passée à une architecture à deux dies avec un agencement 2+2 au niveau de la carte, deux dies identiques par package, avec deux packages sur une seule carte au niveau du rack. Cela préserve la puissance de calcul et la capacité mémoire totale par rack tout en réduisant considérablement la complexité de fabrication et en améliorant l’évolutivité pour les clients hyperscalers.

Aucune perte de performance, sur le papier

Selon les rapports, les performances de calcul par rack ne devraient pas diminuer. Une lame Kyber unique hébergera toujours quatre dies GPU Rubin Ultra, simplement pas intégrés dans un seul package complexe. Les objectifs de capacité HBM4e et de bande passante mémoire restent inchangés.

Ce changement de conception évite une alternative plus radicale : passer au packaging Chip-on-Panel-on-Substrate (CoPoS) de TSMC, conçu pour les accélérateurs IA de plus grande taille mais dont la production de masse n’est pas attendue avant fin 2028, bien trop tard pour le déploiement prévu du Rubin Ultra en 2027.

Rubin standard sur les rails

Le GPU Rubin standard à deux dies, conçu pour l’entraînement IA à grande échelle, reste sur le calendrier pour des expéditions en volume à partir de mi-2026. La variante Rubin Ultra, reposant sur une plateforme Kyber améliorée, était attendue dans la seconde moitié de 2027.

Contexte industriel

Ce recentrage du packaging souligne un défi croissant dans l’industrie des puces IA : alors que la réduction des transistors se poursuit, le packaging avancé est devenu le goulot d’étranglement critique. Alors que les dies GPU s’agrandissent et que les demandes de mémoire explosent, la physique consistant à maintenir plusieurs puces de silicium plates, refroidies et connectées sur un seul substrat s’avère plus difficile que la conception de la puce elle-même.

Nvidia n’a pas officiellement confirmé la révision de conception. Les spécifications finales de la plateforme Rubin Ultra sont attendues à une date ultérieure.

Traduit par Lydie