
La supercomputadora más rápida del mundo ahora es china, y no contiene ni un solo chip fabricado en Estados Unidos. LineShine, instalada en el Centro Nacional de Supercomputación de Shenzhen, alcanzó el número uno en la lista TOP500 de junio de 2026 con un rendimiento sostenido de 2.198 exaflops (doble precisión) en el benchmark High Performance Linpack (HPL). Esto es aproximadamente un 22% más rápido que El Capitan, el anterior poseedor del récord en el Laboratorio Nacional Lawrence Livermore.
El sistema marca el regreso de China a la cima del ranking mundial de supercomputación por primera vez desde 2017, cuando Sunway TaihuLight ocupaba la posición con apenas 93 petaflops, LineShine es aproximadamente 24 veces más rápida. Pero la importancia de la máquina va mucho más allá de una puntuación de benchmark. LineShine es un desafío directo a los controles de exportación estadounidenses diseñados para frenar las capacidades informáticas avanzadas de China, y su arquitectura representa un enfoque fundamentalmente diferente para la computación a exaescala.
Todo CPU, sin GPU
La mayoría de las supercomputadoras actuales, incluyendo El Capitan, Frontier y los próximos sistemas estadounidenses, dependen de aceleradores GPU para ofrecer su máximo rendimiento. Las GPU de Nvidia o AMD manejan el paralelismo masivo de los cálculos científicos mientras que las CPU orquestan el flujo de trabajo. LineShine no usa GPU en absoluto.
En su lugar, los 92 gabinetes de LineShine albergan 40,960 procesadores LX2 personalizados, cada uno con 304 núcleos Armv9 funcionando a 1.55 GHz, para un total de 13,789,440 núcleos, aproximadamente 14 millones. El LX2 es ampliamente atribuido a Huawei, el gigante chino de telecomunicaciones que fue colocado en la Lista de Entidades de EE.UU. en 2019. Al licenciar el conjunto de instrucciones Armv9 (de Arm Ltd, una empresa británica no sujeta a las mismas restricciones que los fabricantes de chips estadounidenses) e integrar unidades SVE (Scalable Vector Extension) y SME (Scalable Matrix Extension) directamente en cada núcleo, el LX2 puede ejecutar tanto computación científica tradicional (FP64) como cargas de trabajo de IA (BF16, FP16, INT8) en el mismo procesador, sin transferencia de datos entre espacios de memoria separados de CPU y GPU.
El enfoque elimina lo que los arquitectos informáticos llaman el “muro de la memoria”, el cuello de botella de transportar datos entre CPU y GPU a través de interconexiones lentas. Cada uno de los 14 millones de núcleos de LineShine puede acceder al mismo espacio de memoria coherente. Para cargas de trabajo que combinan simulación física con aprendizaje automático, esta arquitectura unificada puede ser transformadora.
El sistema también alcanzó el número uno en el benchmark HPCG (High Performance Conjugate Gradient), una medida más realista de la computación científica limitada por memoria, con 22.00 petaflops, y quedó cuarto en el benchmark de precisión mixta HPL-MxP con 7.92 exaflops. La modesta aceleración de 3.6x de HPL a HPL-MxP confirma que este es fundamentalmente un diseño completamente basado en CPU; los sistemas con aceleradores GPU dedicados pueden mostrar aceleraciones de 10 a 20x en tareas de precisión mixta.
Una declaración política en silicio
China dejó de enviar sistemas al ranking TOP500 alrededor de 2023, ante la preocupación de que revelar datos de rendimiento pudiera informar la estrategia de sanciones de EE.UU. Durante ese tiempo, varios sistemas exaescala chinos, Sunway OceanLight (estimado ~1.22 exaflops) y Tianhe-3 (~1.57 exaflops), aparecieron en publicaciones académicas pero nunca fueron evaluados oficialmente. Por lo tanto, el envío de LineShine es más que un anuncio técnico: es una señal estratégica de que China puede competir en la cima de la computación de alto rendimiento mundial sin componentes estadounidenses.
“Hecho con piezas chinas, en parte porque Estados Unidos ha restringido la exportación de sus GPU a China, citando preocupaciones de seguridad nacional”, informó Nature, resumiendo una tensión central. Los controles de exportación de EE.UU. de 2022 y 2023 se dirigieron específicamente a GPU avanzadas, la A100, H100 y B200 de Nvidia, la MI250 y MI300 de AMD, que son críticas tanto para la computación científica como para el entrenamiento de IA. El diseño completamente basado en CPU de LineShine elude estas restricciones por completo.
Si el procesador LX2 fue fabricado en un proceso de 7 nm o 5 nm, y qué fundición lo produjo, sigue sin revelarse, precisamente la información que los analistas de inteligencia de chips más desean conocer.
Clima, materiales y la fusión de la física con la IA
Haohuan Fu de la Universidad Tsinghua, citado en Nature, describió el potencial del sistema: “Sistemas como LineShine hacen posible estudiar sistemas naturales e ingenieriles complejos a mayor escala, mayor resolución y mayor velocidad. Más importante aún, nos permiten reunir el conocimiento físico y la IA basada en datos de una manera mucho más integrada.”
Un preprint en arXiv (2605.24896) demuestra la arquitectura en acción, ejecutando CAPES, un sistema de pronóstico por conjuntos híbrido numérico-IA a exaescala para las lluvias estivales de Asia Oriental. CAPES combinó 174 miembros de modelos numéricos meteorológicos basados en física con 1,600 miembros generados por IA, completando 10 años de retropronósticos (2016 a 2025) en solo 14.6 horas. Este tipo de carga de trabajo numérico-IA estrechamente acoplada, imposible de ejecutar eficientemente en sistemas híbridos CPU-GPU tradicionales, es exactamente para lo que fue diseñada la arquitectura unificada de LineShine.
Otras aplicaciones demostradas incluyen simulaciones a escala atómica de materiales magnéticos, y los diseñadores del sistema señalan potencial en modelización climática, dinámica de fluidos computacional y descubrimiento de fármacos.
Los inconvenientes
El consumo de energía de 42.2 MW de LineShine es el más alto entre los 10 sistemas principales, lo que le otorga una eficiencia energética de 52.07 gigaflops por vatio, en comparación con los 60.9 gigaflops por vatio de El Capitan. Esto lo sitúa en el número 50 de la lista Green500, detrás tanto de El Capitan como de Frontier. El sistema es potente pero no eficiente según los estándares de primer nivel.
Para cargas de trabajo de entrenamiento de IA puras, los grandes clústeres de GPU en Google, Meta y OpenAI probablemente siguen siendo más rápidos. Como dijo Jack Dongarra, experto líder en supercomputación de la Universidad de Tennessee, a Nature: “Encabezar el ranking no necesariamente convierte a LineShine en la computadora más rápida del mundo para cada aplicación científica o de IA.” El TOP500 mide Linpack de doble precisión, no el rendimiento real de entrenamiento de IA, y el cuarto puesto de LineShine en los benchmarks de precisión mixta sugiere que su rendimiento en IA, aunque impresionante, va por detrás de los sistemas basados en GPU más grandes.
Lo que viene después
LineShine representa una prueba de concepto para la computación a exaescala solo con CPU, una apuesta arquitectónica que parece cada vez más previsora a medida que el suministro de GPU a China está restringido. Si este enfoque escala a los sistemas zettaescala de la próxima generación sigue siendo una pregunta abierta. El procesador LX2 de 304 núcleos presiona fuertemente contra los límites de la escalabilidad del silicio, y nuevas ganancias requerirán un empaquetado más eficiente, litografía avanzada a la que China quizás aún no tenga acceso, o una arquitectura híbrida que reintroduzca aceleradores, esta vez, fabricados a nivel nacional.
Por ahora, el primer lugar del TOP500 de junio de 2026 pertenece a Shenzhen. La máquina se llama LineShine. No tiene piezas estadounidenses.
Traducido por Alessandra
Fuentes:
[Nature News] “China’s LineShine just topped the global supercomputer ranking: what you need to know.” Nature, junio de 2026. https://www.nature.com/articles/d41586-026-02047-w
[TOP500] Lista de junio de 2026. https://www.top500.org
[arXiv] “CAPES: Exascale Hybrid Numerical-AI Ensemble Forecasting.” arXiv:2605.24896, 2026.

