Meta desarrolla un chip CXL personalizado para reutilizar memoria de servidores antiguos y reduce las necesidades de su flota en un 25 %

Meta ha desarrollado un ASIC (circuito integrado de aplicación específica) Compute Express Link (CXL) personalizado llamado Vistara que rescata la memoria DDR4 de servidores retirados y la pone de nuevo a trabajar en máquinas nuevas, una respuesta práctica tanto al desperdicio de hardware como al creciente coste de la DRAM.

El problema es estructural. Alrededor del 40 % de la enorme flota de servidores de Meta no puede aumentar su memoria, lo que deja a millones de máquinas fuera de ciertas cargas de trabajo. Los servidores tienen una vida útil prevista de tres a cinco años, pero los módulos DDR4 siguen siendo útiles durante siete a diez años. Con los precios de la memoria disparados, el sector lo llama «RAMpocalypse», comprar nueva RAM es caro. Reutilizar los módulos antiguos evita ese coste por completo.

Vistara está diseñado en torno a una interfaz PCIe Gen5 x16 compatible con CXL 2.0 y 1.1. Cada chip integra dos canales de memoria DDR4 de 72 bits independientes que admiten velocidades de hasta 3200 MT/s y hasta 256 GB por chip utilizando módulos de 64 GB. Dos procesadores RISC-V personalizados impulsan el ASIC. La unidad física que aloja Vistara, denominada MemServer, combina un procesador AMD Turin (158 núcleos) con 768 GB de DDR5 local y 256 GB de DDR4 reutilizada.

La memoria DDR4 aparece ante el sistema operativo como un nodo NUMA distinto y sin CPU. Las plataformas de Meta utilizan primero toda la DDR4 local disponible y luego recurren a la memoria CXL según sea necesario. Todas las modificaciones del controlador del kernel de Linux ya están integradas en el repositorio principal o en proceso de estarlo.

Desplegado en millones de servidores en producción, Vistara gestiona inferencia ML desagregada (tablas de incrustación para sistemas de recomendación), procesamiento de macrodatos con Spark y Hive, bases de datos, cachés distribuidas y sistemas de compilación CI/CD. El resultado: una reducción del 25 % en el número de servidores para cargas de trabajo de inferencia desagregada y una reducción del 33 % en los fallos por falta de memoria y los reinicios de trabajos asociados.

Meta presentó la tecnología en la ISCA 2026 el 29 de junio.

Traducido del inglés por el equipo de localización de 1ban.news.

Scroll to Top