Meta、旧サーバーのメモリを再利用するカスタムCXLチップを開発、サーバー台数を25%削減

Metaは、Vistaraと呼ばれるカスタムCompute Express Link(CXL)ASICを開発した。これは、現役を退いたサーバーからDDR4メモリを救出し、新しいマシンで再利用するもので、ハードウェア廃棄物とDRAMの高騰するコストの両方に対する実用的な対応策である。

問題は構造的なものである。Metaの広大なサーバーフリートの約40%はメモリを増設できず、何百万台ものマシンが特定のワークロードから締め出されている。サーバーの期待耐用年数は3年から5年だが、DDR4 DIMMは7年から10年は使用可能である。メモリ価格が高騰するなか 、 業界では「RAMpocalypse」と呼ばれている 、 新しいRAMの購入は高額であり、古いDIMMを再利用することでそのコストを完全に回避できる。

Vistaraは、CXL 2.0および1.1に準拠したPCIe Gen5 x16インターフェースを中心に設計されている。各チップは、最大3,200 MT/sの速度と、64 GB DIMMを使用してチップあたり最大256 GBをサポートする、2つの独立した72ビットDDR4メモリチャネルを統合している。2つのカスタムRISC-VプロセッサがASICを駆動する。Vistaraを搭載する物理ユニットはMemServerと呼ばれ、AMD Turinプロセッサ(158コア)と768 GBのローカルDDR5、256 GBの再利用DDR4を組み合わせている。

DDR4メモリは、CPUを持たない独立したNUMAノードとしてオペレーティングシステムに認識される。Metaのプラットフォームは、まず利用可能なすべてのローカルDDR4を使用し、必要に応じてCXL対応メモリにフォールバックする。すべてのLinuxカーネルドライバの修正は、すでにアップストリームに取り込まれているか、その過程にある。

本番環境で数百万台のサーバーに展開されているVistaraは、分散型ML推論(レコメンデーションシステムの埋め込みテーブル)、SparkおよびHiveを用いたビッグデータ処理、データベース、分散キャッシュ、CI/CDビルドシステムを処理する。成果は以下の通り:分散型推論ワークロードにおけるサーバー台数の25%削減、およびメモリ不足による障害と関連ジョブの再起動の33%削減である。

Metaは2026年6月29日にISCA 2026でこの技術を発表した。

英文を1ban.newsローカライゼーションチームが翻訳しました。

Scroll to Top