Глава компании NVIDIA Дженсен Хуанг (Jensen Huang), на конференции GTC 2025, продемонстрировал прототип системы Vera Rubin Superchip, которая объединяет на одной плате новый центральный процессор Vera и два больших графических чипа Rubin. Такая комбинация повышает уровень производительности для ИИ-суперкомпьютеров будущего.

Каждый GPU Rubin состоит из двух больших кристаллов с ядрами CUDA и восьми стеков высокоскоростной памяти HBM4 объемом 288 Gb. Характеристики GPU и пропускная способность памяти не уточнялись. Отмечается, что одна система Vera Rubin Superchip обеспечивает производительность в ИИ-операциях (FP4) на уровне 100 Пфлопс.

Центральный процессор Vera предлагает 88 ядер на неназванной версии архитектуры Arm с 176 потоками, будет задействован интерфейс NVLink-C2C с пропускной способностью 1,8 Тбайт/с. Также на плате расположится оперативная память LPDDR (версия не уточняется), в результате чего общий объем оперативной памяти на один «суперчип» достигнет 2 Tb. На базе новых ускорителей NVIDIA предложит различные системы, например, новые Compute Tray, включая CPX-версию для задач с большим контекстом ИИ-моделей.

Также компания рассказала о готовых серверных стойках Vera Rubin NVL144 с производительностью 3,6 Эфлопс для запуска уже обученных ИИ-моделей (FP4 inference), а также 1,2 Эфлопс для обучения моделей (FP8 training). Система предложит 13 Тбайт/c общей пропускной способностью для памяти HBM4 и в совокупности 75 Тбайт быстрой системной памяти, а общая пропускная способность интерфейсов NVLink и CX9 достигнет 260 Тбайт/с и 28,8 Тбайт/с соответственно.

Первые тестовые экземпляры Vera Rubin Superchip уже поступили в лаборатории компании для испытаний, а старт массового производства запланирован на 2026 год.