Наверх

Microsoft бросила вызов физике: 4608 чипов как единый мозг

OpenAI получила доступ к суперкомпьютеру Microsoft с 4608 GPU GB300. Кластер обеспечивает 92 эксафлопса для ускоренного обучения моделей ИИ.

13.10.2025
13:01
Microsoft с OpenAI

Основные идеи

Microsoft создала суперкомпьютерный кластер на 4608 GPU.
Система обеспечивает рекордные 92 эксафлопса для ИИ.
Кластер предназначен для ускорения работы OpenAI.
Nvidia и Microsoft укрепляют партнёрство с OpenAI.

Мнение автора

Это качественный скачок в инфраструктуре ИИ. Тройственный альянс Microsoft, Nvidia и OpenAI создает экосистему, недоступную конкурентам. Однако такая концентрация ресурсов у нескольких компаний может ограничить инновации на рынке и усилить технологическую зависимость.

Microsoft только что обновила свою облачную платформу Azure с помощью Blackwell Ultra от Nvidia, развернув, как она сама называет, первый в мире крупномасштабный суперкомпьютерный кластер GB300 NVL72. Этот кластер состоит из нескольких стоек, в которых установлено ровно 4608 графических процессоров GB300, соединенных коммутационной сетью NVLink 5, которая, в свою очередь, объединена с помощью сетевой ткани Nvidia Quantum-X800 InfiniBand по всему кластеру. Это позволяет одной стойке NVL72 обеспечивать общую пропускную способность памяти 130 ТБ/с, при этом каждая стойка обеспечивает пропускную способность межсоединений 800 Гбит/с на графический процессор.

Первый в мире крупномасштабный суперкомпьютерный кластер @nvidia GB300 NVL72 для задач искусственного интеллекта теперь доступен в Microsoft Azure. Развертывание включает в себя подключение более 4600 графических процессоров NVIDIA Blackwell Ultra с использованием сети InfiniBand нового поколения, предназначенной для обучения и развертывания передовых моделей искусственного интеллекта.

Видео от DGL.RU

Число 4608, указанное Nvidia, обозначает 64 системы GB300 NVL72, учитывая, что в каждой стойке 72 графических процессора Blackwell и 36 процессоров Grace (всего 2592 ядра Arm). Технически это далеко от полноценного гипермасштабируемого расширения, но это всё равно важная веха для Nvidia Grace Blackwell GB300, которая недавно установила новые рекорды по производительности логического вывода. Microsoft заявляет, что этот кластер будет предназначен для рабочих нагрузок OpenAI, что позволит ещё быстрее запускать продвинутые модели обработки данных и обучать модели «за недели, а не месяцы».

Сообщается, что на уровне стойки каждая система NVL72 обеспечивает производительность FP4 Tensor в 1440 петафлопс при использовании 37 терабайт унифицированной «быстрой памяти», которая разделена на 20 ТБ HBM3E для графического процессора и 17 ТБ LPDDR5X для процессора Grace. Как упоминалось ранее, эта память объединена с помощью NVLink 5, что позволяет каждой стойке работать как единый унифицированный ускоритель с прямой пропускной способностью 130 ТБ/с. Пропускная способность памяти — одна из самых впечатляющих характеристик GB300 NVL72, поэтому важно понимать, как она работает.

Платформа Quantum-X800 InfiniBand позволяет каждому из 4608 внутренних графических процессоров иметь пропускную способность 800 Гбит/с на уровне между стойками. В итоге каждый графический процессор подключается как внутри стоек, так и между ними.

Microsoft с OpenAI

Кластер GB300 NVL72 имеет жидкостное охлаждение с использованием автономных теплообменников и контуров, спроектированных таким образом, чтобы минимизировать расход воды при интенсивных рабочих нагрузках. Nvidia утверждает, что Microsoft пришлось переосмыслить каждый уровень своего центра обработки данных для этого развертывания, и Microsoft с радостью отмечает, что это лишь первый из многих кластеров, которые будут распространять GB300 по всему миру, раскрывая его гипермасштабный потенциал. OpenAI и Microsoft уже используют кластеры GB200 для обучения моделей, так что это естественное продолжение их эксклюзивного партнёрства.

Nvidia сама активно инвестирует в OpenAI, и обе компании недавно подписали соглашение о намерениях (LoI) о крупном стратегическом партнёрстве, в рамках которого производитель чипов постепенно вложит в OpenAI 100 миллиардов долларов. С другой стороны, OpenAI будет использовать графические процессоры Nvidia для своей инфраструктуры искусственного интеллекта нового поколения, развернув ускорители мощностью не менее 10 гигаватт (ГВт), начиная с Веры Рубин в следующем году. Таким образом, этот суперкластер GB300 NVL72 можно рассматривать как предвестника, почти материализацию этих инвестиций, поскольку именно Microsoft развертывает кластер для OpenAI, используя оборудование Nvidia.

OpenAI делает ставку на AMD — грядет переворот в мире ИИ

Хассам Насир

Хассам Насир

Страстный поклонник аппаратного обеспечения, специализируется на подробном сравнении процессоров и общих новостях в сфере аппаратного обеспечения. В свободное от работы время он гнёт трубки для своей постоянно совершенствующейся игровой системы с водяным охлаждением или просто ради интереса тестирует новейшие процессоры и графические процессоры.

Источник: Tomshardware
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»