Наверх
Обновлено

NVIDIA громит рекорды: Blackwell Ultra GB200 доминирует в MLPerf!

Аппаратные и программные апгрейды принесли до 45% роста скорости inference для DeepSeek R-1. Новый король бенчмарков.

Обновлено 9.11.2025 в 2:12 Опубликовано 12.09.2025 в 03:40 2 мин
2 мин
NVIDIA громит рекорды: Blackwell Ultra GB200 доминирует в MLPerf!

Nvidia побила собственные рекорды в бенчмарках MLPerf, используя свою стоечную систему последнего поколения Blackwell Ultra GB300 NVL72, и заявляет о 45% приросте производительности в задачах инференса (логического вывода) по сравнению с платформой GB200 на базе Blackwell в тестах DeepSeek R1. Сочетая улучшения в аппаратном обеспечении и оптимизацию программного обеспечения, Nvidia заявляет о лидирующей позиции при работе с рядом моделей. Компания предполагает, что это должно стать основным фактором для любых разработчиков, создающих «фабрики ИИ», поскольку это может привести к значительному увеличению выручки.

Архитектура Nvidia Blackwell лежит в основе ее видеокарт последнего поколения серии RTX 50, которые предлагают лучшую производительность в играх, даже если серия RX 9000 от AMD, возможно, предлагает лучшее соотношение цены и качества. Но она также находится под капотом крупных систем на базе GPU для ИИ, таких как ее платформа GB200, которая встраивается в дата-центры по всему миру для питания приложений ИИ следующего поколения. Blackwell Ultra, GB300, является усовершенствованной версией этой платформы с еще большей производительностью, и теперь Nvidia протестировала ее, установив несколько впечатляющих рекордов в MLPerf.

Видео от DGL.RU

Последняя версия бенчмарка MLPerf включает тесты производительности инференса с использованием моделей DeepSeek R1, Llama 3.1 405B, Llama 3.1 8B и Whisper, и GB300 NVL72 показала лучший результат во всех из них. Nvidia заявляет о 45% приросте производительности по сравнению с GB200 при работе с моделью DeepSeek и до пяти раз большей производительности по сравнению со старыми GPU Hopper, хотя Nvidia отмечает, что эти сравнительные результаты получены от непроверенных третьих сторон.

Частично этот прирост производительности обусловлен более мощными тензорными ядрами, используемыми в Blackwell Ultra: Nvidia заявляет о «двукратном ускорении слоя внимания и в 1,5 раза большей вычислительной мощности ИИ в FLOPS». Однако это также стало возможным благодаря ряду важных улучшений и оптимизаций программного обеспечения.

В рамках этих бенчмарков Nvidia активно использовала свой формат NVFP4, который квантовал веса DeepSeek R1 таким образом, чтобы уменьшить общий размер модели и позволить Blackwell Ultra ускорить вычисления для повышения пропускной способности при сохранении точности.

Для других бенчмарков, таких как более крупная модель Llama 3.1 405B, Nvidia смогла «разделить» модель на несколько GPU одновременно, обеспечивая более высокую пропускную способность при соблюдении стандартов задержки. Это стало возможным только благодаря ее шине NVLink со скоростью 1,8 ТБ/с между каждым из 72 GPU, что дает общую пропускную способность 130 ТБ/с.

Все это является частью продвижения Nvidia платформы Blackwell Ultra как экономически прорывной для развития «фабрик ИИ». Более высокая производительность инференса благодаря улучшенному аппаратному обеспечению и оптимизации программного обеспечения делает GB300 более потенциально прибыльной платформой в представлении Nvidia о токенизированном будущем рабочих нагрузок в дата-центрах. Учитывая, что поставки GB300 должны начаться в этом месяце, время появления этих новых результатов бенчмарков не кажется совпадением.

Слухи о видеокартах Nvidia RTX 50 SUPER: все, что известно на данный момент

Джон Мартиндейл

Джон Мартиндейл

Он начал собирать компьютеры ещё подростком. С тех пор прошло двадцать лет, и теперь он разбирается буквально во всём. Его фишка — это невероятный диапазон. Ему всё равно, о чём писать: о компонентах для ПК, блокчейне или аксессуарах для стола. А когда он не погружен в мир технологий, то, скорее всего, раскладывает очередную настольную игру.

Источник: tom'sHardware
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»