Наверх

Пока все смотрели на Intel, Nvidia совершила тихую революцию, купив Enfabrica. И вот почему это гениально

Enfabrica — ключевое приобретение Nvidia за $1 млрд. Технология ACF-S для масштабирования ИИ-кластеров и эластичной памяти. Обзор возможностей.

2.10.2025
6:16
Enfabrica
  • Благодаря приобретению Nvidia инженеры Enfabrica получили прямой доступ к экосистеме искусственного интеллекта компании
  • Шасси EMFASYS позволяет использовать до 18 ТБ памяти для кластеров GPU
  • Эластичная ткань с эффектом памяти освобождает HBM для выполнения срочных задач ИИ

Решение Nvidia потратить более 900 миллионов долларов на Enfabrica стало неожиданностью, особенно учитывая, что оно сопровождалось отдельными инвестициями в Intel в размере 5 миллиардов долларов.

По словам ServeTheHome, «у Enfabrica самая крутая технология», вероятно, благодаря уникальному подходу к решению одной из самых масштабных проблем масштабирования ИИ: объединению десятков тысяч вычислительных чипов в единую систему без потери ресурсов.

Эта сделка говорит о том, что Nvidia считает устранение узких мест в межсетевых соединениях не менее важной задачей, чем обеспечение производственных мощностей для чипов.

Видео от DGL.RU

Уникальный подход к обработке данных

Архитектура коммутатора Enfabrica Accelerated Compute Fabric Switch (ACF-S) включает в себя линии PCIe с одной стороны и высокоскоростную сеть с другой.

Устройство ACF-S «Миллениум» представляет собой сетевой чип со скоростью 3,2 Тбит/с и 128 линиями PCIe, который может подключать графические процессоры, сетевые карты и другие устройства, сохраняя при этом гибкость.

Конструкция устройства позволяет данным перемещаться между портами или внутри чипа с минимальной задержкой, объединяя технологии Ethernet и PCIe/CXL.

Для ИИ-кластеров это означает более интенсивное использование и меньшее количество простаивающих графических процессоров, ожидающих данных, что повышает рентабельность дорогостоящего оборудования.

Ещё одно предложение от Enfabrica — шасси EMFASYS, в котором используются контроллеры CXL для объединения до 18 ТБ памяти в кластеры графических процессоров.

Эта эластичная структура памяти позволяет графическим процессорам переносить данные из ограниченной памяти HBM в общее хранилище по сети.

Освободив HBM для выполнения критически важных задач, операторы могут сократить расходы на обработку токенов.

По словам представителей Enfabrica, сокращение может достигать 50 %, что позволит масштабировать рабочие нагрузки без чрезмерной нагрузки на локальную память.

Для больших языковых моделей и других систем искусственного интеллекта такие возможности могут стать критически важными.

Чип ACF-S также обеспечивает многоканальную избыточность с высоким коэффициентом. Вместо нескольких мощных каналов со скоростью 800 Гбит/с операторы могут использовать 32 канала со скоростью 100 Гбит/с.

Если коммутатор выходит из строя, пропускная способность снижается всего на 3 %, а не на большую часть сети.

Такой подход может повысить надёжность кластера в больших масштабах, но он также усложняет проектирование сети.

В результате сделки команда разработчиков Enfabrica, включая генерального директора Рочана Санкара, переходит в Nvidia, а не остаётся у конкурентов, таких как AMD или Broadcom.

В то время как доля Nvidia в Intel обеспечивает производственные мощности, это приобретение напрямую решает проблему масштабирования в сфере ИИ в центрах обработки данных.

Nvidia платит OpenAI $100 млрд, чтобы та покупала ее же чипы. Гениальная схема или антимонопольная бомба?

Эфоса Удинмвен

Эфоса Удинмвен

Он не технарь, который пишет, а учёный, который влюбился в технологии и заражает этой страстью других. Его тексты — это мост между сложной наукой и нашим любопытством, построенный на прочном фундаменте из его знаний.

Источник: Techradar
Теги:
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»