
Пока все смотрели на Intel, Nvidia совершила тихую революцию, купив Enfabrica. И вот почему это гениально
Enfabrica — ключевое приобретение Nvidia за $1 млрд. Технология ACF-S для масштабирования ИИ-кластеров и эластичной памяти. Обзор возможностей.
- Благодаря приобретению Nvidia инженеры Enfabrica получили прямой доступ к экосистеме искусственного интеллекта компании
- Шасси EMFASYS позволяет использовать до 18 ТБ памяти для кластеров GPU
- Эластичная ткань с эффектом памяти освобождает HBM для выполнения срочных задач ИИ
Решение Nvidia потратить более 900 миллионов долларов на Enfabrica стало неожиданностью, особенно учитывая, что оно сопровождалось отдельными инвестициями в Intel в размере 5 миллиардов долларов.
По словам ServeTheHome, «у Enfabrica самая крутая технология», вероятно, благодаря уникальному подходу к решению одной из самых масштабных проблем масштабирования ИИ: объединению десятков тысяч вычислительных чипов в единую систему без потери ресурсов.
Эта сделка говорит о том, что Nvidia считает устранение узких мест в межсетевых соединениях не менее важной задачей, чем обеспечение производственных мощностей для чипов.
Уникальный подход к обработке данных
Архитектура коммутатора Enfabrica Accelerated Compute Fabric Switch (ACF-S) включает в себя линии PCIe с одной стороны и высокоскоростную сеть с другой.
Устройство ACF-S «Миллениум» представляет собой сетевой чип со скоростью 3,2 Тбит/с и 128 линиями PCIe, который может подключать графические процессоры, сетевые карты и другие устройства, сохраняя при этом гибкость.
Конструкция устройства позволяет данным перемещаться между портами или внутри чипа с минимальной задержкой, объединяя технологии Ethernet и PCIe/CXL.
Для ИИ-кластеров это означает более интенсивное использование и меньшее количество простаивающих графических процессоров, ожидающих данных, что повышает рентабельность дорогостоящего оборудования.
Ещё одно предложение от Enfabrica — шасси EMFASYS, в котором используются контроллеры CXL для объединения до 18 ТБ памяти в кластеры графических процессоров.
Эта эластичная структура памяти позволяет графическим процессорам переносить данные из ограниченной памяти HBM в общее хранилище по сети.
Освободив HBM для выполнения критически важных задач, операторы могут сократить расходы на обработку токенов.
По словам представителей Enfabrica, сокращение может достигать 50 %, что позволит масштабировать рабочие нагрузки без чрезмерной нагрузки на локальную память.
Для больших языковых моделей и других систем искусственного интеллекта такие возможности могут стать критически важными.
Чип ACF-S также обеспечивает многоканальную избыточность с высоким коэффициентом. Вместо нескольких мощных каналов со скоростью 800 Гбит/с операторы могут использовать 32 канала со скоростью 100 Гбит/с.
Если коммутатор выходит из строя, пропускная способность снижается всего на 3 %, а не на большую часть сети.
Такой подход может повысить надёжность кластера в больших масштабах, но он также усложняет проектирование сети.
В результате сделки команда разработчиков Enfabrica, включая генерального директора Рочана Санкара, переходит в Nvidia, а не остаётся у конкурентов, таких как AMD или Broadcom.
В то время как доля Nvidia в Intel обеспечивает производственные мощности, это приобретение напрямую решает проблему масштабирования в сфере ИИ в центрах обработки данных.











