
Убийца Nvidia? Ассоциативный процессор переносит вычисления прямо в память
APU Gemini-I потребляет на 98% меньше энергии, чем стандартный графический процессор.
Основные идеи
Мнение автора
Главная проблема GPU — постоянная перекачка данных. GSI решает ее, встраивая вычисления в память. Результаты Cornellского исследования впечатляют: 98% экономии энергии — это не шутки, а реальный прорыв для ИИ на дронах и роботах. Но главный барьер — это софт. Без экосистемы, как у Nvidia, это останется нишевым решением. Мой совет: следить за Gemini-II, там будет видно, смогут ли они решить и программную проблему.
Кажется, у Nvidia на горизонте замаячил серьезный конкурент. Компания GSI Technology выкатила совершенно новый подход к обработке данных для искусственного интеллекта, который, без шуток, переносит вычисления прямо в память.
Недавнее исследование Корнеллского университета подсветило эту архитектуру, известную как ассоциативный процессор (APU), и намекнуло, что она может положить конец давним проблемам с производительностью и эффективностью. Похоже, доминированию топовых GPU в мире ИИ и дата-центров скоро может прийти конец.
Новый претендент на рынке оборудования для ИИ
В исследовании Корнеллского университета, опубликованном в журнале ACM и представленном на недавней конференции Micro ’25, APU Gemini-I от GSI сравнивался с ведущими центральными и графическими процессорами, включая Nvidia A6000. Оценка проводилась с использованием рабочих нагрузок генерации с дополненной выборкой (RAG).
Тесты охватывали наборы данных объемом от 10 до 200 ГБ, что соответствует реалистичным условиям работы ИИ-инференса.
Выполняя вычисления внутри статической оперативной памяти (SRAM), APU сокращает постоянное перемещение данных между процессором и памятью.
Именно это перемещение является основным источником потерь энергии и задержек в традиционных архитектурах графических процессоров.
Результаты показали, что APU может достичь пропускной способности уровня GPU при значительно меньшем энергопотреблении.
По данным GSI, их APU потреблял до 98% меньше энергии, чем стандартный графический процессор, и выполнял задачи поиска до 80% быстрее, чем сопоставимые центральные процессоры.
Такая эффективность может сделать его привлекательным для периферийных устройств, таких как дроны, системы IoT и робототехника, а также для использования в оборонной и аэрокосмической отраслях, где существуют строгие ограничения по энергопотреблению и охлаждению.
Несмотря на эти результаты, пока неясно, сможет ли технология вычислений в памяти масштабироваться до того же уровня зрелости и поддержки, которым обладают лучшие платформы на базе GPU.
Графические процессоры в настоящее время выигрывают за счет хорошо развитых программных экосистем, которые обеспечивают бесшовную интеграцию с основными инструментами ИИ.
Для устройств с вычислениями в памяти оптимизация и программирование остаются новыми областями, что может замедлить их широкое внедрение, особенно в крупных центрах обработки данных.
GSI Technology заявляет, что продолжает совершенствовать свое оборудование. Ожидается, что поколение Gemini-II обеспечит в десять раз большую пропускную способность и меньшую задержку.
Еще одна разработка под названием Plato находится в стадии создания и призвана еще больше увеличить вычислительную производительность для встраиваемых периферийных систем.
«Независимая проверка Корнеллского университета подтверждает то, во что мы давно верили: вычисления в памяти способны произвести революцию на рынке ИИ-инференса объемом 100 миллиардов долларов (около 8,2 трлн руб.)», — заявил Ли-Лин Шу, председатель и главный исполнительный директор GSI Technology.
«APU обеспечивает производительность уровня графического процессора при малеькой доле энергозатрат благодаря своей высокоэффективной архитектуре, ориентированной на память. Наш недавно выпущенный кремниевый чип APU второго поколения, Gemini-II, может обеспечить примерно в 10 раз большую пропускную способность и еще меньшую задержку для ресурсоемких рабочих нагрузок ИИ».
ИИ в каждый офис: Google представляет Gemini Enterprise для бизнеса

















