Наверх

Qualcomm бросает вызов AMD и Nvidia с новыми AI-ускорителями

AI200 и AI250 обещают прокачать дата-центры. Но смогут ли они реально обойти лидеров рынка? Вопрос остаётся открытым.

03.11.2025
12:23
Ускорители Qualcomm AI200 и AI250 для центров данных

Основные идеи

AI200 и AI250 используют Hexagon NPU с 12+8+1 ускорителями для широких форматов данных
AI200 оснащён 768 ГБ LPDDR, PCIe и жидкостным охлаждением
AI250 повышает пропускную способность памяти в 10 раз

Мнение автора

Покопался в деталях ускорителей Qualcomm AI200 и AI250 — и впечатляет масштаб. AI200 с 768 ГБ LPDDR, PCIe, жидкостным охлаждением и 160 кВт на стойку — зверь для логического вывода. AI250 добавляет память близкую к оперативной и дезагрегированное распределение ресурсов, что даёт десятикратный прирост пропускной способности. Плюс полный софт-стек с PyTorch, ONNX и LangChain — генеративный ИИ с такими железом и поддержкой становится реально доступным и безопасным.

В понедельник Qualcomm официально представила два новых ускорителя ИИ — AI200 и AI250, которые появятся на рынке в 2026 и 2027 годах. Судя по всему, они готовы бросить вызов решениям от AMD и Nvidia и обещают более высокую эффективность и меньшие эксплуатационные расходы при масштабных задачах генеративного ИИ.

Это объявление также подтверждает стратегию Qualcomm: обновлять линейку продуктов каждый год. Похоже, компания всерьёз нацелилась на лидирующие позиции в мире ИИ-ускорителей.

Оба ускорителя Qualcomm AI200 и AI250 основаны на нейронных процессорах Qualcomm Hexagon (NPU), которые настроены для рабочих нагрузок ИИ центров обработки данных. В последние годы компания постепенно совершенствовала свои NPU Hexagon, поэтому последние версии этих процессоров уже оснащены скалярными, векторными и тензорными ускорителями (в конфигурации 12+8+1).

Они поддерживают такие форматы данных, как INT2, INT4, INT8, INT16, FP8, FP16, вывод микроплиток для сокращения трафика памяти, 64-битную адресацию памяти, виртуализацию и шифрование модели Gen AI для дополнительной безопасности. Масштабирование Hexagon для рабочих нагрузок центров обработки данных является естественным выбором для Qualcomm, хотя ещё предстоит увидеть, какие целевые показатели производительности компания установит для своих блоков AI200 и AI250.

Стоечные решения Qualcomm AI200 станут первой системой логического вывода уровня центра обработки данных компании на базе ускорителей AI200 с 768 ГБ встроенной памяти LPDDR (что весьма много для ускорителя логического вывода). Система будет использовать интерфейсы PCIe для вертикального масштабирования и Ethernet для горизонтального. Система будет использовать прямое жидкостное охлаждение и энергоснабжение 160 кВт на стойку, что также является беспрецедентным показателем для решений логического вывода. Кроме того, система будет поддерживать конфиденциальные вычисления для корпоративных развёртываний. Решение будет доступно в 2026 году.

Модель AI250, которая выйдет годом позже, сохраняет эту структуру, но добавляет архитектуру вычислений, приближенную к оперативной памяти, что позволяет увеличить эффективную пропускную способность памяти более чем в 10 раз. Кроме того, система будет поддерживать функцию дезагрегированного вывода, которая позволяет динамически распределять вычислительные ресурсы и память между картами. Qualcomm позиционирует её как более эффективное решение с высокой пропускной способностью, которое оптимизировано для крупных моделей трансформаторов, при этом сохраняя те же характеристики теплопередачи, охлаждения, безопасности и масштабируемости, что и AI200.

«С Qualcomm AI200 и AI250 мы переосмысливаем возможности стоечного ИИ-анализа», — заявил Дурга Маллади, старший вице-президент и генеральный менеджер по технологическому планированию, периферийным решениям и центрам обработки данных компании Qualcomm Technologies. «Эти инновационные решения для инфраструктуры ИИ позволяют заказчикам внедрять генеративный ИИ с беспрецедентной совокупной стоимостью владения, сохраняя при этом гибкость и безопасность, необходимые современным центрам обработки данных».

Помимо создания аппаратных платформ, Qualcomm также разрабатывает комплексную программную платформу гипермасштабируемого уровня, которая оптимизирована для крупномасштабного вывода. Платформа будет поддерживать основные наборы инструментов машинного обучения и генеративного ИИ, включая PyTorch, ONNX, vLLM, LangChain и CrewAI, обеспечивая при этом бесперебойное развёртывание моделей. Программный стек будет поддерживать дезагрегированное обслуживание, конфиденциальные вычисления и подключение предварительно обученных моделей одним щелчком мыши для упрощения развёртывания.

«Наш богатый программный стек и поддержка открытой экосистемы позволяют разработчикам и предприятиям проще, чем когда-либо, интегрировать, управлять и масштабировать уже обученные модели ИИ в наших оптимизированных решениях для вывода ИИ», — сказал Маллади. «Благодаря полной совместимости с ведущими фреймворками ИИ и развёртыванию моделей одним щелчком мыши, Qualcomm AI200 и AI250 разработаны для беспроблемного внедрения и быстрого внедрения инноваций».

Один из ключевых аспектов стоечных решений для логического вывода AI200 и AI250, который Qualcomm не раскрыла, — это процессоры, на которых будут работать эти машины. Компания официально начала разработку собственных процессоров уровня центров обработки данных ранее в этом году.

Хотя команда Nuvia, вероятно, уже проделала некоторую работу по микроархитектуре процессоров, на определение и разработку логической схемы уйдёт около года, затем не менее шести месяцев на реализацию проекта и его демонстрацию, а затем ещё несколько месяцев на запуск чипа и выпуск образцов. Короче говоря, вполне разумно ожидать появления процессоров Qualcomm собственного производства в конце 2027 года, а скорее в 2028 году. Тем не менее AI200, по крайней мере, готов использовать готовый процессор Arm или x86, поэтому возникает вопрос: какой из них?

Обзор Corsair Novablade Pro — исключительный игровой контроллер

Антон Шилов

Антон Шилов

Пишет обо всём: от процессоров и графических процессоров до суперкомпьютеров, от современных технологических процессов и новейших производственных инструментов до тенденций в высокотехнологичной отрасли.

Источник: Tomshardware
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»