
Genie 3 от Google: создай свой 3D-мир за секунды!
Революционный ИИ генерирует интерактивные вселенные в реальном времени — вот как это работает.
- Google DeepMind только что представила Genie 3, свою новейшую мировую модель
- В отличие от Genie 2, эта модель обеспечивает взаимодействие в реальном времени и предоставляет результат в разрешении 720p
- Это означает, что вы можете сгенерировать окружение, исследовать его и изменять на лету
Мировая модель искусственного интеллекта от Google получила значительное обновление: технологический гигант, а точнее Google DeepMind, представляет Genie 3. Это новейшая мировая модель ИИ, которая выводит возможности на новый уровень, позволяя пользователю генерировать 3D-мир в качестве 720p, исследовать его и вводить новые команды для взаимодействия или изменения окружения в реальном времени.
Это действительно впечатляет. Genie 3 также заметно отличается от все еще поразительной модели Veo 3, поскольку предлагает видео со звуком, которое выходит далеко за рамки 8-секундного лимита. Genie 3 предоставляет несколько минут того, что Google называет «горизонтом взаимодействия», позволяя вам взаимодействовать с окружением в реальном времени и вносить коррективы по мере необходимости.
Это похоже на слияние ИИ и VR: вы можете построить мир на основе текстовой команды, добавить в него новые объекты и исследовать его. Genie 3 выглядит как усовершенствование по сравнению с Genie 2, которая была представлена в конце 2024 года. В таблице, опубликованной Google DeepMind, можно увидеть прогресс от GameNGen к Genie 2 и Genie 3, и даже сравнение с Veo.
Google также поделилась несколькими демонстрациями, которые напоминают игру в жанре «выбери свое приключение». Есть несколько различных сцен, которые можно опробовать: заснеженный холм или даже цель, которую ИИ должен достичь в музейной среде.
Google подводит итог: «Genie 3 — это наша первая мировая модель, которая позволяет взаимодействовать в реальном времени, одновременно улучшая согласованность и реализм по сравнению с Genie 2». И хотя многие сразу подумали о взаимодействии с этим окружением в VR-гарнитуре для исследования новых мест или как о большом подспорье для разработчиков игр, Google рассматривает это — что неудивительно — как шаг к созданию сильного искусственного интеллекта (AGI). По мнению DeepMind, это позволит обучать различных ИИ-агентов в неограниченном количестве глубоко иммерсивных сред внутри Genie 3.
Еще одно ключевое улучшение в Genie 3 — это способность сохранять объекты в мире. Например, в одном из роликов руки наносят синюю краску на стену с помощью валика. В клипе было видно несколько широких полос синей краски на стене, затем камера отворачивалась и снова возвращалась, показывая, что следы краски остались на прежних местах.
Это впечатляет и напоминает некоторые функции сохранения объектов, которые Apple планирует реализовать в visionOS 26. Конечно, в случае с Apple речь идет о наложении на реальный мир, так что это, возможно, не так впечатляюще.
| GameNGen | Genie 2 | Veo | Genie 3 | |
| Разрешение | 320p | 360p | от 720p до 4K | 720p |
| Домен | Для конкретных игр | 3D-окружения | Общий | Общий |
| Управление | Для конкретных игр | Ограниченные действия клавиатуры/мыши | Описание на уровне видео* | Навигация; Управляемые события в мире |
| Горизонт взаимодействия | Несколько секунд | 10-20 секунд | 8 секунд | Несколько минут |
| Задержка взаимодействия | Реальное время | Не в реальном времени | Н/Д | Реальное время |
*Доступны дополнительные элементы управления, такие как референсы, стиль и камера.

DeepMind описывает ограничения Genie 3, отмечая, что в текущей версии мировая модель не может «симулировать реальные локации с идеальной географической точностью» и поддерживает взаимодействие лишь в течение нескольких минут. Возможность работы в течение нескольких минут — это все равно значительный шаг вперед по сравнению с Genie 2, но это еще не часы использования.
Прямо сейчас погрузиться в мир Genie 3 тоже нельзя. Модель доступна лишь небольшой группе тестировщиков. Google отмечает, что надеется предоставить Genie 3 и другим тестерам, но пока решает, как лучше это сделать. На данном этапе неясно, как выглядит интерфейс для взаимодействия с Genie 3, но из опубликованных демонстраций совершенно очевидно, что это весьма убедительная технология.
Независимо от того, ограничит ли Google ее использование для исследований и обучения ИИ или начнет изучать возможности генерации медиа, нет сомнений, что в скором времени появится Genie 4 или, по крайней мере, расширенная версия Genie 3.










