Наверх

Google наконец-то исправит главный недостаток нейросети Gemini

Больше не придется писать гигантские промпты. Теперь достаточно просто обвести нужный объект, чтобы Gemini все поняла.

28.11.2025
14:54
Google наконец-то исправит главный недостаток нейросети Gemini

Основные идеи

Нейросеть Gemini получит встроенные инструменты для рисования прямо на фото.
Это решит проблему неточного понимания сложных текстовых запросов.
Пользователи смогут обвести объект и дать команду, что с ним делать.
Процесс редактирования изображений станет намного проще и интуитивнее.

Мнение автора

Это не просто очередная функция, а фундаментальный сдвиг в общении с ИИ. Мы уходим от словесных команд, которые требуют навыка, к прямому визуальному контакту. Теперь не нужно быть «инженером промптов», чтобы получить результат. Инструменты на базе ИИ становятся по-настоящему массовыми.

Нравится вам это или нет, но будущее мобильной фотографии — за нейросетями. Однако даже у мощных инструментов вроде Google Gemini есть одна серьезная проблема: чтобы внести правки, приходится писать текстовые запросы, которые искусственный интеллект не всегда понимает правильно. И это ужасно раздражает.

Но в Google об этом знают и уже готовят решение.

Новые модели Gemini уже показывают впечатляющие результаты, даже когда сталкиваются со сложными задачами по редактированию изображений. Но если вам нужно добавить пометку, выделить область или оставить заметку на картинке, все равно приходится открывать другое приложение.

Видео от DGL.RU

Судя по последним утечкам, Google пытается исправить именно этот неудобный процесс.

Google наконец-то исправит главный недостаток нейросети Gemini
В Gemini появятся инструменты для рисования.

По информации из источников, Google встраивает инструменты для аннотирования изображений прямо в веб-версию Gemini. Пользователи смогут рисовать на картинках, обводить элементы и добавлять текстовые слои в том же интерфейсе, который они используют для генерации и редактирования. Это избавляет от лишнего шага, когда нужно экспортировать изображение и работать с ним в другой программе.

Это подтверждает и более ранние находки в коде мобильного приложения Gemini, где уже были спрятаны элементы интерфейса, которые связаны с разметкой. Теперь мы видим, что та же функциональность переезжает и в браузерную версию, где большинство пользователей и занимается более серьезным редактированием.

Более интуитивный способ общения с Gemini

Мобильная версия показывает всплывающие окна, которые намекают, что аннотации могут быть привязаны к локальному редактированию на основе подсказок. Другими словами, вместо того чтобы описывать правку в тексте, пользователи смогут визуально отметить область, а затем сказать Gemini, что делать дальше.

Это значительно упростит выполнение сложных запросов. Пользователи смогут использовать визуальные маркеры, чтобы показать, какие области их изображения требуют редактирования.

Такой подход решает одну из главных проблем текущих ИИ-инструментов, которые оставляют большую часть процесса на волю догадок, что приводит к множеству неверных интерпретаций. Возможность визуально отметить конкретную область даст Gemini более четкий и контролируемый способ понимать инструкции, особенно при редактировании мелких деталей или множества пересекающихся элементов.

Маленькая функция с огромным значением

Возможность делать пометки прямо на изображении может показаться незначительной, но для инструментов на базе ИИ это огромное дело. Большинство пользователей полагаются на внешние приложения для разметки, когда хотят выделить область или точно указать, что нужно изменить. Интеграция этого шага в Gemini упростит весь рабочий процесс.

Это также делает инструмент гораздо более дружелюбным к новичкам. Вместо того чтобы выдумывать идеальные промпты, пользователи смогут просто отметить то, что они хотят исправить.

Официально Google еще не анонсировала эту функцию, но раз элементы интерфейса появляются и в мобильной, и в веб-версии, тестирование, похоже, идет полным ходом. Когда новшество станет доступно всем, редактирование в Gemini станет значительно интуитивнее и мощнее.

ИИ в каждый офис: Google представляет Gemini Enterprise для бизнеса

Александр Анастасов

Александр Анастасов

Обычный гик, который приходит в восторг от всего, что связано с технологиями: смартфонов, автомобилей, ноутбуков, ПК, космоса и многого другого. Его заводит всё, что расширяет границы человеческих возможностей.

Источник: PhoneArena
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»