"> ?>
Наверх

Google Gemini начинает понимать изображения по-настоящему

Новое обновление Gemini позволяет точно указывать, куда смотреть на картинках, делая работу с изображениями проще и нагляднее.

Опубликовано 15.12.2025 в 16:31
ИИ Gemini научился разметке изображений | DGL.RU

Основные идеи

Gemini теперь поддерживает разметку изображений и анализ в приложении и веб-версии
Пользователь может указывать конкретные области изображения для фокусировки ИИ
Тестирование пока ограничено, но функция доступна на некоторых устройствах Android и в Chrome
Возможности инструмента включают как редактирование, так и направленный анализ изображений

Мнение автора

Google постепенно раскрывает новые возможности Gemini, добавляя разметку и анализ изображений прямо в приложение и веб-версию. Эта функция позволяет пользователям направлять внимание ИИ на конкретные области изображения, что делает работу с фото более точной и интерактивной. Несмотря на пока ограниченное распространение, инструмент уже показывает впечатляющую способность понимать, на что именно указывает пользователь.

В течение последних нескольких месяцев Google работала над внедрением инструментов разметки изображений в Gemini. Помимо следов кода, найденных в приложении, мы также видели утечки в интернете, демонстрирующие эту функцию. Теперь эти инструменты начинают появляться у пользователей Gemini, поддерживая как редактирование, так и анализ изображений.

Благодаря наводке от пользователя, мы запустили Gemini для проверки и можем подтвердить, что возможность разметки (рисования поверх фото) присутствует как в приложении Gemini, так и в веб-версии в Chrome. При первом прикреплении изображения в Gemini на Android приложение сообщит вам о новой возможности.

ИИ Gemini научился разметке изображений | DGL.RU

Мы уже встречали это приветственное уведомление, связанное с редактированием. Но не волнуйтесь, это не единственное применение инструмента: как мы и предполагали изначально, он также позволяет направлять внимание Gemini на определенные области изображения.

Как видно на примерах редактирования и анализа, Gemini легко понимает, какая часть изображения нас интересует, когда мы выделяем её и вводим запрос.

Возможно, пример с редактированием выглядит удачнее. И хотя при анализе справа Gemini промахнулся, он явно понял, что мы спрашивали именно о крайнем левом человеке из троих.

На данный момент мы не можем сказать, насколько широко распространено это тестирование и начала ли Google полномасштабное внедрение. Надеемся, что более точная информация о доступности появится после выходных, но проверьте свои устройства уже сейчас — возможно, вы уже можете пользоваться этими инструментами.

Лучшие смартфоны 2025 года

Стивен Шенк

Стивен Шенк

Один из тех журналистов, кто начал писать о смартфонах ещё до того, как купил себе первый. Его первым аппаратом стал легендарный Motorola Droid, и он до сих пор с ностальгией вспоминает времена физических клавиатур, особенно свой BlackBerry. Он из тех редких гиков, кто предпочитает маленькие и тонкие телефоны, выкручивая размер шрифта на минимум, какой только позволяет Android.

Источник: Androidauthority
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»