Наверх

Редактор Gemini: решение главной проблемы искусственных фото

Теперь можно легко исправить типичные артефакты AI-генерации — от странных пальцев до неестественного фона

27.08.2025
13:45
Редактор Gemini: решение главной проблемы искусственных фото

Обычно попытки заставить ИИ-генератор изображений создать одного и того же персонажа на нескольких картинках превращались в настоящий хаос. Вы получаете отличный портрет, просите ИИ поместить этого же человека на пляж, и внезапно у него меняется нос и появляются другие зубы. Хотя инструменты вроде ChatGPT с DALL-E 3 невероятно мощны для создания одиночных изображений, это отсутствие постоянства было серьезным препятствием для всех, кто хотел сделать нечто большее, чем просто статичную картинку.

Что ж, похоже, Google решила взяться за эту проблему всерьез. В новом обновлении приложения Gemini они интегрировали совершенно новую модель редактирования изображений от своей команды DeepMind. Модель под названием «nano banana» предлагает то, о чем все давно просили: она сохраняет вашу внешность без изменений.

Видео от DGL.RU

Новая функция позволяет загрузить фотографию себя, друга или даже питомца, а затем вносить самые смелые изменения, не теряя при этом основных черт объекта. Хотите увидеть себя с прической «улей» в стиле 60-х или нарядить свою чихуахуа в пачку? Gemini обещает внести эти изменения, сохранив ваше лицо и черты узнаваемыми. Это огромный шаг вперед по сравнению с шаблонными и зачастую разочаровывающими результатами конкурирующих моделей.

Примеры сохранения постоянства персонажа при редактировании с помощью ИИ.

Помимо простых косметических правок, обновление предлагает и другие впечатляющие возможности. Теперь можно смешивать несколько фотографий, например, без проблем поместив свой портрет рядом с собакой на баскетбольной площадке. Также поддерживается многоэтапное редактирование: можно начать с пустой комнаты, попросить Gemini покрасить стены, добавить книжную полку и, наконец, поставить кофейный столик — изображение будет меняться на каждом шагу. Вы даже можете переносить стиль и текстуру с одного объекта на другой, например, создавая платье с узором крыльев бабочки.

Пример смешивания двух изображений.

На мой взгляд, это именно то направление, в котором должно было развиваться редактирование изображений с помощью ИИ. Вместо того чтобы гнаться за более мощной, но «сырой» генерацией, Google сосредоточилась на практической пользе. Решение проблемы постоянства персонажей превращает Gemini из диковинной игрушки в по-настоящему полезный творческий инструмент на каждый день. Если функция будет работать так, как заявлено, это может дать Google преимущество и сделать приложение Gemini основным местом для персонализации фотографий способами, которые раньше были невозможны.

Обновленная функция станет доступна в приложении Gemini начиная с сегодняшнего дня, а все отредактированные изображения будут содержать водяной знак, указывающий на использование ИИ.

Освободите себя: позвольте искусственному интеллекту Google взять на себя все заботы!

Джоанна Ромеро

Джоанна Ромеро

Настоящий гуру по всему, что связано с Google. Она прошла путь от специалиста техподдержки, который решает проблемы, до крутого контент-мейкера, который учит, как их не создавать. Её конёк — экосистема Google и гаджеты Pixel, о которых она знает абсолютно всё. Она умеет находить неочевидные фишки и объяснять самые сложные вещи простым языком. За это её и ценят, а сама Google даже сделала ее официальным участником.

Источник: PhoneArena
Теги:
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»