
Редактор Gemini: решение главной проблемы искусственных фото
Теперь можно легко исправить типичные артефакты AI-генерации — от странных пальцев до неестественного фона
Обычно попытки заставить ИИ-генератор изображений создать одного и того же персонажа на нескольких картинках превращались в настоящий хаос. Вы получаете отличный портрет, просите ИИ поместить этого же человека на пляж, и внезапно у него меняется нос и появляются другие зубы. Хотя инструменты вроде ChatGPT с DALL-E 3 невероятно мощны для создания одиночных изображений, это отсутствие постоянства было серьезным препятствием для всех, кто хотел сделать нечто большее, чем просто статичную картинку.
Что ж, похоже, Google решила взяться за эту проблему всерьез. В новом обновлении приложения Gemini они интегрировали совершенно новую модель редактирования изображений от своей команды DeepMind. Модель под названием «nano banana» предлагает то, о чем все давно просили: она сохраняет вашу внешность без изменений.
Новая функция позволяет загрузить фотографию себя, друга или даже питомца, а затем вносить самые смелые изменения, не теряя при этом основных черт объекта. Хотите увидеть себя с прической «улей» в стиле 60-х или нарядить свою чихуахуа в пачку? Gemini обещает внести эти изменения, сохранив ваше лицо и черты узнаваемыми. Это огромный шаг вперед по сравнению с шаблонными и зачастую разочаровывающими результатами конкурирующих моделей.
Примеры сохранения постоянства персонажа при редактировании с помощью ИИ.
Помимо простых косметических правок, обновление предлагает и другие впечатляющие возможности. Теперь можно смешивать несколько фотографий, например, без проблем поместив свой портрет рядом с собакой на баскетбольной площадке. Также поддерживается многоэтапное редактирование: можно начать с пустой комнаты, попросить Gemini покрасить стены, добавить книжную полку и, наконец, поставить кофейный столик — изображение будет меняться на каждом шагу. Вы даже можете переносить стиль и текстуру с одного объекта на другой, например, создавая платье с узором крыльев бабочки.
Пример смешивания двух изображений.
На мой взгляд, это именно то направление, в котором должно было развиваться редактирование изображений с помощью ИИ. Вместо того чтобы гнаться за более мощной, но «сырой» генерацией, Google сосредоточилась на практической пользе. Решение проблемы постоянства персонажей превращает Gemini из диковинной игрушки в по-настоящему полезный творческий инструмент на каждый день. Если функция будет работать так, как заявлено, это может дать Google преимущество и сделать приложение Gemini основным местом для персонализации фотографий способами, которые раньше были невозможны.
Обновленная функция станет доступна в приложении Gemini начиная с сегодняшнего дня, а все отредактированные изображения будут содержать водяной знак, указывающий на использование ИИ.
Освободите себя: позвольте искусственному интеллекту Google взять на себя все заботы!
























