
Камера с Nano Banana: Caira, которая перевернет мир AI-фото
Камера Caira создана, чтобы каждый стал контентмейкером. Возможно, именно она сделает ИИ-фотографию по-настоящему массовой.
Основные идеи
Мнение автора
После десятков концепций камер на ИИ я вижу, что Caira — первая реально может стать массовым продуктом. Это настоящая беззеркалка с сенсором в четыре раза больше, чем у iPhone, и встроенной LLM для цветокоррекции и голосового управления. Интеграция Nano Banana от Google — шаг к осмысленному использованию генеративного ИИ. Я бы не стал использовать генеративное редактирование на съёмке, но потенциал для контент-креаторов очевиден. ИИ наконец выходит прямо в объектив. Рекомендую следить за запуском Kickstarter 30 октября: Caira может задать новый стандарт интерфейса в фотоиндустрии.
До Caira на фоне стремительного развития генеративного ИИ в сфере цифрового искусства за последние пару лет появилось несколько странных концепций ИИ-камер. Была безлинзовая Paragraphica, а затем минималистичная DreamGenerator, которая генерировала изображения на основе ИИ, предположительно, реальной сцены. Пожалуй, самой странной идеей была Poetry Camera, которая выглядела как самодельный полароид и превращала изображения в сонеты и хайку.
Меня не удивило, что ни одна из них не стала популярной. Но Caira от Camera Intelligence, которая позиционируется как «первая в мире беззеркальная камера с Nano Banana», похоже, имеет гораздо больше шансов стать массовой. Для начала, это действительно камера.
Caira — это настоящая беззеркальная камера, поддерживающая сменные объективы Micro Four Thirds. Её сенсор в 4 раза больше, чем у iPhone, и она оснащена встроенной большой языковой моделью (LLM) для редактирования на устройстве, включая цветокоррекцию, а также голосовым управлением функциями камеры.
Устройство будет оснащено чипами Qualcomm Snapdragon и Google Edge TPU, а также будет иметь встроенную функцию Nano Banana. Последний генератор изображений с искусственным интеллектом от Google наиболее известен тем, что создаёт вирусные 3D-фигурки с искусственным интеллектом, но он также впечатляет людей своей способностью сохранять детали исходных изображений при использовании их в качестве подсказок для создания композитов с помощью искусственного интеллекта, при этом количество галлюцинаций сокращается.
По словам разработчиков Camera Intelligence, наличие Nano Banana на устройстве означает, что пользователи смогут мгновенно вносить генеративные изменения в свои изображения: от настройки цвета и освещения до преобразования объектов, например превращения вина в бокале в воду, — и всё это прямо на устройстве.

Учитывая нынешние споры вокруг Sora 2 от OpenAI, запуск оборудования с любой моделью ИИ для обработки изображений в качестве ключевого преимущества выглядит рискованным. Компания Camera Intelligence утверждает, что придерживается стратегии разработки, в основе которой лежит «этика», и что в Caira будут встроены средства защиты ИИ, которые будут блокировать такие действия, как изменение тона кожи или этнической принадлежности, а также ненадлежащее манипулирование человеческими персонажами.
В сообщении говорится, что система будет соответствовать политике Google в отношении запрещённого использования генеративного искусственного интеллекта, и добавляется, что компания работает с фотографами и исследователями в области этики, чтобы выработать лучшие практики.

Генеративное редактирование изображений в момент съёмки — это не для меня, но я вижу в этом потенциальную привлекательность, особенно для тех, кто создаёт контент на ходу и хочет иметь возможность быстро обрабатывать контент и отправлять его прямо со своего устройства в соцсети за считаные минуты с более высоким качеством изображения, чем даже у лучшего телефона с камерой.
На бумаге это камера достойного качества с удобным интерфейсом в виде приложения для смартфона с голосовым управлением. Мне было бы интересно попробовать её в деле, чтобы понять, действительно ли она настолько универсальна и точна в редактировании и обладает ли она достаточной вычислительной мощностью для выполнения своих обещаний. Компания заявляет, что система будет подключаться к сторонним инструментам редактирования через API, что звучит многообещающе.
Я бы представлял себе камеру с искусственным интеллектом как обычный фотоаппарат, который использует ИИ для упрощения процесса съёмки, например для расчёта гиперфокального расстояния, а не для создания вымышленных сцен. Поэтому лично мне в Caira больше всего нравится голосовое управление.
Современные камеры имеют огромное количество запутанных меню, на изучение которых могут уйти дни. Если вы работаете с камерой, с которой не знакомы, вам может потребоваться целый день, чтобы найти все настройки. Я бы хотел иметь возможность поговорить со своей камерой R5, чтобы она переключилась с 50 на 100 кадров в секунду или отключила отслеживание взгляда без необходимости искать настройку в меню или вспоминать, какую кнопку я назначил для этой задачи.
То же самое касается постобработки. Компания Camera Intelligence опередила разработчиков камер и программного обеспечения, добавив интерфейс с голосовым управлением (голосовое управление включается и выключается с помощью небольшой кнопки в сопутствующем iOS приложении). Adobe и другие разработчики лучшего программного обеспечения для редактирования фотографий должны наверстать упущенное.
Caira будет доступна для предзаказа на Kickstarter 30 октября. Будут доступны дополнительные опции, в том числе держатель для аккумулятора, который позволит снимать дольше. Подробнее можно узнать на сайте компании.
Обзор vivo X300 и vivo X300 Pro: удобные, красивые, компактные















