
Apple Intelligence — полный провал? 7 функций ИИ от Google и OpenAI, которые отчаянно нужны iPhone 17
Apple Intelligence потерпел неудачу. Настало время для смелых шагов, чтобы вдохнуть новую жизнь в следующий iPhone.
Ключевые выводы
- Выход телефонов Google Pixel 10 с глубоко интегрированными функциями искусственного интеллекта, предлагающими впечатляющие новые возможности, показал, насколько уязвимым может оказаться iPhone 17.
- Многие из самых умных сервисов ИИ в мире уже доступны на iPhone в виде приложений, поэтому существует вероятность, что Apple может сотрудничать с ними для более глубокой интеграции.
- Новые функции ИИ-камеры в Pixel 10 могут стать главным отличием между ним и iPhone 17.
Хотя на iPhone доступны практически все самые умные приложения с искусственным интеллектом от последних первопроходцев в этой области, ему не хватает той глубокой интеграции функций ИИ, которая возможна только на стыке операционной системы и новейшего оборудования. Именно это мы увидели с выходом линейки Google Pixel 10.
Вот семь функций от лидеров в области ИИ, которые оказали бы огромное влияние, если бы были бесшовно встроены на системном уровне в iPhone 17.
1. Голосовой режим ChatGPT
Голосовой режим OpenAI в ChatGPT, по сути, работает так, как я всегда хотел, чтобы работала Siri на iPhone. Вы просто запускаете его и начинаете говорить с ним на естественном языке, и он может отвечать на вопросы, находить информацию и даже выполнять несколько действий.
Но голосовой режим, который переименовывается в ChatGPT Voice и скоро станет доступен бесплатным пользователям, все еще ограничен в командах, которые он может выполнять на вашем iPhone. Версия этой функции от Apple или партнерство с OpenAI могли бы обеспечить гораздо более глубокую интеграцию с календарем, электронной почтой, текстовыми сообщениями, заметками, настройками и другими задачами операционной системы (с соблюдением мер конфиденциальности Apple). Аналогичным образом, у Google уже есть Gemini Live, а Microsoft (признана экстремистской организацией и её деятельность запрещена на территории РФ) предлагает Copilot Voice, так что Apple нужно действовать более решительно, чтобы помочь iPhone не отставать.
2. Super Res Zoom в Pixel 10

Я уже писал о том, что люблю фотографировать с зумом, и это одна из областей, где камеры телефонов все еще уступают, и мне приходится регулярно обращаться к своей беззеркальной камере Sony с зум-объективом 70-200 мм. Однако Google недавно сделал большой шаг, чтобы восполнить этот пробел в зум-фотографии в Pixel 10 Pro. С его новой функцией Super Res Zoom, Pixel 10 Pro восполнит недостающие данные и автоматически обработает цифровое зум-изображение до 100x, чтобы сделать его более пригодным для использования.
Это поднимает ряд вопросов о том, что делает фотографию фотографией, и мне все еще нужно опробовать это на Pixel 10 Pro, чтобы сообщить, насколько хорошо это работает, но это кажется достойным использованием вычислительной фотографии. И единственный производитель смартфонов, который собирается конкурировать с Google в области вычислительной фотографии, — это Apple.
3. Magic Cue от Google
В прошлом году на WWDC 2024 Apple много говорила о своей функции Personal Intelligence, которая могла бы понимать ваши вопросы и запросы, потому что у нее была информация о вас из вашего календаря, почты, текстовых сообщений и других данных, хранящихся в частном порядке в экосистеме Apple. В основной презентации WWDC Apple использовала примеры, такие как «Найди файлы, которыми Джоз поделился со мной на прошлой неделе» и оповещение в реальном времени о том, что встреча, которую вы собираетесь перенести, может конфликтовать с тем, чтобы отвезти вашего ребенка на регулярное занятие.
Конечно, Apple так и не выпустила эту функцию — а вот Google выпустил. В Pixel 10 Google запустил Magic Cue, который может избавить вас от необходимости переключаться между приложениями, зная о вас достаточно, чтобы помочь вам с информацией. Один из приведенных примеров — текстовое сообщение, в котором кто-то спрашивает вас, на какое время забронирован столик в ресторане, и Magic Cue, предположительно, использовал информацию из подтверждающего сообщения в Gmail, чтобы показать эту информацию прямо в приложении для обмена сообщениями, и пользователю нужно было просто нажать, чтобы отправить ответ.

Google говорит, что такого рода действия теперь могут происходить локально на устройстве благодаря чипу Tensor G5 в Pixel 10. Тем не менее, я думаю, что больше людей доверяли бы Apple свою конфиденциальность в такой функции, потому что Apple не зарабатывает деньги на использовании ваших данных в оппортунистических целях.
4. Deep Research от Anthropic
Один из самых больших способов, которым генеративный ИИ экономит мне время, — это использование его в качестве ассистента для исследований. Несколько приложений ИИ теперь предлагают функцию Deep Research, где вы можете задать важный вопрос по более сложной теме и дать ИИ дополнительное время (обычно 5-30 минут), чтобы проанализировать доступные источники и вернуться с ответом, который включает четко отмеченные ссылки на источники информации.
Я предпочитаю использовать Deep Research из приложения Claude от Anthropic из-за его ориентации на точность. Было много сообщений о том, что Apple вела переговоры с Anthropic о различных возможностях сотрудничества. Интеграция Deep Research от Claude в Siri, чтобы вы могли быстро запустить его голосовой или текстовой командой, была бы мощной опцией.
5. Best Take от Google Photos
Google впервые запустил свою функцию Best Take на Pixel 8 в 2023 году и недавно значительно ее обновил на Pixel 10. Эта функция возникла в результате сотрудничества команд Google Pixel, Google Photos и Google Research, работающих вместе над решением «дилеммы группового снимка».
Она использует несколько фотографий, сделанных подряд, группы людей, где не у всех открыты глаза, кто-то не смотрит в камеру или делает неловкое выражение лица. Затем она объединяет лучшие кадры каждого в более удачную фотографию. Новая функция «Auto Best Take» на Pixel 10 делает это в фоновом режиме и создает для вас фотографию Best Take.
Аналогичным образом, есть также функция Add Me (запущенная на Pixel 9), которая использует AR и ИИ умными способами, чтобы позволить фотографу добавиться на групповой снимок, по сути, объединяя две фотографии — под руководством приложения камеры. Разумно ожидать, что у Apple есть навыки вычислительной фотографии, чтобы справиться с этим, или отношения с Google, чтобы лицензировать технологию, тем более что она основана на приложении Google Photos, которое уже доступно на iOS.
6. Гораздо более широкая языковая поддержка

Одной из самых передовых возможностей больших языковых моделей является перевод между различными языками, и мы видели, как этим пользуются не только смартфоны, но и умные очки, включая Meta Ray-Bans, Solos AirGo 3, Even Realities G1 и The Frame от Brilliant Labs. Некоторые из этих умных очков, наряду с несколькими телефонными приложениями, теперь могут переводить на десятки языков (Google Translate поддерживает более 100 языков).
Apple все еще отстает, поддерживая всего 20 языков в Apple Translate. Используя мощь LLM, Apple должна значительно увеличить количество поддерживаемых языков и интегрировать их в Siri и другие функции ИИ, такие как Live Translation в телефонных звонках и текстовых сообщениях, а также Visual Intelligence.
7. Разговорное редактирование фотографий от Google
Возможно, самой большой неожиданностью в новом телефоне Pixel 10 является его новая функция Conversational Editing в Google Photos. Это позволяет вам описать изменения, которые вы хотели бы внести в фотографию, а затем ИИ автоматически их выполняет. Например, вы можете попросить его переместить объект в сцене, убрать блики или отражения, перецентрировать объект, заменить фон, добавить облака на голубое небо, увеличить или уменьшить размытие фона и многое другое.
Конечно, изменение фотографий может быть деликатным вопросом. В LinkedIn руководитель продукта Google по вычислительной фотографии отметил: «Мы настроили наши модели так, чтобы они были сверхчувствительны к мелким деталям на фотографии, чтобы она отражала контекст, который вы хотите сохранить, с изменениями, которые вы хотите внести».
Я подозреваю, что это будет очень популярная функция, так как она очень проста в доступе и не требует продвинутых технических навыков, которые ранее были необходимы для такого рода редактирования фотографий.
Заключительное слово
Apple предстоит проделать большую работу, чтобы догнать функции, которые ведущие компании в области ИИ привносят в свои приложения для iPhone, не говоря уже о глубокой интеграции ИИ, которую Google теперь привносит в ключевые функции своих телефонов Pixel.
Хотя задержка с развертыванием функций Apple Intelligence, возможно, и не повредила iPhone за последний год, Apple необходимо сократить разрыв, чтобы iPhone 17 не ощущался как устройство, отставшее на шаг. Прямо сейчас Google может с полным основанием утверждать, что теперь именно у них самый умный телефон в индустрии.
Редактор Gemini: решение главной проблемы искусственных фото
















