Наверх

От кухни до соцсетей: как Google Veo 3 создаёт идеальные ASMR-ролики

Шеф-повар будущего: как Google Veo 3 генерирует аппетитные ASMR-ролики. Полный разбор возможностей и лайфхаков.

22.07.2025
08:00
Google Veo 3

Google превосходит всех своих конкурентов по одной ключевой причине — звук. Вы можете задавать вопросы не только о том, что видите на экране, но и о том, что слышите.

Первая модель Google Veo 3, созданная лабораторией DeepMind компании Google, была представлена в мае 2024 года, и с каждым новым поколением её функциональность расширялась. Она всегда превосходила конкурентов в точности движений и понимании физики, но добавление звука стало настоящим прорывом.

Вы можете использовать его для создания короткого рекламного ролика, сцены из фильма, который вы пишете, или даже музыкального клипа. Но есть один вариант использования, который я встречал чаще всего, — это ASMR (автономная сенсорная меридиональная реакция): лёгкое постукивание, шёпот и окружающие звуки, которые у некоторых людей вызывают ощущение покалывания.

Чтобы понять, как далеко это может зайти, я создал серию подсказок для ASMR-продюсеров, каждая из которых предназначена для создания соответствующего видео и звука на кулинарную тему.

Видео от DGL.RU

Подсказка Google Veo 3 в приложении Gemini

Google Veo 3 теперь доступен в приложении Gemini. Просто выберите опцию «Видео» при создании нового запроса, введите текст, и будет создан 8-секундный ролик.

Хотя Gemini не обязательно является лучшим способом доступа к Google Veo 3 — я бы порекомендовал Freepik, Fal, Higgsfield или Google Flow, — он прост в использовании и справляется со своей задачей.

Ключевое преимущество прямого использования Gemini заключается в том, что он автоматически интерпретирует и дополняет ваши запросы. Так что если вы попросите «крутое ASMR-видео с лазаньей», вы получите именно это.

Вы также можете быть более конкретными, используя так называемое структурированное подсказывание — помечая каждый момент временными метками и описаниями сцен. Но если вам не нужен точный контроль, то простой абзац (он же повествовательное подсказывание) обычно более эффективен.

Создание подсказок

Первая задача в любом проекте, связанном с искусственным интеллектом, — продумать запрос. Модели всё лучше понимают намерения пользователей, но всё же лучше быть конкретным, если вы знаете, чего хотите.

Я знал, что хочу снимать ASMR-видео о еде, поэтому начал с теста: «ASMR-видео о еде со звуком».

Результат? Неплохо. По сути, я получил именно ту лазанью, которую хотел. Затем я доработал рецепт — уточнил виды продуктов, добавил звуковые описания и даже попробовал структурированную подсказку для газированного напитка со льдом.

В большинстве случаев лучше всего работают повествовательные подсказки. Просто опишите, что вы хотите увидеть, как будет развиваться видео и как должен звучать звук.

1. Лазанья, шипящая на сковороде

По первому запросу «Видео с едой в стиле ASMR со звуком» был получен потрясающий ролик, в котором кто-то втыкает вилку в кусок лазаньи. Вы слышите, как вилка входит в блюдо, а затем с глухим стуком падает на тарелку. В таких случаях мне бы хотелось, чтобы в Google Veo 3 была кнопка «Продлить ролик».

Никаких других подсказок не было, поэтому я не мог определить, что это за блюдо, как будет звучать голос и будет ли он вообще работать. Вот почему важно давать конкретные указания моделям ИИ, даже таким чат-ботам, как Gemini.

2. Приготовление и приём пищи

Затем я уточнил задачу — дал более длинное описание в повествовательном стиле и попросил Google Veo 3 сгенерировать крупный план шеф-повара, который готовит и ест вкусную еду на хорошо освещённой кухне.

Я попросил Google Veo 3 снять замедленную съёмку того, как нарезаются ингредиенты, как шипит масло на сковороде и как хрустит хлеб, когда шеф-повар откусывает кусочек.

Я также добавил эту строку: «Подчеркните качество звука: чистый, многослойный ASMR-звук без музыки», чтобы указать не только на звук, но и на его стиль и на то, что я не хочу слышать.

3. Попкорн лопается

Для финального запроса я начал с изображения. Я использовал Midjourney v7, чтобы создать изображение женщины, смотрящей на радужный попкорн, а затем добавил в Gemini запрос «еда ASMR».

Визуально результат был потрясающим, но по какой-то причине женщина за кадром говорит: «Это восхитительно, этот радужный попкорн». Это моя вина — я не уточнил, должна ли она говорить и что именно.

Простое решение: заключите любую речь в кавычки. Например, я мог бы предложить ей сказать: «Я люблю смотреть, как лопается попкорн», и сделать акцент на слове «лопается». Я также мог бы указать, что она говорит на камеру, и Google Veo 3 синхронизировал бы движение губ с речью.

Заключение

В целом Google Veo 3 демонстрирует впечатляющие результаты, особенно когда речь идёт о создании высококачественного звука, точно передающего визуальные эффекты. Несмотря на некоторые особенности, с которыми приходится сталкиваться, например непреднамеренную озвучку или слегка недопечённую лазанью, эти проблемы легко решаются с помощью более конкретных подсказок.

Новый ИИ от Google для образования: помощник учителям или замена преподавателям?

Источник: Tomsguide
Теги:
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»