Google работает над ИИ, который может озвучивать видео

Новый искусственный интеллект (ИИ) от разработчиков Google использует пиксели видео и текстовые подсказки для создания насыщенных звуковых дорожек

Фото: freepik.com

Многие современные ИИ-инструменты могут генерировать только видеозаписи без звука. Одним из следующих важных шагов в Google считают создание звуковых дорожек для этих немых видео.

Команда Google DeepMind представила технологию преобразования видео в аудио (V2A), которая делает возможным синхронизированное аудиовизуальное создание. V2A сочетает видеопиксели с текстовыми подсказками на естественном языке для создания насыщенного звукового ландшафта для действий на экране.

V2A совместима с такими моделями видеогенерации, как Veo, о которой мы писали ранее. Вместе они могут создавать кадры с драматической партитурой, реалистичными звуковыми эффектами или диалогами, которые соответствуют персонажам и тону видео.

Также новый ИИ может создавать звуковые дорожки для различных традиционных материалов, включая архивные материалы, немые фильмы и тому подобное. V2A может генерировать неограниченное количество звуковых дорожек для любого видеоролика, при этом пользователь может давать ему подсказки. Ниже представлены несколько примеров технологии. Больше вы можете увидеть в блоге DeepMind.

Вас может заинтересовать: В Google с помощью ИИ можно будет подбирать одежду

Разработчики обучали технологию на аннотациях, сгенерированных ИИ, с подробным описанием звука и расшифровками разговорных диалогов, а также на различных видео и аудио. Как результат — нейросеть учится связывать конкретные звуковые события с различными визуальными сценами, реагируя на информацию, предоставленную в аннотациях или стенограммах. При желании можно добавлять текстовые подсказки, но это не является обязательным.

В то же время есть несколько недостатков, которые в Google сейчас пытаются устранить. Среди них снижение качества видео на выходе и плохая синхронизация губ во время сгенерированных диалогов.

Напомним, Google представит свою платформу для 3D-видеозвонков Starline уже в 2025 году. Она разрабатывалась в сотрудничестве с HP. Используя достижения в области искусственного интеллекта, 3D-визуализации и других технологий, Starline работает как «волшебное окно».

Ознакомьтесь с другими популярными материалами:

Google планирует сделать поиск платным: причина

Материнская компания Google впервые в истории выплатит дивиденды: сколько получат акционеры

Google выделил 700 тысяч евро для обучения украинцев — детали программы

Google работает над ИИ, который может озвучивать видео

Как криптотрейдеры используют ИИ: обзор возможностей, рисков и сервисов

Кто из финансовых компаний лишился права работать в Украине: самые громкие кейсы последних лет

Кто из финкомпаний получил штраф от НБУ и лишился лицензии в мае 2025 — аналитика

Тренды Money20/20 Europe 2025: будущее платежных технологий в условиях глобальных вызовов

Что нужно сделать до операции по коррекции искривленной перегородки носа

4 лучших планшета от Apple для студентов

UniCredit готується закрити бізнес у Росії замість продажу активів

На скільки зросли борги українців по мікрокредитах за рік — Опендатабот

Как взять кредит под залог недвижимости, не выходя из дома

Програма Національний кешбек запрацювала по-новому — Мінекономіки

Google работает над ИИ, который может озвучивать видео

Как криптотрейдеры используют ИИ: обзор возможностей, рисков и сервисов

Кто из финансовых компаний лишился права работать в Украине: самые громкие кейсы последних лет

Кто из финкомпаний получил штраф от НБУ и лишился лицензии в мае 2025 — аналитика

Тренды Money20/20 Europe 2025: будущее платежных технологий в условиях глобальных вызовов

Что нужно сделать до операции по коррекции искривленной перегородки носа

4 лучших планшета от Apple для студентов

UniCredit готується закрити бізнес у Росії замість продажу активів

На скільки зросли борги українців по мікрокредитах за рік — Опендатабот

Как взять кредит под залог недвижимости, не выходя из дома

Програма Національний кешбек запрацювала по-новому — Мінекономіки

Хочу получать: