close-btn

Слідом за Meta: Google представив генератор відеороликів за текстовими запитами

Сервіс створює невелике відео, після чого ШІ-алгоритм доповнює його графічним контентом на власний розсуд

Розробники компанії представили новий продукт на основі штучного інтелекту Imagen Video, який здатний трансформувати словесний запит у відеоролик із роздільною здатністю 1280×768 пікселів та частотою 24 кадри на секунду. В основі сервісу лежить технологія Imagen, яка повторює функціональні характеристики DALL-E 2 та Stable Diffusion.

Генератор картинок використовує велику передбачувану мовну нейромережу та каскадну дифузну модель. За словами розробників, спочатку сервіс вибудовує на основі пошукового запиту 16-кадровий ролик з роздільною здатністю 24х48 пікселів і частотою 3 FPS. Потім “розумні” алгоритми масштабують отримане відео та “домальовують” деякі фрагменти контенту.

В результаті виходить 128-кадрова анімація з роздільною здатністю 1280×768 пікселів та частотою 24 FPS. Для навчання Imagen Video розробники використовували 14 млн пар фраз «відео-опис» та 60 млн «зображення-текст», а також загальнодоступний набір даних LAION-400M, що дозволило моделі застосовувати низку естетичних аспектів.

«На відміну від Stable Diffusion і DALL-E 2, які намагаються перетворити запит на кшталт “логотип для Diffusion” у слова, що читаються, Imagen Video відтворює його без проблем», — йдеться в документі проєкту.

ЧИТАЙТЕ ТАКОЖ: Дуров розповів, які небезпеки чатують на користувачів WhatsApp

Ми раніше повідомляли, що користувачі Reddit та Twitter опублікували скріншоти, на яких видно, що опція 4K, яка зазвичай безкоштовна для всіх користувачів, стала функцією YouTube Premium.

ЧИТАЙТЕ ТАКОЖ:

Однаковий зарядний кабель для всіх пристроїв: парламент ЄС схвалив ініціативу

TikTok слідкує за користувачами? Думка експертів

За матеріалами сайту forklog.com

google news