close-btn

Google запустил новый ИИ VLOGGER: что умеет

Исследователи из Google представили новый инструмент на основе искусственного интеллекта под названием VLOGGER, способный трансформировать статические фотографии в реалистичные видео

Google запустив новий ШІ VLOGGER. Фото: freepik.com

Google запустив новий ШІ VLOGGER. Фото: freepik.com

Этот инструмент не только оживляет лица на фотографиях, но и позволяет изображениям двигаться и выполнять жесты, создавая иллюзию полноценной видеозаписи.

Читайте также: Microsoft, Google и Amazon анонсировали ограничения для российских компаний

Отличительной чертой VLOGGER является его способность работать без необходимости предварительного обучения для каждой отдельной фотографии, открывая широкие перспективы применения от создания 3D фотореалистичных аватаров для видеоигр и виртуальной реальности до оцифровки актеров для нужд киноиндустрии.

Google позиционирует VLOGGER как виртуозный инструмент, который найдет применение в образовательных программах, презентациях, при низкоскоростной интернет-связи, виртуальном повествовании и в интерфейсах коммуникации «текст-компьютер». Несмотря на некоторые ограничения, такие как короткая продолжительность видео и статический фон, технология маркирует существенный прогресс в сфере анимации изображений.

Вас может заинтересовать: Gemini от Google спровоцировал скандал: что произошло

Однако, новаторство VLOGGER несет с собой и вопросы этики, в частности рост беспокойства по поводу дипфейков. Благодаря своим передовым возможностям в точности изображения, сохранении личности и последовательности действий, модель Google вызывает дебаты среди законодателей и специалистов в области безопасности на глобальном уровне.

Этот прорыв Google может кардинально изменить способ взаимодействия людей с фотографиями, предоставляя возможность не только создавать трехмерные аватары из своих фото, но и оживлять целые сцены, расширяя границы креативности.

Напомним, Google объявил о разработке обновленной большой языковой модели, или LLM, под названием Gemini 1.5. Первая версия этой технологии вскоре будет выпущена для раннего тестирования. Информация появилась всего через два месяца после того, как Google представил оригинальную Gemini, которая должна стать ответом на GPT-4 OpenAI и другие LLM.

Gemini — это мультимодальная модель ИИ нового поколения. Это означает, что технология может обрабатывать более одного типа данных, включая комбинацию изображений, текста, аудио, видео и языков кодирования. Технология предназначена для использования в качестве бизнес-инструмента и личного ассистента.

Ознакомьтесь с другими популярными материалами:

Сколько Apple зарабатывала за секунду в 2023 году — AltIndex.com

Чем обусловлена популярность iPhone 13: 5 факторов

Apple запустила свое первое спортивное приложение

Источник: vlogger

google news