Apple выпустила ИИ-инструмент для обработки фото: как работает

Техногигант Apple презентовал генеративный искусственный интеллект (ИИ) MGIE с открытым кодом, который позволяет редактировать изображения

Фото: freepik.com

Над нейросетью MGIE (MLLM-Guided Image Editing) инженеры Apple работали в сотрудничестве с Калифорнийским университетом в Санта-Барбаре. Воспользоваться демо-версией инструмента можно по ссылке. Полная версия опубликована на GitHub.

ИИ позволяет обрезать, изменять размер, переворачивать и добавлять фильтры к изображениям с помощью текстовых подсказок.

MGIE можно применять для простых и более сложных задач по редактированию изображений, например изменение определенных объектов на фотографии, чтобы сделать их другой формы или ярче.

С помощью инструмента можно также редактировать определенные участки фотографии и, например, изменять волосы, глаза и одежду человека на ней, или удалять элементы на заднем плане.

Примеры работы инструмента MGIE. Фото: arxiv.org

ИИ-инструмент сочетает в себе две разные мультимодальные языковые модели. Сначала она учится интерпретировать подсказки пользователя. Затем она «представляет», как будет выглядеть редактирование.

Например, в случае просьбы сделать на фотографии небо более голубым, модель корректирует яркость неба на фото. Или можно попросить добавить молнию на снимок пейзажа и тому подобное.

Во время редактирования фотографии с помощью MGIE пользователи должны ввести текстом то, что они хотят изменить на самом изображении.

Вас может заинтересовать: Microsoft инвестирует в медиастартап и даст ему свой ИИ-бот: детали сделки

Примеры работы инструмента MGIE. Фото: arxiv.org

На данный момент Apple не является «большим игроком» в сфере ИИ, в отличие от его конкурентов — Microsoft, Meta или Google. Но генеральный директор компании Тим Кук уже анонсировал, что компания хочет добавить больше функций на основе ИИ к своим устройствам в этом году.

Напомним, в начале февраля Google представил новый инструмент Lumiere на базе искусственного интеллекта (ИИ), который может создать изображение или видео с помощью текста, а также исправить его.

Так, Lumiere способен создавать движение, которое выглядит реалистично и не имеет прерывистости. Это возможно благодаря тому, что программа создает все видеокадры одновременно, а не использует ключевые кадры и изучает, каким должно быть движение.

Ознакомьтесь с другими популярными материалами:

Mastercard создала собственную модель генеративного ИИ

Samsung презентовала линейку смартфонов с ИИ на базе технологии Google

Nvidia применит собственную ИИ-систему в производстве чипов: с какой целью

По материалам VentureBeat