Техногигант Apple презентовал генеративный искусственный интеллект (ИИ) MGIE с открытым кодом, который позволяет редактировать изображения

Фото: freepik.com
Над нейросетью MGIE (MLLM-Guided Image Editing) инженеры Apple работали в сотрудничестве с Калифорнийским университетом в Санта-Барбаре. Воспользоваться демо-версией инструмента можно по ссылке. Полная версия опубликована на GitHub.
ИИ позволяет обрезать, изменять размер, переворачивать и добавлять фильтры к изображениям с помощью текстовых подсказок.
MGIE можно применять для простых и более сложных задач по редактированию изображений, например изменение определенных объектов на фотографии, чтобы сделать их другой формы или ярче.
С помощью инструмента можно также редактировать определенные участки фотографии и, например, изменять волосы, глаза и одежду человека на ней, или удалять элементы на заднем плане.
Читайте также: Peugeot интегрирует ChatGPT в ИИ-помощника в своих авто

Примеры работы инструмента MGIE. Фото: arxiv.org
ИИ-инструмент сочетает в себе две разные мультимодальные языковые модели. Сначала она учится интерпретировать подсказки пользователя. Затем она «представляет», как будет выглядеть редактирование.
Например, в случае просьбы сделать на фотографии небо более голубым, модель корректирует яркость неба на фото. Или можно попросить добавить молнию на снимок пейзажа и тому подобное.
Во время редактирования фотографии с помощью MGIE пользователи должны ввести текстом то, что они хотят изменить на самом изображении.
Вас может заинтересовать: Microsoft инвестирует в медиастартап и даст ему свой ИИ-бот: детали сделки

Примеры работы инструмента MGIE. Фото: arxiv.org
На данный момент Apple не является «большим игроком» в сфере ИИ, в отличие от его конкурентов — Microsoft, Meta или Google. Но генеральный директор компании Тим Кук уже анонсировал, что компания хочет добавить больше функций на основе ИИ к своим устройствам в этом году.
Напомним, в начале февраля Google представил новый инструмент Lumiere на базе искусственного интеллекта (ИИ), который может создать изображение или видео с помощью текста, а также исправить его.
Так, Lumiere способен создавать движение, которое выглядит реалистично и не имеет прерывистости. Это возможно благодаря тому, что программа создает все видеокадры одновременно, а не использует ключевые кадры и изучает, каким должно быть движение.
Ознакомьтесь с другими популярными материалами:
Mastercard создала собственную модель генеративного ИИ
Samsung презентовала линейку смартфонов с ИИ на базе технологии Google
Nvidia применит собственную ИИ-систему в производстве чипов: с какой целью
По материалам VentureBeat