Техногігант Apple презентував генеративний штучний інтелект (ШІ) MGIE з відкритим кодом, який дозволяє редагувати зображення
Над нейромережею MGIE (MLLM-Guided Image Editing) інженери Apple працювали в співробітництві з Каліфорнійським університетом у Санта-Барбарі. Скористатись демоверсією інструмента можна за посиланням. Повна версія опублікована на GitHub.
ШІ дозволяє обрізати, змінювати розмір, перевертати та додавати фільтри до зображень за допомогою текстових підказок.
MGIE можна застосовувати для простих і складніших завдань з редагування зображень, як-от зміна певних об’єктів на фотографії, щоб зробити їх іншої форми або яскравішими.
За допомогою інструмента можна також редагувати певні ділянки фотографії та, наприклад, змінювати волосся, очі та одяг людини на ній, або видаляти елементи на задньому плані.
Читайте також: Peugeot інтегрує ChatGPT в ШІ-помічника у своїх авто
ШІ-інструмент поєднує в собі дві різні мультимодальні мовні моделі. Спочатку вона навчається інтерпретувати підказки користувача. Потім вона «уявляє», як виглядатиме редагування.
Наприклад, в разі прохання зробити на фотографії небо більш блакитним, модель корегує яскравість неба на фото. Або можна попросити додати блискавку на знімок пейзажу і тому подібне.
Під час редагування фотографії за допомогою MGIE користувачі повинні ввести текстом те, що вони хочуть змінити на самому зображенні.
Вас може зацікавити: Microsoft інвестує в медіастартап та дасть йому свій ШІ-бот: деталі угоди
Наразі Apple не є «великим гравцем» у сфері ШІ, на відміну від його конкурентів — Microsoft, Meta або Google. Але генеральний директор компанії Тім Кук вже анонсував, що компанія хоче додати більше функцій на основі ШІ до своїх пристроїв цього року.
Нагадаємо, на початку лютого Google представив новий інструмент Lumiere на базі штучного інтелекту (ШІ), який може створити зображення або відео за допомогою тексту, а також виправити його.
Так, Lumiere здатен створювати рух, який виглядає реалістично і не має переривчастості. Це можливо завдяки тому, що програма створює всі відеокадри одночасно, а не використовує ключові кадри й вивчає, яким має бути рух.
Ознайомтесь з іншими популярними матеріалами:
Mastercard створила власну модель генеративного ШІ
Samsung презентувала лінійку смартфонів з ШІ на базі технології Google
Nvidia застосує власну ШІ-систему у виробництві чипів: з якою метою
За матеріалами VentureBeat