Французький стартап Mistral, що займається розробкою штучного інтелекту, розробляє свою першу мультимодальну модель, яка може обробляти як зображення, так і текст
Модель з 12 мільярдами параметрів під назвою Pixtral 12B має розмір близько 24 ГБ. Параметри приблизно відповідають навичкам моделі вирішувати проблеми, і моделі з більшою кількістю параметрів, як правило, працюють краще, ніж моделі з меншою кількістю параметрів.
Побудована на основі однієї з текстових моделей Mistral, Nemo 12B, нова модель може відповідати на питання про довільну кількість зображень довільного розміру, заданих або URL-адресами, або зображеннями, закодованими за допомогою base64, схеми кодування двійково-десяткового коду в текст.
Подібно до інших мультимодальних моделей, таких як сімейство Claude від Anthropic і GPT-4o від OpenAI, Pixtral 12B повинен — принаймні в теорії — виконувати такі завдання, як підписи до зображень і підрахунок кількості об’єктів на фото.
У своєму пості на X Софія Ян, керівник відділу зв’язків з розробниками Mistral, повідомила, що Pixtral 12B незабаром буде доступний для тестування на чат-ботах і API-платформах Mistral, Le Chat і Le Plateforme.
Цікаве по темі: Голосовий режим ChatGPT може бути небезпечним для людей: причини
Наразі незрозуміло, які саме дані Mistral міг використати для розробки Pixtral 12B. Більшість генеративних моделей ШІ, в тому числі й інші моделі компанії Mistral, навчаються на величезній кількості публічних даних з інтернету, які часто захищені авторським правом. Деякі виробники моделей стверджують, що права «добросовісного використання» дають їм право вилучати будь-які публічні дані, але багато правовласників не погоджуються з цим і подали позови проти великих ШІ-компаній, таких як OpenAI і Midjourney, щоб покласти край такій практиці.
Pixtral 12B з’явився після того, як компанія Mistral закрила раунд фінансування на суму $645 млн під керівництвом General Catalyst, який оцінив компанію в $6 млрд. Компанія Mistral, міноритарним акціонером якої є Microsoft, існує трохи більше року, і багато хто в ШІ-спільноті розглядає її як європейську відповідь OpenAI. Досі стратегія молодої компанії полягала у випуску безкоштовних «відкритих» моделей, стягуванні плати за керовані версії цих моделей та наданні консалтингових послуг корпоративним клієнтам.
Нагадаємо, що підписка на ChatGPT може здорожчати у 100 разів. Шляхом підвищення вартості підписки на ChatGPT компанія OpenAI хоче стабілізувати своє фінансове становище.
Ознайомтеся з іншими популярними матеріалами:
OpenAI надав безплатний доступ до DALL-E 3 в ChatGPT
Українська ІТ-компанія розробила конкурента ChatGPT
У Китаї створили ШІ, який може перевершити ChatGPT
За матеріалами: Tech Crunch.