close-btn

Alibaba запустила моделі ШІ, які розуміють візуальний контент

Alibaba Cloud представила дві моделі штучного інтелекту (ШІ) з відкритим вихідним кодом, які здатні розуміти як зображення, так і текст

Alibaba запустила модели ИИ, которые понимают визуальный контент

Alibaba запустила модели ИИ, которые понимают визуальный контент. Фото freepik.com

Ці моделі – Qwen-VL і Qwen-VL-Chat – були навчені на великій мовній моделі Alibaba Cloud Qwen-7B і пропонують покращену продуктивність розпізнавання і розуміння зображень у порівнянні з іншими моделями з відкритим вихідним кодом

Запуск цих нових моделей демонструє прихильність Alibaba Cloud до просування мультимодальних можливостей для своїх великих мовних моделей, йдеться в пресреліз. Включаючи сенсорні дані, такі як зображення та аудіо, Alibaba Cloud має на меті дослідити нові можливості застосування для дослідників та комерційних організацій.

Ці моделі мають потенціал трансформувати взаємодію користувачів з візуальним контентом, йдеться у пресреліз. Однією з ключових переваг цих моделей є їхня здатність генерувати підписи до фотографій для новин або допомагати людям, які не володіють китайською мовою, читати вуличні вивіски китайською. Крім того, моделі дозволяють візуально відповідати на запитання, роблячи покупки більш доступними для сліпих і слабозорих користувачів.

Попередні великі мовні моделі Alibaba Cloud, Qwen-7B і Qwen-7B-Chat, набули значної популярності з моменту їх запуску місяць тому, отримавши понад 400 000 завантажень, йдеться в пресреліз. Ці моделі стали доступними для розробників, дослідників і комерційних організацій, що полегшує розробку власних генеративних моделей ШІ в економічно ефективний спосіб.

Національне агентство з питань запобігання корупції (НАЗК) внесло китайську групу компаній Alibaba Group Holding Limited до переліку міжнародних спонсорів війни. Це обумовлено співпрацею з рф, зокрема, e-commerce платформа AliExpress використовується для продажу товарів, вивезених з окупованих територій України

Ознайомтеся з іншими популярними матеріалами:

Як стати професіоналом у використанні Bard: рекомендації від Google

Apple розробила технологією для аналізу дихання через iPhone та Apple Watch

Visa і Mastercard зупиняють співпрацю з Binance щодо випуску криптокарток

google news