У понеділок компанія Nvidia представила нову ШІ-інфраструктуру та моделі, розвиваючи базові технології для систем, що працюють у фізичному світі (коли алгоритми діють у пристроях і керують діями в реальному середовищі), зокрема для роботів і автономних транспортних засобів, які можуть сприймати реальний світ і взаємодіяти з ним

Фото: nvidianews.nvidia.com
Напівпровідниковий гігант представив Alpamayo-R1 — відкриту зорово-мовну модель із міркуванням для досліджень автономного водіння — на конференції NeurIPS у Сан-Дієго, Каліфорнія. Компанія стверджує, що це перша подібна модель дій, сфокусована на автономному водінні. Відповідні системи можуть одночасно обробляти текст і зображення, що дозволяє транспортним засобам «бачити» своє оточення та ухвалювати рішення на основі того, що вони сприймають.
Нова розробка базується на Cosmos-Reason від Nvidia — ШІ з міркуванням, який «продумує» рішення перед тим, як відповісти. Сімейство Cosmos компанія вперше представила у січні 2025 року, а в серпні випустила нові моделі.
За словами Nvidia, технології на кшталт Alpamayo-R1 є критично важливими для компаній, які прагнуть досягти 4-го рівня автономного водіння — повної самостійності авто в межах визначеної зони та за конкретних умов.
Nvidia сподівається, що такі моделі з міркуванням дадуть автономним автомобілям «здоровий глузд», щоб краще підходити до нюансних рішень на дорозі так, як це роблять люди.
Ця модель доступна на GitHub і Hugging Face.
Читайте також: Україна почала працювати з NVIDIA для розбудови суверенного ШІ
Паралельно Nvidia виклала на GitHub покрокові інструкції, ресурси для запуску моделей, а також приклади та шаблони для донавчання — усе це компанія об’єднала під назвою Cosmos Cookbook. Це має допомогти розробникам ефективніше використовувати і тренувати сімейство Cosmos під свої завдання. Посібник охоплює підбір і підготовку даних, генерацію синтетичних даних та оцінювання.
Ці анонси з’явилися на тлі того, що компанія активно просуває втілений ШІ як новий напрям для своїх передових графічних процесорів. Співзасновник і CEO Nvidia Дженсен Хуанг неодноразово казав, що наступна хвиля штучного інтелекту — це ШІ, який працює у фізичному світі (втілений). Головний науковець Nvidia Білл Даллі підтримав цю тезу в літній розмові з TechCrunch, наголосивши на важливості робототехніки.
«Я думаю, зрештою роботи стануть величезним гравцем у світі, і ми хочемо, по суті, створювати «мозок» для всіх роботів, — сказав тоді Даллі. — Щоб зробити це, нам потрібно почати розробляти ключові технології».
Раніше ми також писали, що Nvidia 29 жовтня досягла історичного рівня ринкової капіталізації — $5 трлн. Це сталося завдяки серії угод генерального директора Дженсена Хуана, що підживили нову хвилю ажіотажу навколо штучного інтелекту.
Ознайомтеся з іншими популярними матеріалами:
Nvidia інвестує до $2 млрд у стартап Ілона Маска xAI
Nvidia інвестувала $5 млрд у Intel
Ілон Маск створить дитячий ШІ-чат-бот Baby Grok
За матеріалами techcrunch.com.