close-btn

Nvidia представила нову ШІ-модель для фізичного світу

Nvidia анонсувала Cosmos 3 — нову відкриту базову модель для фізичного штучного інтелекту, яка може стати основою для навчання роботів, автономного транспорту та систем комп’ютерного зору

Nvidia представила нову ШІ-модель для фізичного світу

Фото: thedigital.gov.ua

Компанія стверджує, що модель здатна скоротити цикли розробки та тестування фізичного ШІ з місяців до кількох днів завдяки поєднанню генерації, прогнозування та логічного аналізу в одній системі.

За словами Nvidia, Cosmos 3 є першою повністю відкритою омнімоделлю, яка нативно працює з текстом, зображеннями, відео, звуком та діями. Модель здатна не лише аналізувати інформацію з різних джерел, а й генерувати нові сценарії, прогнозувати розвиток подій та моделювати поведінку об’єктів у фізичному світі.

Генеральний директор Nvidia Дженсен Хуанг заявив, що прориви в мультимодальних моделях наближають початок нової ери фізичного ШІ.

«Сімейство відкритих передових омнімоделей Cosmos 3 дає розробникам безпрецедентні можливості для створення роботів, автономних транспортних засобів та систем комп’ютерного зору, які можуть сприймати, міркувати, планувати та діяти у фізичному світі», — зазначив він.

В основі Cosmos 3 лежить нова архітектура mixture-of-transformers, яка об’єднує два спеціалізовані компоненти. Один відповідає за логічний аналіз і розуміння навколишнього середовища, а інший — за генерацію відео та прогнозування можливих дій. Такий підхід дозволяє моделі спочатку оцінити взаємодію об’єктів, їхній рух і просторово-часові зв’язки, а вже потім створювати симуляції або прогнозувати майбутні стани середовища.

Читайте також: Nvidia підвищила дивіденди на 2 400%

Модель навчали на одному з найбільших мультимодальних наборів даних для фізичного ШІ. До нього увійшли мільярди прикладів тексту, зображень, відео, звукових записів та траєкторій руху. У Nvidia вважають, що це дозволить компаніям створювати ефективні системи фізичного ШІ з меншими витратами на збір даних і навчання моделей.

Cosmos 3 можна використовувати як мультимодальну модель для аналізу даних, модель світу для симуляції фізичних середовищ або як основу для моделей дій, які навчають роботів виконувати конкретні завдання.

Разом із запуском моделі Nvidia також оголосила про створення Cosmos Coalition — міжнародної коаліції розробників моделей світу та ШІ. До числа перших учасників увійшли Agile Robots, Black Forest Labs, Generalist, LTX, Runway і Skild AI. Учасники співпрацюватимуть над розвитком відкритих моделей світу, обміном дослідженнями та методиками оцінювання.

Лінійка Cosmos 3 наразі складається з двох доступних моделей — Cosmos 3 Super для завдань, де потрібна максимальна точність фізичного моделювання, та Cosmos 3 Nano для швидкого аналізу відео й прогнозування дій. Також Nvidia анонсувала Cosmos 3 Edge для роботи в режимі реального часу на периферійних пристроях.

Серед компаній, які вже використовують платформу Cosmos для розвитку фізичного ШІ, Nvidia називає Agile Robots, Doosan Robotics, LG Electronics, Samsung Electronics, Skild AI та автовиробника Li Auto. Компанія також повідомила, що відкриті моделі вже доступні для тестування та завантаження через власні сервіси й платформу Hugging Face.

Ознайомтеся з іншими популярними матеріалами:

9 акцій, які варто купити за версією Трампа

Частка проблемних кредитів в українських банках знизилася — НБУ

Фондовий ринок США наблизився до рівнів Великої депресії

Джерело: Nvidia.

google news
Akurateco banner
credit link image
×
Підписуйтесь на нас в Telegram та Viber!
x

Введіть запрос вище та натисніть Enter щоб шукати.