У відповідь на тиск з боку конкурентів, зокрема китайської ШІ-компанії DeepSeek, OpenAI змінює спосіб, у який її новітня ШІ-модель o3-mini передає поетапний «розумовий» процес
Компанія оголосила, що безкоштовні та платні користувачі ChatGPT побачать оновлений «ланцюжок думок», який показує більше кроків «міркувань» моделі і те, як вона приходить до відповідей на запитання. Підписники преміум-планів ChatGPT, які використовують o3-mini в конфігурації «високого рівня міркувань», також побачать ці оновлені показники.
«Ми представляємо оновлений ланцюжок міркувань для o3-mini, покликаний полегшити людям розуміння того, як мислить модель, — повідомив представник OpenAI. — З цим оновленням ви зможете стежити за міркуваннями моделі, що дасть вам більше ясності і впевненості в її відповідях».
Моделі міркувань, такі як o3-mini, ретельно перевіряють себе, перш ніж видавати результати, що допомагає їм уникнути деяких пасток, які зазвичай підстерігають ШІ. Компроміс полягає в тому, що логічним моделям потрібно трохи більше часу, щоб прийти до рішення — зазвичай на кілька секунд або хвилин довше.
Модель R1 від DeepSeek, модель «міркувань» на кшталт o3-mini, розкриває повний процес мислення, що, на думку багатьох дослідників ШІ, є найкращим підходом. На додаток до того, що модель легше вивчати, кроки міркувань забезпечують кращий користувацький досвід у певних ситуаціях, допомагаючи вказати, коли модель може бути на правильному — або неправильному — шляху.
Цікаве по темі: OpenAI представила першого автоматизованого ШІ-агента
OpenAI вирішив не показувати повні кроки міркувань для o3-mini і його попередників, o1 і o1-mini, частково через конкурентні причини. Замість цього користувачі бачили лише резюме кроків міркувань — резюме, які іноді були помилковими.
OpenAI досі не показує повні кроки міркувань o3-mini, але компанія заявила, що «знайшла баланс»: o3-mini може «вільно мислити», а потім організовувати свої «думки» в більш докладні резюме.
«Щоб підвищити ясність і безпеку, ми додали додатковий етап пост-обробки, на якому модель переглядає сирий ланцюжок думок, видаляючи будь-який небезпечний вміст, а потім спрощує будь-які складні ідеї, — продовжив представник OpenAI. — Крім того, цей етап пост-обробки дозволяє неангломовним користувачам отримувати ланцюжок думок рідною мовою, створюючи більш доступний і дружній досвід».
Ознайомтеся з іншими популярними матеріалами:
OpenAI запустила нову функцію в ChatGPT
OpenAI не запустила анонсований інструмент для захисту авторських прав
OpenAI відкрила ранній доступ до нових ШІ-моделей
Джерело: Tech Crunch.