OpenAI оновила o3-mini: тепер ШІ пояснює хід своїх думок

У відповідь на тиск з боку конкурентів, зокрема китайської ШІ-компанії DeepSeek, OpenAI змінює спосіб, у який її новітня ШІ-модель o3-mini передає поетапний «розумовий» процес

OpenAI оновила o3-mini: тепер ШІ пояснює хід своїх думок Фото: freepik.com

Компанія оголосила, що безкоштовні та платні користувачі ChatGPT побачать оновлений «ланцюжок думок», який показує більше кроків «міркувань» моделі і те, як вона приходить до відповідей на запитання. Підписники преміум-планів ChatGPT, які використовують o3-mini в конфігурації «високого рівня міркувань», також побачать ці оновлені показники.

«Ми представляємо оновлений ланцюжок міркувань для o3-mini, покликаний полегшити людям розуміння того, як мислить модель, — повідомив представник OpenAI. — З цим оновленням ви зможете стежити за міркуваннями моделі, що дасть вам більше ясності і впевненості в її відповідях».

Моделі міркувань, такі як o3-mini, ретельно перевіряють себе, перш ніж видавати результати, що допомагає їм уникнути деяких пасток, які зазвичай підстерігають ШІ. Компроміс полягає в тому, що логічним моделям потрібно трохи більше часу, щоб прийти до рішення — зазвичай на кілька секунд або хвилин довше.

Модель R1 від DeepSeek, модель «міркувань» на кшталт o3-mini, розкриває повний процес мислення, що, на думку багатьох дослідників ШІ, є найкращим підходом. На додаток до того, що модель легше вивчати, кроки міркувань забезпечують кращий користувацький досвід у певних ситуаціях, допомагаючи вказати, коли модель може бути на правильному — або неправильному — шляху.

Цікаве по темі: OpenAI представила першого автоматизованого ШІ-агента

OpenAI вирішив не показувати повні кроки міркувань для o3-mini і його попередників, o1 і o1-mini, частково через конкурентні причини. Замість цього користувачі бачили лише резюме кроків міркувань — резюме, які іноді були помилковими.

OpenAI досі не показує повні кроки міркувань o3-mini, але компанія заявила, що «знайшла баланс»: o3-mini може «вільно мислити», а потім організовувати свої «думки» в більш докладні резюме.

«Щоб підвищити ясність і безпеку, ми додали додатковий етап пост-обробки, на якому модель переглядає сирий ланцюжок думок, видаляючи будь-який небезпечний вміст, а потім спрощує будь-які складні ідеї, — продовжив представник OpenAI. — Крім того, цей етап пост-обробки дозволяє неангломовним користувачам отримувати ланцюжок думок рідною мовою, створюючи більш доступний і дружній досвід».

Ознайомтеся з іншими популярними матеріалами:

OpenAI запустила нову функцію в ChatGPT

OpenAI не запустила анонсований інструмент для захисту авторських прав

OpenAI відкрила ранній доступ до нових ШІ-моделей

Джерело: Tech Crunch.