Компанія OpenAI представила GPT-5 — нову флагманську модель штучного інтелекту (ШІ), яка стане основою наступного покоління ChatGPT

GPT-5 стала першою «уніфікованою» моделлю компанії. Вона поєднує логічні здібності моделей серії o з швидкістю відповіді моделей GPT.

На відміну від GPT-4, яка дозволяла відповідати на широкий спектр запитів, GPT-5 здатна виконувати завдання замість користувача — наприклад, створювати програмне забезпечення, керувати календарем чи готувати аналітичні довідки.

Ще одна зміна — GPT-5 стала простіше у використанні. Модель автоматично підбирає найкращий спосіб відповіді: або швидко реагує, або «обдумує» запит довше, щоб дати глибшу відповідь. Це завдяки вбудованому маршрутизатору, який працює в реальному часі.

CEO OpenAI Сем Альтман назвав GPT-5 «найкращою моделлю у світі» та заявив, що це «значний крок» на шляху до створення AGI — штучного загального інтелекту, який зможе перевершити людину у більшості економічно цінних завдань.

«Раніше важко було уявити щось на кшталт GPT-5», — додав Альтман.

GPT-5 буде доступна безкоштовним користувачам ChatGPT за замовчуванням. За словами віцепрезидента ChatGPT Ніка Терлі, це вперше OpenAI відкрила доступ до моделі з потужними логічними можливостями для всіх, а не лише для підписників.

«Це один зі способів реалізувати нашу місію — щоб штучний інтелект дійсно приносив користь людям», — пояснив Терлі.

Великі очікування і перші результати

GPT-5 — одна з найочікуваніших новинок OpenAI з моменту запуску ChatGPT у 2022 році. За цей час ChatGPT перетворився на один із найпопулярніших продуктів у світі — понад 700 млн користувачів щотижня, що становить майже 10% населення планети.

Цікаве по темі: OpenAI запустила режим навчання в ChatGPT

Багато хто вважає, що GPT-5 стане індикатором загального прогресу в сфері штучного інтелекту. Від реакції Кремнієвої долини на цю модель можуть залежати подальші рішення великих IT-компаній, інвесторів і регуляторів.

Легка перевага над конкурентами

OpenAI заявляє, що GPT-5 демонструє найкращі результати в низці тестів, трохи випереджаючи найсильніших конкурентів — Claude Opus 4.1 (Anthropic), Gemini 2.5 Pro (Google DeepMind) та Grok 4 Heavy (xAI Ілона Маска). Але в деяких напрямах GPT-5 дещо поступається.

GPT-5 особливо добре справляється з програмуванням — створює повноцінні додатки «з нуля» у режимі так званого vibe coding. У тесті SWE-bench Verified (реальні завдання з GitHub) GPT-5 показала результат 74,9% з першої спроби. Для порівняння: Claude Opus 4.1 — 74,5%, Gemini 2.5 Pro — 59,6%.

У складному мультипредметному тесті Humanity’s Last Exam модель GPT-5 Pro набрала 42% (з використанням інструментів), тоді як Grok 4 Heavy — 44,4%.

У GPQA Diamond (PhD-рівень питань з природничих наук) GPT-5 Pro показала 89,4%, випередивши Claude Opus 4.1 (80,9%) і Grok 4 Heavy (88,9%).

GPT-5 також значно точніше відповідає на медичні запити. У тесті HealthBench Hard Hallucinations GPT-5 помиляється лише у 1,6% випадків, тоді як GPT-4o — у 12,9%, а o3 — у 15,8%.

У творчих завданнях, як-от написання текстів чи дизайн, GPT-5 звучить природніше, ніж попередники.

GPT-5 також набагато менше «галюцинує» (вигадує факти). У тестах з ChatGPT рівень помилок із GPT-5 (у режимі з мисленням) становив 4,8%, тоді як у o3 — 22%, а GPT-4o — 20,6%.

У тесті Tau-bench, що оцінює агентні здібності ШІ, GPT-5 показала змішані результати: на сайтах авіакомпаній — 63,5% (дещо гірше за o3 — 64,8%), на сайтах рітейлерів — 81,1% (менше, ніж у Claude Opus 4.1 — 82,4%).

GPT-5 також вважається безпечнішою моделлю. Вона рідше вводить в оману, рідше намагається приховати свої дії та краще відрізняє шкідливі запити від безпечних.

Ознайомтеся з іншими популярними матеріалами:

OpenAI запускає ChatGPT agent — автоматизованого ШІ-помічника

OpenAI тестує систему оплати покупок у ChatGPT

OpenAI готує запуск браузера з вбудованим ШІ

Джерело: TechCrunch.