OpenAI представила нове покоління інструментів генерації зображень — ChatGPT Images 2.0. Оновлення стало одним із найбільших кроків компанії у розвитку генеративного ШІ та напряму націлене на конкуренцію з моделлю Gemini Nano Banana 2 від Google

Фото: freepik.com
Перший прорив у цьому напрямку OpenAI здійснила ще на початку 2025 року, коли запустила нову модель генерації зображень у ChatGPT. Вона швидко стала вірусною та, за даними компанії, допомогла залучити мільйони нових користувачів. Згодом технологію відкрили для розробників через API gpt-image-1, а наприкінці року вийшла вдосконалена версія gpt-image-1.5.
Тепер компанія робить наступний крок. Під час прямої трансляції генеральний директор OpenAI Сем Альтман продемонстрував можливості ChatGPT Images 2.0. Ключове покращення — значно точніша робота з текстом усередині зображень. Модель здатна коректно відтворювати написи в інтерфейсах, наприклад у вікнах macOS або чатах, що раніше було складним завданням для генеративних моделей.
Images 2.0 також краще дотримується інструкцій користувача та зберігає деталі запиту. Це стосується як дрібного тексту та іконок, так і складних композицій або стилістичних вимог. Модель може генерувати зображення з роздільною здатністю до 2K і підтримує різні формати — від широких 3:1 до вертикальних 1:3.
Цікаве по темі: OpenAI представила нову версію ChatGPT — GPT-5.4-Cyber
Окремий акцент зроблено на функціональності. ChatGPT Images 2.0 доступна у двох версіях — instant і thinking. У режимі thinking модель може звертатися до вебу для отримання актуальної інформації, що дозволяє створювати точніші зображення. Також вона здатна генерувати кілька варіантів із одного запиту та перевіряти власні результати.
Ще одна важлива зміна — покращене розуміння мов. Модель значно краще працює з нелатинськими текстами, включно з японською, корейською, китайською, гінді та бенгальською.
Для розробників нова модель gpt-image-2 вже доступна через API. Вартість становить $8 за вхідні дані, $2 за кешовані та $30 за згенерований результат.
ChatGPT Images 2.0 instant уже доступна всім користувачам ChatGPT і Codex. Водночас версія thinking відкрита лише для підписників тарифів Plus, Pro та Business.
Запуск Images 2.0 демонструє, що конкуренція між OpenAI та Google у сфері генерації зображень виходить на новий рівень, де ключову роль відіграють точність, робота з текстом і здатність моделей взаємодіяти з актуальними даними.
Ознайомтеся з іншими популярними матеріалами:
OpenAI закриває ШІ-застосунок Sora для генерації відео
OpenAI залучила $110 млрд інвестицій: куди підуть гроші
OpenAI випускатиме власну техніку на базі ШІ
Джерело: Neowin.