Google запускає Gemini Deep Think — ШІ для складних міркувань

Google DeepMind запускає Gemini 2.5 Deep Think, яку компанія називає своєю найпросунутішою моделлю штучного інтелекту для логічних міркувань. Вона здатна відповідати на запитання, досліджуючи та розглядаючи одночасно кілька ідей, а потім використовуючи ці результати для вибору найкращої відповіді

Фото: freepik.com

Доступ до Gemini 2.5 Deep Think отримають підписники пакета Ultra вартістю $250 на місяць у застосунку Gemini, починаючи з п’ятниці, 1 серпня 2025 року.

Вперше модель було представлено у травні на конференції Google I/O 2025. Це перша публічно доступна мультиагентна модель компанії. Такі системи створюють кілька агентів штучного інтелекту для паралельного розв’язання задачі. Цей процес потребує значно більше обчислювальних ресурсів, ніж робота одного агента, але зазвичай дає якісніші результати.

Google використала варіацію Gemini 2.5 Deep Think, щоб здобути золоту медаль на цьогорічній Міжнародній математичній олімпіаді (IMO).

Разом із запуском Gemini 2.5 Deep Think компанія повідомила, що надасть модель, використану на IMO, обраній групі математиків та науковців. За словами Google, ця модель «потребує годин для міркувань» замість секунд чи хвилин, як більшість споживчих AI. Вона має допомогти в академічних дослідженнях, а також зібрати зворотний зв’язок для вдосконалення мультиагентної системи в наукових випадках застосування.

Читайте також: Mastercard запустила ШІ-платформу для створення дизайну карток

Google наголошує, що Gemini 2.5 Deep Think значно перевищує можливості версії, презентованої на конференції I/O. Також компанія стверджує, що розробила «нові методи навчання з підкріпленням», які допомагають моделі ефективніше використовувати шляхи міркувань.

«Deep Think може допомогти людям розв’язувати задачі, що потребують креативності, стратегічного планування та покрокового вдосконалення», — зазначила компанія у блозі.

За словами Google, Gemini 2.5 Deep Think демонструє найкращі результати на тесті Humanity’s Last Exam (HLE) — складному випробуванні, що вимірює здатність AI відповідати на тисячі краудсорсингових запитань з математики, гуманітарних і природничих наук. Модель Google отримала 34,8% (без інструментів) проти 25,4% у Grok 4 від xAI та 20,3% у o3 від OpenAI.

Також Gemini 2.5 Deep Think перевершує моделі OpenAI, xAI та Anthropic у тесті LiveCodeBench6 — складному змаганні з програмування. Модель Google досягла 87,6%, тоді як Grok 4 набрав 79%, а o3 від OpenAI — 72%.

Ознайомтеся з іншими популярними матеріалами:

PayPal запустив ШІ-систему виявлення шахрайства

Аналітик з Волл-стріт попереджає, що ШІ-бульбашка скоро лусне

У Дії з’явиться голосове керування та AI-асистент — Федоров

За матеріалами techcrunch.com.