OpenAI выпускает новые модели ИИ — o3 и o4-mini: чем отличаются и что могут

Сегодня OpenAI выпускает две новые модели искусственного интеллекта: o3, которую компания называет самой мощной моделью для рассуждений, и o4-mini, меньшую и более быструю версию

OpenAI выпускает новые модели ИИ — o3 и o4-mini: чем отличаются и что могут Фото: unsplash.com

Об этом говорится в материале на официальном сайте OpenAI.

«Сегодня мы выпускаем OpenAI o3 и o4-mini — новейшие модели из нашей серии o, обученные думать дольше перед тем, как дать ответ. Это самые умные модели, которые мы выпустили на сегодня, и они представляют существенный шаг вперед в возможностях ChatGPT для всех: от любознательных пользователей до опытных исследователей. Впервые наши модели для рассуждений могут агентно использовать и комбинировать все инструменты ChatGPT — это включает поиск в интернете, анализ загруженных файлов и других данных с помощью Python, глубокое рассуждение о визуальных входных данных и даже генерацию изображений», — говорится в статье.

Отмечается, что эти модели обучены понимать, когда и как использовать инструменты для создания детальных и продуманных ответов в соответствующих форматах вывода, обычно за менее чем минуту, чтобы решить более сложные проблемы.

«Это позволяет им эффективнее решать многогранные вопросы, что является шагом к более автономному ChatGPT, который может самостоятельно выполнять задачи от вашего имени. Сочетание передовых возможностей для рассуждений с полным доступом к инструментам позволяет значительно улучшить производительность как на академических, так и на практических задачах, устанавливая новый стандарт как в интеллектуальности, так и в полезности», — отмечают в OpenAI.

Introducing OpenAI o3 and o4-mini—our smartest and most capable models to date.
For the first time, our reasoning models can agentically use and combine every tool within ChatGPT, including web search, Python, image analysis, file interpretation, and image generation. pic.twitter.com/rDaqV0x0wE
— OpenAI (@OpenAI) April 16, 2025

Что изменилось

OpenAI o3 — это наша самая мощная модель для рассуждений, которая расширяет границы в таких сферах, как программирование, математика, наука, визуальное восприятие и другие. Она устанавливает новый стандарт на таких бенчмарках, как Codeforces, SWE-bench (без создания кастомизированной модели) и MMMU. Она идеально подходит для сложных запросов, требующих многогранного анализа и ответы на которые могут быть не очевидны сразу.

Модель демонстрирует особую силу в визуальных задачах, таких как анализ изображений, графиков и диаграмм. В оценках внешних экспертов o3 делает на 20% меньше серьезных ошибок, чем OpenAI o1, при решении сложных реальных задач, в частности, в таких областях, как программирование, бизнес/консалтинг и креативная идеация. Ранние тестировщики подчеркнули ее аналитическую строгость как партнера в размышлениях и отметили ее способность генерировать и критически оценивать новые гипотезы, в частности в контексте биологии, математики и инженерии.

OpenAI o4-mini — это меньшая модель, оптимизированная для быстрых и экономически эффективных рассуждений. Он демонстрирует впечатляющие результаты по своим размерам и затратам, особенно в математике, программировании и визуальных задачах.

«Это лучшая модель, которая прошла бенчмарки на AIME 2024 и 2025. В оценках экспертов она также превосходит своего предшественника, o3-mini, в задачах вне STEM и в таких областях, как наука о данных. Благодаря своей эффективности o4-mini поддерживает значительно более высокие лимиты использования, чем o3, что делает ее мощным вариантом для высокого объема запросов, которые выигрывают от рассуждений», — говорится в блоге разработчиков.

Внешние экспертные оценщики оценили обе модели как демонстрирующие улучшенную способность следовать инструкциям и предоставлять более полезные, проверенные ответы, чем их предшественники, благодаря улучшенному интеллекту и включению веб-источников.

«По сравнению с предыдущими версиями наших моделей для рассуждений, эти две модели должны также выглядеть более естественными и разговорными, особенно когда они используют память и ссылаются на предыдущие разговоры для создания более персонализированных и релевантных ответов», — отметили в компании.

Инструменты будут доступны уже сегодня для пользователей ChatGPT Plus, Pro и Team в o3, o4-mini и o4-mini-high, а также появятся в o3-pro «через несколько недель».

Ознакомьтесь с другими популярными материалами:

OpenAI обновляет ChatGPT: искусственный интеллект теперь имеет память

Тренд на ИИ-изображения от ChatGPT «плавит» графические процессоры OpenAI

OpenAI запустила свою самую дорогую ИИ-модель