Названа лучшая модель ИИ среди чат-ботов

Рейтинг больших языковых моделей (LLM) искусственного интеллекта постоянно меняется с развитием технологий. И недавно установился новый лидер

Фото: freepik.com

Классификацию среди моделей ИИ ведет сервис LMSYS Chatbot Arena. Это краудсорсинговая открытая платформа для оценивания LLM.

Составленный сервисом рейтинг позволяет оценить, какие нейросети сейчас лучше всего справляются со своими задачами по сравнению с конкурентами. Для его составления оцениваются более 300 тыс. человеческих отзывов о работе моделей по системе рейтинга Эло.

Как работает тест — люди вводят запрос и выбирают лучший ответ из нескольких вариантов от разных моделей. На основе тысяч пользовательских тестов формируется и ранжируется топ.

Как свидетельствует новый рейтинг от 7 марта, лидером среди LLM пока является GPT4, две версии которого заняли первые места.

Недавние утверждения Claude, что их модель лучше не подтвердились. Она заняла третью строчку. Сразу за ней расположилась модель Bard (Gemini Pro) от Google. Пятерку лидеров закрывает другая версия Claude. Все эти модели получили рейтинг Эло свыше 1200.

Ознакомиться с подробными актуальными результатами рейтинга крупных языковых моделей можно по ссылке.

Рейтинг LLM. chat.lmsys.org

Напомним, ChatGPT теперь может зачитывать свои ответы вслух. Эта функция появилась в веб- и мобильной версиях ChatGPT.

Новая функция чтения вслух от OpenAI для ChatGPT может пригодиться, когда пользователи находятся в дороге, зачитывая ответы в одном из пяти голосовых вариантов вслух для пользователей. Теперь она доступна как в веб-версии ChatGPT, так и в приложениях ChatGPT для iOS и Android.

Read Aloud может разговаривать на 37 языках, но автоматически определяет язык текста, который читает, и эта функция доступна как для GPT-4, так и для GPT-3.5.

Также развитие языковых моделей искусственного интеллекта демонстрирует то, насколько далеко зашла сегодня наука. Среди последних достижений — Gemini 1.5 Pro от Google и GPT-4 Turbo от OpenAI. В нашей статье мы подробно сравнили их возможности, как двух флагманов на рынке AI.

Ознакомьтесь с другими популярными материалами:

Сколько OpenAI заработал за 2023 год — Financial Times

Microsoft и OpenAI инвестируют в разработку человекоподобных роботов

OpenAI разрешила использовать ChatGPT в военных целях

Названа лучшая модель ИИ среди чат-ботов

Как криптотрейдеры используют ИИ: обзор возможностей, рисков и сервисов

Кто из финансовых компаний лишился права работать в Украине: самые громкие кейсы последних лет

Кто из финкомпаний получил штраф от НБУ и лишился лицензии в мае 2025 — аналитика

Тренды Money20/20 Europe 2025: будущее платежных технологий в условиях глобальных вызовов

Что нужно сделать до операции по коррекции искривленной перегородки носа

4 лучших планшета от Apple для студентов

UniCredit готується закрити бізнес у Росії замість продажу активів

На скільки зросли борги українців по мікрокредитах за рік — Опендатабот

Как взять кредит под залог недвижимости, не выходя из дома

Програма Національний кешбек запрацювала по-новому — Мінекономіки

Названа лучшая модель ИИ среди чат-ботов

Как криптотрейдеры используют ИИ: обзор возможностей, рисков и сервисов

Кто из финансовых компаний лишился права работать в Украине: самые громкие кейсы последних лет

Кто из финкомпаний получил штраф от НБУ и лишился лицензии в мае 2025 — аналитика

Тренды Money20/20 Europe 2025: будущее платежных технологий в условиях глобальных вызовов

Что нужно сделать до операции по коррекции искривленной перегородки носа

4 лучших планшета от Apple для студентов

UniCredit готується закрити бізнес у Росії замість продажу активів

На скільки зросли борги українців по мікрокредитах за рік — Опендатабот

Как взять кредит под залог недвижимости, не выходя из дома

Програма Національний кешбек запрацювала по-новому — Мінекономіки

Хочу получать: