Рейтинг больших языковых моделей (LLM) искусственного интеллекта постоянно меняется с развитием технологий. И недавно установился новый лидер
Классификацию среди моделей ИИ ведет сервис LMSYS Chatbot Arena. Это краудсорсинговая открытая платформа для оценивания LLM.
Составленный сервисом рейтинг позволяет оценить, какие нейросети сейчас лучше всего справляются со своими задачами по сравнению с конкурентами. Для его составления оцениваются более 300 тыс. человеческих отзывов о работе моделей по системе рейтинга Эло.
Как работает тест — люди вводят запрос и выбирают лучший ответ из нескольких вариантов от разных моделей. На основе тысяч пользовательских тестов формируется и ранжируется топ.
Читайте также: Microsoft готовится выпустить первые компьютеры с ИИ: названа дата
Как свидетельствует новый рейтинг от 7 марта, лидером среди LLM пока является GPT4, две версии которого заняли первые места.
Недавние утверждения Claude, что их модель лучше не подтвердились. Она заняла третью строчку. Сразу за ней расположилась модель Bard (Gemini Pro) от Google. Пятерку лидеров закрывает другая версия Claude. Все эти модели получили рейтинг Эло свыше 1200.
Ознакомиться с подробными актуальными результатами рейтинга крупных языковых моделей можно по ссылке.
Напомним, ChatGPT теперь может зачитывать свои ответы вслух. Эта функция появилась в веб- и мобильной версиях ChatGPT.
Новая функция чтения вслух от OpenAI для ChatGPT может пригодиться, когда пользователи находятся в дороге, зачитывая ответы в одном из пяти голосовых вариантов вслух для пользователей. Теперь она доступна как в веб-версии ChatGPT, так и в приложениях ChatGPT для iOS и Android.
Read Aloud может разговаривать на 37 языках, но автоматически определяет язык текста, который читает, и эта функция доступна как для GPT-4, так и для GPT-3.5.
Также развитие языковых моделей искусственного интеллекта демонстрирует то, насколько далеко зашла сегодня наука. Среди последних достижений — Gemini 1.5 Pro от Google и GPT-4 Turbo от OpenAI. В нашей статье мы подробно сравнили их возможности, как двух флагманов на рынке AI.
Ознакомьтесь с другими популярными материалами:
Сколько OpenAI заработал за 2023 год — Financial Times
Microsoft и OpenAI инвестируют в разработку человекоподобных роботов
OpenAI разрешила использовать ChatGPT в военных целях