Технологический гигант Google, принадлежащий материнской компании Alphabet, Inc. объявил о разработке обновленной большой языковой модели, или LLM, под названием Gemini 1.5. Первая версия этой технологии вскоре будет выпущена для раннего тестирования
Об этом написали в блоге гендиректор Google и Alphabet Сундар Пичаи, а также соучредитель и CEO DeepMind Демис Хассабис. Информация появилась всего через два месяца после того, как Google представил оригинальную Gemini, которая должна стать ответом на GPT-4 OpenAI и другие LLM.
Gemini — это мультимодальная модель ИИ нового поколения. Это означает, что технология может обрабатывать более одного типа данных, включая комбинацию изображений, текста, аудио, видео и языков кодирования. Технология предназначена для использования в качестве бизнес-инструмента и личного ассистента.
В Gemini 1.5 используется «модель смеси экспертов»
Gemini 1.5 обещает быть быстрее и эффективнее благодаря методу специализации под названием «смесь экспертов», также известному как MoE. Вместо того, чтобы запускать всю модель каждый раз, когда она получает запрос, MoE в Gemini может использовать только соответствующие части своей вычислительной мощности для получения качественного ответа.
Увеличенное контекстное окно
Мощность ИИ-модели определяется ее контекстным окном, которое состоит из строительных блоков, используемых для обработки информации. Это могут быть слова, изображения, видео, аудио или код. В мире ИИ эти строительные блоки известны как токены.
«Оригинальный Gemini мог работать с 32 000 токенов. Однако емкость контекстного окна Gemini 1.5 Pro может обрабатывать до 1 миллиона токенов. Это означает, что новый LLM может анализировать больше данных, чем предыдущая версия: 1 час видео, 11 часов аудио, кодовые базы из более 30 000 строк кода или более 700 000 слов», — говорится в блоге Google.
Интересное по теме: Google объявил о новых грантах для украинских стартапов
По сравнению с предыдущими версиями, она имеет повышенную производительность
Во время тестирования Gemini 1.5 Pro превзошел своего предшественника в 87% бенчмарков, которые использует Google. Кроме того, в 99% случаев Gemini 1.5 смог найти небольшой фрагмент текста в блоках данных длиной до миллиона токенов во время тестирования, известного как «поиск иглы в стоге сена».
Gemini 1.5 также лучше генерирует хорошие ответы на сверхдлинные запросы, при этом пользователю не нужно тратить много дополнительного времени на точную настройку своих запросов. В Google заявили, что тестировщики дали Gemini 1.5 пособие по грамматике непонятного языка, и он смог перевести текст на английском языке на уровне, подобном тому, как это делает человек.
Gemini 1.5 Pro прошел усиленное тестирование на безопасность
С развитием искусственного интеллекта растет беспокойство о роли технологии в вопросах безопасности. Google заявляет, что перед запуском Gemini 1.5 он прошел тщательное тестирование на этичность и безопасность, чтобы получить разрешение на более широкий запуск. Технологическая компания провела исследование рисков безопасности ИИ и разработала методы для уменьшения потенциального вреда.
Ознакомьтесь с другими популярными материалами:
Google запустил бесплатные ИИ-инструменты для усиления кибербезопасности
Украинский стартап участвует в программе Google
Сколько «налога на Google» заплатили компании в конце 2023 года — Гетманцев
По материалам The Verge.