Google презентував оновлену Gemini 2.0 і тестову версію Flash

Оновлена модель Gemini 2.0 працює на унікальному обладнанні, зокрема процесорах TPU шостого покоління, пропонує нові можливості та покращену інтеграцію з інструментами, такими як Google Search. Модель вже доступна для розробників і користувачів, а її тестова версія Flash забезпечує ще більшу швидкість і продуктивність, що відкриває нові можливості для автоматизації завдань

Google презентував оновлену Gemini 2.0 і тестову версію Flash Фото: blog.google

Про це йдеться у повідомленні пресслужби.

Генеральний директор Google та материнської компанії Alphabet Сундар Пічаї у своїй заяві зазначив, що Gemini 2.0 дасть змогу створювати нових «AI-агентів», які наблизять нас до реалізації бачення універсального асистента. Він також розповів, що модель включає нові досягнення у сфері мультимодальності — наприклад, нативний вивід зображень і аудіо.

«Якщо Gemini 1.0 був зосереджений на організації та розумінні інформації, то Gemini 2.0 робить її набагато кориснішою, — сказав Пічаї. — Я з нетерпінням чекаю, що принесе ця нова ера».

За його словами, модель побудована на кастомному обладнанні, такому як шосте покоління тензорних процесорів (TPU) від Google, які забезпечували весь процес навчання та виконання задач Gemini 2.0.

Експериментальна версія Flash

Разом із основною моделлю компанія представила Gemini 2.0 Flash — експериментальну версію з підвищеною швидкістю та продуктивністю. Вона вже доступна для розробників через API Google AI та користувачів чат-бота Gemini.

У цій версії підтримуються обробка мультимодальних даних, що дозволяє моделі поєднувати й обробляти інформацію з різних форматів, таких як текст, зображення та аудіо. Наприклад, користувач може завантажити текст із супровідним зображенням або аудіофайлом, і модель зможе об’єднати ці дані для аналізу, створення відповідей або генерації контенту.

Цікаве по темі: Google DeepMind створила найточніший ШІ для прогнозу погоди

Нові функції для розробників

Google також випустив Multimodal Live API, завдяки якому можна створювати застосунки, які працюють із даними з різних джерел у режимі реального часу, забезпечуючи високу точність і ефективність. Наприклад, розробники можуть поєднувати текстовий аналіз, голосове керування та обробку відео в одному продукті, відкриваючи нові сценарії використання для бізнесу й кінцевих користувачів.

Прототипи на основі Gemini 2.0

Google продемонстрував прототипи, які показують можливості Gemini 2.0:

Astra — AI-асистент із підтримкою кількох мов, новими інструментами та зниженою затримкою;
Mariner — розширення для браузера, яке аналізує інформацію на екрані та виконує завдання;
Jules — агент для програмування, який допомагає розробникам автоматизувати процеси на GitHub.

Gemini 2.0 вже тестується в пошуковій системі Google у функції AI Overviews, яка допомагає відповідати на складні питання та задачі. Ця функція охоплює понад мільярд користувачів і стане доступною ширшій аудиторії на початку наступного року.