Google запустила власну нейромережу Gemini: чим вона особлива

Google презентувала свою велику мовну модель (LLM) Gemini, яку в компанії називають найпотужнішою та найефективнішою моделлю штучного інтелекту (ШІ) серед усіх існуючих

Фото: blog.google

Вперше Gemini анонсували ще у травні цього року на заході I/O 2023. Як розповіли в корпорації, загалом нейромережа націлена на просту інтеграцію з API та іншими інструментами.

Gemini містить три компоненти, кожна з яких підтримує фото, аудіо та відео:

Ultra — найбільша та функціональна, в основному призначена для використання в центрах обробки даних та інтеграції з корпоративними програмами;
Pro — для вирішення широкого кола завдань, в майбутньому вона стане основою для сервісів Google;
Nano — для конкретних завдань та автономної роботи на Android.

Найбільш потужною серед них є Ultra, яка включає інформацію з 57 предметів (математики, фізики, історії, права, медицини, етики та інших). Також вона здатна самостійно перевіряти факти та розв’язувати проблеми, що виникають в процесі. В загальному доступі ця модель з’явиться лише наступного року.

«Gemini – це результат спільних зусиль різних команд Google. Ця модель була створена з нуля. Вона може узагальнювати та легко розуміти, обробляти та комбінувати різні типи інформації, включаючи текст, код, аудіо, зображення та відео», — заявив Сундар Пічаї, генеральний директор Alphabet Inc., материнської компанії Google.

Починаючи з 7 грудня, Google Bard використовує Gemini Pro для допомоги користувачам у плануванні, розумінні складних тем та інших задач. Також з 13 грудня розробники та корпоративні клієнти зможуть отримати доступ до моделі Pro через Google Generative AI Studio або Vertex AI у хмарній платформі Google Cloud.

Читайте також: Google оновила політику щодо реклами криптовалют: що зміниться

Gemini проти ChatGPT

Наразі Gemini може обробляти запити лише англійською, але в майбутньому планується додати підтримку інших мов.

Під час презентації Gemini гендиректор Google DeepMind Деміс Гассабіс повідомив, що компанія провела ретельне порівняння своєї мовної моделі з GPT-4, останньою версією нейромережі, що лежить в основі ChatGPT.

За його словами, Gemini випереджає конкурента за 30 із 32 показників. В деяких тестах нейромережа Google випереджає GPT-4 мінімально, тоді як в інших — більш відчутно.

Найбільшою перевагою Gemini під час тестувань стала його здатність розуміти відео та аудіо, а також взаємодіяти з ними. Загалом Google дотримується ідеї інтегрувати ці можливості безпосередньо в Gemini, на відміну від OpenAI, яка створила окремі ШІ-моделі для обробки зображень та аудіо, такі як DALL-E та Whisper.

На цей момент базові версії Gemini підтримують тільки текстове введення та виведення, але більш потужні версії алгоритму, включаючи Gemini Ultra, здатні працювати із зображеннями, відео та аудіо.

Нагадаємо, Google активно працює над розвитком як програмного забезпечення, так і апаратної частини цієї технології. Нещодавно компанія оголосила про створення нових спеціалізованих процесорів та розробку інноваційного «гіперкомп’ютера», призначеного для штучного інтелекту нового покоління.

Ознайомтеся з іншими популярними матеріалами:

Віталік Бутерін: ШІ може перевершити людину як «вищий» вид

Google оголосила найкращі програми та ігри 2023 року

Google Ukraine шукає нового директора до українського офісу: які вимоги