Google надав вільний доступ до Gemini 1.5 Pro: як скористатись

Gemini 1.5 Pro від Google — це нова можливість для розробників і не тільки, щоб обробляти великі обсяги даних та створювати нові продукти

Фото: blog.google

Техногігант Google відкрив безплатний доступ всім охочим до своєї нейромережі останнього покоління Gemini 1.5 Pro. Про це оголосив провідний науковий співробітник компанії Джеф Дін на сторінці в X (Twitter).

«Ми з нетерпінням чекаємо на те, що ви створите за допомогою контекстного вікна токенів на 1M! Спочатку ми будемо підключати людей до API повільно, а потім нарощуватимемо темпи», — зазначив він.

Фото: twitter.com/JeffDean

Спробувати повзаємодіяти з Gemini 1.5 Pro можна за посиланням. Хоч нейромережа і підтримує українську мову, але поки недоступна в Україні. Щоб почати роботу, потрібно скористатися VPN (найкраще вибрати США), після чого залогінитися і насолоджуватися новинкою.

Раніше ми детально порівняли можливості Gemini 1.5 Pro від Google і GPT-4 Turbo від OpenAI, як двох флагманів на ринку штучного інтелекту (ШІ).

Особливості Gemini 1.5 Pro

У порівнянні з Gemini 1.0, Gemini 1.5 Pro має набагато швидший час відгуку, і все це завдяки новітній архітектурі Transformer і Mixture-of-Experts (MoE).

Контекстне вікно — одне з найважливіших особливостей Gemini 1.5 Pro. Воно складається з токенів, які можуть бути частинами текстів, зображень, аудіо, коду або відео. Чим більшим є контекстне вікно, тим більше інформації Gemini може прийняти та обробити, щоб згенерувати вихідні дані. Gemini 1.5 Pro поставляється з контекстним вікном на 1 мільйон токенів.

Фото: blog.google

Читайте також: ШІ від Google може попереджати стихійні лиха

Завдяки збільшеному контекстному вікну Gemini 1.5 Pro може обробити 1 годину відео, 11 годин аудіо і код з більш ніж 30 000 рядків або 700 000 слів. Для прикладу, Google завантажив у Gemini 1.5 Pro 402-сторінкову стенограму польоту Аполлона-11 на Місяць і попросив її знайти три комічні моменти. Стенограма містила близько 330 000 лексем, і модель видала точний результат менш ніж за хвилину.

Gemini 1.5 Pro вирізняється своєю здатністю розуміти та генерувати контент у різних форматах. Його здатність до довготривалого контекстного пошуку — революційна, дозволяючи підтримувати узгодженість довгих фрагментів контенту і різних типів даних.

Це робить Gemini 1.5 Pro особливо корисною в освітньому контексті, де вона може надавати пояснення та навчальні посібники, що включають текст, діаграми та відео для більш повного засвоєння матеріалу.

Нагадаємо, дослідники з Google представили новий інструмент на основі штучного інтелекту під назвою VLOGGER, здатний трансформувати статичні фотографії в реалістичні відео. Цей інструмент не тільки оживляє обличчя на фотографіях, а й дає змогу зображенням рухатися і виконувати жести, створюючи ілюзію повноцінного відеозапису.

Ознайомтесь з іншими популярними матеріалами:

ЄС ухвалив закон про регуляцію ШІ: які будуть обмеження

Microsoft надав безплатний доступ до GPT-4 Turbo: як скористатись

Українська компанія потрапила до 100 потенційних єдинорогів Європи