Gemini 1.5 Pro від Google — це нова можливість для розробників і не тільки, щоб обробляти великі обсяги даних та створювати нові продукти
Техногігант Google відкрив безплатний доступ всім охочим до своєї нейромережі останнього покоління Gemini 1.5 Pro. Про це оголосив провідний науковий співробітник компанії Джеф Дін на сторінці в X (Twitter).
«Ми з нетерпінням чекаємо на те, що ви створите за допомогою контекстного вікна токенів на 1M! Спочатку ми будемо підключати людей до API повільно, а потім нарощуватимемо темпи», — зазначив він.
Спробувати повзаємодіяти з Gemini 1.5 Pro можна за посиланням. Хоч нейромережа і підтримує українську мову, але поки недоступна в Україні. Щоб почати роботу, потрібно скористатися VPN (найкраще вибрати США), після чого залогінитися і насолоджуватися новинкою.
Раніше ми детально порівняли можливості Gemini 1.5 Pro від Google і GPT-4 Turbo від OpenAI, як двох флагманів на ринку штучного інтелекту (ШІ).
Особливості Gemini 1.5 Pro
У порівнянні з Gemini 1.0, Gemini 1.5 Pro має набагато швидший час відгуку, і все це завдяки новітній архітектурі Transformer і Mixture-of-Experts (MoE).
Контекстне вікно — одне з найважливіших особливостей Gemini 1.5 Pro. Воно складається з токенів, які можуть бути частинами текстів, зображень, аудіо, коду або відео. Чим більшим є контекстне вікно, тим більше інформації Gemini може прийняти та обробити, щоб згенерувати вихідні дані. Gemini 1.5 Pro поставляється з контекстним вікном на 1 мільйон токенів.
Читайте також: ШІ від Google може попереджати стихійні лиха
Завдяки збільшеному контекстному вікну Gemini 1.5 Pro може обробити 1 годину відео, 11 годин аудіо і код з більш ніж 30 000 рядків або 700 000 слів. Для прикладу, Google завантажив у Gemini 1.5 Pro 402-сторінкову стенограму польоту Аполлона-11 на Місяць і попросив її знайти три комічні моменти. Стенограма містила близько 330 000 лексем, і модель видала точний результат менш ніж за хвилину.
Gemini 1.5 Pro вирізняється своєю здатністю розуміти та генерувати контент у різних форматах. Його здатність до довготривалого контекстного пошуку — революційна, дозволяючи підтримувати узгодженість довгих фрагментів контенту і різних типів даних.
Це робить Gemini 1.5 Pro особливо корисною в освітньому контексті, де вона може надавати пояснення та навчальні посібники, що включають текст, діаграми та відео для більш повного засвоєння матеріалу.
Нагадаємо, дослідники з Google представили новий інструмент на основі штучного інтелекту під назвою VLOGGER, здатний трансформувати статичні фотографії в реалістичні відео. Цей інструмент не тільки оживляє обличчя на фотографіях, а й дає змогу зображенням рухатися і виконувати жести, створюючи ілюзію повноцінного відеозапису.
Ознайомтесь з іншими популярними матеріалами:
ЄС ухвалив закон про регуляцію ШІ: які будуть обмеження
Microsoft надав безплатний доступ до GPT-4 Turbo: як скористатись
Українська компанія потрапила до 100 потенційних єдинорогів Європи