Міф про «відкритий» ШІ: навіщо корпораціям зливати дані про роботу моделей

Може скластись враження, що попри ретельний захист даних про функціонування алгоритмів ШІ, технологічні гіганти потроху відкривають завісу, надаючи стороннім розробникам «відкритий» код та нові можливості. Однак, як зазначають експерти, не все так просто

Artificial intelligence Фото: freepik.com

Відкриття доступу до таємниць ШІ?

В останні місяці зусилля, спрямовані на те, щоб зробити ШІ більш «відкритим», схоже, набрали обертів. У травні стався витік моделі Meta під назвою Llama, який надав стороннім доступ до її базового коду, а також до «вагових коефіцієнтів», що визначають її поведінку.

Потім, у липні цього року, Meta вирішила зробити ще потужнішу модель під назвою Llama 2, доступною для завантаження, модифікації та повторного використання будь-ким. Відтоді моделі Meta стали надзвичайно популярною основою для багатьох компаній, дослідників та аматорів, які створюють інструменти та додатки з можливостями, подібними до ChatGPT.

«У нас є широке коло прихильників у всьому світі, які вірять у наш відкритий підхід до сучасного ШІ… Зокрема, експерти, які прагнуть проводити дослідження з цією моделлю, а також люди з технологічних, наукових і політичних кіл. Вони бачать переваги Llama і відкритої платформи так само, як і ми», — заявили в Meta, анонсуючи Llama 2.

Нагадаємо, що нещодавно Мета випустила ще одну модель, Llama 2 Code, яка допрацьована для кодування.

Цікаве по темі: NVIDIA отримала рекордний дохід у $13,5 млрд завдяки буму ШІ

Не так швидко

Може здатися, що загальний підхід до відкритого вихідного коду, який десятиліттями демократизував доступ до програмного забезпечення, надавав прозорість і підвищував безпеку, тепер готовий мати аналогічний вплив і на ШІ.

«Не так швидко», — стверджує група авторів наукової роботи, яка вивчає реальність Llama 2 та інших моделей ШІ, які так чи інакше описуються як «відкриті». Дослідники з Університету Карнегі-Меллона, Інституту AI Now і Фонду Signal кажуть, що моделі, які називають «відкритими», можуть мати свої підводні камені.

Llama 2 можна безкоштовно завантажувати, модифікувати і розгортати, але на неї не поширюється звичайна ліцензія з відкритим вихідним кодом. Ліцензія Meta забороняє використовувати Llama 2 для навчання інших мовних моделей, і вона вимагає спеціальної ліцензії, якщо розробник розгортає її у додатку або сервісі з більш ніж 700 мільйонами щоденних користувачів.

Такий рівень контролю означає, що Llama 2 може забезпечити значні технічні та стратегічні переваги для Meta. Наприклад, дозволивши компаніям інтегрувати модель у власні застосунки та розвивати її, Meta може скористатись цим, збираючи корисні налаштування, зроблені сторонніми розробниками.

Моделі, які випускаються під звичайними ліцензіями з відкритим вихідним кодом, такі як GPT Neo від некомерційної організації EleutherAI, — «значно відкритіші», — кажуть дослідники. Але таким проєктам складно стати на рівних.

По-перше, дані, необхідні для навчання просунутих моделей, часто тримаються в секреті. По-друге, програмні фреймворки, необхідні для побудови таких моделей, часто контролюються великими корпораціями. Дві найпопулярніші з них, TensorFlow і Pytorch, підтримуються компаніями Google і Meta відповідно.

По-третє, комп’ютерні потужності, необхідні для навчання великої моделі, також не під силу звичайному розробнику чи компанії — зазвичай для одного тренувального прогону потрібні десятки чи сотні мільйонів доларів. І, нарешті, людська праця, необхідна для доопрацювання та вдосконалення цих моделей, також є ресурсом, який здебільшого доступний лише великим компаніям з «глибокими кишенями».

Все на благо корпорацій

За такого розвитку подій одна з найважливіших технологій десятиліть може зрештою збагатити і розширити можливості лише кількох компаній, серед яких OpenAI, Microsoft, Meta і Google. Якщо ШІ дійсно є такою технологією, що змінює світ, то найбільші переваги можна було б відчути, якби вона стала більш доступною і поширеною.

«Наш аналіз показує, що відкритість не лише не сприяє «демократизації» ШІ. Виходить так, що компанії, які використовують «відкриті» моделі штучного інтелекту, лише зміцнюють та розширюють централізовану владу (технологічних гігантів)», — каже Мередіт Віттакер, президентка Signal, дослідниця і одна з авторів звіту.

Ознайомтеся з іншими популярними матеріалами:

YouTube та Universal Music Group об’єдналися для захисту прав виконавців від ШІ

MediaTek інтегрує генеративний ШІ Meta у свої чіпи для смартфонів

Meta представляє ШІ для перекладу SeamlessM4T: які переваги

За матеріалами wired.com.

Міф про «відкритий» ШІ: навіщо корпораціям зливати дані про роботу моделей

Відкриття доступу до таємниць ШІ?

Не так швидко

Все на благо корпорацій

Готовність до кіберзагроз: як IBM Power і FlashSystem підвищують кіберстійкість інфраструктури

Ілон Маск окреслив три принципи безпечного розвитку ШІ

Amazon анонсувала запуск трьох ШІ-агентів

Україна увійшла до списку лідерів з розвитку ШІ

Nvidia представила нові відкриті моделі ШІ та набір інструментів Cosmos

Українську LLM тренуватимуть на моделі Gemma від Google

Що передбачає нова програма МВФ та які вимоги до України: коментарі експертів

Ще 10 днів щоб стати фінтех-легендою: Чорна п’ятниця PSM Awards

Інвестори масово виводять кошти з Біткоїн-ETF BlackRock

Хто представить Україну на головній технологічній виставці світу CES 2026

Українські стартапи можуть пройти безкоштовне навчання від YEP Accelerator

Netflix офіційно купує Warner Bros.

Скільки донатів збирають на банки monobank щомісяця — Опендатабот

Binance запустив криптозастосунок для дітей і підлітків

Скільки ЄСВ сплатили українці у 2025

Міф про «відкритий» ШІ: навіщо корпораціям зливати дані про роботу моделей

Відкриття доступу до таємниць ШІ?

Не так швидко

Все на благо корпорацій

Готовність до кіберзагроз: як IBM Power і FlashSystem підвищують кіберстійкість інфраструктури

Ілон Маск окреслив три принципи безпечного розвитку ШІ

Amazon анонсувала запуск трьох ШІ-агентів

Україна увійшла до списку лідерів з розвитку ШІ

Nvidia представила нові відкриті моделі ШІ та набір інструментів Cosmos

Українську LLM тренуватимуть на моделі Gemma від Google

Що передбачає нова програма МВФ та які вимоги до України: коментарі експертів

Ще 10 днів щоб стати фінтех-легендою: Чорна п’ятниця PSM Awards

Інвестори масово виводять кошти з Біткоїн-ETF BlackRock

Хто представить Україну на головній технологічній виставці світу CES 2026

Українські стартапи можуть пройти безкоштовне навчання від YEP Accelerator

Netflix офіційно купує Warner Bros.

Скільки донатів збирають на банки monobank щомісяця — Опендатабот

Binance запустив криптозастосунок для дітей і підлітків

Скільки ЄСВ сплатили українці у 2025

Хочу отримувати: