Спостерігається падіння продуктивності моделі ШІ OpenAI GPT-4. Експерти припускають, що причиною цього може бути серйозна перебудова, що включає більш дрібні спеціалізовані моделі.
Останнім часом користувачі GPT-4 повідомляють про зниження його продуктивності. Однак причиною цього можуть бути зміни в моделі. Наприклад, GPT-4, яку колись вважали найпотужнішою моделлю штучного інтелекту, тепер, схоже, стала працювати слабкіше.
Повідомляється, що модель працює не на піку своїх можливостей (критики називають її «ледачою» і «дурною»). Користувачі пишуть про це у Twitter і на форумі розробників OpenAI. Вони розповіли про такі проблеми, як недосконала логіка, відповіді, що повторюються, нездатність відстежувати надану інформацію і слідувати інструкціям.
Один із розробників, який покладається на GPT-4 під час кодування функцій сайту, висловив своє розчарування. Він сказав:
«Це як їздити на Ferrari протягом місяця, а потім раптом машина перетворюється на побитий старий пікап. Я не впевнений, що хочу за це платити».
Таке падіння продуктивності різко контрастує з тим, що було на початку року. Тоді ChatGPT, що працює на GPT-3 і GPT-3.5, вразив світ технологій. Тому, з випуском GPT-4 були пов’язані великі очікування. Цікаво, що після запуску GPT-4 користувачі були задоволені.
Цікаве на тему: Google відправляє ChatGPT на пенсію.
Однак в останні тижні продуктивність GPT-4, схоже, знизилася. Це викликало дискусії у спільноті фахівців зі ШІ. Експерти, зокрема генеральний директор компанії Lamini Шерон Чжоу, припускають, що OpenAI може розробляти більш компактні й менш дорогі версії GPT-4. Такий підхід, що дістав назву Mixture of Experts (MOE), передбачає створення спеціалізованих версій GPT-4 для різних предметних областей. Коли користувачі ставлять запитання, нова система направляє запит до відповідної моделі (моделей).
Чжоу порівнює ситуацію з філософською дилемою корабля Тезея. Це парадокс, який можна сформулювати так:
«Якщо всі складові частини вихідного об’єкта були замінені, чи залишається об’єкт тим самим об’єктом?»
За аналогією, оскільки частини GPT-4 замінюються дрібнішими моделями, у багатьох постає питання: «Чи варто називати вже де-факто новий продукт GPT-4?» Компанія OpenAI поки ніяк не прокоментувала це питання.
Чому так сталося і що далі?
Нещодавно експерти в галузі ШІ поділилися в соціальних мережах своїми прогнозами щодо деталей архітектури GPT-4. Існують дві основні причини для прийняття підходу MOE – розширені можливості реагування та ефективні, швидкі відповіді. Проте між вартістю і якістю може існувати компроміс.
Чжоу припускає, що нещодавнє падіння продуктивності моделі може бути результатом такого підходу. На жаль, на початковому етапі GPT-4 може не показати хороших результатів, оскільки він адаптується до нових завдань. Однак на думку експертів, очікується, що з часом він навчиться і поліпшить свої показники, внаслідок чого стане більш ефективним. У підсумку GPT-4 може стати більш привабливим варіантом для користувачів і розробників.
Інші статті на цю тему:
- П’ять найкращих плагінів у роботі з ChatGPT;
- Як заробити тисячі доларів за допомогою ChatGPT: історія письменника;
- OpenAI запускає офіційний додаток ChatGPT для iOS.
За матеріалами: Business Insider.