Чому користувачі скаржаться на GPT-4

Спостерігається падіння продуктивності моделі ШІ OpenAI GPT-4. Експерти припускають, що причиною цього може бути серйозна перебудова, що включає більш дрібні спеціалізовані моделі.

ChatGPT. Фото: pexels.com

Останнім часом користувачі GPT-4 повідомляють про зниження його продуктивності. Однак причиною цього можуть бути зміни в моделі. Наприклад, GPT-4, яку колись вважали найпотужнішою моделлю штучного інтелекту, тепер, схоже, стала працювати слабкіше.

Повідомляється, що модель працює не на піку своїх можливостей (критики називають її «ледачою» і «дурною»). Користувачі пишуть про це у Twitter і на форумі розробників OpenAI. Вони розповіли про такі проблеми, як недосконала логіка, відповіді, що повторюються, нездатність відстежувати надану інформацію і слідувати інструкціям.

Один із розробників, який покладається на GPT-4 під час кодування функцій сайту, висловив своє розчарування. Він сказав:

«Це як їздити на Ferrari протягом місяця, а потім раптом машина перетворюється на побитий старий пікап. Я не впевнений, що хочу за це платити».

Таке падіння продуктивності різко контрастує з тим, що було на початку року. Тоді ChatGPT, що працює на GPT-3 і GPT-3.5, вразив світ технологій. Тому, з випуском GPT-4 були пов’язані великі очікування. Цікаво, що після запуску GPT-4 користувачі були задоволені.

Цікаве на тему: Google відправляє ChatGPT на пенсію.

Однак в останні тижні продуктивність GPT-4, схоже, знизилася. Це викликало дискусії у спільноті фахівців зі ШІ. Експерти, зокрема генеральний директор компанії Lamini Шерон Чжоу, припускають, що OpenAI може розробляти більш компактні й менш дорогі версії GPT-4. Такий підхід, що дістав назву Mixture of Experts (MOE), передбачає створення спеціалізованих версій GPT-4 для різних предметних областей. Коли користувачі ставлять запитання, нова система направляє запит до відповідної моделі (моделей).

Чжоу порівнює ситуацію з філософською дилемою корабля Тезея. Це парадокс, який можна сформулювати так:

«Якщо всі складові частини вихідного об’єкта були замінені, чи залишається об’єкт тим самим об’єктом?»

За аналогією, оскільки частини GPT-4 замінюються дрібнішими моделями, у багатьох постає питання: «Чи варто називати вже де-факто новий продукт GPT-4?» Компанія OpenAI поки ніяк не прокоментувала це питання.

Чому так сталося і що далі?

Нещодавно експерти в галузі ШІ поділилися в соціальних мережах своїми прогнозами щодо деталей архітектури GPT-4. Існують дві основні причини для прийняття підходу MOE – розширені можливості реагування та ефективні, швидкі відповіді. Проте між вартістю і якістю може існувати компроміс.

Чжоу припускає, що нещодавнє падіння продуктивності моделі може бути результатом такого підходу. На жаль, на початковому етапі GPT-4 може не показати хороших результатів, оскільки він адаптується до нових завдань. Однак на думку експертів, очікується, що з часом він навчиться і поліпшить свої показники, внаслідок чого стане більш ефективним. У підсумку GPT-4 може стати більш привабливим варіантом для користувачів і розробників.