Китайські вчені представили інструмент під назвою Woodpecker, призначений для виправлення галюцинацій штучного інтелекту у великих мовних моделях
Група вчених з Університету науки й технологій Китаю та лабораторії YouTu Lab компанії Tencent розробила принципово нове рішення проблеми галюцинацій ШІ в мультимодальних моделях великої мови (MLLM).
Рішення було представлено в опублікованій науковій роботі під назвою “Woodpecker: корекція галюцинацій для мультимодальних великих мовних моделей”.
Woodpecker використовує три різні моделі ШІ: GPT-3.5 turbo, Grounding DINO та BLIP-2-FlanT5. Їхнє спільне використання дає змогу створити систему, у якій спочатку проводять оцінювання, що виявляє галюцинації, а потім дають команду моделі, що піддається корекції на галюцинації, перебудувати свій результат відповідно до отриманих даних.
Це вже не перша спроба виправити проблему галюцинацій у моделях ШІ. До цього наявні рішення передбачали підхід, заснований на налаштуванні за інструкціями, який вимагав перенавчання моделі на конкретних даних. Однак ці методи вимагали великих обсягів даних і обчислень, що рівною мірою означає їхню дорожнечу.
Відповідно до назви фреймворк Woodpecker працює в п’ять етапів, включно з витяганням ключових понять, формулюванням запитань, перевіркою візуальних знань, генерацією візуальних тверджень і корекцією галюцинацій.
Галюцинації в моделях ШІ
Як приклад можна навести ситуацію, коли модель штучного інтелекту генерує результати з високим ступенем імовірності, але вони не відповідають інформації, закладеної в її навчальних даних.
Такі сценарії значною мірою спостерігаються під час дослідження великих мовних моделей (Large Language Model, LLM). Прикладами застосунків ШІ, що використовують LLM і схильні до ризику виникнення подібних галюцинацій, є ChatGPT компанії OpenAI та Claude компанії Anthropic.
Детальніше про це читайте в нашій статті Що таке ШІ-галюцинація та як її виявити звичайному користувачеві“.
Інші цікаві матеріали:
- Як заробити на штучному інтелекті: 5 перевірених способів
- 10 реалістичних технологічних прогнозів на наступні 30 років
- Топ ботів-психотерапевтів для підтримки ментального здоров’я