Anthropic представила Claude Opus 4.8

Anthropic випустила нову версію своєї флагманської моделі штучного інтелекту — Claude Opus 4.8. Компанія заявляє, що модель стала ефективнішою у програмуванні, агентних завданнях, логічному мисленні та виконанні складних робочих процесів, зберігши при цьому попередню ціну використання

Фото: chatgpt.com

Новинка є розвитком Claude Opus 4.7, але отримала низку важливих покращень. За даними Anthropic, модель демонструє кращі результати в бенчмарках і працює як надійніший помічник під час виконання багатокрокових завдань.

Однією з головних змін стала підвищена чесність та обережність у відповідях. У компанії зазначають, що багато сучасних ШІ-моделей можуть робити передчасні висновки або повідомляти про досягнутий результат без достатніх доказів. За результатами внутрішніх тестів Claude Opus 4.8 приблизно в чотири рази рідше залишає без уваги помилки у створеному нею коді порівняно з попередньою версією.

Перші користувачі також відзначили, що модель частіше визнає невизначеність у власних висновках і рідше робить необґрунтовані твердження. В Anthropic вважають це важливим кроком до створення більш надійних ШІ-систем для професійного використання.

Окрему увагу компанія приділила безпеці. Перед запуском Opus 4.8 пройшла серію перевірок на відповідність внутрішнім стандартам узгодженості та безпечної поведінки. За підсумками оцінювання модель показала нижчий рівень небажаних дій, включаючи потенційний обман або сприяння неправомірному використанню, ніж Claude Opus 4.7.

Також читайте: ШІ може автоматизувати до половини роботи у фінансовому секторі

Разом із новою моделлю Anthropic представила функцію Dynamic Workflows для Claude Code. Вона дозволяє моделі планувати великі проєкти та запускати сотні паралельних субагентів у межах однієї сесії. Завдяки цьому Claude може працювати над масштабними завданнями на кшталт міграції великих кодових баз із сотнями тисяч рядків коду, самостійно перевіряючи результати перед передачею їх користувачеві.

Ще одним нововведенням став контроль рівня зусиль у сервісі claude.ai. Користувачі тепер можуть самостійно визначати, наскільки глибоко модель аналізуватиме запит. Вищий рівень забезпечує більш детальне опрацювання завдання, тоді як нижчий дозволяє отримувати відповіді швидше та економніше використовувати доступні ліміти.

Anthropic також оновила Messages API. Розробники отримали можливість змінювати системні інструкції для моделі безпосередньо під час виконання завдання, що спрощує керування агентами та складними автоматизованими процесами.

Claude Opus 4.8 вже доступна для всіх користувачів. Вартість використання залишилася незмінною — $5 за 1 млн вхідних токенів і $25 за 1 млн вихідних токенів. Водночас швидкий режим роботи, який забезпечує продуктивність у 2,5 раза вищу за стандартну, тепер коштує втричі дешевше, ніж аналогічні режими в попередніх моделях Anthropic.

Ознайомтеся з іншими популярними матеріалами:

У ChatGPT тепер можна купувати криптовалюту

Google показала майбутнє ШІ-агентів — але не пояснила головного

ШІ-чипи працюватимуть на світлі замість електрики — вчені

Джерело: Anthropic.