Pantera Capital і підрозділ цифрових активів Франкліна Темплтона приєдналися до першої когорти Arena, нового середовища тестування від лабораторії штучного інтелекту Sentient з відкритим кодом, яке розроблено для оцінки ефективності роботи агентів ШІ в корпоративних робочих процесах.
У п’ятничному повідомленні, оприлюдненому для Cointelegraph, Sentient позиціонує Arena як платформу для порівняльного аналізу у виробничому стилі, а не як тест статичної моделі. Замість того, щоб оцінювати агентів лише за фіксованими наборами даних, він запускає їх через стандартизовані завдання, змодельовані на умовах підприємства, включаючи довгі документи, неповну інформацію та суперечливі джерела.
«На цьому початковому етапі участь стосується підтримки програми Arena і когорти розробників», — сказав Cointelegraph Олег Голєв, керівник продукту Sentient Labs.
Він сказав, що партнери допомагають сформувати те, як виглядає «готове до виробництва обґрунтування» для важких завдань, пов’язаних із документами, таких як аналіз, відповідність і операції. Компанії не оголошують про капітальні зобов’язання, пов’язані з ініціативою.
Запуск відбувається в той момент, коли підприємства прискорюють розгортання агентів штучного інтелекту в дослідницьких і операційних робочих процесах, незважаючи на відставання систем управління.
Відповідно до звіту Celonis 2026 Process Optimization Report, опублікованого 4 лютого, 85% опитаних керівників вищої ланки бізнесу прагнуть стати «агентними підприємствами» протягом трьох років, тоді як лише 19% зараз використовують багатоагентні системи.

Оцінка в стилі виробництва, а не статична оцінка
Голев описав Arena як спільну платформу, де розробники піддають агентам штучного інтелекту стандартизовані завдання та порівнюють результати в постійних умовах тестування.
Платформа відстежує категорії невдач, такі як галюцинації, відсутність доказів, неправильні цитати та прогалини в аргументації, дозволяючи розробникам діагностувати проблеми, що повторюються.
Arena планує опублікувати порівняльні показники продуктивності через загальнодоступну таблицю лідерів і опублікувати посмертні підсумки типових режимів несправностей і виправлень.
Партнери з інфраструктури, включаючи OpenRouter і Fireworks, надають обчислення висновків для початкової когорти, тоді як інші партнери підтримують інструменти та семінари.
Рівень управління на тлі зростання автономії ШІ
Ініціатива виникає, коли фінансові та криптовалютні фірми експериментують із наданням систем ШІ більшої економічної автономії.
У середу MoonPay запустив інфраструктуру, яка дозволяє агентам штучного інтелекту створювати гаманці та виконувати транзакції стейблкойнів.
У четвер керівники Stripe попередили, що блокчейни можуть потребувати значного вдосконалення масштабування, якщо комерція, керована ШІ, розшириться.








