Pantera Capital и подразделение цифровых активов Франклина Темплтона присоединились к первой группе Arena, новой среды тестирования от лаборатории искусственного интеллекта с открытым исходным кодом Sentient, которая предназначена для оценки того, как агенты искусственного интеллекта работают в рабочих процессах корпоративного стиля.
В пятничном объявлении, опубликованном Cointelegraph, Sentient позиционирует Arena как платформу для сравнительного анализа производственного стиля, а не как статический тест модели. Вместо того, чтобы оценивать агентов только по фиксированным наборам данных, он запускает их через стандартизированные задачи, смоделированные с учетом условий предприятия, включая длинные документы, неполную информацию и противоречивые источники.
«На этом начальном этапе участие подразумевает поддержку программы Arena и группы разработчиков», — сказал Cointelegraph Олег Голев, руководитель продукта в Sentient Labs.
По его словам, партнеры помогают сформировать «готовое к производству обоснование» для задач, требующих большого количества документов, таких как анализ, соблюдение требований и операции. Компании не объявляют о капитальных обязательствах, связанных с этой инициативой.
Запуск происходит по мере того, как предприятия ускоряют внедрение агентов ИИ в исследовательские и операционные рабочие процессы, даже несмотря на то, что системы управления отстают.
Согласно отчету Celonis 2026 Process Optimization Report, опубликованному 4 февраля, 85% опрошенных старших руководителей бизнеса стремятся стать «агентскими предприятиями» в течение трех лет, тогда как только 19% в настоящее время используют мультиагентные системы.

Оценка производственного стиля, а не статическая оценка
Голев описал Arena как общую платформу, где разработчики отправляют ИИ-агентам стандартизированные задачи и сравнивают результаты в одинаковых условиях тестирования.
Платформа отслеживает такие категории ошибок, как галлюцинации, отсутствие доказательств, неправильные цитаты и пробелы в рассуждениях, что позволяет разработчикам диагностировать повторяющиеся проблемы.
Arena планирует опубликовать сравнительные показатели производительности через общедоступную таблицу лидеров и опубликовать вскрытие, обобщающее распространенные режимы сбоев и исправления.
Партнеры по инфраструктуре, включая OpenRouter и Fireworks, предоставляют вычисления для начальной группы, в то время как другие партнеры поддерживают инструменты и семинары.
Уровень управления на фоне растущей автономности ИИ
Инициатива возникла, когда финансовые и криптовалютные компании экспериментируют с предоставлением системам искусственного интеллекта большей экономической автономии.
В среду MoonPay запустила инфраструктуру, позволяющую агентам искусственного интеллекта создавать кошельки и выполнять транзакции со стабильными монетами.
В четверг руководители Stripe предупредили, что блокчейнам могут потребоваться значительные улучшения масштабирования, если коммерция, основанная на искусственном интеллекте, будет расширяться.







