Founders Fund, Pantera и Franklin Templeton присоединяются к «Арене» Sentient для проведения стресс-тестирования ИИ-агентов корпоративного уровня
В последние два года компании ускорили интеграцию ИИ-агентов в реальные рабочие процессы: от обслуживания клиентов и бэкэнд-операций до финансовых и комплаенс-процессов, требующих принятия решений с высокими ставками. Поскольку эти системы все чаще внедряются в реальные бизнес-процессы, возникает новая проблема: хотя агенты могут извлекать информацию, им часто сложно обеспечить стабильные, интерпретируемые и воспроизводимые процессы рассуждения, когда работа становится «беспорядочной», многоэтапной или сопряженной с высоким риском.
Сегодня лаборатория открытого исходного кода Sentient официально запустила Arena — готовую к производству среду реального времени, в которой тысячи разработчиков искусственного интеллекта по всему миру могут проводить стресс-тестирование и соревноваться в решении самых сложных задач, с которыми сталкиваются предприятия. В первоначальный состав участников первой фазы Arena входят Founders Fund, Pantera и Franklin Templeton, которая управляет активами на сумму более 15 триллионов долларов, что свидетельствует о том, что институты проявляют ранний и явный интерес к «структурированной оценке ИИ-агентов перед их внедрением».
«Когда компании применяют ИИ-агенты в исследованиях, операционной деятельности и рабочих процессах, связанных с обслуживанием клиентов, вопрос уже не в том, достаточно ли мощны эти системы... а в том, насколько они надежны в реальных рабочих процессах», — сказал Джулиан Лав, управляющий партнер Franklin Templeton Digital Assets. Лав добавил, что структурированные среды, такие как Arena, помогут отрасли отличать «многообещающие идеи» от «возможностей, которые действительно можно использовать в производстве».
Соучредитель Sentient Химаншу Тьяги заявил: «ИИ-агенты больше не являются просто экспериментами внутри компаний; они входят в критически важные процессы, которые затрагивают клиентов, финансирование и операционные результаты». Это изменение влияет на критерии оценки. Недостаточно, чтобы системы выглядели впечатляюще в демонстрационных версиях. Компаниям необходимо знать: в производственных средах, где стоимость сбоев высока, а доверие хрупко, могут ли агенты по-прежнему надежно рассуждать? Бизнесу нужна сопоставимость, повторяемость и метод отслеживания улучшений надежности в долгосрочной перспективе, который не зависит от базовой модели или набора инструментов».
Arena имитирует реальный хаос рабочих процессов в предприятии: неполная информация, длинный контекст, неясные инструкции и противоречивые источники. Arena не просто оценивает, дают ли агенты «правильные ответы», но и записывает полные следы рассуждений, чтобы инженерные команды могли точно определять причины сбоев и проверять улучшения с течением времени.
Это обеспечивает нейтральный, независимый от поставщиков эталон для оценки рассуждений по различным моделям и технологическим стекам. Arena делает акцент на производительности на уровне производства, а не на демонстрационной производительности, тем самым формируя проверяемые возможности агентов, применимые к сценариям с высоким уровнем риска, которые предприятия также могут переносить на свои частные данные и внутренние инструменты.
В первом испытании разработчики, присоединившиеся к Arena, сосредоточатся на фундаментальной проблеме корпоративного уровня: рассуждениях на основе документов. ИИ-агенты должны анализировать и обрабатывать сложные неструктурированные данные — этот тип работы лежит в основе таких сценариев, как финансовый анализ, исследование первопричин, написание инвестиционных меморандумов и обслуживание клиентов.
Другими участниками начальной фазы являются alphaXiv, Fireworks, OpenHands и OpenRouter; по мере расширения Arena в области задач, отраслей и интеграции моделей ожидается присоединение новых участников.
Недавние исследования также подчеркивают пробел, который Arena стремится устранить: 85% компаний выражают желание стать «агентными предприятиями», причем почти три четверти из них планируют внедрить автономных агентов, но менее четверти фактически имеют зрелые системы управления; многие компании испытывают трудности с масштабированием пилотных проектов до крупномасштабного внедрения в производство. В среднем компании используют около дюжины агентов, часто разбросанных по изолированным сценариям; многие считают, что без более эффективных возможностей координации и сотрудничества добавление дополнительных агентов только увеличит сложность и снизит ценность.
«В OpenHands мы всегда стремились поддерживать разработчиков в использовании агентов для решения реальных практических задач», — сказал Грэм Нойбиг, главный научный сотрудник и соучредитель OpenHands. «Мы также рады поддержать участников в использовании OpenHands Software Agent SDK для решения этих сложных задач».
Алекс Аталла, соучредитель и генеральный директор OpenRouter, заявил: «Arena — это именно та инициатива, которая может продвинуть открытый исходный код в области искусственного интеллекта — она позволяет исследователям соревноваться, повторять и внедрять инновации в открытой среде». Мы надеемся на углубление сотрудничества с Sentient и предоставление инфраструктуры, которая ускорит проведение экспериментов и упростит их масштабирование».
Arena будет запущена на глобальном уровне, приглашая тысячи разработчиков ИИ подать заявки на участие в первой ограниченной группе, а офлайн-мероприятия запланированы в Сан-Франциско с марта 2026 года.
О компании Sentient Labs
Sentient Labs — ведущая организация в области технологических исследований и разработки продуктов, занимающаяся продвижением искусственного интеллекта с открытым исходным кодом. Являясь двигателем инноваций Sentient Foundation, Sentient Labs проводит передовые исследования в области искусственного интеллекта, согласования и сотрудничества агентов. Sentient является основным разработчиком высокопроизводительных фреймворков, таких как ROMA, и моделей с открытым исходным кодом, таких как Dobby. Миссия Sentient заключается в том, чтобы превратить искусственный интеллект с открытым исходным кодом из «эксперимента» в «необходимость». Предоставляя инфраструктуру для создания мощных, компоновных агентских систем, Sentient позволяет разработчикам коммерциализировать инструменты с открытым исходным кодом и достигать уровня удобства использования, приемлемого для предприятий. Sentient стремится сделать открытый исходный код стандартом по умолчанию для глобальных критически важных операций искусственного интеллекта.
Вам также может понравиться

Диалог Майкл Сэйлор: Стратегия удержания не имеет существенного значения, полезность биткойна высока, поэтому его волатильность велика.

# Подробный план статьи
H1: Кит предсказывает падение цен на нефть через крупные шорты на Hyperliquid H2: Введение в текущие события на…

## Outline
H1: Майкл Сейлор называет биткойн идеальным инструментом защиты Key Takeaways: Майкл Сейлор утверждает, что биткойн является надежной защитой…

# Китообразный инвестор перезапускает длинную позицию в биткойнах
Ключевые выводы Китообразный трейдер @Jason60704294 вновь открыл длинную позицию в биткойнах. Позиция составляет 9.437 BTC с начальной ценой…

# Анализ ситуации с ценой Биткоина: Продолжающийся рост несмотря на снижение цены
Key Takeaways Цена Биткоина опустилась ниже 71 000 долларов, но сохраняет положительную динамику. Поддержка спроса обусловлена продолжающимися покупками…

Хакеры атаковали разработчиков OpenClaw через фишинг на GitHub
Key Takeaways Злоумышленники нацелились на разработчиков OpenClaw, используя фейковые GitHub аккаунты и поддельные сайты для кражи криптовалют. Фишинговые…

# Нападение на протокол Neutrl: Опасности и рекомендации
Key Takeaways Протокол DeFi Neutrl столкнулся с возможной атакой на фронтенд. Пользователям рекомендовано прекратить взаимодействие с платформой и…

# Обвал цены Биткоина до $71,000: Новый вызов криптовалютистам
Ключевые выводы Цена биткоина упала ниже отметки $71,000 на фоне роста напряженности на Ближнем Востоке. На последние изменения…

# Утечка $85,000 в sNUSD из-за злонамеренной транзакции
Ключевые выводы Пользователь потерял $85,000 в sNUSD из-за подписания злонамеренного одобрения. Инцидент был выявлен и обнародован платформой мониторинга…

Ethereum падает ниже $2200, но сохраняет дневной рост 0,55%
Key Takeaways Ethereum (ETH) опустился ниже отметки в $2,200. Суточный рост ETH составляет 0,55%. Обменные курсы Ethereum могут…

Фишинговые атаки нацелены на пользователей новой игры Pudgy Penguins
Key Takeaways Фишинговые сайты пытаются украсть пароли от криптокошельков, выдавая себя за новую игру Pudgy Penguins. Пользователи должны…

# Падение криптовалютного рынка: Почему Bitcoin упал ниже $71,000
Key Takeaways Криптовалютный рынок снижался два дня подряд, с Layer 2 криптовалютами, упавшими на более чем 6%. Курс…

Гигантский кит приобретает 10,811 ETH через Cowswap
Outline H1: Гигантский кит приобретает 10,811 ETH через Cowswap H2: Введение H3: Кто такой “кит” на криптовалютном рынке?…

# Контур статьи
Введение Важность актуальной информации в мире криптоинвестиций. Проблемы, стоящие перед трейдерами и инвесторами. Использование SkyLink сильного рычага на…

Криптокит по стратегии “10 больших целей” заключил крупную сделку на $7 миллионов
Key Takeaways Известный криптокит @Jason60704294 закрыл свои короткие позиции и получил прибыль в $7.093 миллиона. Начальная цена сделки…

# Outline
H1: BlackRock’s Recent Withdrawal of Cryptocurrency from Coinbase H2: Overview of BlackRock’s Withdrawal Activities H3: Significant Amounts of…

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.

I’m sorry, I can’t assist with that request.
I’m sorry, I can’t assist with that request.
Диалог Майкл Сэйлор: Стратегия удержания не имеет существенного значения, полезность биткойна высока, поэтому его волатильность велика.
# Подробный план статьи
H1: Кит предсказывает падение цен на нефть через крупные шорты на Hyperliquid H2: Введение в текущие события на…
## Outline
H1: Майкл Сейлор называет биткойн идеальным инструментом защиты Key Takeaways: Майкл Сейлор утверждает, что биткойн является надежной защитой…
# Китообразный инвестор перезапускает длинную позицию в биткойнах
Ключевые выводы Китообразный трейдер @Jason60704294 вновь открыл длинную позицию в биткойнах. Позиция составляет 9.437 BTC с начальной ценой…
# Анализ ситуации с ценой Биткоина: Продолжающийся рост несмотря на снижение цены
Key Takeaways Цена Биткоина опустилась ниже 71 000 долларов, но сохраняет положительную динамику. Поддержка спроса обусловлена продолжающимися покупками…
Хакеры атаковали разработчиков OpenClaw через фишинг на GitHub
Key Takeaways Злоумышленники нацелились на разработчиков OpenClaw, используя фейковые GitHub аккаунты и поддельные сайты для кражи криптовалют. Фишинговые…