Founders Fund, Pantera та Franklin Templeton приєднуються до "Арени" Sentient, щоб провести стрес-тестування агентів штучного інтелекту корпоративного рівня

By: rootdata|2026/03/21 15:26:59

Поширити

Протягом останніх двох років компанії прискорюють інтеграцію агентів ШІ в реальні робочі процеси: від обслуговування клієнтів і бекенд-операцій до фінансових і нормативних процесів, які вимагають прийняття рішень з високими ставками. Оскільки ці системи все більше впроваджуються в реальні бізнес-процеси, виникає нова проблема: хоча агенти можуть отримувати інформацію, вони часто не можуть забезпечити стабільні, інтерпретовані та відтворювані процеси обґрунтування, коли робота стає "незграбною", багатоетапною або високоризиковою.

Сьогодні лабораторія штучного інтелекту з відкритим вихідним кодом Sentient офіційно запустила Arena — середовище реального часу, готове до виробництва, для тисяч розробників ШІ по всьому світу, щоб проводити стрес-тестування та ітеративно конкурувати на найскладніших проблемах обґрунтування, з якими стикаються підприємства. До першого етапу учасників Arena входять Founders Fund, Pantera та Franklin Templeton, який управляє активами на суму понад 15 трильйонів доларів, що є сигналом того, що інституції виявляють ранній, чіткий інтерес до "структурованих оцінок агентів ШІ перед їх розгортанням".

"Коли компанії застосовують агентів ШІ для досліджень, операцій і робочих процесів, орієнтованих на клієнтів, питання вже не в тому, чи достатньо потужні ці системи... а в тому, чи вони надійні в реальних робочих процесах", — сказав Джуліан Лав, керуючий партнер Franklin Templeton Digital Assets. Лав додав, що структуровані середовища, такі як Arena, допоможуть галузі відрізняти «перспективні ідеї» від «можливостей, які дійсно можна використовувати у виробництві».

Співзасновник Sentient Гимшану Тайягі заявив: «АІ-агенти вже не просто експерименти в компаніях; вони входять у критичні процеси, які стосуються клієнтів, фінансування та операційних результатів. Цей зсуг змінює критерії оцінки. Систем недостатньо, щоб вони виглядали вражаюче в демонстраціях. Компаніям потрібно знати: чи можуть агенти все ще надійно міркувати в виробничих умовах, де вартість невдачі висока, а довіра крихка? Бізнесу потрібна порівнянність, повторюваність і метод відстеження покращення надійності в довгостроковій перспективі, який не залежить від базової моделі або стека інструментів».

Arena моделює реальний хаос робочих процесів підприємства: неповноцінну інформацію, довгий контекст, нечіткі інструкції та суперечливі джерела. Arena не просто оцінює, чи надають агенти «правильні відповіді», але записує повні сліди міркувань, щоб інженерні команди могли точно визначати причини невдач і перевіряти покращення з часом.

Це забезпечує нейтральний, незалежний від постачальника орієнтир для оцінки міркувань у різних моделях і стеках технологій. Arena наголошує на продуктивності рівня виробництва, а не на демонстраційній продуктивності, тим самим формуючи можливості агента, які можна перевірити і застосувати до сценаріїв з високим рівнем ризику, які бізнеси також можуть перенести на свої приватні дані та внутрішні інструменти.

У першому завданні розробники, які приєднуються до Arena, зосередяться на фундаментальній проблемі корпоративного рівня: обґрунтуванні документів. Агентства штучного інтелекту повинні обґрунтовувати та обчислювати складні, неструктуровані дані — цей тип роботи лежить в основі таких сценаріїв, як фінансовий аналіз, розслідування першопричин, написання інвестиційних мемо та обслуговування клієнтів.

Інші учасники початкового етапу включають alphaXiv, Fireworks, OpenHands та OpenRouter; оскільки Arena розширюється в задачах, галузях та інтеграції моделей, очікується, що приєднається більше учасників.

Останні дослідження також висвітлюють розрив, який Arena прагне подолати: 85% компаній висловлюють бажання стати "агентними підприємствами", причому майже три чверті планують розгортати автономних агентів, але менше чверті фактично мають зрілі системи управління; багато компаній намагаються масштабувати пілотні проекти до великомасштабних виробничих розгортань. У середньому компанії використовують близько десятка агентів, часто розкиданих по ізольованих сценаріях; багато хто вважає, що без кращої оркестрації та можливостей для співпраці додавання більше агентів лише збільшить складність і зменшить цінність.

"У OpenHands ми завжди прагнули підтримувати розробників у використанні агентів для вирішення реальних, практичних проблем", — сказав Грем Нейбіг, головний науковий співробітник і співзасновник OpenHands. "Ми також раді підтримати учасників у використанні SDK програмного агента OpenHands для вирішення цих складних завдань".

Алекс Аталлах, співзасновник і генеральний директор OpenRouter, заявив: "Arena — це саме та ініціатива, яка може просунути вперед штучний інтелект з відкритим вихідним кодом — вона дозволяє дослідникам конкурувати, ітерати та інноваційно працювати в відкритому середовищі". Ми з нетерпінням чекаємо поглиблення нашої співпраці з Sentient і надання інфраструктури для прискорення та спрощення масштабування експериментів.

Arena буде запущена в усьому світі, запрошуючи тисячі розробників штучного інтелекту подати заявку на першу обмежену групу, а офлайн-заходи заплановані в Сан-Франциско, починаючи з березня 2026 року.

Про Sentient Labs

Sentient Labs — це провідна організація з дослідження технологій і розробки продуктів, яка займається просуванням штучного інтелекту з відкритим вихідним кодом. Як двигун інновацій Фонду Sentient, Sentient Labs проводить передові дослідження в галузі обґрунтування, узгодження та співпраці агентів штучного інтелекту. Sentient є основним розробником високопродуктивних фреймворків, таких як ROMA, і моделей з відкритим вихідним кодом, таких як Dobby. Місія Sentient полягає в тому, щоб перетворити штучний інтелект з відкритим вихідним кодом з "експерименту" на "необхідність". Забезпечуючи інфраструктуру для створення потужних, композибельних систем агентів, Sentient дає змогу розробникам комерціалізувати інструменти з відкритим вихідним кодом і досягти зручності на рівні підприємства. Sentient прагне зробити відкритий вихідний код стандартним стандартом для глобальних місіонок з критично важливими операціями штучного інтелекту.

Вам також може сподобатися

Ранковий звіт | Coinbase Ventures здійснює свою першу інвестицію в ENA; SpaceX планує встановити ціну IPO на рівні 135 доларів за акцію

Огляд важливих ринкових подій за 3 червня

Повний текст та аналіз виступу генерального директора SanDisk на 42-й щорічній конференції зі стратегічних рішень Bernstein

Основна цінність виступу Геклера полягає у наданні надзвичайно прозорої та логічно чіткої концептуальної бази для корпоративної трансформації.

Ранковий звіт | Минулого тижня Strategy продала 32 BTC та понад 800 000 акцій MSTR; Binance офіційно анонсувала свій портал для торгівлі акціями США; Polymarket уклала ексклюзивне партнерство з OneFootball

Огляд важливих ринкових подій за 1 червня

Торговий буткемп WEEXPERIENCE у Польщі: як WEEX та FireCrew роблять криптотрейдинг доступним для кожного

29 травня WEEX у партнерстві з Firecrew провели у Польщі торговий буткемп WEEXPERIENCE. Читайте підсумок експертних сесій з технічного аналізу, психології трейдингу та інструментів ШІ, які підтверджують місію WEEX зробити криптотрейдинг доступним для кожного.

Панування Парижа: як PSG розбив мрію Arsenal у захопливому історичному фіналі Ліги чемпіонів

PSG проти Arsenal, драма, доля та розбите 20-річне прокляття. Згадайте фінал Ліги чемпіонів 2026 року, де PSG захистив свій титул у напруженій серії пенальті, а золотий момент Усмана Дембеле та один болісний промах увійшли в історію в Будапешті.

TaiJi залучає $3,5 млн стратегічних інвестицій від Castrum Capital, Becker Ventures та Coinvestor Ventures

Платформа ринкової аналітики Web3 на базі ШІ TaiJi оголосила про залучення $3,5 млн стратегічних інвестицій, які будуть спрямовані на прискорення розробки нового рушія ринкового ШІ-моделювання.

Bitcoin застряг біля $73 тис.? Як трейдери знаходять вигоду на червневому боковику

Bitcoin застряг біля позначки $73 тис., оскільки приплив коштів у ETF сповільнюється, а макроекономічна невизначеність змушує трейдерів бути обережними. Ось як акції на кшталт WEEX Joker Party допомагають трейдерам залишатися активними під час червневого бокового руху ринку.

Як стейкати Solana: покрокова інструкція на 2026 рік

Знайдіть найкращі AI-криптовалюти 2026 року за допомогою аналітичних даних: Bittensor, Render та перспективні проєкти. Включено ончейн-метрики, ризики та посібник з торгівлі на WEEX.

Гарантована ціна вже на WEEX: торгуйте з більшою точністю

Для забезпечення більш плавного досвіду торгівлі ф'ючерсами, WEEX запустила функцію «Гарантована ціна».

Останнє дослідження BIS: майбутнє стейблкоїнів та глобальний монетарний ландшафт

У звіті зазначається, що стейблкоїни зміцнюватимуть домінування долара США в короткостроковій перспективі, створюючи ризики для монетарного суверенітету ринків, що розвиваються, та економік, що формуються, тоді як довгострокова траєкторія залежатиме від моделей їх впровадження, регуляторних заходів та синергії...

Інтерв'ю з макроекономічним експертом Раулем Палом: конкуренція у сфері ШІ веде до «економічної сингулярності», не поспішайте позбуватися своїх активів у найближчі чотири роки

Порівняно з Nasdaq, Bitcoin наразі перебуває у стані сильної перепроданості в межах свого довгострокового тренду.

Чому Пітер Тіль, який стоїть за Palantir, готує шлях до відступу в Аргентині?

Palantir, політичні ризики та самозбереження технологічних олігархів.

Злам оборони захисників Solana: щоб розгромити Hyperliquid, вони використали сценарій, за який колись критикували Ethereum?

Стрімке зростання HYPE розпалює битву гігантів. Лідер Solana гнівно критикує Hyperliquid за надмірну централізацію, а Артур Хейс відповідає різкою відсіччю, укладаючи парі на $100 000.

Ранковий звіт | Coinbase Ventures здійснює свою першу інвестицію в ENA; SpaceX планує встановити ціну IPO на рівні 135 доларів за акцію

Огляд важливих ринкових подій за 3 червня

Повний текст та аналіз виступу генерального директора SanDisk на 42-й щорічній конференції зі стратегічних рішень Bernstein