Founders Fund, Pantera та Franklin Templeton приєднуються до "Арени" Sentient, щоб провести стрес-тестування агентів штучного інтелекту корпоративного рівня

By: rootdata|2026/03/21 15:26:59
0
Поширити
copy

Протягом останніх двох років компанії прискорюють інтеграцію агентів ШІ в реальні робочі процеси: від обслуговування клієнтів і бекенд-операцій до фінансових і нормативних процесів, які вимагають прийняття рішень з високими ставками. Оскільки ці системи все більше впроваджуються в реальні бізнес-процеси, виникає нова проблема: хоча агенти можуть отримувати інформацію, вони часто не можуть забезпечити стабільні, інтерпретовані та відтворювані процеси обґрунтування, коли робота стає "незграбною", багатоетапною або високоризиковою.

Сьогодні лабораторія штучного інтелекту з відкритим вихідним кодом Sentient офіційно запустила Arena — середовище реального часу, готове до виробництва, для тисяч розробників ШІ по всьому світу, щоб проводити стрес-тестування та ітеративно конкурувати на найскладніших проблемах обґрунтування, з якими стикаються підприємства. До першого етапу учасників Arena входять Founders Fund, Pantera та Franklin Templeton, який управляє активами на суму понад 15 трильйонів доларів, що є сигналом того, що інституції виявляють ранній, чіткий інтерес до "структурованих оцінок агентів ШІ перед їх розгортанням".

"Коли компанії застосовують агентів ШІ для досліджень, операцій і робочих процесів, орієнтованих на клієнтів, питання вже не в тому, чи достатньо потужні ці системи... а в тому, чи вони надійні в реальних робочих процесах", — сказав Джуліан Лав, керуючий партнер Franklin Templeton Digital Assets. Лав додав, що структуровані середовища, такі як Arena, допоможуть галузі відрізняти «перспективні ідеї» від «можливостей, які дійсно можна використовувати у виробництві».

Співзасновник Sentient Гимшану Тайягі заявив: «АІ-агенти вже не просто експерименти в компаніях; вони входять у критичні процеси, які стосуються клієнтів, фінансування та операційних результатів. Цей зсуг змінює критерії оцінки. Систем недостатньо, щоб вони виглядали вражаюче в демонстраціях. Компаніям потрібно знати: чи можуть агенти все ще надійно міркувати в виробничих умовах, де вартість невдачі висока, а довіра крихка? Бізнесу потрібна порівнянність, повторюваність і метод відстеження покращення надійності в довгостроковій перспективі, який не залежить від базової моделі або стека інструментів».

Arena моделює реальний хаос робочих процесів підприємства: неповноцінну інформацію, довгий контекст, нечіткі інструкції та суперечливі джерела. Arena не просто оцінює, чи надають агенти «правильні відповіді», але записує повні сліди міркувань, щоб інженерні команди могли точно визначати причини невдач і перевіряти покращення з часом.

Це забезпечує нейтральний, незалежний від постачальника орієнтир для оцінки міркувань у різних моделях і стеках технологій. Arena наголошує на продуктивності рівня виробництва, а не на демонстраційній продуктивності, тим самим формуючи можливості агента, які можна перевірити і застосувати до сценаріїв з високим рівнем ризику, які бізнеси також можуть перенести на свої приватні дані та внутрішні інструменти.

У першому завданні розробники, які приєднуються до Arena, зосередяться на фундаментальній проблемі корпоративного рівня: обґрунтуванні документів. Агентства штучного інтелекту повинні обґрунтовувати та обчислювати складні, неструктуровані дані — цей тип роботи лежить в основі таких сценаріїв, як фінансовий аналіз, розслідування першопричин, написання інвестиційних мемо та обслуговування клієнтів.

Інші учасники початкового етапу включають alphaXiv, Fireworks, OpenHands та OpenRouter; оскільки Arena розширюється в задачах, галузях та інтеграції моделей, очікується, що приєднається більше учасників.

Останні дослідження також висвітлюють розрив, який Arena прагне подолати: 85% компаній висловлюють бажання стати "агентними підприємствами", причому майже три чверті планують розгортати автономних агентів, але менше чверті фактично мають зрілі системи управління; багато компаній намагаються масштабувати пілотні проекти до великомасштабних виробничих розгортань. У середньому компанії використовують близько десятка агентів, часто розкиданих по ізольованих сценаріях; багато хто вважає, що без кращої оркестрації та можливостей для співпраці додавання більше агентів лише збільшить складність і зменшить цінність.

"У OpenHands ми завжди прагнули підтримувати розробників у використанні агентів для вирішення реальних, практичних проблем", — сказав Грем Нейбіг, головний науковий співробітник і співзасновник OpenHands. "Ми також раді підтримати учасників у використанні SDK програмного агента OpenHands для вирішення цих складних завдань".

Алекс Аталлах, співзасновник і генеральний директор OpenRouter, заявив: "Arena — це саме та ініціатива, яка може просунути вперед штучний інтелект з відкритим вихідним кодом — вона дозволяє дослідникам конкурувати, ітерати та інноваційно працювати в відкритому середовищі". Ми з нетерпінням чекаємо поглиблення нашої співпраці з Sentient і надання інфраструктури для прискорення та спрощення масштабування експериментів.

Arena буде запущена в усьому світі, запрошуючи тисячі розробників штучного інтелекту подати заявку на першу обмежену групу, а офлайн-заходи заплановані в Сан-Франциско, починаючи з березня 2026 року.

Про Sentient Labs

Sentient Labs — це провідна організація з дослідження технологій і розробки продуктів, яка займається просуванням штучного інтелекту з відкритим вихідним кодом. Як двигун інновацій Фонду Sentient, Sentient Labs проводить передові дослідження в галузі обґрунтування, узгодження та співпраці агентів штучного інтелекту. Sentient є основним розробником високопродуктивних фреймворків, таких як ROMA, і моделей з відкритим вихідним кодом, таких як Dobby. Місія Sentient полягає в тому, щоб перетворити штучний інтелект з відкритим вихідним кодом з "експерименту" на "необхідність". Забезпечуючи інфраструктуру для створення потужних, композибельних систем агентів, Sentient дає змогу розробникам комерціалізувати інструменти з відкритим вихідним кодом і досягти зручності на рівні підприємства. Sentient прагне зробити відкритий вихідний код стандартним стандартом для глобальних місіонок з критично важливими операціями штучного інтелекту.

Вам також може сподобатися

Ранковий звіт | Coinbase Ventures здійснює свою першу інвестицію в ENA; SpaceX планує встановити ціну IPO на рівні 135 доларів за акцію

Огляд важливих ринкових подій за 3 червня

Повний текст та аналіз виступу генерального директора SanDisk на 42-й щорічній конференції зі стратегічних рішень Bernstein

Основна цінність виступу Геклера полягає у наданні надзвичайно прозорої та логічно чіткої концептуальної бази для корпоративної трансформації.

Прогноз ціни біткоїна на 2030 рік: Ark Invest прогнозує $710 тис.

Ознайомтеся з прогнозами ціни біткоїна на 2030 рік від Ark Invest та Standard Chartered, а також дізнайтеся про ключові ризики та способи формування портфеля. Повний аналіз на WEEX.

Ціна SOL сьогодні: актуальний курс Solana, графіки та ринкові дані

Дізнайтеся ціну SOL сьогодні за допомогою даних у реальному часі, а також ключові фактори, що впливають на рух Solana, та практичні поради з торгівлі. Читайте повний аналіз на WEEX.

Що таке Bitcoin ETF: спотові та ф'ючерсні фонди

Дізнайтеся, що таке Bitcoin ETF, як працюють спотові та ф'ючерсні ETF і чому інституційні припливи капіталу змінюють BTC у 2026 році. Аналітика від WEEX.

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

Bitcoin падає на 15% до $66 000 на тлі побоювань через геополітичну напруженість, тоді як Nasdaq злітає до історичних максимумів. Аналіз макроекономічних чинників, потоків ETF, поведінки роздрібних інвесторів та «китів», а також прихованої кореляції між криптовалютами та акціями.

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon
Підтримка клієнтів:@weikecs
Співпраця:@weikecs
Кількісна торгівля та маркетмейкінг:[email protected]
VIP-програма:[email protected]