logo

Founders Fund, Pantera та Franklin Templeton приєднуються до "Арени" Sentient, щоб провести стрес-тестування агентів штучного інтелекту корпоративного рівня

By: rootdata|2026/03/21 23:42:19
0
Поширити
copy

Протягом останніх двох років компанії прискорюють інтеграцію агентів ШІ в реальні робочі процеси: від обслуговування клієнтів і бекенд-операцій до фінансових і нормативних процесів, які вимагають прийняття рішень з високими ставками. Оскільки ці системи все більше впроваджуються в реальні бізнес-процеси, виникає нова проблема: хоча агенти можуть отримувати інформацію, вони часто не можуть забезпечити стабільні, інтерпретовані та відтворювані процеси обґрунтування, коли робота стає "незграбною", багатоетапною або високоризиковою.

Сьогодні лабораторія штучного інтелекту з відкритим вихідним кодом Sentient офіційно запустила Arena — середовище реального часу, готове до виробництва, для тисяч розробників ШІ по всьому світу, щоб проводити стрес-тестування та ітеративно конкурувати на найскладніших проблемах обґрунтування, з якими стикаються підприємства. До першого етапу учасників Arena входять Founders Fund, Pantera та Franklin Templeton, який управляє активами на суму понад 15 трильйонів доларів, що є сигналом того, що інституції виявляють ранній, чіткий інтерес до "структурованих оцінок агентів ШІ перед їх розгортанням".

"Коли компанії застосовують агентів ШІ для досліджень, операцій і робочих процесів, орієнтованих на клієнтів, питання вже не в тому, чи достатньо потужні ці системи... а в тому, чи вони надійні в реальних робочих процесах", — сказав Джуліан Лав, керуючий партнер Franklin Templeton Digital Assets. Лав додав, що структуровані середовища, такі як Arena, допоможуть галузі відрізняти «перспективні ідеї» від «можливостей, які дійсно можна використовувати у виробництві».

Співзасновник Sentient Гимшану Тайягі заявив: «АІ-агенти вже не просто експерименти в компаніях; вони входять у критичні процеси, які стосуються клієнтів, фінансування та операційних результатів. Цей зсуг змінює критерії оцінки. Систем недостатньо, щоб вони виглядали вражаюче в демонстраціях. Компаніям потрібно знати: чи можуть агенти все ще надійно міркувати в виробничих умовах, де вартість невдачі висока, а довіра крихка? Бізнесу потрібна порівнянність, повторюваність і метод відстеження покращення надійності в довгостроковій перспективі, який не залежить від базової моделі або стека інструментів».

Arena моделює реальний хаос робочих процесів підприємства: неповноцінну інформацію, довгий контекст, нечіткі інструкції та суперечливі джерела. Arena не просто оцінює, чи надають агенти «правильні відповіді», але записує повні сліди міркувань, щоб інженерні команди могли точно визначати причини невдач і перевіряти покращення з часом.

Це забезпечує нейтральний, незалежний від постачальника орієнтир для оцінки міркувань у різних моделях і стеках технологій. Arena наголошує на продуктивності рівня виробництва, а не на демонстраційній продуктивності, тим самим формуючи можливості агента, які можна перевірити і застосувати до сценаріїв з високим рівнем ризику, які бізнеси також можуть перенести на свої приватні дані та внутрішні інструменти.

У першому завданні розробники, які приєднуються до Arena, зосередяться на фундаментальній проблемі корпоративного рівня: обґрунтуванні документів. Агентства штучного інтелекту повинні обґрунтовувати та обчислювати складні, неструктуровані дані — цей тип роботи лежить в основі таких сценаріїв, як фінансовий аналіз, розслідування першопричин, написання інвестиційних мемо та обслуговування клієнтів.

Інші учасники початкового етапу включають alphaXiv, Fireworks, OpenHands та OpenRouter; оскільки Arena розширюється в задачах, галузях та інтеграції моделей, очікується, що приєднається більше учасників.

Останні дослідження також висвітлюють розрив, який Arena прагне подолати: 85% компаній висловлюють бажання стати "агентними підприємствами", причому майже три чверті планують розгортати автономних агентів, але менше чверті фактично мають зрілі системи управління; багато компаній намагаються масштабувати пілотні проекти до великомасштабних виробничих розгортань. У середньому компанії використовують близько десятка агентів, часто розкиданих по ізольованих сценаріях; багато хто вважає, що без кращої оркестрації та можливостей для співпраці додавання більше агентів лише збільшить складність і зменшить цінність.

"У OpenHands ми завжди прагнули підтримувати розробників у використанні агентів для вирішення реальних, практичних проблем", — сказав Грем Нейбіг, головний науковий співробітник і співзасновник OpenHands. "Ми також раді підтримати учасників у використанні SDK програмного агента OpenHands для вирішення цих складних завдань".

Алекс Аталлах, співзасновник і генеральний директор OpenRouter, заявив: "Arena — це саме та ініціатива, яка може просунути вперед штучний інтелект з відкритим вихідним кодом — вона дозволяє дослідникам конкурувати, ітерати та інноваційно працювати в відкритому середовищі". Ми з нетерпінням чекаємо поглиблення нашої співпраці з Sentient і надання інфраструктури для прискорення та спрощення масштабування експериментів.

Arena буде запущена в усьому світі, запрошуючи тисячі розробників штучного інтелекту подати заявку на першу обмежену групу, а офлайн-заходи заплановані в Сан-Франциско, починаючи з березня 2026 року.

Про Sentient Labs

Sentient Labs — це провідна організація з дослідження технологій і розробки продуктів, яка займається просуванням штучного інтелекту з відкритим вихідним кодом. Як двигун інновацій Фонду Sentient, Sentient Labs проводить передові дослідження в галузі обґрунтування, узгодження та співпраці агентів штучного інтелекту. Sentient є основним розробником високопродуктивних фреймворків, таких як ROMA, і моделей з відкритим вихідним кодом, таких як Dobby. Місія Sentient полягає в тому, щоб перетворити штучний інтелект з відкритим вихідним кодом з "експерименту" на "необхідність". Забезпечуючи інфраструктуру для створення потужних, композибельних систем агентів, Sentient дає змогу розробникам комерціалізувати інструменти з відкритим вихідним кодом і досягти зручності на рівні підприємства. Sentient прагне зробити відкритий вихідний код стандартним стандартом для глобальних місіонок з критично важливими операціями штучного інтелекту.

Ціна --

--

Вам також може сподобатися

Щорічний лист Stripe: Нова когнітивна щільність надзвичайно висока, особливо 5-рівнева модель "ШІ + Оплата"

Кожен тренд тут впливає на виживання всіх у майбутньому.

Лілі Лью, голова фонду Solana, вигукнула: "Не витрачайте час на криптовалюту", чи дійсно криптоіндустрія мертва?

Інтерес молодого покоління зміщується від криптовалют до галузі штучного інтелекту, що збігається з поточним явищем у криптовалютній індустрії.

Дослідження стейблкоїнів Dune: Потік і попит на ринку в $300 млрд

У наборі даних перекази більше не просто позначаються як чистий "обсяг транзакцій", а класифікуються як різні види активності в ланцюжку блоків. Це різниця між "просто знати, що було переведено $100 трлн" і "зрозуміти, навіщо це було переведено".

Ранкові новини | OpenAI отримує інвестиції в розмірі 110 мільярдів доларів; Solana запускає Solana Payments; M0, MoonPay і PayPal спільно запускають PYUSDx

Огляд важливих подій на ринку 27 лютого

Громадянська війна в Aave загострюється, Morpho тихо подвоюється: Чи ось-ось зміниться власник трону кредитування?

Гігант з управління активами Уолл-стріт Apollo Global Management інвестував у Morpho 160 мільйонів доларів.

Нова арифметика Paradigm: Коли Crypto не може утримати 12,7 мільярдів, штучний інтелект стає відповіддю

Парадигмі знадобилося три роки, щоб вийти з руїн FTX.

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon

Бот служби підтримки@WEEX_support_smart_Bot

VIP-послуги[email protected]