Founders Fund, Pantera e Franklin Templeton se juntam à "Arena" da Sentient para testar agentes de IA de nível empresarial

By: rootdata|2026/03/20 01:13:39
0
Compartilhar
copy

Nos últimos dois anos, as empresas têm acelerado a integração de agentes de IA em fluxos de trabalho reais: desde atendimento ao cliente e operações de backend até processos financeiros e de conformidade que exigem tomada de decisão de alto risco. À medida que esses sistemas são cada vez mais incorporados às operações comerciais reais, um novo problema está surgindo: embora os agentes possam recuperar informações, eles muitas vezes lutam para fornecer processos de raciocínio estáveis, interpretáveis e reprodutíveis quando o trabalho se torna "desorganizado", multi-passo ou de alto risco.

Hoje, o laboratório de IA de código aberto Sentient lançou oficialmente a Arena — um ambiente em tempo real e pronto para produção para milhares de desenvolvedores de IA em todo o mundo testarem e competirem iterativamente nos problemas de raciocínio mais difíceis enfrentados pelas empresas. A formação inicial de participantes na primeira fase da Arena inclui Founders Fund, Pantera e Franklin Templeton, que gerencia mais de $15 trilhões em ativos — enviando um sinal de que as instituições estão mostrando interesse claro e precoce em "avaliações estruturadas de agentes de IA antes da implantação".

"Quando as empresas aplicam agentes de IA em pesquisa, operações e fluxos de trabalho voltados para o cliente, a questão não é mais se esses sistemas são poderosos o suficiente... mas se são confiáveis em fluxos de trabalho reais", disse Julian Love, sócio-gerente da Franklin Templeton Digital Assets. Love acrescentou que ambientes estruturados como o Arena ajudarão a indústria a distinguir entre "ideias promissoras" e "capacidades que podem ser realmente utilizadas na produção".

O cofundador da Sentient, Himanshu Tyagi, afirmou: "Os agentes de IA não são mais apenas experimentos dentro das empresas; eles estão entrando em processos críticos que afetam clientes, financiamento e resultados operacionais. Essa mudança altera os critérios de avaliação. Não basta que os sistemas pareçam impressionantes em demonstrações. As empresas precisam saber: em ambientes de produção, onde o custo do fracasso é alto e a confiança é frágil, os agentes ainda conseguem raciocinar de forma confiável? As empresas precisam de comparabilidade, repetibilidade e um método para acompanhar as melhorias na confiabilidade a longo prazo que não dependa do modelo subjacente ou da pilha de ferramentas."

O Arena simula o verdadeiro caos dos fluxos de trabalho empresariais: informações incompletas, contexto demorado, instruções vagas e fontes conflitantes. O Arena não avalia apenas se os agentes fornecem "respostas corretas", mas registra traços de raciocínio completos para que as equipes de engenharia possam identificar as causas de falhas e validar melhorias ao longo do tempo.

Isso fornece um benchmark neutro e independente do fornecedor para a avaliação do raciocínio em modelos e pilhas de tecnologia. O Arena enfatiza o desempenho de nível de produção em vez do desempenho de demonstração, formando assim capacidades de agentes verificáveis aplicáveis a cenários de alto risco, que as empresas também podem transferir para seus dados privados e ferramentas internas.

No primeiro desafio, os desenvolvedores que se juntam à Arena focarão em um problema fundamental de nível empresarial: o raciocínio de documentos. Agentes de IA precisam raciocinar e calcular dados complexos e não estruturados — esse tipo de trabalho sustenta cenários como análise financeira, investigação da causa raiz, redação de memorandos de investimento e atendimento ao cliente.

Outros participantes na fase inicial incluem alphaXiv, Fireworks, OpenHands e OpenRouter; à medida que a Arena se expande em tarefas, indústrias e integrações de modelos, espera-se que mais participantes se juntem.

Pesquisas recentes também destacam a lacuna que a Arena visa abordar: 85% das empresas expressam o desejo de se tornarem "empresas agências", com quase três quartos planejando implantar agentes autônomos, mas menos de um quarto realmente possui sistemas de governança maduros; muitas empresas lutam para escalar projetos piloto para implantações de produção em grande escala. Em média, as empresas estão executando cerca de uma dúzia de agentes, muitas vezes espalhados por cenários isolados; muitos acreditam que, sem melhores capacidades de orquestração e colaboração, adicionar mais agentes só aumentará a complexidade e diminuirá o valor.

"Na OpenHands, sempre estivemos ansiosos para apoiar os desenvolvedores no uso de agentes para resolver problemas reais e práticos", disse Graham Neubig, Cientista Chefe e Cofundador da OpenHands. "Também estamos entusiasmados em apoiar os participantes no uso do SDK de Agente de Software OpenHands para enfrentar esses desafios complexos."

Alex Atallah, Cofundador e CEO da OpenRouter, afirmou: "A Arena é exatamente o tipo de iniciativa que pode impulsionar a IA de código aberto — permite que os pesquisadores competam, iterem e inovem em um ambiente aberto." Esperamos aprofundar nossa colaboração com a Sentient e fornecer a infraestrutura para tornar as experiências mais rápidas e fáceis de escalar."

A Arena será lançada globalmente, convidando milhares de desenvolvedores de IA a se candidatarem à primeira coorte limitada, com eventos offline programados para ocorrer em São Francisco a partir de março de 2026.

Sobre a Sentient Labs

A Sentient Labs é uma organização líder em pesquisa e desenvolvimento de tecnologia dedicada ao avanço da IA de código aberto. Como o motor de inovação da Fundação Sentient, a Sentient Labs realiza pesquisas de ponta em raciocínio de IA, alinhamento e colaboração de agentes. A Sentient é a desenvolvedora principal de frameworks de alto desempenho como ROMA e modelos de código aberto como Dobby. A missão da Sentient é fazer com que a IA de código aberto passe de "experimento" para "necessidade". Ao fornecer a infraestrutura para construir sistemas de agentes poderosos e compostíveis, a Sentient permite que os desenvolvedores comercializem ferramentas de código aberto e alcancem usabilidade em nível empresarial. A Sentient está comprometida em fazer do código aberto o padrão padrão para operações de IA críticas em nível global.

Preço de --

--

Você também pode gostar

5 minutos para transformar a IA no seu segundo cérebro

É hora de delegar a tarefa de memorização à IA

O mistério de 17 anos será desvendado: quem é Satoshi Nakamoto?

O New York Times investiga o mistério de Satoshi Nakamoto, com pistas que apontam para Adam Back

A Uniswap está presa em um dilema de inovação

As diversas versões do Uniswap são uma das fontes de vitalidade do mercado DeFi, mas, desde 2023, o Uniswap não propôs nenhuma inovação substancial, limitando-se a explorar áreas tradicionais de negócios, como cadeias de aplicativos, Launchpads etc., o que levou a uma queda nos preços dos tokens e no mercado...

Qual é o segredo da competitividade no setor bancário de criptomoedas?

Os bancos digitais, cartões de criptomoedas, carteiras digitais, superapps e protocolos DeFi estão todos convergindo para o mesmo objetivo: tornar-se o principal ponto de acesso para suas economias, gastos, rendimentos e transferências nesta nova era.

O fluxo de stablecoins e os efeitos colaterais no mercado de câmbio

A pesquisa descobriu que um aumento exógeno nas entradas líquidas de stablecoins amplia significativamente a divergência de preços entre stablecoins e câmbio tradicional, leva à depreciação da moeda local e piora as condições de financiamento para dólares sintéticos (ou seja, aumenta o prêmio do dólar)

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A entidade regulamentada está pronta para lançar uma stablecoin na primeira metade deste ano.

Populares

Últimas notícias sobre cripto

Leia mais