Founders Fund, Pantera e Franklin Templeton se juntam à "Arena" da Sentient para testar agentes de IA de nível empresarial

By: rootdata|2026/03/20 01:13:39

Nos últimos dois anos, as empresas têm acelerado a integração de agentes de IA em fluxos de trabalho reais: desde atendimento ao cliente e operações de backend até processos financeiros e de conformidade que exigem tomada de decisão de alto risco. À medida que esses sistemas são cada vez mais incorporados às operações comerciais reais, um novo problema está surgindo: embora os agentes possam recuperar informações, eles muitas vezes lutam para fornecer processos de raciocínio estáveis, interpretáveis e reprodutíveis quando o trabalho se torna "desorganizado", multi-passo ou de alto risco.

Hoje, o laboratório de IA de código aberto Sentient lançou oficialmente a Arena — um ambiente em tempo real e pronto para produção para milhares de desenvolvedores de IA em todo o mundo testarem e competirem iterativamente nos problemas de raciocínio mais difíceis enfrentados pelas empresas. A formação inicial de participantes na primeira fase da Arena inclui Founders Fund, Pantera e Franklin Templeton, que gerencia mais de $15 trilhões em ativos — enviando um sinal de que as instituições estão mostrando interesse claro e precoce em "avaliações estruturadas de agentes de IA antes da implantação".

"Quando as empresas aplicam agentes de IA em pesquisa, operações e fluxos de trabalho voltados para o cliente, a questão não é mais se esses sistemas são poderosos o suficiente... mas se são confiáveis em fluxos de trabalho reais", disse Julian Love, sócio-gerente da Franklin Templeton Digital Assets. Love acrescentou que ambientes estruturados como o Arena ajudarão a indústria a distinguir entre "ideias promissoras" e "capacidades que podem ser realmente utilizadas na produção".

O cofundador da Sentient, Himanshu Tyagi, afirmou: "Os agentes de IA não são mais apenas experimentos dentro das empresas; eles estão entrando em processos críticos que afetam clientes, financiamento e resultados operacionais. Essa mudança altera os critérios de avaliação. Não basta que os sistemas pareçam impressionantes em demonstrações. As empresas precisam saber: em ambientes de produção, onde o custo do fracasso é alto e a confiança é frágil, os agentes ainda conseguem raciocinar de forma confiável? As empresas precisam de comparabilidade, repetibilidade e um método para acompanhar as melhorias na confiabilidade a longo prazo que não dependa do modelo subjacente ou da pilha de ferramentas."

O Arena simula o verdadeiro caos dos fluxos de trabalho empresariais: informações incompletas, contexto demorado, instruções vagas e fontes conflitantes. O Arena não avalia apenas se os agentes fornecem "respostas corretas", mas registra traços de raciocínio completos para que as equipes de engenharia possam identificar as causas de falhas e validar melhorias ao longo do tempo.

Isso fornece um benchmark neutro e independente do fornecedor para a avaliação do raciocínio em modelos e pilhas de tecnologia. O Arena enfatiza o desempenho de nível de produção em vez do desempenho de demonstração, formando assim capacidades de agentes verificáveis aplicáveis a cenários de alto risco, que as empresas também podem transferir para seus dados privados e ferramentas internas.

No primeiro desafio, os desenvolvedores que se juntam à Arena focarão em um problema fundamental de nível empresarial: o raciocínio de documentos. Agentes de IA precisam raciocinar e calcular dados complexos e não estruturados — esse tipo de trabalho sustenta cenários como análise financeira, investigação da causa raiz, redação de memorandos de investimento e atendimento ao cliente.

Outros participantes na fase inicial incluem alphaXiv, Fireworks, OpenHands e OpenRouter; à medida que a Arena se expande em tarefas, indústrias e integrações de modelos, espera-se que mais participantes se juntem.

Pesquisas recentes também destacam a lacuna que a Arena visa abordar: 85% das empresas expressam o desejo de se tornarem "empresas agências", com quase três quartos planejando implantar agentes autônomos, mas menos de um quarto realmente possui sistemas de governança maduros; muitas empresas lutam para escalar projetos piloto para implantações de produção em grande escala. Em média, as empresas estão executando cerca de uma dúzia de agentes, muitas vezes espalhados por cenários isolados; muitos acreditam que, sem melhores capacidades de orquestração e colaboração, adicionar mais agentes só aumentará a complexidade e diminuirá o valor.

"Na OpenHands, sempre estivemos ansiosos para apoiar os desenvolvedores no uso de agentes para resolver problemas reais e práticos", disse Graham Neubig, Cientista Chefe e Cofundador da OpenHands. "Também estamos entusiasmados em apoiar os participantes no uso do SDK de Agente de Software OpenHands para enfrentar esses desafios complexos."

Alex Atallah, Cofundador e CEO da OpenRouter, afirmou: "A Arena é exatamente o tipo de iniciativa que pode impulsionar a IA de código aberto — permite que os pesquisadores competam, iterem e inovem em um ambiente aberto." Esperamos aprofundar nossa colaboração com a Sentient e fornecer a infraestrutura para tornar as experiências mais rápidas e fáceis de escalar."

A Arena será lançada globalmente, convidando milhares de desenvolvedores de IA a se candidatarem à primeira coorte limitada, com eventos offline programados para ocorrer em São Francisco a partir de março de 2026.

Sobre a Sentient Labs

A Sentient Labs é uma organização líder em pesquisa e desenvolvimento de tecnologia dedicada ao avanço da IA de código aberto. Como o motor de inovação da Fundação Sentient, a Sentient Labs realiza pesquisas de ponta em raciocínio de IA, alinhamento e colaboração de agentes. A Sentient é a desenvolvedora principal de frameworks de alto desempenho como ROMA e modelos de código aberto como Dobby. A missão da Sentient é fazer com que a IA de código aberto passe de "experimento" para "necessidade". Ao fornecer a infraestrutura para construir sistemas de agentes poderosos e compostíveis, a Sentient permite que os desenvolvedores comercializem ferramentas de código aberto e alcancem usabilidade em nível empresarial. A Sentient está comprometida em fazer do código aberto o padrão padrão para operações de IA críticas em nível global.

Preço de --

Você também pode gostar

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A entidade regulamentada está pronta para lançar uma stablecoin na primeira metade deste ano.

A pessoa que ajudou o TAO a subir 90% foi a mesma que, sozinha, fez o preço despencar novamente hoje

Enquanto houver pessoas, a história continua. Mas, quando eles forem embora, talvez você nem consiga encontrar um adversário à altura para jogar.

Guia de 3 minutos para participar da oferta pública inicial (IPO) da SpaceX na Bitget

O Bitget IPO Prime oferece uma oportunidade única para usuários de todo o mundo participarem de aberturas de capital de empresas unicórnio de nível internacional, permitindo que usuários comuns tenham acesso igualitário aos potenciais benefícios econômicos dessas ofertas públicas de ações de primeira linha.

Como ganhar US$ 15.000 com USDT ocioso antes da temporada de altcoins de 2026

Você está se perguntando se a temporada das altcoins chegará em 2026? Fique por dentro das últimas novidades do mercado e descubra como transformar suas stablecoins ociosas, que estão à espera de serem investidas, em recompensas extras de até 15.000 USDT.

Você pode vencer o Joker Returns sem um grande volume de negociação? 5 Erros que Novos Jogadores Cometem na Temporada 2 do WEEX Joker Returns

Os pequenos traders podem vencer o WEEX Joker Returns 2026 sem um volume enorme? Sim, se você evitar esses 5 erros dispendiosos. Aprenda a maximizar os sorteios de cartas, usar os Jokers com sabedoria e transformar pequenos depósitos em 15.000 USDT em recompensas.

Será que a “Alt Season” vai acontecer em 2026? 5 dicas para identificar as próximas oportunidades de criptomoedas com potencial de valorização de 100 vezes

Será que a temporada das altcoins chegará em 2026? Descubra as 5 fases de rotação, os sinais precoces que os traders experientes observam e os principais setores de criptomoedas onde podem surgir as próximas oportunidades de altcoins com potencial de valorização de 100 vezes.

Temporada das Altcoins de 2026: 4 etapas para obter lucro (antes que a galera entre na onda do FOMO)

A Temporada das Altcoins de 2026 está começando — descubra as quatro etapas principais da rotação de capital (da ETH para a PEPE) e como se posicionar antes do pico. Descubra quais tokens vão liderar cada fase e não perca a recuperação.

Top 5 Criptomoedas para Comprar no 1º Trimestre de 2026: Uma Análise Profunda do ChatGPT

Explore as 5 principais criptomoedas para comprar no 1º trimestre de 2026, incluindo BTC, ETH, SOL, TAO e ONDO. Veja as previsões de preços, narrativas-chave e catalisadores institucionais que estão moldando o próximo movimento do mercado.

O mercado em baixa chegou, e os emissores de ETF de criptomoedas também estão se envolvendo

A listagem de hoje do MSBT é o mais recente marco nesta reestruturação, com a entrada de instituições acelerando a adoção de criptomoedas pelas finanças tradicionais, mas também diluindo a liquidez do mercado nativo.

O homem mais rico teve uma discussão com seu antigo chefe

Isso causou um grande alvoroço, já que várias figuras de destaque do meio das criptomoedas na China se envolveram em intensas disputas verbais e confrontos nas últimas 24 horas.

Bônus de Ganho Automático 2026: WEEX x Binance x Bybit x OKX x Kraken (apenas uma oferece bônus extra)

Auto Earn 2026: Binance? Bybit? Sem bônus adicional. Só o WEEX oferece +0,5% + 300% de APR por indicação. Por tempo limitado. Veja exatamente quanto mais você pode ganhar.

Auto Earn 2026: A WEEX oferece 0,5% a mais + 300% de bônus APR — mais do que Binance e Bybit?

A maioria das exchanges oferece Auto Earn, mas somente a WEEX adiciona um bônus extra de 0,5% no crescimento do saldo + 300% de recompensas de referência em 2026. Veja como a WEEX se compara à Binance, Bybit, OKX e Kraken — e por que você pode ganhar mais com um simples ajuste.

Sete Velas Verdes Encontram Três Soldados Brancos | Rewire News Morning Brief

Na noite passada, as atas do Fed já liberaram o sinal de "manter a linha na contenção", o CPI é o segundo sapato

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A entidade regulamentada está pronta para lançar uma stablecoin na primeira metade deste ano.