A velocidade com que a IA descobre vulnerabilidades já ultrapassou a velocidade com que ela as corrige.

By: blockbeats|2026/03/30 18:07:22
0
Compartilhar
copy

Em 27 de março, um cache de dados desprotegido na Anthropic expôs cerca de 3.000 arquivos internos. Um rascunho de postagem no blog revelou o novo modelo a ser lançado, o Mythos, que a Anthropic autodescreveu como “superando de longe qualquer modelo de IA em termos de capacidade de segurança cibernética”. No mesmo dia, a CrowdStrike e a Okta despencaram 7% cada uma, enquanto a Palo Alto Networks caiu 6%.

O pânico no mercado não se deve ao surgimento de um modelo mais potente. Isso porque o criador desse modelo afirmou que o avanço do lado do ataque tem superado a velocidade com que o lado da defesa consegue acompanhar.

O domínio da IA na segurança cibernética

De acordo com os resultados dos testes do benchmark acadêmico CAIBench, no teste Cybench, que simula um ambiente real de ataque e defesa, o Claude Sonnet alcançou uma taxa de sucesso de 46%. O GPT-5, que ficou em segundo lugar, atingiu 28%; o Gemini 2.5 Pro, do Google, ficou apenas em 18%; e o modelo de código aberto qwen3-32B ficou ainda mais atrás, com 10%.

A velocidade com que a IA descobre vulnerabilidades já ultrapassou a velocidade com que ela as corrige.

Embora 46% possa não parecer um número alto, essa é a taxa de sucesso em tarefas complexas de penetração, incluindo etapas como a descoberta de vulnerabilidades, a criação de cadeias de exploração e a escalada de privilégios. Em um teste mais básico do Base, a taxa de sucesso do Claude já atingiu 75%, aproximando-se do seu limite máximo.

A diferença não está em quem é um pouco melhor, mas na magnitude. A capacidade complexa de ataque e defesa do Claude é 1,6 vezes maior que a do GPT-5 e 2,5 vezes maior que a do Gemini. Nesta dimensão da segurança cibernética, a distribuição de capacidades entre os modelos não é uma escada, mas sim uma lacuna.

Duplicar em 6 meses

O que vale mais a pena analisar não é a distância horizontal, mas a velocidade vertical.

De acordo com os dados oficiais da Anthropic, o Sonnet 3.7, lançado em fevereiro de 2025, alcançou uma taxa de sucesso de 35,9% no Cybench (10 tentativas). Na segunda metade do mesmo ano, o Sonnet 4.5 atingiu 76,5%. A conclusão da equipe de pesquisa da Anthropic é a seguinte: em seis meses, a taxa de sucesso dobrou.

O que significa essa velocidade? Em uma comparação com situações reais: O Claude Opus 4.6 foi utilizado para auditar o código-fonte do Firefox em março deste ano. De acordo com o InfoQ, foram descobertas 22 vulnerabilidades de segurança em duas semanas, sendo 14 delas de alto risco. Essas vulnerabilidades permaneceram sem serem detectadas, apesar de anos de auditorias manuais e milhões de horas de testes de fuzz de CPU. A equipe de segurança da Anthropic revelou anteriormente que o Claude identificou mais de 500 vulnerabilidades de alto risco em vários projetos de código aberto em ambiente de produção, algumas das quais estavam presentes há décadas.

E o prazo padrão do setor para testes de penetração tradicionais é de 2 a 3 semanas, e isso se refere apenas a uma aplicação. De acordo com o Relatório de Investigações sobre Vazamentos de Dados 2025 da Verizon, o tempo médio entre a divulgação pública de uma vulnerabilidade crítica e a exploração em massa por parte de invasores é de 5 dias, com um tempo médio para a aplicação de correções de 32 a 38 dias.

A velocidade com que a IA descobre vulnerabilidades está crescendo exponencialmente, enquanto a velocidade com que os humanos aplicam correções é linear. A diferença de tempo é a janela de ataque.

No rascunho do Mythos que vazou, a Anthropic escreveu que esse modelo "anuncia uma onda de modelos que serão capazes de explorar vulnerabilidades de uma forma que vai muito além dos esforços dos defensores". Com base na curva de capacidade de conhecimento público, isso não é um exagero.

Quanto mais rápido for o lançamento, mais urgente será o aviso

Se você colocar as ações da Anthropic nos últimos três anos em uma linha do tempo, verá um padrão claro: sempre que um modelo mais avançado é lançado, isso é rapidamente seguido por uma resposta de segurança de nível superior.

Em julho de 2023, a Casa Branca assinou um compromisso voluntário, seguido pela divulgação da primeira Política de Expansão Responsável (RSP v1.0) em setembro do mesmo ano. Em outubro de 2024, o RSP foi atualizado para a versão 2.0, com a inclusão de um limite para capacidades relacionadas a armas bioquímicas. Em novembro de 2025, a Anthropic divulgou o incidente GTG-1002. Um grupo de ameaças apoiado pela China atacou cerca de 30 organizações utilizando o Claude Code, sendo que a IA executou de forma autônoma entre 80% e 90% das operações táticas ao longo da operação. Essa foi a primeira campanha de espionagem interorganizacional em grande escala orquestrada por IA a ser documentada.

Em fevereiro de 2026, o RSP foi atualizado para a versão 3.0, com o lançamento simultâneo do Claude Code Security. No mesmo mês, o Pentágono classificou a Anthropic como um “risco para a cadeia de suprimentos”, pois a empresa se recusou a revogar cláusulas do contrato que proíbem a vigilância em larga escala e o uso de armas totalmente autônomas. Um mês depois, o vazamento do Mythos revelou que a Anthropic reconheceu no rascunho que esse modelo representa “riscos de segurança de rede sem precedentes”.

O ritmo de lançamento de novos recursos está se acelerando. Há um intervalo de um ano entre o Claude 1 e o Claude 3, e menos de três meses entre o Opus 4.5 e o Opus 4.6. As respostas de segurança também estão se tornando mais rápidas, mas são sempre reativas: as vulnerabilidades são exploradas primeiro, e as correções de política vêm depois. A queda generalizada das ações do setor de segurança cibernética em 27 de março reflete essa diferença de tempo.

Uma pesquisa realizada pela Dark Reading no início deste ano revelou que 48% dos profissionais de segurança cibernética identificaram os agentes baseados em IA como o principal vetor de ataque para 2026. Há dois anos, essa opção mal figurava entre as principais opções.

A estratégia de lançamento do Mythos da Anthropic consiste em oferecer acesso antecipado a organizações de segurança, “proporcionando-lhes uma vantagem de pioneirismo”. Essa afirmação, por si só, reconhece a assimetria entre ataque e defesa. Se os defensores não precisam da vantagem de serem os primeiros a agir, isso significa que os atacantes ainda não chegaram à porta.

Preço de --

--

Você também pode gostar

Forbes: A tecnologia quântica ameaça a indústria de criptografia? Mas é mais provável que seja uma oportunidade

Computação quântica não irá derrubar o blockchain, mas forçará uma reconstrução de seu sistema de segurança.

Pesquisa sobre o tigre: Análise da situação atual dos investidores de varejo em nove dos principais mercados asiáticos

Analisamos as barreiras à entrada nos maiores mercados para nove grupos de usuários potenciais na Ásia, bem como as respostas das bolsas.

Quase US$ 300 milhões destinados aos EUA Eleições de meio de mandato: executivo da Tether lidera o segundo maior fundo político do setor de criptomoedas

Durante o período crucial das negociações legislativas, utilizando contribuições políticas para promover os interesses do setor.

O que é o Auto Earn? Como reivindicar criptografia extra gratuita no Auto Earn 2026

O que é o Auto Earn e como você o usa? Este guia explica como o Auto Earn funciona e como o saldo aumenta e as indicações podem se qualificar para recompensas extras durante o Auto Earn Boost Fest.

A OpenAI e a Anthropic anunciaram aquisições no mesmo dia, causando apreensão em relação a duas ofertas públicas iniciais.

As duas empresas apresentam uma diferença de valorização de mais de duas vezes, mas estão disputando o mesmo montante de recursos dos investidores.

Auto Earn Comparado 2026: Qual Exchange Oferece O Maior Bônus Extra?

O que é Auto Earn em cripto? Compare as funcionalidades de Auto Earn da Kraken, OKX, Bybit, Binance e WEEX em 2026 e veja quais plataformas oferecem recompensas promocionais adicionais além dos mecanismos de rendimento padrão.

Populares

Últimas notícias sobre cripto

Leia mais