Você vem treinando a IA do Google de graça há 15 anos, e nem sabia disso
Título original: Você vem treinando a IA do Google há 15 anos. Você nem imaginava.
Autor original: Sharbel, cofundador da Unfungible
Tradutor original: Lila, BlockBeats
Nota do editor: O CAPTCHA, aqueles números ou imagens nos quais você precisa clicar sempre que faz login em um site, é conhecido por todos os usuários da Internet. Mas quando você clica em “Não sou um robô” repetidamente, pode pensar que está apenas confirmando sua identidade, quando, na verdade, está participando da maior e mais secreta produção de dados do mundo. O reCAPTCHA, de Luis von Ahn, reuniu comportamentos humanos dispersos em uma base de dados fundamental para o Google e sua subsidiária, a empresa de veículos autônomos Waymo.
Por trás da fachada de "gratuito" e "seguro", a Internet silenciosamente moldou uma nova forma de relação de trabalho: você gasta tempo provando que é humano, mas, na verdade, está contribuindo para o treinamento da IA; e, assim que a IA aprende, esse trabalho é completamente substituído. Este artigo recebeu mais de 9,5 milhões de visualizações no Twitter em menos de 20 horas. Segue abaixo o conteúdo original:
Aproximadamente 500 mil horas de trabalho humano são exploradas gratuitamente pelo Google todos os dias. E as pessoas que estão contribuindo para isso só querem acessar o banco online.
O reCAPTCHA é a operação invisível de dados de maior sucesso da história da Internet. No auge, 200 milhões de pessoas concluíam o processo de verificação todos os dias. Mas quase ninguém percebia o que cada clique significava nos bastidores.
A Waymo, empresa de carros autônomos do Google, está avaliada atualmente em US$ 45 bilhões. E a maior parte dos dados essenciais para o treinamento é fornecida gratuitamente por você ao acessar diversos sites.
Aqui está a história completa:
Origem: Uma ideia inteligente
Em 2000, os robôs de spam estavam causando estragos na Internet. Os fóruns estavam inundados, as caixas de entrada estavam transbordando e os sites precisavam de uma maneira de distinguir entre humanos e máquinas.
O professor Luis von Ahn, da Universidade Carnegie Mellon, resolveu esse problema. Ele inventou o CAPTCHA: texto distorcido que só os humanos conseguiam ler, e não os robôs.
Mas von Ahn viu mais do que isso. Milhões de pessoas dedicaram suas energias a esses desafios. E se essa energia pudesse fazer duas coisas ao mesmo tempo?
Em 2007, ele lançou o reCAPTCHA. O que é genial: já não exibe texto aleatório e ilegível, mas sim duas palavras. Uma palavra era conhecida pelo sistema, a outra era uma palavra real de um livro digitalizado que os computadores ainda não conseguiam reconhecer. E a sua resposta ajudou na digitalização desses livros.
Esses livros foram extraídos dos arquivos do The New York Times e do Google Livros, totalizando 130 milhões.
Você pensava que estava apenas acessando um site comum, mas, na verdade, estava realizando um OCR (Reconhecimento Ótico de Caracteres) para a maior biblioteca digital do mundo.
Em 2009, o Google adquiriu oficialmente o reCAPTCHA.

Mais tarde, o Google revolucionou o mercado
A era do “texto distorcido” chegou ao fim por volta de 2012.
O Google enfrentou um novo desafio: Os carros do Street View já haviam fotografado todas as ruas do mundo, mas as imagens eram apenas dados brutos. Para que a IA pudesse fazer sua mágica, ela precisava entender o que via: sinais de trânsito, faixas de pedestres, semáforos, fachadas de lojas.
Então, o Google reformulou o reCAPTCHA v2. Em vez de texto distorcido, havia grades de fotos. "Clique em todos os quadrados com semáforos." "Selecione todas as faixas de pedestres." "Identifique as fachadas das lojas."
Essas imagens foram obtidas diretamente do Google Street View. Seus cliques serviram como tags.
Cada seleção alimentava o modelo de visão computacional do Google: esses pixels formam um semáforo, aquela forma é uma faixa de pedestres. Você não estava fazendo um teste; estava criando um conjunto de dados.

Uma escala inimaginável
No auge, eram resolvidos 200 milhões de reCAPTCHAs por dia. Cada desafio levava 10 segundos, o que significa 2 bilhões de segundos de trabalho humano por dia. Isso dá 500 mil horas por dia.
O custo do trabalho remunerado de rotulagem de dados varia entre US$ 10 e US$ 50 por hora. Calculado com base na taxa mais baixa: o valor diário do trabalho extraído gratuitamente chegou a atingir US$ 5 milhões.
Além disso, o reCAPTCHA não está presente apenas em um aplicativo específico. Está presente em todos os bancos, em todos os portais governamentais e em todos os sites de comércio eletrônico. Você não tem escolha: Quer fazer login na sua conta? Primeiro, ajude a anotar o conjunto de dados. O Google nunca pediu sua opinião, nunca lhe pagou um centavo de salário, nem mesmo lhe contou nada sobre isso.

A que tudo isso levou?
Esses dados são utilizados diretamente em dois produtos:
-Google Maps: A ferramenta de navegação mais utilizada em todo o mundo. Sua capacidade de reconhecer sinais de trânsito, lojas e a geografia da cidade deve-se, em parte, aos bilhões de anotações feitas por pessoas durante o acesso a sites.
-Waymo: O projeto de veículos autônomos do Google. Para uma navegação segura, os veículos autônomos precisam identificar com quase total precisão milhares de padrões visuais.
Os dados de treinamento de referência para esse trabalho de identificação são exatamente aqueles que milhões de pessoas, sem saber, anotaram por meio do reCAPTCHA. A Waymo realizou mais de 4 milhões de viagens pagas em 2024, no valor de US$ 45 bilhões. Sua pedra fundamental, lançada por aqueles “usuários da internet não remunerados” que só queriam verificar seus e-mails.
Por que ninguém consegue reproduzir esse modelo?
A anotação de dados é extremamente cara. Empresas como a Scale AI, a Appen e a Labelbox existem para resolver esse problema; elas contratam centenas de milhares de trabalhadores, às vezes pagando menos de US$ 1 por hora.
O Google adotou uma abordagem diferente para o problema: transformou a anotação em um requisito. Não é necessário pagar nem dar consentimento, mas serve como um “bilhete” para acessar todos os cantos da internet. O resultado: bilhões de imagens rotuladas, cobertura global, em todas as condições climáticas, em todas as cidades do mundo. Nenhuma empresa de anotação consegue fazer isso. A própria internet é uma fábrica, e cada internauta é um funcionário sem contrato.

Você ainda está participando
O reCAPTCHA v3, lançado em 2018, nem sequer exibe mais os desafios. Ele monitora como você move o mouse, a velocidade de rolagem e o tempo de permanência. Sua assinatura comportamental indica se você é humano. Esses dados comportamentais também são incorporados aos sistemas de IA do Google.
Você nunca escolheu ativamente participar, nunca teve uma caixa de seleção para marcar. No entanto, neste momento, na maioria dos sites que você visita, você ainda está fazendo isso.
Uma ironia perturbadora
A intenção original de Luis von Ahn era brilhante: transformar a energia que as pessoas já desperdiçavam em algo útil. No entanto, o que o Google fez com essa visão é uma história completamente diferente. Eles pegaram um mecanismo de segurança que os usuários eram obrigados a usar, implementaram-no na web e aproveitaram os resultados para criar um produto comercial avaliado em centenas de bilhões de dólares. Os usuários não receberam nada em troca, nem mesmo reconhecimento.
A ironia mais profunda é esta: você passou anos provando que é humano ao realizar tarefas de reconhecimento visual que a IA não conseguia realizar naquela época. Mas, assim que a IA aprendeu a realizar essas tarefas, as anotações visuais feitas por humanos deixaram de ser necessárias.
Você provou que é humano, mas acabou se tornando dispensável.
Você também pode gostar

5 minutos para transformar a IA no seu segundo cérebro

O mistério de 17 anos será desvendado: quem é Satoshi Nakamoto?

A Uniswap está presa em um dilema de inovação

Qual é o segredo da competitividade no setor bancário de criptomoedas?

O fluxo de stablecoins e os efeitos colaterais no mercado de câmbio

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A pessoa que ajudou o TAO a subir 90% foi a mesma que, sozinha, fez o preço despencar novamente hoje

Guia de 3 minutos para participar da oferta pública inicial (IPO) da SpaceX na Bitget

Como ganhar US$ 15.000 com USDT ocioso antes da temporada de altcoins de 2026
Você está se perguntando se a temporada das altcoins chegará em 2026? Fique por dentro das últimas novidades do mercado e descubra como transformar suas stablecoins ociosas, que estão à espera de serem investidas, em recompensas extras de até 15.000 USDT.

Você pode vencer o Joker Returns sem um grande volume de negociação? 5 Erros que Novos Jogadores Cometem na Temporada 2 do WEEX Joker Returns
Os pequenos traders podem vencer o WEEX Joker Returns 2026 sem um volume enorme? Sim, se você evitar esses 5 erros dispendiosos. Aprenda a maximizar os sorteios de cartas, usar os Jokers com sabedoria e transformar pequenos depósitos em 15.000 USDT em recompensas.

Será que a “Alt Season” vai acontecer em 2026? 5 dicas para identificar as próximas oportunidades de criptomoedas com potencial de valorização de 100 vezes
Será que a temporada das altcoins chegará em 2026? Descubra as 5 fases de rotação, os sinais precoces que os traders experientes observam e os principais setores de criptomoedas onde podem surgir as próximas oportunidades de altcoins com potencial de valorização de 100 vezes.

Temporada das Altcoins de 2026: 4 etapas para obter lucro (antes que a galera entre na onda do FOMO)
A Temporada das Altcoins de 2026 está começando — descubra as quatro etapas principais da rotação de capital (da ETH para a PEPE) e como se posicionar antes do pico. Descubra quais tokens vão liderar cada fase e não perca a recuperação.

Top 5 Criptomoedas para Comprar no 1º Trimestre de 2026: Uma Análise Profunda do ChatGPT
Explore as 5 principais criptomoedas para comprar no 1º trimestre de 2026, incluindo BTC, ETH, SOL, TAO e ONDO. Veja as previsões de preços, narrativas-chave e catalisadores institucionais que estão moldando o próximo movimento do mercado.

O mercado em baixa chegou, e os emissores de ETF de criptomoedas também estão se envolvendo

O homem mais rico teve uma discussão com seu antigo chefe

Bônus de Ganho Automático 2026: WEEX x Binance x Bybit x OKX x Kraken (apenas uma oferece bônus extra)
Auto Earn 2026: Binance? Bybit? Sem bônus adicional. Só o WEEX oferece +0,5% + 300% de APR por indicação. Por tempo limitado. Veja exatamente quanto mais você pode ganhar.

Auto Earn 2026: A WEEX oferece 0,5% a mais + 300% de bônus APR — mais do que Binance e Bybit?
A maioria das exchanges oferece Auto Earn, mas somente a WEEX adiciona um bônus extra de 0,5% no crescimento do saldo + 300% de recompensas de referência em 2026. Veja como a WEEX se compara à Binance, Bybit, OKX e Kraken — e por que você pode ganhar mais com um simples ajuste.

