Você vem treinando a IA do Google de graça há 15 anos, e nem sabia disso

By: blockbeats|2026/03/18 18:06:42

Título original: Você vem treinando a IA do Google há 15 anos. Você nem imaginava.

Autor original: Sharbel, cofundador da Unfungible

Tradutor original: Lila, BlockBeats

Nota do editor: O CAPTCHA, aqueles números ou imagens nos quais você precisa clicar sempre que faz login em um site, é conhecido por todos os usuários da Internet. Mas quando você clica em “Não sou um robô” repetidamente, pode pensar que está apenas confirmando sua identidade, quando, na verdade, está participando da maior e mais secreta produção de dados do mundo. O reCAPTCHA, de Luis von Ahn, reuniu comportamentos humanos dispersos em uma base de dados fundamental para o Google e sua subsidiária, a empresa de veículos autônomos Waymo.

Por trás da fachada de "gratuito" e "seguro", a Internet silenciosamente moldou uma nova forma de relação de trabalho: você gasta tempo provando que é humano, mas, na verdade, está contribuindo para o treinamento da IA; e, assim que a IA aprende, esse trabalho é completamente substituído. Este artigo recebeu mais de 9,5 milhões de visualizações no Twitter em menos de 20 horas. Segue abaixo o conteúdo original:

Aproximadamente 500 mil horas de trabalho humano são exploradas gratuitamente pelo Google todos os dias. E as pessoas que estão contribuindo para isso só querem acessar o banco online.

O reCAPTCHA é a operação invisível de dados de maior sucesso da história da Internet. No auge, 200 milhões de pessoas concluíam o processo de verificação todos os dias. Mas quase ninguém percebia o que cada clique significava nos bastidores.

A Waymo, empresa de carros autônomos do Google, está avaliada atualmente em US$ 45 bilhões. E a maior parte dos dados essenciais para o treinamento é fornecida gratuitamente por você ao acessar diversos sites.

Aqui está a história completa:

Origem: Uma ideia inteligente

Em 2000, os robôs de spam estavam causando estragos na Internet. Os fóruns estavam inundados, as caixas de entrada estavam transbordando e os sites precisavam de uma maneira de distinguir entre humanos e máquinas.

O professor Luis von Ahn, da Universidade Carnegie Mellon, resolveu esse problema. Ele inventou o CAPTCHA: texto distorcido que só os humanos conseguiam ler, e não os robôs.

Mas von Ahn viu mais do que isso. Milhões de pessoas dedicaram suas energias a esses desafios. E se essa energia pudesse fazer duas coisas ao mesmo tempo?

Em 2007, ele lançou o reCAPTCHA. O que é genial: já não exibe texto aleatório e ilegível, mas sim duas palavras. Uma palavra era conhecida pelo sistema, a outra era uma palavra real de um livro digitalizado que os computadores ainda não conseguiam reconhecer. E a sua resposta ajudou na digitalização desses livros.

Esses livros foram extraídos dos arquivos do The New York Times e do Google Livros, totalizando 130 milhões.

Você pensava que estava apenas acessando um site comum, mas, na verdade, estava realizando um OCR (Reconhecimento Ótico de Caracteres) para a maior biblioteca digital do mundo.

Em 2009, o Google adquiriu oficialmente o reCAPTCHA.

Você vem treinando a IA do Google de graça há 15 anos, e nem sabia disso

Mais tarde, o Google revolucionou o mercado

A era do “texto distorcido” chegou ao fim por volta de 2012.

O Google enfrentou um novo desafio: Os carros do Street View já haviam fotografado todas as ruas do mundo, mas as imagens eram apenas dados brutos. Para que a IA pudesse fazer sua mágica, ela precisava entender o que via: sinais de trânsito, faixas de pedestres, semáforos, fachadas de lojas.

Então, o Google reformulou o reCAPTCHA v2. Em vez de texto distorcido, havia grades de fotos. "Clique em todos os quadrados com semáforos." "Selecione todas as faixas de pedestres." "Identifique as fachadas das lojas."

Essas imagens foram obtidas diretamente do Google Street View. Seus cliques serviram como tags.

Cada seleção alimentava o modelo de visão computacional do Google: esses pixels formam um semáforo, aquela forma é uma faixa de pedestres. Você não estava fazendo um teste; estava criando um conjunto de dados.

Uma escala inimaginável

No auge, eram resolvidos 200 milhões de reCAPTCHAs por dia. Cada desafio levava 10 segundos, o que significa 2 bilhões de segundos de trabalho humano por dia. Isso dá 500 mil horas por dia.

O custo do trabalho remunerado de rotulagem de dados varia entre US$ 10 e US$ 50 por hora. Calculado com base na taxa mais baixa: o valor diário do trabalho extraído gratuitamente chegou a atingir US$ 5 milhões.

Além disso, o reCAPTCHA não está presente apenas em um aplicativo específico. Está presente em todos os bancos, em todos os portais governamentais e em todos os sites de comércio eletrônico. Você não tem escolha: Quer fazer login na sua conta? Primeiro, ajude a anotar o conjunto de dados. O Google nunca pediu sua opinião, nunca lhe pagou um centavo de salário, nem mesmo lhe contou nada sobre isso.

A que tudo isso levou?

Esses dados são utilizados diretamente em dois produtos:

-Google Maps: A ferramenta de navegação mais utilizada em todo o mundo. Sua capacidade de reconhecer sinais de trânsito, lojas e a geografia da cidade deve-se, em parte, aos bilhões de anotações feitas por pessoas durante o acesso a sites.

-Waymo: O projeto de veículos autônomos do Google. Para uma navegação segura, os veículos autônomos precisam identificar com quase total precisão milhares de padrões visuais.

Os dados de treinamento de referência para esse trabalho de identificação são exatamente aqueles que milhões de pessoas, sem saber, anotaram por meio do reCAPTCHA. A Waymo realizou mais de 4 milhões de viagens pagas em 2024, no valor de US$ 45 bilhões. Sua pedra fundamental, lançada por aqueles “usuários da internet não remunerados” que só queriam verificar seus e-mails.

Por que ninguém consegue reproduzir esse modelo?

A anotação de dados é extremamente cara. Empresas como a Scale AI, a Appen e a Labelbox existem para resolver esse problema; elas contratam centenas de milhares de trabalhadores, às vezes pagando menos de US$ 1 por hora.

O Google adotou uma abordagem diferente para o problema: transformou a anotação em um requisito. Não é necessário pagar nem dar consentimento, mas serve como um “bilhete” para acessar todos os cantos da internet. O resultado: bilhões de imagens rotuladas, cobertura global, em todas as condições climáticas, em todas as cidades do mundo. Nenhuma empresa de anotação consegue fazer isso. A própria internet é uma fábrica, e cada internauta é um funcionário sem contrato.

Você ainda está participando

O reCAPTCHA v3, lançado em 2018, nem sequer exibe mais os desafios. Ele monitora como você move o mouse, a velocidade de rolagem e o tempo de permanência. Sua assinatura comportamental indica se você é humano. Esses dados comportamentais também são incorporados aos sistemas de IA do Google.

Você nunca escolheu ativamente participar, nunca teve uma caixa de seleção para marcar. No entanto, neste momento, na maioria dos sites que você visita, você ainda está fazendo isso.

Uma ironia perturbadora

A intenção original de Luis von Ahn era brilhante: transformar a energia que as pessoas já desperdiçavam em algo útil. No entanto, o que o Google fez com essa visão é uma história completamente diferente. Eles pegaram um mecanismo de segurança que os usuários eram obrigados a usar, implementaram-no na web e aproveitaram os resultados para criar um produto comercial avaliado em centenas de bilhões de dólares. Os usuários não receberam nada em troca, nem mesmo reconhecimento.

A ironia mais profunda é esta: você passou anos provando que é humano ao realizar tarefas de reconhecimento visual que a IA não conseguia realizar naquela época. Mas, assim que a IA aprendeu a realizar essas tarefas, as anotações visuais feitas por humanos deixaram de ser necessárias.

Você provou que é humano, mas acabou se tornando dispensável.

Link da publicação original

Preço de --

Você também pode gostar

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A entidade regulamentada está pronta para lançar uma stablecoin na primeira metade deste ano.

A pessoa que ajudou o TAO a subir 90% foi a mesma que, sozinha, fez o preço despencar novamente hoje

Enquanto houver pessoas, a história continua. Mas, quando eles forem embora, talvez você nem consiga encontrar um adversário à altura para jogar.

Guia de 3 minutos para participar da oferta pública inicial (IPO) da SpaceX na Bitget

O Bitget IPO Prime oferece uma oportunidade única para usuários de todo o mundo participarem de aberturas de capital de empresas unicórnio de nível internacional, permitindo que usuários comuns tenham acesso igualitário aos potenciais benefícios econômicos dessas ofertas públicas de ações de primeira linha.

Como ganhar US$ 15.000 com USDT ocioso antes da temporada de altcoins de 2026

Você está se perguntando se a temporada das altcoins chegará em 2026? Fique por dentro das últimas novidades do mercado e descubra como transformar suas stablecoins ociosas, que estão à espera de serem investidas, em recompensas extras de até 15.000 USDT.

Você pode vencer o Joker Returns sem um grande volume de negociação? 5 Erros que Novos Jogadores Cometem na Temporada 2 do WEEX Joker Returns

Os pequenos traders podem vencer o WEEX Joker Returns 2026 sem um volume enorme? Sim, se você evitar esses 5 erros dispendiosos. Aprenda a maximizar os sorteios de cartas, usar os Jokers com sabedoria e transformar pequenos depósitos em 15.000 USDT em recompensas.

Será que a “Alt Season” vai acontecer em 2026? 5 dicas para identificar as próximas oportunidades de criptomoedas com potencial de valorização de 100 vezes

Será que a temporada das altcoins chegará em 2026? Descubra as 5 fases de rotação, os sinais precoces que os traders experientes observam e os principais setores de criptomoedas onde podem surgir as próximas oportunidades de altcoins com potencial de valorização de 100 vezes.

Temporada das Altcoins de 2026: 4 etapas para obter lucro (antes que a galera entre na onda do FOMO)

A Temporada das Altcoins de 2026 está começando — descubra as quatro etapas principais da rotação de capital (da ETH para a PEPE) e como se posicionar antes do pico. Descubra quais tokens vão liderar cada fase e não perca a recuperação.

Top 5 Criptomoedas para Comprar no 1º Trimestre de 2026: Uma Análise Profunda do ChatGPT

Explore as 5 principais criptomoedas para comprar no 1º trimestre de 2026, incluindo BTC, ETH, SOL, TAO e ONDO. Veja as previsões de preços, narrativas-chave e catalisadores institucionais que estão moldando o próximo movimento do mercado.

O mercado em baixa chegou, e os emissores de ETF de criptomoedas também estão se envolvendo

A listagem de hoje do MSBT é o mais recente marco nesta reestruturação, com a entrada de instituições acelerando a adoção de criptomoedas pelas finanças tradicionais, mas também diluindo a liquidez do mercado nativo.

O homem mais rico teve uma discussão com seu antigo chefe

Isso causou um grande alvoroço, já que várias figuras de destaque do meio das criptomoedas na China se envolveram em intensas disputas verbais e confrontos nas últimas 24 horas.

Bônus de Ganho Automático 2026: WEEX x Binance x Bybit x OKX x Kraken (apenas uma oferece bônus extra)

Auto Earn 2026: Binance? Bybit? Sem bônus adicional. Só o WEEX oferece +0,5% + 300% de APR por indicação. Por tempo limitado. Veja exatamente quanto mais você pode ganhar.

Auto Earn 2026: A WEEX oferece 0,5% a mais + 300% de bônus APR — mais do que Binance e Bybit?

A maioria das exchanges oferece Auto Earn, mas somente a WEEX adiciona um bônus extra de 0,5% no crescimento do saldo + 300% de recompensas de referência em 2026. Veja como a WEEX se compara à Binance, Bybit, OKX e Kraken — e por que você pode ganhar mais com um simples ajuste.

Sete Velas Verdes Encontram Três Soldados Brancos | Rewire News Morning Brief

Na noite passada, as atas do Fed já liberaram o sinal de "manter a linha na contenção", o CPI é o segundo sapato

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A entidade regulamentada está pronta para lançar uma stablecoin na primeira metade deste ano.