Você vem treinando a IA do Google de graça há 15 anos, e nem sabia disso

By: blockbeats|2026/03/18 18:06:42
0
Compartilhar
copy
Título original: Você vem treinando a IA do Google há 15 anos. Você nem imaginava.
Autor original: Sharbel, cofundador da Unfungible
Tradutor original: Lila, BlockBeats
Nota do editor: O CAPTCHA, aqueles números ou imagens nos quais você precisa clicar sempre que faz login em um site, é conhecido por todos os usuários da Internet. Mas quando você clica em “Não sou um robô” repetidamente, pode pensar que está apenas confirmando sua identidade, quando, na verdade, está participando da maior e mais secreta produção de dados do mundo. O reCAPTCHA, de Luis von Ahn, reuniu comportamentos humanos dispersos em uma base de dados fundamental para o Google e sua subsidiária, a empresa de veículos autônomos Waymo.
Por trás da fachada de "gratuito" e "seguro", a Internet silenciosamente moldou uma nova forma de relação de trabalho: você gasta tempo provando que é humano, mas, na verdade, está contribuindo para o treinamento da IA; e, assim que a IA aprende, esse trabalho é completamente substituído. Este artigo recebeu mais de 9,5 milhões de visualizações no Twitter em menos de 20 horas. Segue abaixo o conteúdo original:

Aproximadamente 500 mil horas de trabalho humano são exploradas gratuitamente pelo Google todos os dias. E as pessoas que estão contribuindo para isso só querem acessar o banco online.

O reCAPTCHA é a operação invisível de dados de maior sucesso da história da Internet. No auge, 200 milhões de pessoas concluíam o processo de verificação todos os dias. Mas quase ninguém percebia o que cada clique significava nos bastidores.

A Waymo, empresa de carros autônomos do Google, está avaliada atualmente em US$ 45 bilhões. E a maior parte dos dados essenciais para o treinamento é fornecida gratuitamente por você ao acessar diversos sites.

Aqui está a história completa:

Origem: Uma ideia inteligente

Em 2000, os robôs de spam estavam causando estragos na Internet. Os fóruns estavam inundados, as caixas de entrada estavam transbordando e os sites precisavam de uma maneira de distinguir entre humanos e máquinas.

O professor Luis von Ahn, da Universidade Carnegie Mellon, resolveu esse problema. Ele inventou o CAPTCHA: texto distorcido que só os humanos conseguiam ler, e não os robôs.

Mas von Ahn viu mais do que isso. Milhões de pessoas dedicaram suas energias a esses desafios. E se essa energia pudesse fazer duas coisas ao mesmo tempo?

Em 2007, ele lançou o reCAPTCHA. O que é genial: já não exibe texto aleatório e ilegível, mas sim duas palavras. Uma palavra era conhecida pelo sistema, a outra era uma palavra real de um livro digitalizado que os computadores ainda não conseguiam reconhecer. E a sua resposta ajudou na digitalização desses livros.

Esses livros foram extraídos dos arquivos do The New York Times e do Google Livros, totalizando 130 milhões.

Você pensava que estava apenas acessando um site comum, mas, na verdade, estava realizando um OCR (Reconhecimento Ótico de Caracteres) para a maior biblioteca digital do mundo.

Em 2009, o Google adquiriu oficialmente o reCAPTCHA.

Você vem treinando a IA do Google de graça há 15 anos, e nem sabia disso

Mais tarde, o Google revolucionou o mercado

A era do “texto distorcido” chegou ao fim por volta de 2012.

O Google enfrentou um novo desafio: Os carros do Street View já haviam fotografado todas as ruas do mundo, mas as imagens eram apenas dados brutos. Para que a IA pudesse fazer sua mágica, ela precisava entender o que via: sinais de trânsito, faixas de pedestres, semáforos, fachadas de lojas.

Então, o Google reformulou o reCAPTCHA v2. Em vez de texto distorcido, havia grades de fotos. "Clique em todos os quadrados com semáforos." "Selecione todas as faixas de pedestres." "Identifique as fachadas das lojas."

Essas imagens foram obtidas diretamente do Google Street View. Seus cliques serviram como tags.

Cada seleção alimentava o modelo de visão computacional do Google: esses pixels formam um semáforo, aquela forma é uma faixa de pedestres. Você não estava fazendo um teste; estava criando um conjunto de dados.

Uma escala inimaginável

No auge, eram resolvidos 200 milhões de reCAPTCHAs por dia. Cada desafio levava 10 segundos, o que significa 2 bilhões de segundos de trabalho humano por dia. Isso dá 500 mil horas por dia.

O custo do trabalho remunerado de rotulagem de dados varia entre US$ 10 e US$ 50 por hora. Calculado com base na taxa mais baixa: o valor diário do trabalho extraído gratuitamente chegou a atingir US$ 5 milhões.

Além disso, o reCAPTCHA não está presente apenas em um aplicativo específico. Está presente em todos os bancos, em todos os portais governamentais e em todos os sites de comércio eletrônico. Você não tem escolha: Quer fazer login na sua conta? Primeiro, ajude a anotar o conjunto de dados. O Google nunca pediu sua opinião, nunca lhe pagou um centavo de salário, nem mesmo lhe contou nada sobre isso.

A que tudo isso levou?

Esses dados são utilizados diretamente em dois produtos:

-Google Maps: A ferramenta de navegação mais utilizada em todo o mundo. Sua capacidade de reconhecer sinais de trânsito, lojas e a geografia da cidade deve-se, em parte, aos bilhões de anotações feitas por pessoas durante o acesso a sites.

-Waymo: O projeto de veículos autônomos do Google. Para uma navegação segura, os veículos autônomos precisam identificar com quase total precisão milhares de padrões visuais.

Os dados de treinamento de referência para esse trabalho de identificação são exatamente aqueles que milhões de pessoas, sem saber, anotaram por meio do reCAPTCHA. A Waymo realizou mais de 4 milhões de viagens pagas em 2024, no valor de US$ 45 bilhões. Sua pedra fundamental, lançada por aqueles “usuários da internet não remunerados” que só queriam verificar seus e-mails.

Por que ninguém consegue reproduzir esse modelo?

A anotação de dados é extremamente cara. Empresas como a Scale AI, a Appen e a Labelbox existem para resolver esse problema; elas contratam centenas de milhares de trabalhadores, às vezes pagando menos de US$ 1 por hora.

O Google adotou uma abordagem diferente para o problema: transformou a anotação em um requisito. Não é necessário pagar nem dar consentimento, mas serve como um “bilhete” para acessar todos os cantos da internet. O resultado: bilhões de imagens rotuladas, cobertura global, em todas as condições climáticas, em todas as cidades do mundo. Nenhuma empresa de anotação consegue fazer isso. A própria internet é uma fábrica, e cada internauta é um funcionário sem contrato.

Você ainda está participando

O reCAPTCHA v3, lançado em 2018, nem sequer exibe mais os desafios. Ele monitora como você move o mouse, a velocidade de rolagem e o tempo de permanência. Sua assinatura comportamental indica se você é humano. Esses dados comportamentais também são incorporados aos sistemas de IA do Google.

Você nunca escolheu ativamente participar, nunca teve uma caixa de seleção para marcar. No entanto, neste momento, na maioria dos sites que você visita, você ainda está fazendo isso.

Uma ironia perturbadora

A intenção original de Luis von Ahn era brilhante: transformar a energia que as pessoas já desperdiçavam em algo útil. No entanto, o que o Google fez com essa visão é uma história completamente diferente. Eles pegaram um mecanismo de segurança que os usuários eram obrigados a usar, implementaram-no na web e aproveitaram os resultados para criar um produto comercial avaliado em centenas de bilhões de dólares. Os usuários não receberam nada em troca, nem mesmo reconhecimento.

A ironia mais profunda é esta: você passou anos provando que é humano ao realizar tarefas de reconhecimento visual que a IA não conseguia realizar naquela época. Mas, assim que a IA aprendeu a realizar essas tarefas, as anotações visuais feitas por humanos deixaram de ser necessárias.

Você provou que é humano, mas acabou se tornando dispensável.

Link da publicação original

Preço de --

--

Você também pode gostar

5 minutos para transformar a IA no seu segundo cérebro

É hora de delegar a tarefa de memorização à IA

O mistério de 17 anos será desvendado: quem é Satoshi Nakamoto?

O New York Times investiga o mistério de Satoshi Nakamoto, com pistas que apontam para Adam Back

A Uniswap está presa em um dilema de inovação

As diversas versões do Uniswap são uma das fontes de vitalidade do mercado DeFi, mas, desde 2023, o Uniswap não propôs nenhuma inovação substancial, limitando-se a explorar áreas tradicionais de negócios, como cadeias de aplicativos, Launchpads etc., o que levou a uma queda nos preços dos tokens e no mercado...

Qual é o segredo da competitividade no setor bancário de criptomoedas?

Os bancos digitais, cartões de criptomoedas, carteiras digitais, superapps e protocolos DeFi estão todos convergindo para o mesmo objetivo: tornar-se o principal ponto de acesso para suas economias, gastos, rendimentos e transferências nesta nova era.

O fluxo de stablecoins e os efeitos colaterais no mercado de câmbio

A pesquisa descobriu que um aumento exógeno nas entradas líquidas de stablecoins amplia significativamente a divergência de preços entre stablecoins e câmbio tradicional, leva à depreciação da moeda local e piora as condições de financiamento para dólares sintéticos (ou seja, aumenta o prêmio do dólar)

Após dois anos, o primeiro lote de licenças de stablecoin de Hong Kong finalmente emitido: HSBC, Standard Chartered são aprovados

A entidade regulamentada está pronta para lançar uma stablecoin na primeira metade deste ano.

Populares

Últimas notícias sobre cripto

Leia mais