Ha estado entrenando la IA de Google gratis durante 15 años, ¡y ni siquiera lo sabía!
Título original: Ha estado entrenando la IA de Google durante 15 años. No tenía ni idea.
Autor original: Sharbel, cofundador de Unfungible
Original Translator: Lila, BlockBeats
Nota del editor: CAPTCHA, los números o imágenes en los que debe hacer clic cada vez que inicia sesión en un sitio web, es familiar para todos los usuarios de Internet. Pero cuando haces clic en "No soy un robot" una y otra vez, podrías pensar que solo estás verificando tu identidad, cuando en realidad estás participando en la producción de datos más grande y secreta del mundo. El reCAPTCHA de Luis von Ahn ha agregado el comportamiento humano disperso en una piedra angular de datos que respalda a Google y a su subsidiaria, la empresa de vehículos autónomos Waymo.
Bajo la fachada de "gratuito" y "seguro", Internet ha remodelado silenciosamente una nueva forma de relación laboral: pasas tiempo demostrando que eres humano, pero en realidad estás contribuyendo a la formación de la IA, y una vez que la IA aprende, este trabajo es completamente reemplazado. Este artículo ha recibido más de 9,5 millones de visitas en Twitter en menos de 20 horas. A continuación, el contenido original:
Aproximadamente 500.000 horas de trabajo humano son explotadas gratuitamente por Google todos los días. Y las personas que contribuyen a esto solo quieren iniciar sesión en la banca en línea.
reCAPTCHA es la operación de datos invisible más exitosa en la historia de Internet. En su punto álgido, 200 millones de personas completaban el proceso de verificación todos los días. Pero casi nadie se daba cuenta de lo que significaba cada clic entre bastidores.
La empresa de coches autónomos de Google, Waymo, tiene ahora un valor de 45.000 millones de dólares. Y la mayoría de sus datos de entrenamiento centrales son proporcionados libremente por usted al acceder a varios sitios web.
Aquí está la historia completa:
Origen: Una idea inteligente
En 2000, los bots de spam estaban causando estragos en Internet. Los foros estaban inundados, las bandejas de entrada estaban desbordadas y los sitios web necesitaban una forma de distinguir entre humanos y máquinas.
El profesor de la Universidad Carnegie Mellon, Luis von Ahn, resolvió este problema. Inventó CAPTCHA: texto distorsionado que solo los humanos podían leer, no los bots.
Pero von Ahn vio más allá. Millones de personas habían dedicado su energía a estos desafíos. ¿Y si esa energía pudiera hacer dos cosas a la vez?
En 2007, introdujo reCAPTCHA. Su genialidad: ya no mostraba texto aleatorio distorsionado, sino dos palabras. Una palabra era conocida por el sistema, la otra era una palabra real escaneada de un libro que las computadoras aún no podían reconocer. Y su respuesta ayudó en la digitalización de estos libros.
Estos libros provenían de los archivos del New York Times y de Google Books, con un total de hasta 130 millones.
Pensaste que simplemente te estabas conectando a un sitio web común y corriente, pero en realidad estabas realizando OCR (Reconocimiento Óptico de Caracteres) para la biblioteca digital más grande del mundo.
En 2009, Google adquirió oficialmente reCAPTCHA.

Más tarde, Google cambió el juego
La era del "texto torcido" terminó alrededor de 2012.
Google enfrentó un nuevo desafío: Los coches de Street View habían fotografiado todas las carreteras del mundo, pero las imágenes eran solo datos crudos. Para que la IA pudiera hacer su magia, necesitaba entender lo que veía: señales de tráfico, pasos de peatones, semáforos, escaparates.
Así que Google rediseñó reCAPTCHA v2. En lugar de texto distorsionado, había cuadrículas de fotos. "Haz clic en todos los cuadrados con semáforos". "Selecciona todos los pasos de peatones". "Identifica los escaparates".
Estas imágenes provienen directamente de Google Street View. Tus clics sirvieron como etiquetas.
Cada selección informaba al modelo de visión artificial de Google: estos píxeles forman un semáforo, esa forma es un paso de peatones. No estabas haciendo una prueba; estabas construyendo un conjunto de datos.

Una escala inimaginable
En su punto álgido, se resolvían 200 millones de reCAPTCHAs al día. Cada desafío llevaba 10 segundos, lo que significaba 2.000 millones de segundos de trabajo humano por día. Eso son 500.000 horas todos los días.
El costo del etiquetado de datos pagado es de aproximadamente $10 a $50 por hora. Calculado a la tasa más baja: el valor diario del trabajo extraído libremente alcanzó hasta $5 millones.
Además, reCAPTCHA no solo existe en una aplicación en particular. Está presente en cada banco, en cada portal gubernamental, en cada sitio web de comercio electrónico. No tienes opción: ¿Quieres iniciar sesión en tu cuenta? Primero, ayuda a anotar el conjunto de datos. Google nunca ha pedido tu opinión, te ha pagado un centavo de salario, o incluso te ha informado sobre esto.

¿A qué ha llevado todo esto?
Estos datos se incorporan directamente en dos productos:
-Google Maps: La herramienta de navegación más utilizada a nivel mundial. Su capacidad para reconocer señales de tráfico, tiendas y la geografía de la ciudad se debe en parte a los miles de millones de anotaciones humanas realizadas mientras se iniciaba sesión en sitios web.
-Waymo: Proyecto de vehículos autónomos de Google. Para una navegación segura, los vehículos autónomos necesitan identificar casi perfectamente miles de patrones visuales.
Los datos de entrenamiento de la verdad en el terreno para ese trabajo de identificación son precisamente los que millones de personas anotan sin saberlo a través de reCAPTCHA. Waymo completó más de 4 millones de viajes pagados en 2024, valorados en 45.000 millones de dólares. Su piedra angular, colocada por esos «usuarios de Internet no remunerados» que solo querían consultar su correo electrónico.
¿Por qué nadie puede replicar este modelo?
La anotación de datos es extremadamente costosa. Empresas como Scale AI, Appen y Labelbox existen para resolver este problema; contratan a cientos de miles de trabajadores, a veces pagando menos de 1 $ por hora.
Google adoptó un enfoque diferente al problema: convirtieron la anotación en un requisito. No se requiere pago, ni consentimiento, pero como un "billete" para entrar a cada rincón de internet. El resultado: miles de millones de imágenes etiquetadas, cobertura global, en todo tipo de clima, en cada ciudad del mundo. Ninguna empresa de anotación puede lograr esto. Internet en sí es una fábrica, y cada internauta es un empleado indocumentado.

Todavía estás participando
reCAPTCHA v3, lanzado en 2018, ni siquiera muestra desafíos. Observa cómo mueves el mouse, la velocidad de desplazamiento, el tiempo de permanencia. Tu huella conductual le informa si eres humano. Estos datos conductuales también se retroalimentan en los sistemas de IA de Google.
Nunca elegiste activamente unirte, nunca hubo una casilla para marcar. Sin embargo, en este momento, en la mayoría de los sitios web que visitas, sigues haciendo esto.
Ironía perturbadora
La intención original de Luis von Ahn era brillante: transformar la energía que los humanos ya estaban desperdiciando en una salida útil. Sin embargo, lo que Google hizo con esta visión es una historia completamente diferente. Tomaron un mecanismo de seguridad que los usuarios tenían que usar, lo implementaron en la web y recogieron los resultados para crear un producto empresarial valorado en cientos de miles de millones de dólares. Los usuarios no obtuvieron nada a cambio, ni siquiera conciencia.
La ironía más profunda es: pasaste años demostrando que eres humano completando tareas de reconocimiento visual que la IA no podía hacer en ese momento. Pero una vez que la IA aprendió a hacer estas tareas, ya no se necesitaban anotaciones visuales humanas.
Demostró que es humano, solo para terminar haciéndose reemplazable.
Te puede gustar

Regulación, privilegios y esencia: La historia detrás de la valoración de Kalshi en 20 mil millones de dólares.

Cómo comerciar con criptomonedas sin App Store: Comercio de criptomonedas instantáneo en WEEX
Comercia criptomonedas al instante sin descargar una aplicación. Utiliza WEEX H5 para acceder al comercio al contado y de futuros directamente en tu navegador con ejecución rápida, control de riesgo en tiempo real y una experiencia fluida en móvil, tablet y escritorio. Soporta Bitcoin, Ethereum y más.

De OKX a Bybit, los intercambios están cambiando los neumáticos en la autopista a alta velocidad

Breve historia y futuro de los contratos perpetuos

Agente de IA obtiene identificación y billetera el mismo día | Resumen matutino de Rewire News

IOSG: Cambio de paradigma en la flexibilidad energética: Desde activos macro hasta capa de inteligencia distribuida

Explicación del aumento del 35% en el precio de Murata: Un condensador que le da un buen susto al imperio de la IA

MiniMax: Un joven del condado de Henan y sus 300 mil millones

De proyecto abandonado a objetivo ambicioso: Mastercorp adquiere BVNK por 1.800 millones de dólares

¿Son correctos los precios de Polymarket? Simulé una crisis con 200 agentes para averiguarlo.

Una Década de Regulación Finalmente Aclarada, Victoria para la Lógica Nativa de Cripto

Resumen matutino | Mastercard planea adquirir BVNK por hasta 1.800 millones de dólares; la Fundación Solana lanza el agregador Tokens en Solana; el bitcoin registra sus primeras ocho subidas consecutivas en cuatro años

Aster Chain se lanza oficialmente: marcando el inicio de una nueva era de privacidad y transparencia en la cadena de bloques

Token se expande al extranjero, vendiendo electricidad china al mundo

RootData: Informe de investigación sobre la transparencia de los intercambios de criptomonedas de febrero de 2026

«One and Done SEA», así que OpenSea elige esperar un poco más

Ray Dalio: La resolución del conflicto entre Estados Unidos e Irán está en el estrecho de Ormuz

En solo 70 días, Polymarket recaudó fácilmente decenas de millones en comisiones
Regulación, privilegios y esencia: La historia detrás de la valoración de Kalshi en 20 mil millones de dólares.
Cómo comerciar con criptomonedas sin App Store: Comercio de criptomonedas instantáneo en WEEX
Comercia criptomonedas al instante sin descargar una aplicación. Utiliza WEEX H5 para acceder al comercio al contado y de futuros directamente en tu navegador con ejecución rápida, control de riesgo en tiempo real y una experiencia fluida en móvil, tablet y escritorio. Soporta Bitcoin, Ethereum y más.