Sie haben 15 Jahre lang kostenlos Googles KI trainiert, und Sie wussten es nicht einmal

By: blockbeats|2026/03/18 18:03:08
0
Teilen
copy
Originaltitel: Sie haben 15 Jahre lang Googles KI trainiert. Sie hatten keine Ahnung.
Ursprünglicher Autor: Sharbel, Mitbegründer von Unfungible
Ursprünglicher Übersetzer: Lila, BlockBeats
Hinweis des Herausgebers: CAPTCHA, die Zahlen oder Bilder, die Sie jedes Mal anklicken müssen, wenn Sie sich auf einer Website anmelden, sind jedem Internetnutzer vertraut. Aber wenn Sie immer wieder auf "Ich bin kein Roboter" klicken, denken Sie vielleicht, dass Sie nur Ihre Identität überprüfen, während Sie tatsächlich an der größten und geheimsten Datenproduktion der Welt teilnehmen. Luis von Ahns reCAPTCHA hat verstreutes menschliches Verhalten zu einem Datenfundament aggregiert, das Google und dessen Tochtergesellschaft, das selbstfahrende Unternehmen Waymo, unterstützt.
Unter der Fassade von "kostenlos" und "sicher" hat das Internet leise eine neue Form von Arbeitsbeziehungen umgestaltet: Sie verbringen Zeit damit, zu beweisen, dass Sie menschlich sind, tragen aber tatsächlich zur KI-Trainierung bei, und sobald die KI lernt, wird diese Arbeit vollständig ersetzt. Dieser Artikel hat in weniger als 20 Stunden über 9,5 Millionen Aufrufe auf Twitter erhalten. Der folgende Inhalt ist original:

Ungefähr 500.000 Stunden menschlicher Arbeit werden täglich kostenlos von Google ausgebeutet. Und die Menschen, die dazu beitragen, wollen einfach nur auf ihr Online-Banking zugreifen.

reCAPTCHA ist die erfolgreichste unsichtbare Datenoperation in der Internetgeschichte. Zu seinem Höhepunkt haben täglich 200 Millionen Menschen den Verifizierungsprozess abgeschlossen. Aber fast niemand erkannte, was jeder Klick hinter den Kulissen bedeutete.

Die selbstfahrende Autocompany von Google, Waymo, wird jetzt mit 45 Milliarden Dollar bewertet. Und die meisten ihrer grundlegenden Trainingsdaten werden von Ihnen kostenlos bereitgestellt, während Sie auf verschiedene Websites zugreifen.

Hier ist die ganze Geschichte:

Ursprung: Eine clevere Idee

Im Jahr 2000 richteten Spam-Bots im Internet Chaos an. Foren waren überflutet, Postfächer liefen über, und Websites benötigten eine Möglichkeit, zwischen Menschen und Maschinen zu unterscheiden.

Der Professor der Carnegie Mellon University, Luis von Ahn, löste dieses Problem. Er erfand CAPTCHA: verzerrten Text, den nur Menschen lesen konnten, nicht Bots.

Aber von Ahn sah mehr als das. Millionen von Menschen hatten ihre Energie diesen Herausforderungen gewidmet. Was wäre, wenn diese Energie zwei Dinge gleichzeitig tun könnte?

Im Jahr 2007 führte er reCAPTCHA ein. Seine Brillanz: nicht mehr zufällig verzerrten Text anzuzeigen, sondern zwei Wörter. Ein Wort war dem System bekannt, das andere ein echtes gescanntes Buchwort, das Computer noch nicht erkennen konnten. Und Ihre Antwort half bei der Digitalisierung dieser Bücher.

Diese Bücher stammten aus den Archiven der New York Times und Google Books und umfassten insgesamt bis zu 130 Millionen.

Sie dachten, Sie würden sich nur in eine normale Website einloggen, aber Sie führten tatsächlich OCR (Optische Zeichenerkennung) für die größte digitale Bibliothek der Welt durch.

Im Jahr 2009 erwarb Google offiziell reCAPTCHA.

Sie haben 15 Jahre lang kostenlos Googles KI trainiert, und Sie wussten es nicht einmal

Später änderte Google das Spiel

Die Ära des "verzerrten Textes" endete etwa 2012.

Google sah sich einer neuen Herausforderung gegenüber: Die Street View-Autos hatten jede Straße weltweit fotografiert, aber die Bilder waren nur rohe Daten. Damit KI ihre Magie entfalten kann, muss sie verstehen, was sie sieht: Verkehrsschilder, Zebrastreifen, Ampeln, Schaufenster.

Also hat Google reCAPTCHA v2 neu gestaltet. Anstelle von verzerrtem Text gab es Fotogitter. "Klicken Sie auf alle Kästchen mit Ampeln." "Wählen Sie jeden Zebrastreifen aus." "Identifizieren Sie Schaufenster."

Diese Bilder stammen direkt von Google Street View. Ihre Klicks dienten als Tags.

Jede Auswahl informierte das Computer Vision-Modell von Google: diese Pixel bilden eine Ampel, diese Form ist ein Zebrastreifen. Sie haben keinen Test gemacht; Sie haben einen Datensatz erstellt.

Eine unvorstellbare Skala

Auf dem Höhepunkt wurden täglich 200 Millionen reCAPTCHAs gelöst. Jede Herausforderung dauerte 10 Sekunden, was 2 Milliarden Sekunden menschlicher Arbeit pro Tag bedeutet. Das sind 500.000 Stunden jeden Tag.

Die Kosten für bezahlte Datenkennzeichnung liegen bei etwa 10 bis 50 Dollar pro Stunde. Berechnet zum niedrigsten Satz: Der tägliche Wert der kostenlos extrahierten Arbeit erreichte bis zu 5 Millionen Dollar.

Darüber hinaus existiert reCAPTCHA nicht nur in einer bestimmten App. Es ist in jeder Bank, jedem Regierungsportal und jeder E-Commerce-Website präsent. Du hast keine Wahl: Möchtest du dich in dein Konto einloggen? Zuerst hilf dabei, den Datensatz zu annotieren. Google hat nie nach deiner Meinung gefragt, dir einen Cent Gehalt gezahlt oder dir sogar davon erzählt.

Wozu hat das alles geführt?

Diese Daten fließen direkt in zwei Produkte ein:

-Google Maps: Das weltweit am häufigsten verwendete Navigationswerkzeug. Seine Fähigkeit, Verkehrsschilder, Geschäfte und Stadtgeografie zu erkennen, wird teilweise den Milliarden von menschlichen Annotationen zugeschrieben, die beim Einloggen in Websites gemacht wurden.

-Waymo: Das selbstfahrende Projekt von Google. Für eine sichere Navigation müssen autonome Fahrzeuge fast perfekt Tausende von visuellen Mustern identifizieren.

Die Grundwahrheits-Trainingsdaten für diese Identifikationsarbeit sind genau das, was Millionen von Menschen unwissentlich durch reCAPTCHA annotiert haben. Waymo hat 2024 über 4 Millionen bezahlte Fahrten abgeschlossen, die mit 45 Milliarden Dollar bewertet werden. Sein Grundpfeiler wurde von den "unbezahlten Internetnutzern" gelegt, die einfach nur ihre E-Mails abrufen wollten.

Warum kann niemand dieses Modell replizieren?

Datenannotation ist extrem kostspielig. Unternehmen wie Scale AI, Appen und Labelbox existieren, um dieses Problem zu lösen; sie stellen Hunderttausende von Arbeitern ein und zahlen manchmal weniger als 1 Dollar pro Stunde.

Google hat einen anderen Ansatz für das Problem gewählt: Sie haben die Annotation zur Voraussetzung gemacht. Keine Zahlung erforderlich, keine Zustimmung nötig, sondern als "Ticket" um in jede Ecke des Internets einzutreten. Das Ergebnis: Milliarden von gekennzeichneten Bildern, globale Abdeckung, bei jedem Wetter, in jeder Stadt der Welt. Keine Annotationfirma kann dies erreichen. Das Internet selbst ist eine Fabrik, und jeder Netizen ist ein undocumented Mitarbeiter.

Du nimmst immer noch teil

reCAPTCHA v3, gestartet im Jahr 2018, zeigt nicht einmal mehr Herausforderungen an. Es beobachtet, wie du die Maus bewegst, die Scrollgeschwindigkeit, die Verweildauer. Dein Verhaltensfingerabdruck informiert darüber, ob du menschlich bist. Diese Verhaltensdaten fließen auch in Googles KI-Systeme zurück.

Du hast nie aktiv gewählt, beizutreten, hattest nie ein Kästchen zum Ankreuzen. Doch gerade jetzt machst du das auf den meisten Websites, die du besuchst, immer noch.

Störende Ironie

Die ursprüngliche Absicht von Luis von Ahn war brillant: die Energie, die Menschen bereits verschwenden, in nützliche Ergebnisse umzuwandeln. Was Google jedoch mit dieser Vision gemacht hat, ist eine ganz andere Geschichte. Sie haben einen Sicherheitsmechanismus, den die Nutzer verwenden mussten, im gesamten Web eingesetzt und die Ergebnisse geerntet, um ein Geschäftsprodukt im Wert von Hunderten von Milliarden Dollar aufzubauen. Die Nutzer erhielten nichts im Gegenzug, nicht einmal ein Bewusstsein.

Die tiefste Ironie ist: du hast Jahre damit verbracht, zu beweisen, dass du menschlich bist, indem du visuelle Erkennungsaufgaben abgeschlossen hast, die KI damals nicht erledigen konnte. Aber sobald KI lernte, diese Aufgaben zu erledigen, waren menschliche visuelle Annotationen nicht mehr nötig.

Sie haben bewiesen, dass Sie menschlich sind, nur um sich letztendlich ersetzbar zu machen.

Link zum Originalbeitrag

---Preis

--

Das könnte Ihnen auch gefallen

Regulierung, Insiderhandel und das Wesentliche: Die Geschichte hinter Kalshis Bewertung von 20 Milliarden Dollar

80 % der Nutzer nehmen lediglich Informationen auf

Wie man Kryptowährungen ohne App Store handelt: Sofortiges Browser-Krypto-Trading auf WEEX

Handeln Sie Krypto sofort, ohne eine App herunterzuladen. Verwenden Sie WEEX H5, um direkt in Ihrem Browser auf Spot- und Futures-Trading zuzugreifen, mit schneller Ausführung, Echtzeit-Risikokontrolle und nahtlosem Erlebnis auf Mobilgeräten, Tablets und Desktop. Unterstützt Bitcoin, Ethereum und mehr.

Von OKX bis Bybit: Die Börsen wechseln ihre Reifen auf der Autobahn bei hoher Geschwindigkeit

Angesichts der derzeit weltweit verschärften Regulierungsvorschriften sind die Kosten gering, wenn man mit einem Partner, der bereits über ein Compliance-System verfügt, direkt in den Markt eintreten kann und dabei von einer bundesstaatlichen Lizenz, der Glaubwürdigkeit eines börsennotierten Unternehmens sowie dem Zugang zu Kooperationskanälen mit Banken profitiert...

Eine kurze Geschichte und Zukunft der unbefristeten Verträge

Dezentralisierte unbefristete Vertragsbörsen wie Hyperliquid ersetzen traditionelle Derivate mit strukturellen Vorteilen und werden zu Billionen-Dollar-Finanzplattformen, die globale Vermögenswerte anziehen.

AI-Agent erhält ID und Wallet am selben Tag | Rewire News Morgenbrief

Die Infrastruktur für Agenten in der Wirtschaft bildet sich schneller als erwartet

IOSG: Paradigmenwechsel bei der Leistungsflexibilität: Von Makro-Assets zu einer verteilten Intelligenzschicht

Das Stromsystem wird aufgefordert, eine Aufgabe zu erfüllen, für die es nicht konzipiert wurde.

Beliebte Coins

Neueste Krypto-Nachrichten

Mehr lesen