logo

Ви 15 років безкоштовно навчали штучний інтелект Google, і навіть не знали про це

By: blockbeats|2026/03/18 18:04:24
0
Поширити
copy
Оригінальний заголовок: Ви 15 років навчали штучний інтелект Google. Ви й гадки не мали.
Оригінальний автор: Шарбель, співзасновник Unfungible
Original Text: <p>The <a href="https://www.example.com">Example</a> website is a great resource for learning about <a href="https://www.example.com/topic1">Topic 1</a> and <a href="https://www.example.com/topic2">Topic 2</a>.</p> Translated Text: <p>Веб-сайт <a href="https://www.example.com">Example</a> є чудовим ресурсом для вивчення <a href="https://www.example.com/topic1">Теми 1</a> та <a href="https://www.example.com/topic2">Теми 2</a>.</p> Ліла, BlockBeats
Примітка редактора: CAPTCHA, цифри або зображення, на які потрібно натискати щоразу, коли ви входите на веб-сайт, знайомі кожному користувачу Інтернету. Але коли ви раз за разом натискаєте "Я не робот", ви можете думати, що просто підтверджуєте свою особу, тоді як насправді ви берете участь у найбільшому та найсекретнішому у світі виробництві даних. Система reCAPTCHA Луїса фон Ана зібрала розрізнену поведінку людей в надійний джерело даних, що підтримує Google і її дочірню компанію Waymo, яка займається розробкою безпілотних автомобілів.
Під фасадом "безкоштовного" та "безпечного" Інтернет тихо змінив нову форму трудових відносин: ви витрачаєте час, доводячи, що ви людина, але насправді сприяєте навчанню штучного інтелекту, і як тільки ШІ навчається, ця праця повністю замінюється. Ця стаття отримала понад 9,5 мільйона переглядів у Twitter менш ніж за 20 годин. Ось оригінальний текст:

Щодня Google безкоштовно використовує приблизно 500 000 годин людської праці. А люди, які сприяють цьому, просто хочуть увійти в онлайн-банкінг.

reCAPTCHA – найуспішніша невидима операція з обробки даних в історії Інтернету. На піку своєї популярності 200 мільйонів людей щодня проходили процес верифікації. Але майже ніхто не розумів, що означав кожен клік за лаштунками.

Компанія Waymo, яка займається розробкою самокерованих автомобілів від Google, зараз оцінюється в 45 мільярдів доларів. І більшість її основних навчальних даних безкоштовно надаються вами під час доступу до різних веб-сайтів.

Ось повна історія:

Походження: Розумна ідея

У 2000 році спам-боти панували в Інтернеті. Форуми були переповнені, вхідні скриньки переповнені, а веб-сайтам потрібен був спосіб відрізнити людей від машин.

Професор Університету Карнегі-Меллона Луїс фон Ан вирішив цю проблему. Він винайшов CAPTCHA: спотворений текст, який могли прочитати лише люди, а не боти.

Але фон Ан бачив більше. Мільйони людей присвятили свою енергію цим завданням. А що якби ця енергія могла робити дві речі одночасно?

У 2007 році він представив reCAPTCHA. Його геніальність: більше не показувати випадковий нерозбірливий текст, а два слова. Одне слово було відоме системі, інше - реальне скановане слово з книги, яке комп'ютери ще не могли розпізнати. І ваша відповідь допомогла у оцифрування цих книг.

Ці книги були з архівів The New York Times і Google Books, загалом до 130 мільйонів.

Ви думали, що просто входите на звичайний веб-сайт, але насправді виконували оптичне розпізнавання символів (OCR) для найбільшої у світі цифрової бібліотеки.

У 2009 році Google офіційно придбав reCAPTCHA.

Ви 15 років безкоштовно навчали штучний інтелект Google, і навіть не знали про це

Пізніше Google змінив правила гри

Ера "перекрученого тексту" закінчилася приблизно в 2012 році.

Google зіткнувся з новою проблемою: Автомобілі Street View сфотографували всі дороги у світі, але знімки були просто сирими даними. Щоб штучний інтелект міг працювати, йому потрібно було розуміти те, що він бачив: дорожні знаки, пішохідні переходи, світлофори, вивіски.

Тому Google переробив reCAPTCHA v2. Замість спотвореного тексту з'явилися фотографічні сітки. "Клацніть на всі квадрати зі світлофорами." "Виберіть кожен пішохідний перехід." "Визначте вивіски."

Ці зображення надходили безпосередньо з Google Street View. Ваші кліки слугували тегами.

Кожен вибір інформував модель комп'ютерного зору Google: ці пікселі утворюють світлофор, ця форма - пішохідний перехід. Ви не складали тест; ви створювали набір даних.

Немислимий масштаб

На піку популярності щодня розв'язували 200 мільйонів reCAPTCHAs. Кожне завдання займало 10 секунд, що означає 2 мільярди секунд людської праці на день. Це 500 000 годин щодня.

Вартість маркування даних становить приблизно від 10 до 50 доларів на годину. Якщо розраховувати за найнижчою ставкою: щоденна вартість безкоштовно отриманої праці досягала до 5 мільйонів доларів.

Більше того, reCAPTCHA існує не лише в окремому додатку. Він присутній у кожному банку, на кожному урядовому порталі, на кожному вебсайті електронної комерції. У вас немає вибору: Хочете увійти в свій обліковий запис? Спочатку допоможіть прокоментувати набір даних. Google ніколи не питав вашої думки, не платив вам ні цента зарплати або навіть не повідомляв вас про це.

До чого це призвело?

Ці дані безпосередньо використовуються в двох продуктах:

-Google Maps: Найбільш широко використовуваний інструмент навігації у всьому світі. Його здатність розпізнавати дорожні знаки, магазини та географію міста частково обумовлена мільярдами анотацій, зроблених людьми під час входу на вебсайти.

-Waymo: Проект безпілотного автомобіля Google. Для безпечної навігації автономним транспортним засобам потрібно майже ідеально розпізнавати тисячі візуальних шаблонів.

Дані для навчання, які є основою для цієї ідентифікації, - це саме те, що мільйони людей ненавмисно анотували через reCAPTCHA. Waymo здійснила понад 4 мільйони платних поїздок у 2024 році, вартість яких становить 45 мільярдів доларів. Її наріжний камінь заклали ті «неоплачувані інтернет-користувачі», які просто хотіли перевірити свою електронну пошту.

Чому ніхто не може повторити цю модель?

Анотація даних надзвичайно дорога. Такі компанії, як Scale AI, Appen і Labelbox, існують для вирішення цієї проблеми; вони наймають сотні тисяч працівників, іноді платячи менше 1 долара на годину.

Google підійшов до проблеми інакше: вони перетворили анотацію на вимогу. Не потрібно платити, не потрібно згоди, але це "квиток" для доступу до кожного куточка Інтернету. Результат: мільярди зображень із мітками, глобальне охоплення, будь-яка погода, кожне місто світу. Жодна компанія з анотації не може досягти цього. Сам Інтернет є фабрикою, а кожен користувач мережі - незареєстрованим працівником.

Ви все ще берете участь

reCAPTCHA v3, запущений у 2018 році, навіть не відображає виклики. Він спостерігає за тим, як ви рухаєте мишу, швидкістю прокручування, часом очікування. Ваш поведінковий відбиток повідомляє йому, чи ви людина. Ці дані про поведінку також надходять у системи штучного інтелекту Google.

Ви ніколи не обирали активне членство, ніколи не ставили галочку. Проте зараз на більшості вебсайтів, які ви відвідуєте, ви все ще це робите.

Тривожна іронія

Початковий задум Луїса фон Ана був геніальним: перетворити енергію, яку люди вже витрачали даремно, на корисний результат. Однак те, що Google зробив з цим баченням, це зовсім інша історія. Вони взяли механізм безпеки, який користувачі повинні були використовувати, розгорнули його в мережі та зібрали результати, щоб створити бізнес-продукт вартістю сотні мільярдів доларів. Користувачі не отримали нічого натомість, навіть усвідомлення.

Найглибша іронія полягає в тому, що: ви витратили роки на доведення того, що ви людина, виконуючи завдання з розпізнавання зображень, які на той час штучний інтелект не міг виконати. Але як тільки штучний інтелект навчився виконувати ці завдання, людські візуальні анотації більше не були потрібні.

Ви довели, що ви людина, але врешті-решт зробили себе замінюваним.

Посилання на оригінальний пост

Ціна --

--

Вам також може сподобатися

Регулювання, інсайдерство та сутність: Історія, що стоїть за оцінкою Kalshi в 20 мільярдів доларів

80% користувачів просто споживають інформацію

Як торгувати криптовалютою без App Store: Миттєва криптоторгівля в браузері на WEEX

Торгуйте криптовалютою миттєво, не завантажуючи додаток. Використовуйте WEEX H5 для доступу до спот- і ф'ючерсної торгівлі безпосередньо у вашому браузері з швидким виконанням, контролем ризиків у реальному часі та безперебійним досвідом на мобільних пристроях, планшетах і настільних комп'ютерах. Підтримує Bitcoin, Ethereum тощо.

Від OKX до Bybit: біржі швидко змінюють шини на шосе

У нинішньому контексті посилення глобальних регуляторів, якщо можна безпосередньо вийти на ринок з партнером, який вже створив систему дотримання вимог, отримав схвалення федеральної ліцензії, репутацію лістингової компанії та доступ до каналів банківського співробітництва, вартість становить лише ...

Коротка історія та майбутнє безстрокових контрактів

Децентралізовані біржі безстрокових контрактів, такі як Hyperliquid, замінюють традиційні деривативи структурними перевагами, стаючи фінансовими платформами вартістю в трильйони доларів, які залучають глобальні активи.

Агент ІІ отримує ID і гаманець в той самий день | Rewire News Morning Brief

Інфраструктура агентів для економіки формується швидше, ніж хто-небудь очікував

IOSG: Парадигма гнучкості енергії: Від макроактивів до шару розподіленого інтелекту

енергетичну систему просять виконати завдання, для якого вона не була спроектована.

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon

Бот служби підтримки@WEEX_support_smart_Bot

VIP-послуги[email protected]