شما به مدت 15 سال به صورت رایگان هوش مصنوعی گوگل را آموزش دادهاید و حتی نمیدانستید
عنوان اصلی: شما به مدت 15 سال هوش مصنوعی گوگل را آموزش دادهاید. شما هیچ ایدهای نداشتید.
نویسنده اصلی: شاربل، همبنیانگذار Unfungible
مترجم اصلی: لیلا، BlockBeats
یادداشت ویرایشگر: CAPTCHA، شمارهها یا تصاویری که هر بار هنگام ورود به یک وبسایت باید روی آنها کلیک کنید، برای هر کاربر اینترنت آشناست. اما وقتی بارها روی "من ربات نیستم" کلیک میکنید، ممکن است فکر کنید فقط هویت خود را تأیید میکنید، در حالی که در واقع در بزرگترین و مخفیترین تولید دادههای جهان شرکت میکنید. reCAPTCHA لوئیس فون آن، رفتار انسانی پراکنده را به یک سنگبنای دادهای تبدیل کرده است که از گوگل و شرکت زیرمجموعهاش، شرکت خودران Waymo، حمایت میکند.
زیر ظاهر "رایگان" و "ایمن"، اینترنت به آرامی یک نوع جدید از رابطه کار را شکل داده است: شما زمان صرف میکنید تا ثابت کنید انسان هستید، اما در واقع در حال کمک به آموزش هوش مصنوعی هستید و هنگامی که هوش مصنوعی یاد میگیرد، این کار به طور کامل جایگزین میشود. این مقاله در کمتر از 20 ساعت بیش از 9.5 میلیون بازدید در توییتر داشته است. محتوای اصلی به شرح زیر است:
تقریباً 500,000 ساعت کار انسانی به صورت رایگان هر روز توسط گوگل استثمار میشود. و افرادی که به این موضوع کمک میکنند فقط میخواهند به بانکداری آنلاین وارد شوند.
reCAPTCHA موفقترین عملیات داده نامرئی در تاریخ اینترنت است. در اوج خود، 200 میلیون نفر هر روز فرآیند تأیید را تکمیل کردند. اما تقریباً هیچکس متوجه نشد که هر کلیک در پشت صحنه چه معنایی دارد.
شرکت خودران گوگل، ویمو، اکنون به ارزش ۴۵ میلیارد دلار رسیده است. و بیشتر دادههای آموزشی اصلی آن بهطور رایگان توسط شما در دسترس است وقتی که به وبسایتهای مختلف دسترسی پیدا میکنید.
در اینجا داستان کامل است:
منشأ: یک ایده هوشمندانه
در سال ۲۰۰۰، رباتهای هرزنامه در اینترنت آشوب به پا کرده بودند. انجمنها پر شده بودند، صندوقهای ورودی پر از پیام بودند و وبسایتها به روشی برای تمایز بین انسانها و ماشینها نیاز داشتند.
استاد دانشگاه کارنگی ملون، لوئیس فون آهان، این مشکل را حل کرد. او CAPTCHA را اختراع کرد: متنی تحریفشده که فقط انسانها میتوانستند بخوانند، نه رباتها.
اما فون آهان بیشتر از این را دید. میلیونها نفر انرژی خود را صرف این چالشها کرده بودند. اگر آن انرژی بتواند دو کار را همزمان انجام دهد چه؟
در سال ۲۰۰۷، او reCAPTCHA را معرفی کرد. درخشش آن: دیگر متنی تصادفی و نامفهوم نشان نمیداد، بلکه دو کلمه نشان میداد. یک کلمه برای سیستم شناخته شده بود، و دیگری کلمهای واقعی از یک کتاب اسکنشده که کامپیوترها هنوز نمیتوانستند آن را شناسایی کنند. و پاسخ شما در دیجیتالیسازی این کتابها کمک کرد.
این کتابها از آرشیو نیویورک تایمز و گوگل بوکس آمدهاند و مجموعاً به ۱۳۰ میلیون میرسند.
شما فکر میکردید که فقط به یک وبسایت عادی وارد میشوید، اما در واقع در حال انجام OCR (شناسایی نوری کاراکترها) برای بزرگترین کتابخانه دیجیتال جهان بودید.
در سال ۲۰۰۹، گوگل بهطور رسمی reCAPTCHA را خرید.

بعداً، گوگل بازی را تغییر داد
عصر "متن پیچیده" حدود سال ۲۰۱۲ به پایان رسید.
گوگل با چالش جدیدی مواجه شد: ماشینهای خیاباننگاری هر جادهای را در سطح جهانی عکاسی کرده بودند، اما تصاویر فقط دادههای خام. بودند. برای اینکه هوش مصنوعی جادو کند، نیاز داشت آنچه را که میبیند درک کند: علائم جاده، گذرگاهها، چراغهای راهنمایی، فروشگاهها.
بنابراین گوگل reCAPTCHA v2 را طراحی مجدد کرد. به جای متنهای تحریف شده، شبکههای عکسی وجود داشت. "روی تمام مربعها با چراغهای راهنمایی کلیک کنید." "هر گذرگاه را انتخاب کنید." "فروشگاهها را شناسایی کنید."
این تصاویر به طور مستقیم از گوگل استریت ویو آمده بودند. کلیکهای شما به عنوان برچسب عمل میکردند.
هر انتخاب به مدل بینایی کامپیوتری گوگل اطلاع میداد: این پیکسلها یک چراغ راهنمایی را تشکیل میدهند، آن شکل یک گذرگاه است. شما در حال انجام یک آزمون نبودید؛ شما در حال ساخت یک مجموعه داده بودید.

مقیاس غیرقابل تصور
در اوج خود، ۲۰۰ میلیون reCAPTCHA روزانه حل میشد. هر چالش ۱۰ ثانیه طول میکشید، به این معنی که ۲ میلیارد ثانیه کار انسانی در روز. این معادل ۵۰۰,۰۰۰ ساعت در هر روز است.
هزینه برچسبگذاری دادههای پرداختی حدود ۱۰ تا ۵۰ دلار در ساعت است. با محاسبه در پایینترین نرخ: ارزش روزانه کار آزاد استخراج شده به ۵ میلیون دلار رسید.
علاوه بر این، reCAPTCHA فقط در یک برنامه خاص وجود ندارد. این موضوع در هر بانکی، هر پرتال دولتی و هر وبسایت تجارت الکترونیک وجود دارد. شما هیچ انتخابی ندارید: آیا میخواهید به حساب کاربری خود وارد شوید؟ اول، به ما در حاشیهنویسی مجموعه داده کمک کنید. گوگل هرگز از شما نظر نخواسته، یک سنت به شما حقوق نداده و حتی درباره این موضوع به شما نگفته است.

این همه به چه چیزی منجر شده است؟
این دادهها به طور مستقیم به دو محصول تغذیه میشود:
-نقشههای گوگل: پرکاربردترین ابزار ناوبری در سطح جهانی. توانایی آن در شناسایی علائم جاده، فروشگاهها و جغرافیای شهری به بخشی از میلیاردها حاشیهنویسی انسانی که در حین ورود به وبسایتها انجام شده است، نسبت داده میشود.
-وایمو: پروژه خودران گوگل. برای ناوبری ایمن، وسایل نقلیه خودران نیاز دارند که تقریباً به طور کامل هزاران الگوی بصری را شناسایی کنند.
دادههای آموزشی حقیقت زمینی برای آن شناسایی دقیقاً همان چیزی است که میلیونها نفر به طور ناخواسته از طریق reCAPTCHA حاشیهنویسی کردهاند. وایمو بیش از ۴ میلیون سفر پرداختی در سال ۲۰۲۴ انجام داد که ارزش آن ۴۵ میلیارد دلار بود. سنگ بنای آن، توسط آن "کاربران اینترنتی بدون حقوق" که فقط میخواستند ایمیل خود را چک کنند، گذاشته شد.
چرا هیچکس نمیتواند این مدل را تکرار کند؟
حاشیهنویسی دادهها بسیار پرهزینه است. شرکتهایی مانند Scale AI، Appen و Labelbox برای حل این مشکل وجود دارند؛ آنها صدها هزار کارگر استخدام میکنند و گاهی کمتر از ۱ دلار در ساعت پرداخت میکنند.
گوگل رویکرد متفاوتی به این مشکل اتخاذ کرد: آنها حاشیهنویسی را به یک الزام تبدیل کردند. هیچ پرداختی لازم نیست، هیچ رضایتی مورد نیاز نیست، اما به عنوان "بلیط" برای ورود به هر گوشهای از اینترنت. نتیجه: میلیاردها تصویر برچسبگذاری شده، پوشش جهانی، در هر آب و هوا، هر شهری در جهان. هیچ شرکتی در زمینه حاشیهنویسی نمیتواند به این دست یابد. اینترنت خود یک کارخانه است و هر کاربر اینترنتی یک کارمند بدون مدرک است.

شما هنوز در حال مشارکت هستید
reCAPTCHA v3، که در سال 2018 راهاندازی شد، دیگر حتی چالشها را نمایش نمیدهد. این نحوه حرکت ماوس، سرعت اسکرول و زمان توقف شما را مشاهده میکند. اثر انگشت رفتاری شما به آن اطلاع میدهد که آیا شما انسان هستید. این دادههای رفتاری همچنین به سیستمهای هوش مصنوعی گوگل بازخورد میدهد.
شما هرگز به طور فعال انتخاب نکردید که بپیوندید، هرگز یک کادر برای علامتگذاری نداشتید. با این حال، در حال حاضر، در اکثر وبسایتهایی که بازدید میکنید، هنوز این کار را انجام میدهید.
آیرونی نگرانکننده
هدف اصلی لوئیس ون آن درخشان بود: تبدیل انرژی که انسانها در حال حاضر هدر میدهند به خروجی مفید. با این حال، آنچه گوگل با این دیدگاه انجام داد داستان کاملاً متفاوتی است. آنها یک مکانیزم امنیتی که کاربران باید از آن استفاده میکردند را گرفتند، آن را در سراسر وب پیادهسازی کردند و خروجی را برای ساخت یک محصول تجاری به ارزش صدها میلیارد دلار برداشت کردند. کاربران در عوض هیچ چیزی دریافت نکردند، حتی آگاهی.
عمیقترین آیرونی این است: شما سالها برای اثبات اینکه انسان هستید با انجام وظایف شناسایی بصری که هوش مصنوعی در آن زمان نمیتوانست انجام دهد، وقت صرف کردید. اما به محض اینکه هوش مصنوعی یاد گرفت که این وظایف را انجام دهد، حاشیهنویسیهای بصری انسانی دیگر لازم نبود.
شما ثابت کردید که انسان هستید، فقط برای اینکه خودتان را قابل جایگزینی کنید.
ممکن است شما نیز علاقهمند باشید

مه آهسته: آیا واقعاً سپردن پولتان به یک عامل هوش مصنوعی مانند «لابستر» امن است؟

مقررات، خودمحوری و جوهره: داستان پشت ارزشگذاری ۲۰ میلیارد دلاری کالشی

نحوه معامله ارز دیجیتال بدون اپ استور: معاملات فوری ارز دیجیتال در مرورگر WEEX
بدون نیاز به دانلود اپلیکیشن، فوراً ارزهای دیجیتال را معامله کنید. از WEEX H5 برای دسترسی مستقیم به معاملات لحظهای و آتی در مرورگر خود با اجرای سریع، کنترل ریسک در لحظه و تجربهای یکپارچه در تلفن همراه، تبلت و دسکتاپ استفاده کنید. از بیت کوین، اتریوم و موارد دیگر پشتیبانی میکند.

از OKX تا Bybit، صرافیها با سرعت بالا در بزرگراه لاستیک عوض میکنند

تاریخچه مختصر و آینده قراردادهای دائمی

عامل هوش مصنوعی در همان روز شناسه و کیف پول دریافت میکند | خبرهای صبحگاهی ریوایر

IOSG: نگرش انعطافپذیری قدرت: تغییر پارادایم: از داراییهای کلان تا لایه هوش توزیعشده

توضیح افزایش ۳۵ درصدی قیمت موراتا: یک خازن که امپراتوری هوش مصنوعی را سرد میکند

مینیمکس: یک جوان از شهرستان هنان و ۳۰۰ میلیاردش

از پروژه رها شده تا هدفی با ارتفاع آسمانی، مسترکارت BVNK را به قیمت 1.8 میلیارد دلار خریداری کرد

آیا قیمتگذاری Polymarket دقیق است؟ من یک بحران را با ۲۰۰ عامل شبیهسازی کردم تا بفهمم

یک دهه از تنظیمات سرانجام روشن شد، پیروزی برای منطق کریپتو-بومی

گزارش صبحگاهی | مسترکارت برنامه دارد تا BVNK را به مبلغ حداکثر ۱.۸ میلیارد دلار خریداری کند؛ بنیاد سولانا توکنهای جمعآوریکننده را در سولانا راهاندازی میکند؛ بیتکوین برای اولین بار در چهار سال گذشته ۸ افزایش متوالی را تجربه میکند

Aster Chain رسماً راهاندازی شد: تعریف عصر جدیدی از حریم خصوصی و شفافیت درون زنجیرهای

توکن به خارج از کشور میرود و برق چین را به جهان میفروشد

RootData: گزارش پژوهشی شفافیت صرافی ارزهای دیجیتال فوریه ۲۰۲۶

«One and Done SEA»، بنابراین اوپنسی تصمیم میگیرد کمی بیشتر صبر کند.

ری دالیو: راه حل مناقشه ایران و آمریکا در تنگه هرمز است
مه آهسته: آیا واقعاً سپردن پولتان به یک عامل هوش مصنوعی مانند «لابستر» امن است؟
مقررات، خودمحوری و جوهره: داستان پشت ارزشگذاری ۲۰ میلیارد دلاری کالشی
نحوه معامله ارز دیجیتال بدون اپ استور: معاملات فوری ارز دیجیتال در مرورگر WEEX
بدون نیاز به دانلود اپلیکیشن، فوراً ارزهای دیجیتال را معامله کنید. از WEEX H5 برای دسترسی مستقیم به معاملات لحظهای و آتی در مرورگر خود با اجرای سریع، کنترل ریسک در لحظه و تجربهای یکپارچه در تلفن همراه، تبلت و دسکتاپ استفاده کنید. از بیت کوین، اتریوم و موارد دیگر پشتیبانی میکند.