Bạn đã huấn luyện trí tuệ nhân tạo của Google miễn phí trong suốt 15 năm mà không hề hay biết.

By: blockbeats|2026/03/18 18:01:51
0
Chia sẻ
copy
Tựa gốc: Bạn đã huấn luyện trí tuệ nhân tạo của Google trong 15 năm. Bạn hoàn toàn không biết.
Tác giả gốc: Sharbel, đồng sáng lập của Unfungible
Người dịch gốc: Lila, BlockBeats
Ghi chú của biên tập viên: CAPTCHA, chuỗi số hoặc hình ảnh bạn cần nhấp vào mỗi khi đăng nhập vào một trang web, đã quá quen thuộc với mọi người dùng Internet. Nhưng khi bạn liên tục nhấp vào "Tôi không phải là robot", bạn có thể nghĩ rằng mình chỉ đang xác minh danh tính, trong khi thực tế bạn đang tham gia vào quá trình sản xuất dữ liệu lớn nhất và bí mật nhất thế giới. reCAPTCHA của Luis von Ahn đã tổng hợp các hành vi rải rác của con người thành một nền tảng dữ liệu hỗ trợ Google và công ty con của nó, Waymo, một công ty chuyên về xe tự lái.
Ẩn sau vẻ ngoài "tự do" và "an toàn", Internet đã âm thầm định hình lại một hình thức quan hệ lao động mới: bạn dành thời gian chứng minh mình là con người, nhưng thực chất bạn đang đóng góp vào việc huấn luyện trí tuệ nhân tạo (AI), và một khi AI học được, công việc này sẽ hoàn toàn bị thay thế. Bài viết này đã nhận được hơn 9,5 triệu lượt xem trên Twitter trong vòng chưa đầy 20 giờ. Sau đây là nội dung gốc:

Mỗi ngày, Google khai thác miễn phí khoảng 500.000 giờ lao động của con người. Và những người đóng góp vào việc này chỉ muốn đăng nhập vào ngân hàng trực tuyến.

reCAPTCHA là hoạt động mã hóa dữ liệu ẩn thành công nhất trong lịch sử Internet. Vào thời điểm cao điểm, mỗi ngày có tới 200 triệu người hoàn tất quá trình xác minh. Nhưng hầu như không ai nhận ra ý nghĩa thực sự của mỗi cú nhấp chuột đằng sau hậu trường.

Công ty xe tự lái Waymo của Google hiện được định giá 45 tỷ đô la. Và phần lớn dữ liệu huấn luyện cốt lõi được bạn cung cấp miễn phí khi truy cập vào nhiều trang web khác nhau.

Đây là toàn bộ câu chuyện:

Nguồn gốc: Một ý tưởng thông minh

Năm 2000, các bot gửi thư rác đã gây ra sự hỗn loạn trên Internet. Các diễn đàn bị quá tải, hộp thư đến tràn ngập tin nhắn, và các trang web cần một cách để phân biệt giữa con người và máy móc.

Giáo sư Luis von Ahn của Đại học Carnegie Mellon đã giải quyết vấn đề này. Ông ấy đã phát minh ra CAPTCHA: một loại văn bản bị biến dạng mà chỉ con người mới có thể đọc được, chứ không phải robot.

Nhưng von Ahn đã nhìn thấy nhiều hơn thế. Hàng triệu người đã dồn hết tâm huyết vào những thách thức này. Nếu nguồn năng lượng đó có thể thực hiện hai việc cùng một lúc thì sao?

Năm 2007, ông đã giới thiệu reCAPTCHA. Điểm xuất sắc của nó: không còn hiển thị văn bản lộn xộn ngẫu nhiên nữa, mà chỉ hiển thị hai từ. Một từ đã được hệ thống nhận biết, từ còn lại là từ được quét từ một cuốn sách thực tế mà máy tính chưa thể nhận ra. Và câu trả lời của bạn đã giúp ích cho việc số hóa những cuốn sách này.

Những cuốn sách này được lấy từ kho lưu trữ của tờ The New York Times và Google Books, với tổng số lượng lên đến 130 triệu cuốn.

Bạn tưởng rằng mình chỉ đang đăng nhập vào một trang web thông thường, nhưng thực chất bạn đang thực hiện nhận dạng ký tự quang học (OCR) cho thư viện kỹ thuật số lớn nhất thế giới.

Năm 2009, Google chính thức mua lại reCAPTCHA.

Bạn đã huấn luyện trí tuệ nhân tạo của Google miễn phí trong suốt 15 năm mà không hề hay biết.

Sau đó, Google đã thay đổi cuộc chơi.

Kỷ nguyên của "văn bản bị bóp méo" đã kết thúc vào khoảng năm 2012.

Google phải đối mặt với một thách thức mới: Những chiếc xe Street View đã chụp ảnh mọi con đường trên toàn cầu, nhưng những bức ảnh đó chỉ là dữ liệu thô. Để trí tuệ nhân tạo phát huy hết khả năng, nó cần hiểu những gì nó nhìn thấy: biển báo đường, vạch kẻ đường, đèn giao thông, mặt tiền cửa hàng.

Vì vậy, Google đã thiết kế lại reCAPTCHA phiên bản 2. Thay vì văn bản bị biến dạng, chúng là các lưới ảnh. "Nhấp chuột vào tất cả các ô vuông có đèn giao thông." "Chọn tất cả các vạch kẻ đường dành cho người đi bộ." "Xác định các mặt tiền cửa hàng."

Những hình ảnh này được lấy trực tiếp từ Google Street View. Lượt nhấp chuột của bạn đóng vai trò như thẻ tag.

Mỗi lựa chọn đều cung cấp thông tin cho mô hình thị giác máy tính của Google: những pixel này tạo thành đèn giao thông, hình dạng kia là vạch kẻ đường dành cho người đi bộ. Bạn không đang làm bài kiểm tra; bạn đang xây dựng một tập dữ liệu.

Một quy mô không thể tưởng tượng nổi

Vào thời kỳ đỉnh cao, có tới 200 triệu mã reCAPTCHA được giải mỗi ngày. Mỗi thử thách mất 10 giây, tức là 2 tỷ giây lao động của con người mỗi ngày. Như vậy là 500.000 giờ mỗi ngày.

Chi phí cho việc gắn nhãn dữ liệu có trả phí vào khoảng từ 10 đến 50 đô la mỗi giờ. Tính theo mức giá thấp nhất: giá trị lao động được khai thác miễn phí hàng ngày lên tới 5 triệu đô la.

Hơn nữa, reCAPTCHA không chỉ tồn tại trong một ứng dụng cụ thể. Nó hiện diện ở mọi ngân hàng, mọi cổng thông tin chính phủ, mọi trang web thương mại điện tử. Bạn không còn lựa chọn nào khác: Bạn muốn đăng nhập vào tài khoản của mình? Trước tiên, hãy giúp chú thích dữ liệu. Google chưa từng hỏi ý kiến ​​của bạn, chưa từng trả cho bạn một xu tiền lương nào, thậm chí cũng chưa từng thông báo cho bạn về điều này.

Tất cả những điều này đã dẫn đến kết quả gì?

Dữ liệu này được sử dụng trực tiếp cho hai sản phẩm:

-Google Maps: Công cụ định vị được sử dụng rộng rãi nhất trên toàn cầu. Khả năng nhận diện biển báo giao thông, cửa hàng và địa lý thành phố của nó một phần là nhờ hàng tỷ lượt chú thích do con người thực hiện khi đăng nhập vào các trang web.

-Waymo: Dự án xe tự lái của Google. Để đảm bảo an toàn khi di chuyển, xe tự hành cần phải nhận diện gần như hoàn hảo hàng nghìn mẫu hình ảnh.

Dữ liệu huấn luyện thực tế cho công việc nhận dạng đó chính xác là những gì hàng triệu người đã vô tình ghi chú thông qua reCAPTCHA. Năm 2024, Waymo đã hoàn thành hơn 4 triệu chuyến đi có trả phí, với tổng giá trị 45 tỷ đô la. Nền tảng của nó được đặt bởi những "người dùng internet miễn phí" chỉ muốn kiểm tra email của họ.

Tại sao không ai có thể sao chép mô hình này?

Việc chú thích dữ liệu vô cùng tốn kém. Các công ty như Scale AI, Appen và Labelbox ra đời để giải quyết vấn đề này; họ tuyển dụng hàng trăm nghìn nhân viên, đôi khi trả lương dưới 1 đô la một giờ.

Google đã tiếp cận vấn đề theo một cách khác: họ biến việc chú thích thành một yêu cầu bắt buộc. Không cần trả phí, không cần xin phép, nhưng đây là "tấm vé" để vào mọi ngóc ngách của internet. Kết quả: hàng tỷ hình ảnh được gắn nhãn, phạm vi phủ sóng toàn cầu, hoạt động trong mọi điều kiện thời tiết, tại mọi thành phố trên thế giới. Không có công ty chú thích nào có thể làm được điều này. Internet tựa như một nhà máy, và mỗi người dùng mạng đều là một nhân viên không chính thức.

Bạn vẫn đang tham gia

reCAPTCHA v3, ra mắt năm 2018, thậm chí không còn hiển thị các thử thách nữa. Nó theo dõi cách bạn di chuyển chuột, tốc độ cuộn, thời gian dừng lại. Dấu ấn hành vi của bạn cho biết liệu bạn có phải là con người hay không. Dữ liệu hành vi này cũng được đưa trở lại vào hệ thống trí tuệ nhân tạo của Google.

Bạn chưa từng chủ động lựa chọn tham gia, chưa từng có ô chọn nào để đánh dấu. Nhưng ngay lúc này, trên hầu hết các trang web bạn truy cập, bạn vẫn đang làm điều đó.

Sự trớ trêu đáng lo ngại

Ý định ban đầu của Luis von Ahn rất xuất sắc: chuyển hóa năng lượng mà con người đang lãng phí thành năng lượng hữu ích. Tuy nhiên, những gì Google đã làm với tầm nhìn này lại là một câu chuyện hoàn toàn khác. Họ đã lấy một cơ chế bảo mật mà người dùng bắt buộc phải sử dụng, triển khai nó trên toàn bộ mạng internet, và khai thác dữ liệu đầu ra để xây dựng một sản phẩm kinh doanh trị giá hàng trăm tỷ đô la. Người dùng không nhận được gì đổi lại, thậm chí cả sự nhận biết cũng không có.

Điều trớ trêu nhất là: bạn đã dành nhiều năm để chứng minh mình là con người bằng cách hoàn thành các nhiệm vụ nhận dạng hình ảnh mà trí tuệ nhân tạo không thể làm được vào thời điểm đó. Nhưng một khi trí tuệ nhân tạo đã học được cách thực hiện những nhiệm vụ này, việc chú thích hình ảnh bằng con người không còn cần thiết nữa.

Bạn đã chứng minh mình là con người, nhưng cuối cùng lại tự biến mình thành người dễ bị thay thế.

Liên kết bài đăng gốc

Giá --

--

Bạn cũng có thể thích

Tôi vừa tìm thấy một "đồng tiền meme" tăng giá chóng mặt chỉ trong vài ngày. Có lời khuyên nào không?

Trong cộng đồng người Hoa, dần dần xuất hiện một hình thức "bí truyền huyền bí" hoàn chỉnh.

TAO là Elon Musk, người đã đầu tư vào OpenAI, và Subnet là Sam Altman

Hầu hết vốn đầu tư vào TAO cuối cùng sẽ trợ cấp cho các hoạt động phát triển không mang lại giá trị cho các chủ sở hữu token.

Kỷ nguyên "phân phối tiền điện tử hàng loạt" trên các chuỗi công khai đã kết thúc.

Thị trường ngày càng trở nên thông minh hơn, và họ đang từ bỏ những hệ sinh thái chỉ dựa vào nguồn vốn để duy trì các hoạt động giả tạo. Giờ đây, điều được khen thưởng chính là hiệu suất thực tế, người dùng thực tế và doanh thu thực tế.

Sau khi eo biển Hormuz bị phong tỏa, chiến tranh sẽ kết thúc khi nào?

Mỹ đã tước đi con át chủ bài quan trọng nhất của Iran, nhưng đồng thời cũng đánh mất con đường dẫn đến chấm dứt chiến tranh.

Trước khi sử dụng X Chat, "WeChat phương Tây" của Musk, bạn cần hiểu rõ ba câu hỏi này.

Ứng dụng X Chat sẽ có sẵn để tải xuống trên App Store vào thứ Sáu tuần này. Giới truyền thông đã đưa tin về danh sách các tính năng, bao gồm tin nhắn tự hủy, chống chụp màn hình, nhóm chat 481 người, tích hợp Grok và đăng ký không cần số điện thoại, định vị nó là "WeChat phương Tây". Tuy nhiên, có ba câu hỏi hầu như chưa được đề cập trong bất kỳ báo cáo nào.


Trên trang trợ giúp chính thức của X vẫn còn một câu chưa được giải đáp: "Nếu những kẻ nội bộ độc hại hoặc chính X khiến các cuộc hội thoại được mã hóa bị lộ thông qua các thủ tục pháp lý, cả người gửi và người nhận đều hoàn toàn không hay biết."


Câu hỏi thứ nhất: Phương thức mã hóa này có giống với phương thức mã hóa của Signal không?


Không. Sự khác biệt nằm ở nơi lưu trữ các khóa.


Với công nghệ mã hóa đầu cuối của Signal, các khóa mã hóa không bao giờ rời khỏi thiết bị của bạn. X, tòa án, hay bất kỳ bên thứ ba nào khác đều không nắm giữ chìa khóa của bạn. Máy chủ của Signal không có khả năng giải mã tin nhắn của bạn; ngay cả khi bị triệu tập, chúng cũng chỉ có thể cung cấp dấu thời gian đăng ký và thời gian kết nối cuối cùng, như đã được chứng minh trong các hồ sơ triệu tập trước đây.


X Chat sử dụng giao thức Juicebox. Giải pháp này chia khóa thành ba phần, mỗi phần được lưu trữ trên ba máy chủ do X vận hành. Khi khôi phục khóa bằng mã PIN, hệ thống sẽ truy xuất ba phần này từ các máy chủ của X và kết hợp chúng lại. Dù mã PIN có phức tạp đến đâu, X mới là người thực sự nắm giữ chìa khóa, chứ không phải người dùng.


Đây là cơ sở kỹ thuật của "câu trên trang trợ giúp": vì chìa khóa nằm trên máy chủ của X, nên X có khả năng phản hồi các thủ tục pháp lý mà người dùng không cần biết. Signal không có khả năng này, không phải vì chính sách, mà đơn giản là vì nó không có "khóa" cần thiết.


Hình minh họa sau đây so sánh các cơ chế bảo mật của Signal, WhatsApp, Telegram và X Chat theo sáu khía cạnh. X Chat là ứng dụng duy nhất trong bốn ứng dụng mà nền tảng nắm giữ khóa và là ứng dụng duy nhất không có tính năng Bảo mật Chuyển tiếp (Forward Secrecy).


Ý nghĩa của Bảo mật Chuyển tiếp (Forward Secrecy) là ngay cả khi khóa bị lộ tại một thời điểm nhất định, các tin nhắn trước đó cũng không thể được giải mã vì mỗi tin nhắn đều có một khóa duy nhất. Giao thức Double Ratchet của Signal tự động cập nhật khóa sau mỗi tin nhắn, một cơ chế mà X Chat không có.


Sau khi phân tích kiến ​​trúc của X Chat vào tháng 6 năm 2025, giáo sư mật mã học Matthew Green của Đại học Johns Hopkins nhận xét: "Nếu chúng ta đánh giá XChat như một hệ thống mã hóa đầu cuối, thì đây dường như là một lỗ hổng có thể dẫn đến hậu quả nghiêm trọng." Sau đó, ông nói thêm: "Tôi sẽ không tin tưởng điều này hơn là tôi tin tưởng những tin nhắn riêng tư (DM) hiện tại chưa được mã hóa."


Từ báo cáo của TechCrunch vào tháng 9 năm 2025 cho đến khi được đưa vào hoạt động vào tháng 4 năm 2026, kiến ​​trúc này không hề thay đổi.


Trong một tweet ngày 9 tháng 2 năm 2026, Musk cam kết sẽ tiến hành các bài kiểm tra bảo mật nghiêm ngặt đối với X Chat trước khi ra mắt trên nền tảng X Chat và sẽ công khai toàn bộ mã nguồn.



Tính đến ngày ra mắt 17 tháng 4, chưa có cuộc kiểm toán độc lập nào của bên thứ ba được hoàn thành, không có kho mã nguồn chính thức nào trên GitHub, nhãn quyền riêng tư của App Store tiết lộ rằng X Chat thu thập năm hoặc nhiều hơn năm loại dữ liệu bao gồm vị trí, thông tin liên hệ và lịch sử tìm kiếm, mâu thuẫn trực tiếp với tuyên bố tiếp thị "Không quảng cáo, không theo dõi".


Vấn đề 2: Grok có biết bạn đang nhắn tin gì riêng tư không?


Không phải giám sát liên tục, mà là một điểm truy cập rõ ràng.


Đối với mỗi tin nhắn trên X Chat, người dùng có thể nhấn giữ và chọn "Hỏi Grok". Khi nhấn nút này, thông điệp sẽ được gửi đến Grok dưới dạng văn bản thuần, chuyển từ trạng thái mã hóa sang trạng thái không mã hóa ở giai đoạn này.


Thiết kế này không phải là điểm yếu mà là một tính năng. Tuy nhiên, chính sách bảo mật của X Chat không nêu rõ liệu dữ liệu văn bản thuần túy này sẽ được sử dụng để huấn luyện mô hình Grok hay liệu Grok có lưu trữ nội dung cuộc trò chuyện này hay không. Bằng cách chủ động nhấp vào "Hỏi Grok", người dùng tự nguyện gỡ bỏ lớp bảo vệ mã hóa của tin nhắn đó.


Ngoài ra còn có một vấn đề về cấu trúc: Nút này sẽ nhanh chóng chuyển từ "tính năng tùy chọn" thành "thói quen mặc định" như thế nào? Chất lượng phản hồi của Grok càng cao, người dùng càng tin tưởng và sử dụng nó thường xuyên hơn, dẫn đến tỷ lệ tin nhắn không được mã hóa bảo vệ ngày càng tăng. Về lâu dài, độ mạnh mã hóa thực tế của X Chat không chỉ phụ thuộc vào thiết kế của giao thức Juicebox mà còn phụ thuộc vào tần suất người dùng nhấp vào "Hỏi Grok".


Vấn đề 3: Tại sao lại không có phiên bản Android?


Phiên bản phát hành ban đầu của X Chat chỉ hỗ trợ iOS, trong khi phiên bản Android chỉ ghi "sắp ra mắt" mà không có thời gian cụ thể.


Trên thị trường điện thoại thông minh toàn cầu, Android chiếm khoảng 73%, trong khi iOS chiếm khoảng 27% (IDC/Statista, 2025). Trong số 3,14 tỷ người dùng WhatsApp hoạt động hàng tháng, 73% sử dụng hệ điều hành Android (theo Demand Sage). Tại Ấn Độ, WhatsApp có 854 triệu người dùng, với hơn 95% sử dụng trên hệ điều hành Android. Tại Brazil, có 148 triệu người dùng, trong đó 81% sử dụng Android, và tại Indonesia, có 112 triệu người dùng, với 87% sử dụng Android.



Sự thống trị của WhatsApp trên thị trường truyền thông toàn cầu được xây dựng trên nền tảng Android. Signal, với khoảng 85 triệu người dùng hoạt động hàng tháng, cũng chủ yếu dựa vào người dùng quan tâm đến quyền riêng tư ở các quốc gia sử dụng Android nhiều.


X Chat đã né tránh chiến trường này, với hai cách hiểu khả thi. Một trong những vấn đề là nợ kỹ thuật; X Chat được xây dựng bằng Rust, và việc đạt được khả năng hỗ trợ đa nền tảng không hề dễ dàng, vì vậy việc ưu tiên iOS có thể là một hạn chế về mặt kỹ thuật. Một lựa chọn khác là chiến lược; với iOS chiếm gần 55% thị phần tại Mỹ, trong khi cơ sở người dùng cốt lõi của X cũng ở Mỹ, việc ưu tiên iOS đồng nghĩa với việc tập trung vào cơ sở người dùng cốt lõi của họ thay vì cạnh tranh trực tiếp với các thị trường mới nổi do Android thống trị và WhatsApp.


Hai cách giải thích này không loại trừ lẫn nhau, mà dẫn đến cùng một kết quả: Khi ra mắt, X Chat đã tự nguyện từ bỏ 73% thị phần người dùng smartphone toàn cầu.


"Siêu ứng dụng" của Elon Musk


Vấn đề này đã được một số người mô tả như sau: X Chat, cùng với X Money và Grok, tạo thành một bộ ba cung cấp hệ thống dữ liệu khép kín song song với cơ sở hạ tầng hiện có, tương tự về mặt khái niệm với hệ sinh thái WeChat. Đánh giá này không phải là mới, nhưng với sự ra mắt của X Chat, việc xem xét lại sơ đồ này là điều đáng giá.



X Chat tạo ra siêu dữ liệu giao tiếp, bao gồm thông tin về việc ai đang nói chuyện với ai, trong bao lâu và tần suất như thế nào. Dữ liệu này được chuyển vào hệ thống nhận dạng của X. Một phần nội dung tin nhắn sẽ được xử lý thông qua tính năng Hỏi Grok và đi vào chuỗi xử lý của Grok. Các giao dịch tài chính được xử lý bởi X Money: quá trình thử nghiệm công khai bên ngoài đã hoàn tất vào tháng 3, chính thức mở cửa cho công chúng vào tháng 4, cho phép chuyển tiền pháp định ngang hàng thông qua Visa Direct. Một lãnh đạo cấp cao của Fireblocks đã xác nhận kế hoạch triển khai thanh toán bằng tiền điện tử vào cuối năm nay, hiện công ty đang nắm giữ giấy phép chuyển tiền tại hơn 40 tiểu bang của Mỹ.


Mọi tính năng của WeChat đều hoạt động trong khuôn khổ pháp lý của Trung Quốc. Hệ thống của Musk hoạt động trong khuôn khổ pháp lý phương Tây, nhưng ông cũng đồng thời giữ chức người đứng đầu Bộ Hiệu quả Chính phủ (DOGE). Đây không phải là bản sao của WeChat; mà là sự tái hiện lại cùng một logic nhưng trong bối cảnh chính trị khác.


Điểm khác biệt là WeChat chưa bao giờ tuyên bố rõ ràng rằng giao diện chính của họ sử dụng công nghệ "mã hóa đầu cuối", trong khi X Chat thì có. Theo cách hiểu của người dùng, "mã hóa đầu cuối" có nghĩa là không ai, kể cả nền tảng, có thể xem được tin nhắn của bạn. Thiết kế kiến ​​trúc của X Chat không đáp ứng được kỳ vọng này của người dùng, nhưng nó lại sử dụng thuật ngữ này.


X Chat hợp nhất ba luồng dữ liệu "người này là ai, họ đang nói chuyện với ai và tiền của họ đến từ đâu và đi về đâu" trong tay một công ty duy nhất.


Câu hướng dẫn trong trang trợ giúp chưa bao giờ chỉ đơn thuần là hướng dẫn kỹ thuật.


Tăng vọt gấp 50 lần, với giá trị sổ sách (FDV) vượt quá 10 tỷ USD, tại sao lại là RaveDAO?

RaveDAO thực chất là gì? Tại sao nhạc Rave lại có thể phát triển mạnh mẽ đến vậy?

Coin thịnh hành

Tin tức crypto mới nhất

Đọc thêm