那些給AI大型模型打標籤的小鎮青年

By: blockbeats|2026/04/07 13:00:09

文 | Sleepy.md

山西大同，這座曾經靠煤炭支撐起半壁江山的城市，如今抖落滿身煤灰，換了把鋒利的鋤頭，向著另一座無形的礦山重重砸下。

在平城區金貿國際中心的寫字樓裡，不再有升降井，不再有運煤車。取而代之的，是上千個緊密排列的電腦工位。上海潤迅雲中聲谷大數據智慧服務基地佔據了整整幾層樓，數千名戴著耳機的年輕員工，正盯著螢幕，點擊，拖曳，框選。

根據官方數據，截至 2025 年 11 月，大同市已投運伺服器 74.5 萬台，引進了 69 家呼叫標註數據企業，帶動了超過 3 萬人次就近就業，產值 7.5 億元。在這個數字礦坑裡，94% 的從業者都是本地戶籍。

不僅僅是大同。在國家數據局確定的首批數據標註基地中，山西永和縣、貴州畢節、雲南蒙自等中西部縣城赫然在列。在永和縣的數據標註基地裡，80% 是女性員工。她們大多是農村寶媽，或者是找不到合適工作的返鄉青年。

一百年前，英國的曼徹斯特紡織廠裡，擠滿了失去土地的農民。而在今天，這些偏遠縣城裡的電腦螢幕前，坐滿了在實體經濟中找不到位置的年輕人。

他們正在從事一種極具未來感，卻又極度原始的計件工作，為遠在北京、深圳和硅谷的人工智能巨頭，生產大模型所必需的數據飼料。

沒人覺得這有什麼問題。

黃土高原上的新流水線

數據標註的本質，是教機器認世界。

自動駕駛需要認出紅綠燈和行人，大模型需要分辨出什麼是貓、什麼是狗。機器本身是沒有常識的，必須由人類先在圖片上畫出一個框，告訴它「這是行人」，它才能在吞噬了千萬張圖片後，學會自己辨認。

這份工作不需要高學歷，只需要耐心，以及一根能不停點擊的食指。

在 2017 年的黃金時代，一個簡單的 2D 框，價格能達到一毛多錢，甚至有公司開出 5 毛的高價。手速快的標註員，一天幹十幾個小時，能賺到五六百塊。在縣城，這絕對算得上一份高薪、體面的工作。

但隨著大模型的進化，這條流水線上殘酷的一面開始顯現。

到了 2023 年，簡單圖像標註的單價已經被砸到了 3 到 4 分錢，跌幅超過 90%。即便是難度更高的 3D 點雲圖，那些由密集的點構成、需要放大無數倍才能看清邊緣的圖像，標註員也必須在三維空間中拉出一個包含長、寬、高和偏轉角度的立體框，去嚴絲合縫地包裹住車輛或行人，而這樣一個複雜的 3D 框，也僅僅只有 5 分錢。

那些給AI大型模型打標籤的小鎮青年

單價暴跌的直接後果，是勞動強度的劇增。為了死死咬住每個月兩三千塊的底薪，標註員們必須不斷、不停地提升自己的手速。

這根本不是什麼輕鬆的白領工作。在很多標註基地，管理嚴苛到令人窒息，上班不允許接聽電話，手機必須鎖在儲物格裡。系統會精確記錄每個員工的滑鼠軌跡和停留時間，如果停下來超過三分鐘，後臺的警告就會像鞭子一樣抽過來。

更讓人崩潰的是容錯率。行業的及格線通常在 95% 以上，有的公司甚至要求 98%-99%。這意味著，你拉 100 個框，只要錯 2 個，整張圖就會被打回來返修。

動態圖是連幀的，變道的車輛會被遮擋，標註員必須靠聯想把它們一個個找出來；3D 點雲圖裡，只要超過 10 個點的物體，就必須畫框。一個複雜的車位項目，線畫長了、漏標了，質檢時總能挑出毛病。一張圖返修四五次是家常便飯。最後算下來，花了一個小時的功夫，到手的只有幾毛錢。

湖南的一位標註員在社交平台上晒出了自己的結算單，一天工作下來，她拉了 700 多個框，單價 4 分錢，總共收入 30.2 元。

這是一種極度割裂的圖景。

一邊是發布會上光鮮亮麗的科技大佬，談論著 AGI 將如何解放人類；另一邊，是在黃土高原和西南大山的縣城裡，年輕人每天死盯著屏幕八到十個小時，機械地拉框，幾千個、幾萬個，甚至晚上做夢，手指都在半空中畫著車道線。

有人曾經說，人工智能的外表是一輛呼嘯而過的豪車，但打開車門你會發現，裡面有一百個人正騎著自行車，咬著牙拼命踩踏板。

沒人覺得這有什麼問題。

教機器「如何去愛」的計件工

當圖像識別的瓶頸被突破後，大型模型迎來了更深層的進化，它需要學會像人類一樣思考、對話，甚至展現出「同理心」。

這就催生了大型模型訓練中最核心、也最昂貴的環節——RLHF（基於人類反饋的強化學習）。

簡單來說，就是讓真人對 AI 生成的回答進行打分，告訴它哪個回答更好、更符合人類的價值觀和情感偏好。

ChatGPT 之所以看起來「像人」，就是因為背後有無數個 RLHF 標註員在給它上課。

在眾包平台上，這類標註任務往往被明碼標價：單件費用 3 到 7 元。標註員需要對 AI 的回答進行極其主觀的情感打分，去評判這個回答是否「溫暖」、是否「有同理心」、是否「照顧了用戶的情緒」。

一個拿著兩三千月薪、在現實的泥淖裡疲於奔命、甚至連自己的情緒都無暇顧及的底層打工人，卻要在系統中擔任 AI 的情感導師和價值觀裁判。

他們需要把溫暖、同理心這些極其複雜、微妙的人類情感，強行揉碎，量化成 1 到 5 的冰冷分數。如果他們的打分和系統設定的標準答案不一致，就會被判定為正確率不達標，從而扣減原本就微薄的計件工資。

這是一種認知抽空。人類那複雜幽微的情感、道德與悲憫，正被強行拖入演算法的漏斗。在冰冷的量化與標準化刻度裡，它們被榨乾了最後一點溫熱。當你驚嘆於螢幕裡的賽博巨獸已經學會了寫詩譜曲、嘘寒問暖，甚至披上了多愁善感的皮囊時；螢幕外，那群原本鮮活的人類，卻在日復一日的機械判斷中，退化成了沒有情緒的打分機器。

這是整個產業鏈最隱秘的一面，從來不出現在任何融資新聞和技術白皮書裡。

沒人覺得這有什麼問題。

985 碩士與小鎮青年

底層的拉框工作正在被 AI 的履帶碾壓，這條賽博流水線開始向上蔓延，開始吞噬更高階的腦力勞動。

大型模型的胃口變了。它不再滿足於嚼碎簡單的常識，它需要吞噬人類的專業知識和高階邏輯。

各大招聘平台上開始頻繁閃爍一類特殊的兼職，比如「大型模型邏輯推理標註」「AI 人文訓練師」。這份兼職的門檻極高，往往要求「985/211 碩士及以上學歷」，涉及法律、醫學、哲學、文學等專業領域。

許多名校研究生被吸引，湧入這些大廠的外包群。但他們很快發現，這根本不是什麼輕鬆的腦力運動，而是一場精神折磨。

在正式接單前，他們必須閱讀長達幾十頁的評分維度和評判標準文件，進行兩到三輪的試標。達標後，在正式標註中，如果正確率低於平均水準，就會失去資格，被踢出群聊。

最讓人窒息的是，這些標準根本不是固定的。面對類似的問題和答案，用相同的思考方式去評分，結果可能截然相反。這就像在做一份永遠做不完、且根本沒有標準答案的試卷。無法通過自我努力或學習提升正確率，只能原地不停地打轉，消耗腦力和體力。

這就是大型模型時代的新型剝削——階層折疊。

知識，這把曾被視作打破壁壘、向上攀爬的黃金階梯，如今淪為了供奉給算法的、咀嚼起來更為複雜的數字草料。在算法和系統的絕對權力面前，象牙塔裡的 985 碩士與黃土高原上的小鎮青年迎來了最詭異的殊途同歸。

他們一同跌落進這座深不見底的賽博礦坑，被剝奪了光環，抹平了差異，統統化作了履帶上廉價且隨時可以被替換的齒輪。

在國外也是一樣。2024 年，蘋果公司直接砍掉了聖地亞哥一個 121 人的 AI 語音標註團隊。這些員工負責改善 Siri 的多語言處理能力，他們曾以為自己站在大廠核心業務邊緣，卻瞬間墜入失業的深淵。

在科技巨頭眼中，無論是縣城裡的拉框大媽，還是名校畢業的邏輯訓練師，本質上都是隨時可以替換的「耗材」。

沒人覺得這有什麼問題。

-- 價格

兆元巴別塔，砌滿幾分錢的血汗

根據中國信通院發布的數據，2023 年中國數據標註市場規模達 60.8 億元，2025 年預計 200～300 億元，据預測，到 2030 年，全球數據標註和服務市場銷售額將狂飆至 1171 億元。

這些數字背後，是 OpenAI、微軟、字節跳動等科技巨頭動輒數千億、上萬億美元的估值狂歡。

但這些潑天的財富，並沒有流向那些真正「餵養」AI 的人。

中國的資料標註行業，呈現出典型的倒金字塔外包結構。最頂層，是死死捏著核心算法的科技巨頭；第二層，是大型資料服務供應商；第三層，是遍布各地的資料標註基地和中小型外包公司；最底層，才是那些拿計件工資的泥腿子標註員。

每一層外包，都要狠狠刮走一層油水。當大廠砸出的單價是 5 毛錢時，經過層層盤剝，落到縣城標註員手裡的，可能連 5 分錢都不到。

希臘前財政部長雅尼斯·瓦魯法基斯在他的著作《技術封建主義》中，抛出了一個極具穿透力的觀點：今天的科技巨頭，已經不再是傳統意義上的資本家，而是「雲領主」（Cloudalists）。

他們擁有的不是工廠和機器，而是算法、平台、算力，這些是賽博時代的數字領土。在這個新的封建體系裏，用戶不是消費者，而是數字佃農，我們在社交媒體上的每一次點讚、評論、瀏覽，都在免費為雲領主上供數據。

而那些分佈在下沉市場的資料標註員，則是這個體系裡最底層的數字農奴。他們不僅要生產數據，還要對海量的原始數據進行清洗、分類、打分，將其轉化為大模型能夠消化的高質量飼料。

這是一場隱秘的認知圈地運動。就像 19 世紀英國的圈地運動把農民趕進紡織廠一樣，今天的 AI 浪潮，把那些在實體經濟中找不到位置的青年，趕到了屏幕前。

AI 並沒有抹平階層鴻溝，反而建立了一條從中國中西部縣城，直通北上廣深科技巨頭總部的「資料與血汗輸送帶」。技術革命的敘事總是宏大華麗，但其底色，永遠是廉價勞動力的規模化消耗。

沒人覺得這有什麼問題。

不再需要人類的明天

最殘酷的結局就快來了，越來越快。

隨著大模型能力的躍升，那些曾經需要人類日夜勞作才能完成的標註任務，正在被 AI 自己接管。

2023 年 4 月，理想汽車創始人李想在論壇透露了數據，過去，理想一年要做大約 1000 萬幀的自動駕駛圖像人工標定，外包成本接近一個億。但當他們使用大模型進行自動化標註後，過去需要用一年做的事情，基本上 3 個小時就能完成。

效率是人的 1000 倍，而且還是早在 2023 年。在剛剛過去的 3 月，理想還發布了新一代 MindVLA-o1 自動標註引擎。

行業裡流傳著一句無比真實的自嘲：「有多少智能，就有多少人工。」但現在，大廠在數據標註外包方面的投入，已經出現了 40%-50% 的斷崖式下降。

那些在電腦前枯坐了無數個日夜、把眼睛熬得通紅的小鎮青年們，親手餵大了一隻巨獸。而現在，這隻巨獸正在轉過頭來，砸掉了他們的飯碗。

夜幕降臨，大同平城區的寫字樓依然蒼白如晝。交接班的年輕人們在電梯間裡沉默地互換著疲憊的軀殼。在這個由無數個多邊形框死死禁錮的折疊空間裡，沒人關心大洋彼岸的 Transformer 架構又迎來了怎樣史詩級的躍遷，也沒人聽得懂千億參數背後算力的轟鳴。

他們的視線，只被焊死在後台那根代表著「及格線」的紅綠進度條上，算計著那幾分、幾毛的計件數字能不能在月底拼湊起體面的生活。

一邊，是納斯達克的敲鍾聲與科技媒體的連篇累牘，巨頭們正為 AGI 的降臨举杯相慶；而另一邊，這些以血肉之軀一口口餵大 AI 的數字農奴，卻只能在酸痛的睡夢中，戰戰兢兢地等待著那隻由自己親手饲養的巨獸，在某個看似平常的清晨，漫不經心地一腳踢飛他們的飯碗。

沒人覺得這有什麼問題。

Polygon 將啟動 Giugliano 硬分叉，以提升交易最終確認速度

ChainCatcher 消息，Polygon 基金會表示，將在主網上啟動 Giugliano 硬分叉，預計發生在區塊高度 85268500，時間約為 UTC 時間 14:00。該升級旨在通過允許區塊更早廣播、在區塊頭中引入費用參數以及新增費用數據 RPC 支持，從而提升網絡最終確認速度。該升級已於上月在 Amoy 測試網完成測試，數據顯示最終確認時間縮短約 2 秒。官方提示，節點運營者需在升級前將 Bor 更新至 v2.7.0 或 Erigon 更新至 v3.5.0。此次硬分叉屬於 Polygon "Gigagas"擴展路線的一部分，重點提升網絡性能與用戶體驗。

13:48

那些給AI大型模型打標籤的小鎮青年

黃土高原上的新流水線

教機器「如何去愛」的計件工

985 碩士與小鎮青年

-- 價格

兆元巴別塔，砌滿幾分錢的血汗

不再需要人類的明天

猜你喜歡

美伊戰爭可能如何影響油價和比特幣價格（最新分析）

OpenAI 希望为自身制定新政策｜Rewire 新聞早報

Chaos Labs 退場，Aave 的風險誰來接檯？

隱蔽的金融戰爭？伊朗用穩定幣收海峽通行費

OpenAlice：一個人，就是一個Jane Street｜專案介紹

早報 | Strategy 上週增持 4871 枚 BTC；Toss 擬開發自有區塊鏈並發行原生加密貨幣；OpenAI CFO 曾私下質疑 2026 上市時機

研究：穩定幣 35 萬億年交易額，有多少是真實支付？

Galaxy Research：AI 代理正催生鏈上新物種，零人類公司如何激活金融飛輪

數據研究：Hyperliquid 與 CME 原油流動性差距有多大？

GPU價格為何失控上行？

如何徹底掌握Claude Cowork？

70頁機密文件第一項指控「撒謊」，Altman對董事會表示「我改不了我的性格」

2026年會進入競爭幣季節嗎？交易者現在應該關注什麼

2026年比特幣ETF資金流入：對比特幣價格及加密貨幣市場走勢的影響

Visa 的穩定幣戰略：卡、結算及未來

股市的拆分

如何抓住預測市場敘事的下一個Alpha？

「合法的」龐氏騙局？揭秘 Gemini 交易所與其創始人的循環借貸

美伊戰爭可能如何影響油價和比特幣價格（最新分析）

OpenAI 希望为自身制定新政策｜Rewire 新聞早報

Chaos Labs 退場，Aave 的風險誰來接檯？

隱蔽的金融戰爭？伊朗用穩定幣收海峽通行費

OpenAlice：一個人，就是一個Jane Street｜專案介紹

早報 | Strategy 上週增持 4871 枚 BTC；Toss 擬開發自有區塊鏈並發行原生加密貨幣；OpenAI CFO 曾私下質疑 2026 上市時機

熱門幣種

最新加密貨幣要聞

Polygon 將啟動 Giugliano 硬分叉，以提升交易最終確認速度

拉德夫：歐洲央行必須做好應對持續通脹的準備

數據：Bit Digital 質押 43335 枚 ETH，價值約 9134 萬美元

數據：Meme 幣市值短時回漲至 1800 萬美元，24 小時漲幅達 21%

數據：若 BTC 突破 72,164 美元，主流 CEX 累計空單清算強度將達 15.43 億美元