
AI 金字塔的底層:時薪 15 美元的 “數據標註員”

“人工智能” 的背後,依然少不了 “人工”。
人工智能的應用已經相當火熱,ChatGPT 看起來就像 “有求必應的魔法”,但這背後實際上有着勞動密集產業的功勞。
據 CNBC 和 Gizmodo 等媒體報道,OpenaAI 僱傭了大量外包勞動力協助他們完成 “必要的數據標記任務”——也就是給數據打標籤,正式一點的名字叫做 “數據標註員”、“數據標註師”,或者,“AI 訓練師”。
所謂打標籤,就是給 AI 將要分析的數據樣本打上不同標記(語音/圖片/文本等),以幫助 AI 模型更好地識別數據集中的特定項,從而更快地相應用户的請求。
這是 AI 模型訓練最基礎的工作。
但這份工作毫無疑問是枯燥的,它包含着大量重複性的工作,操作者每天只需要辨別數據樣本的類型,然後選擇不同的標籤。
一名接受 CNBC 採訪的數據標註員 Alexej Savreux 説:
我們是工人,但沒有我們就不會有人工智能語言系統。
你可以設計所有你想要的神經網絡,你可以讓所有你想要的研究人員參與進來,但沒有標籤,你就沒有 ChatGPT。你一無所有。
更關鍵的是,這樣一份工作,薪酬是每小時 15 美元——高於美國各個州的最低工資,但並沒有高出太多(Savreux 所在的堪薩斯城,最低工資 7.25 美元)。
目前,國內的 AI 相關企業也在僱傭着這樣的崗位。
科技媒體 “鞭牛士” 在 3 月的一篇文章中指出,和 AI 行業的高薪相比,數據標註員的工資並不高。
“一張圖 9 毛錢,一天做 100 張。” lili 稱,如果都合格,一天能賺 90 塊。
“不同的標註價格不一樣。” 何文新稱,他當時的工資在 3000 左右。基礎的數據標註員月薪大部分在 2000-4000 元之間,但因為標註的速度、質量問題,“很難拿到當時面試跟你承諾的工資。”
鞭牛士在一些招聘網站上搜索 “數據標註”,薪資區間在 2000-8000 之間。一些特殊的標註,比如小語種、高精製圖等,薪酬會更高。
人工智能,重點是人工
將重複勞動外包並不是人工智能行業獨有的現象。
CNBC 指出,硅谷一直都依靠着這些數以千計的低技能、低工資的外包工人的勞動來建立計算機帝國,但這些工人自始至終都處於 “低人一等” 的地位:
這些工作是不穩定的、按需分配的,人們通過書面合同直接受僱於一家公司或通過專門從事臨時工或外包的第三方供應商。
健康保險等福利很少或不存在——這意味着科技公司的成本降低——而且工作通常是匿名的,所有的功勞都歸於科技創業公司的高管和研究人員。
現在,人工智能行業也在遵循這一遊戲規則。而隨着人工智能蓬勃發展,越來越多的數據標註員被僱傭,但越來越多這樣的基礎勞動被忽略。
非營利組織 “AI 夥伴關係中的 AI、勞工和經濟”(AI, labor and the economy at the Partnership on AI,PAI)項目負責人 Sonam Jindal 説:
圍繞人工智能的許多討論都是非常可喜的。
但我們忽略了故事的一個重要部分:這仍然極大地依賴於大量的人類勞動力。
漩渦中的科技巨頭
當然,隨着數據標註員這樣的外包崗位已經被越來越多的組織看到,這也令科技巨頭們不得不面對 “麻煩”。
今年早些時候,據《時代》雜誌報道,OpenAI 正在依靠低工資的肯尼亞外包勞工來標記包含仇恨言論或性虐待語言的文本,以便其模型能更好地自行識別 “有毒(toxic)” 內容。
在肯尼亞內羅畢,150 多名曾為 Facebook、TikTok 和 ChatGPT 從事 AI 工作的人投票決定成立工會,理由是工資低和工作的精神負擔。
另一媒體 Semafor 在今年 1 月報道稱,OpenAI 在東歐和拉丁美洲等地僱傭了大約 1000 名遠程外包工人,為數據貼標籤或對公司軟件進行計算機工程任務培訓,那裏的工資低至 2 美元/小時。
與此相對的另一個數據是,截至今年 1 月,OpenAI 約有 375 名員工。
而該公司的一位發言人説,沒有人可以回答有關其使用人工智能外包員工的問題。
PAI 在 2021 年的一份報告中警告稱,對所謂 “數據填充工作” 的需求正在激增,該組織建議該行業致力於公平的補償和其他改進的做法,並在去年發佈了供公司遵循的自願準則。
CNBC 指出,谷歌的 AI 子公司 DeepMind 是迄今為止唯一公開承諾遵守這些準則的科技公司。
Jindal 表示:
很多人已經認識到這是很重要的事情。現在的挑戰是如何讓公司去做。
這是一個由人工智能創造的新工作,我們有可能讓這成為一份高質量的工作,讓從事這項工作的工人因其對實現這一進步的貢獻而受到尊重和重視。

