波多野结衣按摩,在线观看亚洲视频,国产嫩草在线观看,91视频最新地址

首頁 資訊 > 創新 > 正文

揭秘真實的「AI民工」:為生存機械地「做任務」 時薪低至1美元

核心提示:


【資料圖】

1.即使是最厲害的AI背后也是人,它需要大量人力標注數據來訓練它。AI標注員是人們希望自動化的工作,而且通常認為它們已經自動化了,但是仍需要人類的輔助。

2.他們把這份工作稱為“做任務”,自己也不知道干的是什么。

3.收入微薄,時薪低至1-3美元。

4.標注員抱怨稱“如果我讓某人成為億萬富翁,而我每周只賺幾美元,我真的是在浪費生命。”

人工智能(AI)的火熱不僅取代了一批工作崗位,也造就了新的產業,一支以“做任務”為生的龐大AI民工大軍正在悄然崛起中。

喬(Joe)今年30歲,幾個月前從肯尼亞首都內羅畢的一所大學畢業,找到了一份數據標注員的工作。這份工作單調乏味,整天就是處理用于訓練AI的原始信息。AI通過在海量數據中尋找模式來學習,但是這些數據首先必須由人類進行分類和標記。人類就是隱藏在這些機器背后的龐大勞動力。

以喬為例,他的工作就是為自動駕駛汽車標記視頻,一幀一幀地從每個可能的攝像頭角度標記每輛車、行人、騎自行車的人以及任何車主需要注意的東西。這是一項艱難而又重復性的勞動。一個只有幾秒鐘的視頻片段需要8個小時來標注,喬忙活半天只能賺到大約10美元(約合72元人民幣)。

不過,到了2019年,喬迎來了一個“發財機會”。由于一家新公司迫切需要標注員,他們成立了一個訓練營,培養新的標注員。喬成了這個訓練營的負責人,報酬是之前做標注員的四倍。

每隔兩周時間,50名新手就會排隊進入內羅畢的一棟辦公樓,開始他們的學徒生涯,這讓人感覺市場對標注員的需求似乎是無限的。他們被要求從那些對著鏡子自拍的照片中看到的衣服進行分類,通過機器人吸塵器的視角來確定他們所在的房間,并在激光雷達掃描的摩托車周圍畫出正方形。

喬的一半以上學生通常在訓練營結束前就退學了。“有些人不知道如何長時間待在一個地方。”他委婉地解釋道。他承認,“這很無聊”。

稀里糊涂“做任務”

但是,在一個工作稀缺的地方,這好歹是一份能夠糊口的工作。最終,喬還是培養出了數百名畢業生。訓練營結束后,這些學生回到家里,獨自在臥室和廚房里工作,被禁止告訴任何人他們在做什么。其實,保密性并不是什么問題,因為他們也幾乎不知道自己在干什么。

對于這些剛出師的學生來說,為自動駕駛汽車標記障礙物很好明白,但是對那些不知道是機器人還是人類說的扭曲對話片段進行分類,就沒那么輕松了。他們要上傳自己的照片:先是一臉茫然地盯著攝像頭,然后咧著嘴笑,還要戴上摩托車頭盔。每個項目都是某個更大程序的一個很小組成部分,所以很難說他們到底在訓練AI做什么。他們也無法從這些項目的名稱中尋找蛛絲馬跡:“蟹的傳人”、“鯨魚段”、“林地陀螺儀”和“藥盒香腸”,這些都是不著邊際的項目代號。

那么,他們到底是在為誰打工呢?大多數人只知道它叫Remotasks,是一家面向英語流利者提供工作的網站。和大多數標注員一樣,喬并不知道Remotasks是美國AI標注公司Scale AI旗下的外包公司。Scale AI是一家價值數十億美元的硅谷數據供應商,客戶包括OpenAI和美國軍方。不過,Remotasks和Scale AI的網站都沒有提到雙方的關系。

許多人對于ChatGPT等大語言模型的關注都集中在AI通過自動化取代的工作崗位上。但是,即使是最厲害的AI背后也是人,它需要大量人力標注數據來訓練它,并在它感到“困惑”時對數據進行澄清。只有那些有錢購買這些數據的公司才能參與競爭,這些公司在得到數據后會極力防止數據外泄。結果就是,除了少數例外情況以外,人們對于塑造AI系統行為的信息知之甚少,對于塑造這些系統行為的人就更不了解了。

對喬的學生來說,這是一份“十分不正常”的工作:沒有時間表、沒有同事、不知道自己在做什么、也不知道為誰工作。實際上,他們很少把這項勞動稱之為工作,只是稱之為“任務”,他們是任務工作者。

人類學家大衛·格雷伯(David Graeber)曾經給那些沒有意義的工作起了一個名字:“狗屁工作”,指的是那些本應該被自動化取代,但由于官僚主義、地位或惰性等原因而沒有自動化的工作。AI標注員的工作則與之相反:這是人們希望自動化的工作,而且通常認為它們已經自動化了,但是仍需要人類代替。這些工作確實有一個目的,只是工作者通常不知道它是什么。

標注大生意

當前的AI熱潮,就是源自這種前所未有的大規模單調乏味、重復性勞動。

2007年,時任普林斯頓大學教授的AI研究員李飛飛懷疑,改善圖像識別神經網絡的關鍵是使用更多數據進行訓練,需要數百萬標記圖像而不是數萬張。但問題是,她的本科生團隊需要花費數十年時間和數百萬美元才能給這么多照片貼上標簽。

不過,當時亞馬遜已經擁有了一個眾包平臺Mechanical Turk,世界各地的人們在這里以低廉的價格完成小任務。于是,李飛飛在Mechanical Turk上找到了數千名數據標注工作者,創造了標注數據集ImageNet。它讓機器學習取得了突破,讓這一領域煥發新機,迎來了十年進步。

如今,標注仍然是AI開發的基礎組成部分。但是,工程師們經常覺得,對于構建大模型這一更迷人的工作而言,標注是一個短暫的、不方便的先決條件。你可以盡可能便宜地收集盡可能多的標記數據來訓練模型,如果它有效,至少在理論上你就不再需要標注員了。但是,標注永遠不會真正完成。在研究人員眼里,機器學習系統是“脆弱的”。當遇到訓練數據中沒有充分解釋的東西時,它很容易失敗。這些失敗被稱為“邊緣情況”,可能會產生嚴重的后果。

例如,2018年,網約車巨頭Uber的一輛自動駕駛測試車撞死了一名女性。盡管該汽車的自動駕駛系統被進行了編程,要求避開騎自行車的人和行人,但它不知道該如何對待騎自行車過馬路的人。隨著越來越多的AI系統被投入到世界中提供法律咨詢和醫療幫助,它們面臨的邊緣情況就越多,需要更多人類來協助解決。這已經催生了一個全球性產業,由像喬這樣的人組成,他們用自己獨特的人類能力來幫助機器。

標注是一門大生意。Scale AI由當年19歲的亞歷山大·王(Alexandr Wang)在2016年創立,2021年的估值已達到73億美元,這讓他登上了《福布斯》“最年輕的白手起家億萬富翁”榜單。不過,自那以后,他的股份在二級市場的價值已經下跌。

“標注生意擁有一套完整的供應鏈,”非營利組織AI伙伴關系(Partnership on AI)的項目和研究負責人索南·金達爾(Sonam Jindal)表示,“業內普遍認為,標注不是開發的關鍵部分,也不會長時間需要它。所有的興奮之情都圍繞著人工智能,一旦我們建立了它,就不再需要標注,所以為什么要考慮它呢?但標注是AI的基礎設施。人類智慧是AI的基礎,我們需要將其視為AI經濟中的真正工作,這些工作將在一段時間內存在。”

OpenAI、谷歌和微軟等知名AI公司都有各自的數據供應商。一些私人外包公司擁有類似呼叫中心的辦公室,比如肯尼亞和尼泊爾的CloudFactory。喬就是在那里做標注,每小時1.2美元,之后他才轉投Remotasks。還有像Mechanical Turk和Clickworker這樣的“眾包”網站,任何人都可以注冊來完成任務。中間層是Scale AI之類的服務,任何人都可以注冊,但每個人都必須通過資格考試和培訓課程,并接受績效監控。

怎么接活?

今年早些時候,記者在Scale AI的外包公司Remotasks網站上進行了注冊。過程很簡單,輸入電腦配置、網速和一些基本的聯系信息后,記者就來到了“培訓中心”。為了獲得付費任務,記者首先必須完成一個相關的無償入門課程。

培訓中心展示了一系列課程,但是這些課程的名字令人費解,比如“膠水泳衣”和“海報夏威夷”。記者點開了一個叫“GFD模塊化”的課程,這項課程是給社交媒體照片中的衣物進行標注。

不過,課程的指令很奇怪。例如,它們基本上是由相同的指令組成的,并用特殊的顏色和大寫字體進行強調,旁邊是用來警示的炸彈威脅拼貼畫。

“一定要給真實的、可以讓人類穿著或打算給真人穿著的物品貼上標簽。”指令是這么要求的。

“下面的所有物品都應該貼上標簽,因為它們是真實的,可以被現實生活中的人穿著。”指令再次強調。這些物品來自一個AJ品牌廣告、一個戴著星球大戰凱洛倫頭盔的人,以及一個穿著裙子的人體模型。這些圖片上面有一個石灰綠色的方框,里面的文字再次解釋說,“給真實的人可以穿的真實物品貼上標簽”。

對于不能被標記的物品,指令也給了醒目的提示:“以下物品不應該被貼上標簽,因為人類在實際生活中不可能穿著這些物品!”

記者對于自己的分辨能力感到自信,于是就開始了測試。首先是一張雜志的照片,上面的女人穿著裙子。照片上的服裝是真實的服裝的嗎?記者認為不是,因為人不能穿照片中的服裝。但是,錯了!在AI看來,真實服裝的照片就是真實服裝。接下來是一張在昏暗臥室中,一個女人站在全身鏡子前自拍的照片。她穿著的襯衫和短褲是真實的。那么倒影呢?同樣是真實的!真實服裝的倒影也是真實服裝。

經過尷尬的大量嘗試和錯誤后,記者終于開始了實際工作,卻驚恐地發現他一直在努力遵循的指令已經被更新和澄清了很多次,現在已經變成了一本有43頁的指令書:不要標記裝滿衣服而且打開的行李箱;標記鞋子但不要標記腳蹼;標記緊身褲但不要標記連緊身褲襪;即使有人穿著毛巾也不要標記它;標記服裝但不要標記盔甲。

收入微薄

Remotasks上的大部分工作都是按件計酬的,一項任務的收入從幾美分到幾美元不等。因為任務可能需要幾秒鐘或幾個小時,所以工資很難預測。標注員們稱,當Remotasks剛進入肯尼亞時,他們的報酬相對較高。根據任務的不同,平均每小時大約為5到10美元。但隨著時間的推移,報酬會下降。

Scale AI發言人安娜·弗蘭科(Anna Franko)表示,該公司的經濟學家會分析項目的細節、所需的技能、地區生活成本和其他因素,“以確保公平和有競爭力的薪酬”。Scale AI的前員工還表示,標注員的薪酬是通過一種類似動態定價的機制確定的,該機制根據可用的標注員數量和數據需要的迫切度進行調整。

根據記者的采訪和招聘公告,美國的Remotasks標注員通常每小時能掙10到25美元,一些專業標注領域的專家報酬更高。今年年初時,接受采訪的肯尼亞標注員的報酬已經降到了每小時1到3美元。

這還是能賺錢的時候。標注員對于Remotasks的工作最常見的抱怨就是它的不穩定性。它或許能在很長一段時間內給標注員提供足夠穩定的工作,可以作為全職工作,但也充滿了不可預測性,使人無法依賴它。標注員花費數小時閱讀指令和完成無償培訓,結果只能完成幾十個任務,隨后項目就結束了。接著,標注員可能幾天都沒有新任務,然后再突然出現一項完全不同的任務,可能持續幾個小時到幾周時間不等。任何任務都有可能是他們的最后一項任務,他們永遠不知道下一個任務何時到來。

工程師和數據供應商稱,這種時有時無的工作取決于AI開發的節奏。訓練一個大模型需要大量標注,然后是更多的迭代更新。工程師們希望所有這些都盡可能快地完成,這樣他們就能趕上目標發布日期,可能在幾個月的時間里就需要數千名標注員,然后減少到幾百名,接著只需要十幾名特定類型的專家,然后又需要數千名。“問題是,誰來承擔這些需求波動的成本?”AI伙伴關系的金達爾說,“因為目前承擔這些成本的是標注員們。”

抱團取暖

為了取得成功,標注員們會相互合作。維克多(Victor)在內羅畢上大學時就開始為Remotasks工作。當記者告訴他自己在交通導向員任務中遇到的困難時,他表示大家都知道要遠離那個任務:任務太棘手、報酬還低,不值得做。

和許多標注員一樣,維克多使用非官方的WhatsApp群聊,在有好任務時通知大家。當他弄清楚一個新任務時,他會即興使用谷歌視頻會議服務Meets與其他人分享如何完成任務。任何人都可以加入會議,一起研究,分享技巧。“這是我們培養起來的相互幫助的文化,因為我們知道,單憑一個人是無法掌握所有技巧的。”他說道。

由于工作會毫無征兆地出現又消失,所以標注員們總是需要保持警惕。維克多發現,項目會在深夜突然出現,所以他習慣每三個小時左右醒來檢查一下他的任務隊列。當有任務時,他會保持清醒,只要能讓自己工作。有一次,他熬夜36個小時,在人群照片中給肘部、膝蓋和頭部做標記,他也不知道這么做是干什么。還有一次,他熬夜太久,媽媽問他眼睛怎么了。他照鏡子后才發現,眼睛腫了。

標注員通常只是模糊地知道他們正在為其他地方的企業訓練AI,但有時這種神秘感會消失,因為指令中提到了某個品牌或聊天機器人說得太多了。“我讀了一些資料,并通過谷歌搜索發現,我正在為一位25歲的億萬富翁工作。”一名員工說,他當時正在給打電話訂購達美樂披薩的人的情緒貼標簽。

“如果我讓某人成為億萬富翁,而我每周只賺幾美元,我真的是在浪費我的生命。”他不滿地說。

沒人會記住我們

維克多自稱是一名AI“狂熱者”。他開始做標注,是因為他想幫助實現一個完全自動化的后工作未來。但是今年早些時候,有人在他的WhatsApp群里發了一篇《時代》雜志的報道,內容是標注員訓練ChatGPT識別有毒內容,但是Scale AI支付給他們的時薪不到2美元。

“這些公司利潤豐厚,但支付給標注員的薪酬卻如此之低,這讓人感到憤怒。”維克多說。當被告知Remotasks與Scale的關系時,他才知道自己參與的其中一項任務的指令與OpenAI使用的幾乎相同,這意味著他可能也在訓練ChatGPT,時薪大約3美元。

“我記得有人發帖說,我們將來會被人銘記,”他說,“然后,另一個人回復說,我們的待遇比步兵還差,未來我們什么也不會被記住這段話我記得很清楚。沒有人會認可我們所做的工作和付出的努力。”

關鍵詞:

最近更新

關于本站 管理團隊 版權申明 網站地圖 聯系合作 招聘信息

Copyright © 2005-2023 創投網 - www.extremexp.net All rights reserved
聯系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3