“人工智能訓練師”究竟做些啥
最近,人社部公布了一批新職業,其中有個新職業叫作“人工智能訓練師”。聽起來高大上的人工智能還要人來訓練?誰能訓練這些看不見、摸不著的人工智能?“人工智能訓練師”究竟做些啥?關鍵是,掙得多不多?
帶著這些問題,經濟日報記者近日走訪了百度(山西)人工智能基礎數據產業基地。這里是目前國內從業人員與產值規模第一的單體數據標注基地,入駐企業35家,AI數據標注師從業人員超過2300人。
“我是數據標注員,中專學歷,每天工作8小時,大概能掙300多元。”面對記者的問題,山西麟諾網絡科技有限公司的李宇龍自豪地給出了答案。這個收入對在太原生活的年輕人來說算高水平了——數據顯示,2019年,太原市城鎮居民人均可支配收入36362元。不過,李宇龍說自己不算最高的,“我有的同事一天能掙1000多元”。
李宇龍學歷不高,原本與人工智能沒什么關系。2018年,山西麟諾網絡科技有限公司成立,李宇龍經朋友介紹來到這家公司。
“當時我也不知道數據標注員是做啥的,更沒聽說過人工智能。老板就交給我一套規則,讓我按照規則在電腦上認車道線。”那時20歲出頭的李宇龍正是肯學的時候,短時間內就熟悉了規則,還總結出標注車道的新規律。
作為這項新職業的老員工,李宇龍已轉型培訓師,除了日常工作,還承擔起公司新員工的培訓教學,“有的同事會轉型做項目或者內容審核員,還是有上升空間的”。
“數據標注技術門檻低,招工人群范圍廣泛,對于促進就業作用顯著。”山西麟諾網絡科技有限公司負責人李應維告訴記者,目前公司招聘的員工以大專生為主;標注規則由百度與相關領域專家共同制定,并形成可操作軟件平臺提供給企業,對員工簡單培訓就能上手。以人臉為例,目前他們能實現對約150個特征點的標注。大致標注規則是數據標注師看到雙眼皮就標記雙眼皮,看到獅子鼻就標記獅子鼻,讓機器自己理解與學習。標注特征點越多,AI就越能精確識別人臉。
看似簡單的工作,背后是龐大數據基礎做支持。算法、算力與數據是人工智能發展的三大要素,其中數據是人工智能發展的燃料。每天,人類社會產生的海量數據必須經過清洗與標注,換成人工智能熟悉的語言才有價值。因此,人工智能訓練師主要任務就是數據采集和標注,特別是數據標注。如果說人工智能是個孩子,數據標注師就是帶領這個孩子認識世界的啟蒙老師。有了足夠多、足夠好的數據,AI才能學會像人一樣去感知、思考和決策,更好地為人類服務。
人工智能產業發展之初,數據采集與標注需要人力完成的部分比較多,現在數據平臺已有了持續學習能力,大部分采集與標注工作人工智能自己就可完成,實現預標注與自動標注。因此,目前數據標注工作以機器輔助與人工標注結合為主。除了眼底檢查片、肺部X光片等技術含量較高有專業要求,大多數員工均能按照規則,在平臺上完成語音、人臉、道路的標注操作,只要能熟練操作電腦即可。
郭梅是新職業的受益者。34歲的她原本在山西一家煤礦做監控員,為照顧到太原上學的孩子,她到學校附近的數據標注基地求職。經過公司崗前培訓與團隊幫助,她從起初每天標注兩三百張圖,提升到每天能完成1300多張。
數據標注員的工作隨著人工智能發展需求不斷調整。前幾年人工智能發展伊始,語音識別、人臉、圖像等識別需求大;近幾年無人駕駛進入發展快車道,郭梅與李宇龍的主要工作就改成無人車、地圖、3D點云等數據標注,天天看的是車道線、行人、障礙物。
“還有一些語音識別項目,比如我們接了一些方言語音數據標注項目,這就需要招聘當地人來完成了。”李應維說。
有了足夠技術基礎,數據標注員還能教會人工智能新任務。疫情期間,戴口罩的人臉識別需求激增。“根據客戶需求,山西數據標注基地采集了大量戴口罩人臉照片,由數據標注師對眉毛、眼鏡、顴骨等人臉關鍵點精準標注,訓練人工智能完成了戴口罩人臉圖像識別。”百度(山西)人工智能基礎數據產業基地負責人尉赤說,“人們能在不摘口罩情況下實現精確體溫測量,或是通過人臉閘機,背后就是這些數據標注員在訓練人工智能。”
艾瑞咨詢發布的《中國人工智能基礎數據服務行業白皮書》預測,隨著全球人工智能產業、物聯網、5G的爆發式增長,到2025年,全球每年產生的數據量將從2016年的16.1ZB猛增至2025年的163ZB,其中80%至90%是非結構化數據,需要經過清洗與標注才能被喚醒價值。在我國,每年需要標注的語音數據超過200萬小時,圖片則有數億張。因此,人工智能數據標注師的崗位需求將持續增長。尉赤透露,今年基地新招了500多人,未來5年計劃培養5萬名AI數據訓練師,并引入更多AI合作伙伴。李應維也預計,到明年自家企業用工將翻一番,從160多人擴展到300人左右。未來,數據標注將成為創造大量就業需求的新興職業領域。(佘 穎)
關鍵詞: 人工智能訓練師
您可能也感興趣:
為您推薦
深圳最低工資標準調整為2360元/月 失業保險金為2124元/月
遼寧實施失業保險省級統籌 對缺口核定等作出詳細規定
部分保險公司推出隔離險 理賠卻存在諸多限制
排行
最近更新
- 高端消費品牌開啟漲價潮,大牌還能“笑”多久?
- 百世進入“減法”梯隊 能否堅守當前的道路仍未可知
- 入場容易盈利難,團車造車想要站穩腳跟需要具備什么樣的能力?
- 爾旭大宅新型材料研產銷一體化,創新綠色新建材
- 兒童打鼾、張嘴睡覺要注意了 睡眠障礙將損害身體健康
- 8年開出4000多家門店,俏妃經期護理緣何成為女性剛需
- 預防大于治療,俏妃經期護理喚活女性生殖健康自生力
- 俏妃經期護理憑何為女性健康筑起防火墻
- 檳榔產業發展峰會展開,問道九五之尊品牌引領行業高質量發展
- 黑龍江科技招商大會大慶專場舉行 推動科技成果落地轉化
- 大事件 | 松偉官宣高圓圓為代言人,疊加億級高鐵投放
- “網紅”隔離險買易賠難?是營銷噱頭還是真保障
- 百億私募巨頭林利軍屈身道歉表信心,“少數”投資人為何不買賬?
- 雅居樂擬18.44億元向中海出售廣州亞運城26.66%股權
- 2021年中國跨境資金流動有序 國際收支自主平衡
- 時隔九年,娃哈哈再做醬酒,這次能成功嗎?
- 2025年中國綠色低碳循環發展消費體系將初步形成
- 銷量連續7年居世界首位 新能源汽車有望加速增長
- 一張滑雪票蘊藏無限商機:冬奧會點燃冰雪消費
- 綠城服務盈利增長不及預期 野村將其目標價由12.5港元下調13....
- 銀保監會規范銀行服務市場調節價管理:劃出五條紅線
- ?17家酒企上榜2021年綠色工廠名單
- 麥當勞在推特上發了一個手勢,要痛失韓國市場了?
- 衛生間如何進行清潔消毒?北京疾控:要注意4個環節8個方面
- 上海發布生物醫藥產業發展規劃 到2025年產業規模將超萬億元
- 上海:去年科技信貸授信規模1583億元,科技保險助力科研穩發展
- 中國癌癥防治十大建議發布 公眾應改變多種不良生活方式
- 火山有色加強服務傳統企業
- 螞蟻集團股票有哪些?相關螞蟻集團股票龍頭一覽
- Buck電路原理