【智快網】10月9日消息,近年來,人工智能領域的大模型備受矚目,它們擁有生成逼真文本和圖像、與人類進行自然對話等驚人功能。然而,在這些強大模型的背后,卻有一群默默付出的數據標注員,他們為AI技術提供必要的大量訓練數據,卻常常默默無聞,面臨著諸多挑戰。
這些數據標注員的工作并不輕松,他們需要處理乏味的任務,報酬有限,長期面臨著不穩定性和被替代的風險。雖然他們是AI技術的支撐力量,但卻鮮少受到應有的重視和尊重。
據了解,數據標注員們通常按計件制計算工資,大多數人每月收入不超過5000元。他們來自不同背景,有專科畢業生、家庭主婦,還有轉行者,他們在三四線城市的小格子間里,處理各類數據,為互聯網巨頭和汽車制造商提供服務。
然而,數據標注行業也面臨許多挑戰。2017年,隨著AI技術期望飆升,數據標注員們可以賺取可觀的收入,僅一個2D框選任務就能獲得5毛錢報酬。但隨著競爭激烈和技術進展不順,數據標注的單價不斷下降,現在最低僅為4分錢。
數據標注公司也承受著壓力,它們需要具備一定規模和財力以獲取訂單,并應對回款周期長、員工流動率高、質量和工期不穩定等問題。即便是海天瑞聲這樣的行業內首家主板上市公司,去年僅剛剛超過10%的利潤率,今年上半年已經虧損。
數據標注員們更為擔憂的是,他們可能會很快被由他們參與創造的AI所取代。國內外許多公司正在開發自動標注數據的工具,利用市面上流行的大型模型對數據集進行標注。這些工具宣稱能提高標注效率、降低成本,并達到與人工標注相媲美甚至更高的準確性。
當然,并不是所有的數據標注工作都可以被AI替代。一些需要專業知識和邏輯分析能力的數據標注仍然需要人工干預,比如醫療、金融和自動駕駛領域。但這也表明,數據標注員們若要在這一行業生存下去,可能需要更多學習和努力,因為行業門檻將持續提高。