【人工智能.二】躲在AI背後 數字勞工無保障最易被取代?

撰文:林可欣
出版:更新:

人工智能的浪潮還在上漲,未來五至十年的數據需求或許不會下降,人力和人才都成為關鍵。相比於三、四線城市的數據小作坊,位於百鳥河數字小鎮的夢動科技公司可謂取得先機。夢動透露,數字小鎮的發展緣由是貴州盛華職業學院,該學院在2009年首次招生時僅有76人,如今規模超過4,000人。2013年學院的校長提出要做產教融合,當時貴州還未興起大數據產業、成為全國首個大數據研發中心。「我們構思很早,小鎮實際落地是2014年。」數字小鎮落地的原因有二,學校與大環境。此乃《貴州大數據》專題報道之五

【人工智能.一】AI學習靠他們 數據標註員究竟是什麼?

夢動一開始與百度合作,打造專門的數字加工基地,業務多了,也開始接其他大企業的數據標註任務,例如京東、阿里巴巴。「數據加工肯定需要很多人,這些企業數據量成千上億。人工智能嘛,必須有人在前面。」夢動的員工人數也與數據需求量成正比,從初創時的100多人,到2018年超過500人,加上流動的人員,大概有630人。有職業學校提供生源,對流動性大的數據標註行業是絕對的優勢,雖然夢動也從外面招人,但來自盛華職業學院的比例較大,「其他公司可能也有很多人,但是零散的。我們是集中性的。」

「我想讓他們在人工智能時代找到工作」

「數字小鎮本身就是黔南州代表性的大數據集聚區,因為提起黔南州的大數據就是百鳥河,而且我們是比較實在的。雖然我們的工作比較基層,但是核心的。如果沒有我們做的事情,無人車啊、天貓精靈,都實現不了。」

在夢動的基地門口,公司簡介上有一句標語,「我們取過很多口號,最後定了這個。」——人工智能背後的人。

龍貓的市場負責人康萌表示,機器不能自己學習,人工智能一定少不了人。(梁鵬威攝)

如果說夢動擁有的是先天優勢,其他數據公司則需要和其他地方政府或教育機構合作,才能後發制人。事實上,在數個國家級人工智能相關政策出台後,地方政府也意識到,需要積極搶奪人才和企業落地,才能帶動新興產業發展和再就業。

康萌透露了一項名為「龍貓學院」的計劃,目標受眾是內地重點大學「985」和「211」剛畢業的學生,通過公開課、大小比賽和各種活動,逐步形成社群。「它不是說像付費平台,我要慢慢篩選沉澱,反哺到各個地方的三本職業學校,賦予這些人正確的人工智能的知識和操作技能。讓他們可以在人工智能時代找到工作,或成為龍貓可聘用的人。」康萌再次強調,「人工智能一定少不了『人工』,機器不能自己學習,因為不夠智能。你沒有見過小孩教小孩。都是大人教小孩,所以人教機器,一定會延續多年。」

近兩年,中國已經出台不少人工智能相關政策,2017年更是首次將人工智能寫入政府工作報告,從中央政府到地方政府,都極力推動產教研融合。今年6月,中國教育部科學技術司司長在解讀《高等學校人工智能創新行動計劃》新聞發布會上介紹,2018年設立了57個人工智能類別的項目,截至去年,已有71所高校圍繞人工智能領域設置專業。可以看出,從頂級院校到職業學校,人工智能專業或學科都將為技術革命的新時代儲備人才和人力。

夢動科技公司數據標註工廠門口擺放的標語——人工智能背後的人。(梁鵬威攝)

易被取代的人 VS 最後一批被取代的人

這或許成為一個悖論,數據需求量很大,意味數據標註員需求量在短期內不會下降,但人們研究人工智能的目標之一,正是用機器取代人類做重複性高、無聊的工作,類似數據標註員的工作將來會不會也很容易就被取代呢?

社會輿論對數據標註行業的爭議愈來愈多,有聲音認為這會是第一批被人工智能累死的人。另一方面,科技界的人往往不以為然,因為對數據的需求會導致對人力需求保持在高位。杜霖曾對媒體表示,數據標註員將會是最後一批被取代的人。目前看來,或許這個時間將被縮短。朱鵬飛正在做一項研究,目標是加速數據標註的過程。他表示,「現在我們在整個領域裏面,已經有大規模已經標註過的數據,我們拿它來訓練機器,機器能訓練得很好。」朱鵬飛續指,正是面對勞動力的這麼一個行業,說明裏面是有提高效率的空間。他與團隊正在做人機協同標註的研發,「比如我們已經教會一個機器,大概它知道這裏有手機、相機,它能自己過一遍數據,把能標的地方先標上,人補一下就可以了。」

天津市政府今年在AI領域的投資超過往年。圖為天津大學人工智能實驗室。(梁鵬威攝)

朱鵬飛認為人機協同標註會是大勢所趨,與目前數據標註行業的缺陷息息相關。例如人工標註不僅耗費時間,還費人力,追不上新業務的迭代需求;另一方面,數據標註員算是人工智能界的藍領員工,流動性強,難以吸引優秀人才;而且目前業界沒有建立起一套工具鏈體系和事實的工業標準等,這些都成為發展人機協同標註平台的機會。

然而,人機協同平台未必會很快有大規模的應用,「當然隨着技術的發展,我們希望一步步在更多任務裏面把人工替代,這個思想並不一定會被工業界的人接受,因為他們需要的就是人工的標註。不需要機器來完成。但其實我們自己已經做過評測,人工標的和機器標的,在某些特定場景,像智能冰櫃,精確度達到90%,但有些用戶就只喜歡人工標註,怎麼用機器標都不相信。  」朱鵬飛說。

在開發人工智能領域的自動駕駛應用前,需要大量標註數據訓練模型。(梁鵬威攝)

「現在學術界出現了一些名字,無監督學習或弱監督學習,這些名詞都是為了擺脫數據標註。他們認為不需要標這麼多數據,覺得做一件事情那需要標這麼多,我能不能不標,或者少標,就可以達到同樣的性能。」朱鵬飛表示,「但AI的落地需要百分之百,自動駕駛領域裏面,不允許出現任何錯誤,沒有大規模標註好的數據去支撐模型的訓練,你怎麼可能保證萬無一失?工業界對這個需求會非常旺盛,因為他們要落地。」

「學術界會有一些公開的數據集,在工業界已經把這些刷爆,到頂了,對學術界來說就沒有價值,所以大家提出新的理論,我不要你標這麼多數據,看能造成怎樣。像我是做人機協同,把這個架起來,另一種是我不要那麼多數據,我有一些其他的信息來輔助,這樣我在少量的數據,或有輔助信息的情況下,也能達到相同的性能。」朱鵬飛笑指,「在學術界我們叫『挖坑』,先挖一個坑讓大家往裏跳,填坑的過程一般是五年一個周期。所以這個周期,大家再填五年應該沒問題。」

黃丹關注技術發展下的勞資關係問題,她認為:在看到機器帶來便利的同時,也要看到背後有這麼低收入的人群。

對於技術變革與人類發展關係的討論,不僅僅存在於數據標註行業。「AI出現以後產生了很多新的行業,比如數據採集、標註員,它又養了大量的人,這是一個新興的產業,但可能過些年又消失了。這是由於在技術發展和革新的過程中,對某種職業有一定的依賴所出現的,它不是一定要存在的。這個情況在各行各業都存在。」朱鵬飛認為,技術的迭代更新必然會出現新的崗位,也會替代一些崗位。「我們有這些新的技術,使技術生產效率變得更便捷,但不一定會造成失業,可能會創造新的產業職業,人要適應這個變化。科技會創造很多人需要去做的事情。」

朱鵬飛認為,技術的迭代更新必然會出現新的崗位,也會替代一些崗位。(梁鵬威攝)

「數字勞工最起碼該被看到」

對於香港大學社會學博士黃丹而言,她關注的還是技術變革中的勞資關係。「這個事情上和任何勞資關係沒有差別,我們看到機器帶來便利的同時,也要看到背後有這麼低收入的人群。」黃丹認為,談及數據標註行業,最簡單的意義還應回溯至「起碼應該被看到,可它並沒有被看到」。「大家都非常開心在享受技術的便利,卻沒有看到背後有龐大的人群在服務,他們在做非常無聊的工作,就為了讓你享受自動化。我們不能得出多大的結論,起碼可以關注到這個人群,他們可能至少超過十萬人。」黃丹表示。

2016至2017年數據標註的風潮起來了,但相比於社會上風風火火的智能技術,類似無人超市、自動駕駛、智能家居,還沒有太多人關注到這群人。黃丹說:「誰都不知道他們有多少人,這個人群是最底層的數字勞工,他們並沒有享受到數字帶來的便利。再深一點是反思科技到底能夠帶來什麼東西,如果科技只帶來資本,資本的積累真的和人類的便利沒有衝突嗎?發生衝突怎麼辦?因為從整個資本主義長期的發展來看,技術的發展帶來進一步分工,造成人類幹的工作愈來愈少,無法掌握全局。」

AI技術從來不是中立客觀,重點是它要服務於資本的積累,還是服務於人類更好的生存發展。(梁鵬威攝)

目前對於技術的討論,普遍存在於兩極,一端是技術樂觀派,另一端是悲觀的。前者認為技術進步可徹底解放人類,後者則認為技術的發展會造成人類進一步被奴役。「核心是技術問題,歷史上技術革命或技術發展帶來整個社會結構或勞動過程的改變,其實也不是什麼新奇的事情。」黃丹表示,「比方說,第一次工業革命以後,機器和人的結合使生產率大幅度提高,但大幅度提高後其實整個勞動過程是被分解的」,而在電腦技術發展後,腦力勞動也產生了變化,出現了精英管理層。

回到AI時代,無人超市的出現回應了簡單重複的工作被取代的目的,商店不再需要收銀員。黃丹認為,儘管服務業還沒有被完全取代,但未來還會有很多可能被取代的工作。「目前各大壟斷企業都比較重視發展無人汽車,雖然還沒有廣泛推行,但未來肯定會帶來比較大的影響,對交通系統和整體發展可能都有較大的變革,這是目前我們可能看到的。」

無人超市的出現回應了簡單重複的工作被取代的目的,商店不再需要收銀員。(梁鵬威攝)

面對AI帶來的問題,應該如何反思呢?黃丹指出,應該回歸到人們對技術在意識形態層面的認識,「技術從來不是中立、客觀,它的發展是有目的存在的。問題是,技術的發展是要服務於誰,是要服務於資本的積累,還是服務於人類更好的生存發展。這是我們面對整個技術變革,比較需要認真思考的問題。」

不過對於王利利而言,能加入到大數據潮流中,至今還是一件令她感到神奇的事。至於手把手餵養數據的人工智能,終有一天會不會取代自己,她顯得不那麼擔心,「我覺得世界一直在發展,如果到時候機器都取代我們做的事情,那我們肯定會做更高端的事情,還有更好的工作等待我們去發展。」

框着就能找到一個人?老一輩的人不太能想像。(梁鵬威攝)

王利利的母親長年生病,一年住院兩次。王利利在去年看到一個案例,醫院病人跑出去找不到路,最終護士通過手機定位找到了這位病人。她相信技術的力量。

王利利和媽媽說,「拍張照片,傳到平台,就能把你框起來了。」

「她相信你嗎?」我問。

「她就不相信我,『你框我有什麼用?』我說,框起來,萬一你在醫院走丟了,我就可以找到你了。她不相信我。」

上文節錄自第139期《香港01》周報(2018年11月26日)《站在風口浪尖   教人工智能學習的人》。

重溫《貴州大數據》系列文章:【大數據.一】用大數據重新定義人 當經濟窮省貴州遇上高科技【大數據.二】數據鐵籠管人管事 大數據非收集私隱?【大數據.三】數字化時代爭議四起 社會惡果有待分解【人工智能.一】AI學習靠他們 數據標註員究竟是什麼?

瀏覽更多周報文章︰【01周報專頁】《香港01》周報各大書報攤及便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。