【大數據】貴州數據鐵籠管人管事 大數據非收集私隱?

撰文:林可欣
出版:更新:

目前金融行業是數據交易的重中之重,通過對個體生活、工作或學習等加強相關領域,應用數據了解一個人的誠信程度。而需要了解的方面事無巨細,王京形容,這其中的細緻可以聚焦到一個人在學校的各科成績、有無考試作弊的記錄、有無違紀抑或正面的記錄;如果一個人是駕駛員,其駕駛習慣、有無酒駕或闖紅燈的記錄、一年的違章次數;在生活中,繳交水、電、煤氣費用的習慣,會否拖延繳納。此乃《貴州大數據》專題報道之二

承接上文:【大數據.一】用大數據重新定義人 當經濟窮省貴州遇上高科技

從一個人的手機號都能看出端倪,「手機號碼是非常能說明問題的,如果一個人經常換電話號碼,說明這個人可能有誠信問題。」貴陽大數據交易所(下稱「交易所」)商務總監王京想了想,決定換一個詞來形容,「精確地來說,應該是『不穩定』」。銀行對手機使用習慣會分為四個維度,其一,是否為實名註冊;其二,使用了多少年;其三,手機通話費的區間段;最後,則是手機大部分使用地。貴陽大數據交易所服務金融業時,會盡可能打通和生活相關的數據。「這些點點滴滴構成銀行對用戶的畫像,就是這麼細緻。」王京說。

王京說大數據能精準扶貧。(梁鵬威攝)

儘管GDP伴隨着大數據產業發展有了實質提升,扶貧依舊是貴州的關鍵詞。2013年,中國提出「精準扶貧」的戰略,旨在2020年實現全國的貧困人口脫貧。通過不同政府部門數據的交叉驗證,便可以判斷個體是否真正屬於貧困人口,「是否貧困就一目了然。」王京解釋道。「你可能會想坐飛機和扶貧有什麼關係。一個人在農村登記為貧困人口,不斷在享受社會帶來的福利,同時天天坐飛機在外面玩,這裏面是有嚴重的問題,甚至有腐敗的問題。」他笑言,「大數據精準扶貧,可能動了很多人的『蛋糕』。」

大數據不僅可以刻劃個體,對於企業亦然。若要判斷一間公司是否為空殼公司,可以通過調查企業的註冊地和實際辦公的地點,再借助其繳納水、電費用的情況,就能判斷公司是否只是一具空殼。

貴陽大數據交易所服務金融業時,會盡可能打通和生活相關的數據。(梁鵬威攝)

實現以大數據重新定義人、為人「畫像」,首先需要大量且多元的數據。在採集和應用數據時,更容易涉及私隱問題。在立法保障數據安全亟待解決之前,數據使用的界線究竟在哪裏?王京認為,大數據做的事和個人私隱之間有所區別,「我了解的是特徵值啊,不是私隱。」他篤定說道,「大數據本身就是特徵,大數據就是去研究這個事物的本質,去研究DNA,而不是研究長得漂不漂亮。」

各據資源挖寶 數據壁壘難攻

然而,對於用數據為用戶畫像能夠多準確,存在另一種質疑的聲音。力創科技總經理蘭海翔對記者表示,大數據發展存在數據壁壘的問題,現在政府提出要把政務數據公開,但是能公開的範圍也有限。數據壁壘致使畫像只能描繪輪廓,例如用手機的通話聯絡對象來判斷這個人,「我平常跟他們開玩笑說,如果你這個人經常電話聯繫的都是政府官員,那估計要麼你的政府人脈很深,要麼你本身就是政府官員。如果你打的電話都是商人、高端人群的話,那你這個人本身也就不低級。如果你出入的都是一些低端場所或者都跟低端的人打交道的話,那估計你離低端的人也就不遠。」

貴陽大數據交易所服務行業廣泛。(梁鵬威攝)

但是判斷一個人是否「高端」,可能要納入銀行存款的考量。「銀行不可能把你的存款數據交給我,我也不可能把你的私隱數據交給銀行。」蘭海翔解釋。

真正要打通數據交易,似乎不那麼容易。蘭海翔指出,大家都認為數據是個寶,但這個寶的價值還沒發揮出來。「誰搶佔資源,誰就是未來的贏家。我把資源留在手裏,我不愁,我知道底下有金子,哪怕我沒有辦法挖出來,也不讓你挖,等到有能力挖時,我再去挖,大家都抱這種心態,那就沒法實現互通。」對於企業,幾乎不可能提供絕對準確的信息。至於具有公信力的數據交易平台,蘭海翔認為,「理想是豐滿的,現實是骨感的。也許作為交易所的成員或聯盟單位,我可能貢獻一部分數據來進行這個平台的交易。」通過不同數據方的疊加,來得到相對接近真實的結果。

建設「數字貴州」是貴州發展大數據的目標,上至城市治理,下至民生事務。(梁鵬威攝)

「數字貴州」構築「數據鐵籠」

建設「數字貴州」是貴州發展大數據的目標,上至城市治理,下至民生事務,貴州省政府試圖創造一個用大數據作為燃料的社會。貴陽公安交通管理局利用大數據和雲計算,建立了「數據鐵籠」。這個系統將通過對大數據的綜合分析,實現對權力的監督。在貴陽大數據綜合實驗區展示中心,有兩句話顯示了數據治理的野心,「在大數據的視野中,我們怎麼來描述一個人;在大數據的技術中,我們怎麼來管住一個人」。

一位民警的一天將會如此被記錄:每天都需要記錄考勤,書寫工作日誌,每次的執法行為都需要視頻資料。若沒有寫工作日誌、離開工作區太久,指揮平台便會發送提醒預警,若沒有修正問題,預警將先後抵達上級主管和監督部門。「管住人」便是要掌握執法人員的每個行為,通過數據監管及預警。

貴陽公安交通管理局利用大數據和雲計算,建立了「數據鐵籠」,將通過對大數據的綜合分析,實現對權力的監督。(梁鵬威攝)

管人管事管權 不再無迹可尋

「通過大數據的方式,管住了人、管住了事、也管住了權。」數據鐵籠項目如此宣傳。這個項目也成為貴陽政府展示治理能力的標誌,官方媒體也大力讚揚,形容數據鐵籠「破解了權力運行無迹可尋的特點」。

貴陽在大數據應用的實驗,逐漸為全國聞名。第一次來到貴陽大數據綜合實驗區展示中心時,展示廳的參觀人數寥寥無幾,但預約的場次就有八場,來自全國各地的機構考察團會專程來此參觀。這一天,有中央電視台及外省衛視考察團、澳門工商界骨幹考察團,以及山東省淄博市食品藥品監督管理局等。

大數據的應用不只在監督權力方面,展示中心顯示的「雲上貴州」系統平台,是中國首個實現政府和企業數據資源共享交換的平台,這項使用阿里雲技術的系統,絕大多數使用者是政府部門。具有國企性質的雲上貴州公司,因為2017年與蘋果中國區iCloud服務合作而聲名大噪。前文提及的精準扶貧,在展示中心有更詳細的解釋,識別可對焦當地的貧困人數。貴州的應用層面,在扶貧精準識別方面,識別率高達98%以上。

貴陽大數據交易展示中心的實時監控畫面。(梁鵬威攝)

城市治理亦是大數據應用的重地。人工智能開放平台首席技術官張立銘表示,「坦白說,這三年貴陽已經積累了非常厚實的大數據基礎,依靠這個基礎,貴陽接下來想怎樣應用大數據?」厚實的數據基礎多是來自政務數據。2017年貴陽市政府與英特爾合作建立人工智能開放平台,該平台目標是成立「政產學研」的生態平台。張立銘透露,平台創立初期,貴陽市政府提供了十類政府數據,平台再將數據提供給初創公司,以此建構AI初創應用。這十類政府數據,涵蓋醫療、景區人流統計,以及居民的水、電、燃氣應用等。

掌握數據是步入人工智能時代的敲門磚。張立銘認為,科技巨頭往往擁有自己的數據資源,在自己的平台做應用訓練,貴陽創造了新模式,「沒有一個這樣公開的模式,由市級或省級提供這樣的數據讓初創公司解決問題。」

張立銘認為,貴陽市政府能創立開放平台,並將政務數據與AI結合,在中國是創新的模式。(梁鵬威攝)

由政府提供的數據訓練出來的技術,亦能反哺改善城市治理效率。有初創公司拿到十字路口的視頻錄像,利用真實的場景訓練模型,例如通過十字路口出事的概率、堵塞的時間段來調整紅綠燈。張立銘透露,「很多初創公司在做這樣的創新,這結果能夠直接反饋到政府機關。」他指出,「對政府來講,能夠得到AI的助力,對他們整個政務的管理很有幫助。我們講的紅綠燈管理是最基本,包括很多社會治理方面,實際上都可以用AI算法解決。」張立銘認為,貴陽市政府能創立開放平台,並將政務數據與AI結合,在中國是創新的模式。

「貴陽從當初做大數據產業開始,就是國家層面的,最終達成所謂更高效的政府治理,還有社會治理,對於貴州來說,算是它的使命吧。」而這種以政府或國家力量推動的模式,是一種非典範的形式。張立銘來自台灣,他認為兩地發展路徑有所不同,「台灣政府推動這件事情的話會有一些其他雜音,例如私隱法,一般來說台灣的AI創新還是比較片斷式,以行業內的創新為主。」相較之下,貴陽市的行動力很強,「說幹就幹」。

有初創公司拿到十字路口的視頻錄像,利用真實的場景訓練模型,例如通過十字路口出事的概率、堵塞的時間段來調整紅綠燈。(梁鵬威攝)

延伸閱讀:【大數據.三】數字化時代爭議四起 社會惡果有待分解

上文節錄自第139期《香港01》周報(2018年11月26日)《用網絡重新定義人  大數據如何打救貴州​》。

重溫貴州大數據系列文章:【大數據.一】用大數據重新定義人 當經濟窮省貴州遇上高科技【大數據.二】數據鐵籠管人管事 大數據非收集私隱?【大數據.三】數字化時代爭議四起 社會惡果有待分解

瀏覽更多周報文章︰【01周報專頁】《香港01》周報各大書報攤及便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。