【01周報】IT人製作互動地圖 勾畫選區變形記
每屆區議會選舉網頁均會顯示選區分界圖,讓選民知道自己所屬選區,然而,每屆區議會選舉均有重新劃界的區域,選舉事務處只公佈更改劃界的選區數目,要知道所屬選區是否有重新劃界,可能比想像中困難。
與政府周旋多月 才取得數據地圖
「要向政府取得選區分界圖的digital format並不容易,由於版權屬於選舉事務處,故先要向選舉事務處填表申請,交了700元,還要再向地政署查詢,因為digital format在他們手中」,葉俊延(Stanley)是一名網頁程式編寫員,兩年前曾向選舉事務處索取2007年及2011年兩屆區議會選舉的全港分界圖,希望將兩屆區選的分界圖重疊作對比,哪一個選區被重新劃界,市民可一目了然。「但區選網頁的分界圖是以PDF形式顯示,我必須得到digital format,才可製作互動地圖」,結果,Stanley與兩個部門周旋多個月,才成功取得地圖。今年,Stanley成功製作出兩屆區選的分界互動地圖,全港劃界是否有改變,每個選區誰勝誰負,甚至得票數目及政治聯繫亦清楚列出。
「天后和維園上屆屬於東區,今屆劃去灣仔區,有沒有計算在內?有些改了名稱,如尖沙咀中變成尖沙咀東,亦有些一區的範圍被鎅成三個選區,又有沒有算入這109個選區內?」
在製作分界圖對比網頁的背後,Stanley付出大量時間蒐集各項資料,例如全港參選人的政治連繫、年齡、甚至計算出每個選區劃界與上屆的誤差比率,懂得編寫程式的他,認為一般市民也能做到這種製作,「我只是用了R來寫程式,再以Excel形式輸出,不算太複雜,只是蒐集各項資料非常花時間」。記者曾在過去數屆區議會選舉網頁翻查資料,例如每個選區的當選人得票及其政治聯繫,分別載於「候選人簡介」及「選舉結果」兩個欄目內,而選區分界及預計人口,亦分別載於「選區分界圖」及「區議會選區概要」兩個欄目內,市民也無法一覽全港431個選區的分界,在網頁設計上對使用者極為不便。
對於選舉事務處指今屆有109個選區重新劃界,Stanley質疑數目是否準確,「天后和維園上屆屬於東區,今屆劃去灣仔區,有沒有計算在內?有些改了名稱,如尖沙咀中變成尖沙咀東,亦有些一區的範圍被劃成三個選區,又有沒有算入這109個選區內?根本沒有人考證」,若以他蒐集的分界數據運算出來,被改動的選區不只109個,故他認為選舉事務處應界定「重新劃界」的定義。
「很多資料明明是公開的,為何要市民主動詢問才發放出來?文件沒有寫的東西,政府就不會額外整理給你們」
數據圖像化是全球趨勢
為何花費大量時間,Stanley仍堅持要做?他認為,數據圖像化是全球趨勢,「外國傳媒如New York Times經常在報道中使用量化數據,更聘請了一名教授專門製作infographic(信息圖表),香港的網媒近年亦常用」。Stanley表示,受哥倫比亞大學統計學及政治學教授Andrew Gelman及美國有線電視聯播網ESPN的記者Nate Silver影響,開始在工餘時間量化本港區選數據,「Andrew Gelman出版過一本《Red State, Blue State, Rich State, Poor State: Why Americans Vote the Way They Do》的書,研究在美國總統選舉上,窮人是否票投民主黨,而富人是否一定投共和黨,經他量化數據後,發現原來不是」,他又指,Nate Silver是一名數據新聞記者,專門負責體育及選舉新聞,2012年的美國總統大選,因選情太接近,被評論家認為無法預計結果,但Nate Silver卻憑量化數據準確預測了所有州分的選票結果,故Stanley認為量化數據對研究選舉新聞非常有用。
Stanley認為香港也值得將選舉的資料量化,然而政府各部門的網頁設計欠佳,資料既不齊全,轉換檔案的教學亦不多,令市民在查詢資料時感到不便,「很多資料明明是公開的,為何要市民主動詢問才發放出來?文件沒有寫的東西,政府就不會額外整理給你們」,若有心人希望僅以政府提供的資料做研究,將感到非常困難,故他將已量化好的區選數據放上網,希望方便市民或傳媒作不同研究,被問到會否將9月的立法會選舉甚至下屆區選的數據整理,他苦笑道:「有時間才做吧,況且我知道,網上越來越多人在做同樣的事。」