【人工智能】AI助測肺炎 惟須保障私隱 以免身份被識別

撰文:評論編輯室
出版:更新:

醫管局日前公布三宗醫療事故,醫護人員遲遲未能察覺病人肺 X 光片異常,延誤診治。局方成立委員會製作報告,探討改善方法。事故原因有待查證,但有報道指局方正測試人工智能技術,輔助診斷,並先針對肺 X 光片。有外國研究顯示,人工智能判斷放射準確度比得上專業人員,有助加快診斷時間,減少漏診誤診。港府和醫管局應繼續發展機器學習功能,利用電腦協助診斷,並邀請學界和商界研究,過程中需要妥善移除病人資料,保障私隱。

醫管局公布,近期發生的三宗醫護人員未能適時察覺X光片顯示異常情況,將成立根源分析委員會跟進。(視覺中國圖片)

AI助找出肺炎病徵  成功率堪比真人

醫護人手不勝負荷,如果科技能夠協助偵測病況,既能加快診斷速度,減少病人等候報告時間,又能為專業人員比對判斷結果,提升判斷準確度。以肺部 X 光片為例,美國國家衞生研究院臨床中心(The National Institutes of Health Clinical Center )「Chest X-ray 14」胸腔放射線檢查庫公開了超過 11.2 萬份肺部 X 光片,來自逾三萬名病人,美國印第安納大學醫院也公開了7,470 份肺部 X 光片,相當適合電腦程式學習,分辨正常和異常的肺部 。

究竟人工智能的檢測結果有多準確?比人手偵測相差多少?2017 年,一群學者抽取上述資料庫當中的 420 張肺部 X 光片,分別給機器及四位放射科醫生分類肺炎跟非肺炎病人。結果發現機器的準確度較醫生高,而且具統計學顯著分別。簡單來說,機器比放射科醫師更能偵測肺炎特徵。再者,電腦可以製作肺炎的熱圖(heatmap),顯示肺炎最有可能患病的位置。

必須提醒,上述研究並非無懈可擊,例如有學者質疑放射科醫生數目太少,另外,研究中的 X光片沒有側面照,又缺乏病史佐證,誤診機會較實際高。即使如此,研究支持繼續發展電腦輔助檢測,並套用在不同病症。

在開發人工智能領域的自動駕駛應用前,需要大量標註數據訓練模型。(梁鵬威攝)

個人資料跟醫療數據須分離  免被辨識

推動電動輔助檢測的同時,更須慎守私隱安全。病歷是敏感的個人資料,醫護及學術界使用和分析數據前,必須先要除去能夠識別身份的資料,才能保障病人私隱。這些資料主要為兩類:直接資料和間接資料。前者包括姓名、電郵、電話、身份證號碼,後者包括生日、死亡日期、地址、種族、診斷時間等人口社經資料。兩者都要跟諸如留院時間、病症種類、電腦掃瞄圖片、基因排序等的醫療數據剝離。

更重要的是,數據不應讓使用者得知資料的身份。事實上,外地曾經有人在結合不同數據後,識別出特定人物的例子。2016 年,澳洲墨爾本大學一名學者嘗試在衛生部門開放數據庫的 1.7 萬個女性記錄尋找自己,她借用 facebook 關於性別、出生年份、居住州份及健康活動,成功篩選出 23 個吻合例子。當她加入出生日子後,她就發現自己不在數據庫中。此外,她還聲稱比對出三名國會議員及一名足球員的病歷記錄。

修訂法例、事前檢測  減私隱風險

開放數據同時要保障私隱,難以兩存其美。立法加強數據取用的條件,以及測試數據的安全程度,是可行辦法,但要小心操作。澳洲政府計劃立例,禁止第三者運用政府公開數據組合、識別個人身份。因為罪行涉及刑事,有追溯期,加上舉證責任不在控方,而在被告一方,民間對修法有保留,現時未有定案。在法例以外,數據持有者可以先測試原始數據能被再識別的風險,當風險太高,持有者可以修改或刪除個別欄目,例如改動出生日期,直至不能再辨識身份。

人工智能並非取代醫護,而是加快醫護斷症,減少誤診。這需要大量醫療數據訓練機器辨識,而開放醫療數據則有利知識普及,集思廣益。不論是醫療機構還是公眾,必須謹慎處理資料,避免有人濫用敏感資料。港府屢屢被批私隱監管疏漏,更應及早檢討法例,預防私隱被侵犯,把好事變壞事。