【科技.未來】診症能力媲美人類 人工智能將成未來醫生?
「有病就睇醫生」的說法可能很快就會變成「有病就睇AI」。上月中在科學期刊《自然.醫學》(Nature Medicine)刊登的一項研究顯示,人工智能(AI)在診斷多種常見疾病上,表現已勝過初級兒科醫生。最近,台灣、英國、印度、日本等地陸續有醫療機構採用AI診症,隨着這股新趨勢逐漸發展,未來或可大大縮短診症及病人排隊等候的時間,醫生也可從瀕臨爆煲的工作量中解放出來,有更多時間照顧病人。當然,前提是病人信得過AI的診斷。AI診症能力持續提升,未來會否全面取代人類醫生?
去年8月,美國特拉華州(Delaware)一家兒童醫院有位四歲女童,身型比同齡人略為矮小,但幾乎所有乳齒都已經脫掉,並開始長出恆齒。遺傳學家Karen Gripp回想起Wiedemann-Steiner症候群兒童過早換牙的病例報告,懷疑女童患有該病。但除了早換牙外,女童並無其他與該病有關的身體特徵。
為了驗證自己的判斷,Gripp把女童肖像上載到名為Face2Gene的AI診症手機應用程式。Face2Gene列出女童可能罹患的疾病,果然包括Wiedemann-Steiner症候群。在進行針對性的基因檢測後,Gripp確認女童患上這種由於KMT2A基因突變所致的極罕見遺傳疾病。
能「人」所不能
Face2Gene由總部設在美國波士頓的數碼醫護公司FDNA開發,該程式透過分析先天性疾病和神經發展障礙症患者的照片,歸類出各種疾病的獨特容貌特徵,並尋找當中的規律,從而診斷出程式使用者可能罹患的疾病。《自然.醫學》1月初刊登的一篇研究更顯示,Face2Gene使用的DeepGestalt演算法的診症能力已可媲美人類醫生。
據FDNA技術總監Yaron Gurovich介紹,他們把涵蓋216種症候群、共17,000張已診斷的照片輸入DeepGestalt,訓練它辨識各種病患容貌特徵。研究人員之後進行了兩個測試,分別要Face2Gene在其他疾病患者的照片對照下,診斷出狄蘭氏症候群(Cornelia de Lange syndrome)和天使症候群(Angelman syndrome)。這兩種疾病的患者都有獨特面容徵狀:狄蘭氏症候群患者雙眉呈拱形而且極之接近;天使症患者則有口闊、牙齒疏、斜視等徵狀。結果顯示,Face2Gene在兩個測試中準確率均超過九成,而過往記錄中,人類醫生準確率只有約七成至八成多。
FDNA團隊其後再以同樣患上努南氏症候群(Noonan syndrome)、但病因各異導致外貌略為不同的病人,測試DeepGestalt可否從他們的照片中正確診斷出屬於哪種病因,結果準確率達64%,比隨機猜的20%機率為高。研究人員還以502張涵蓋92種不同疾病的病人照片再作診斷測試,DeepGestalt可為每張照片的病人列出十個可能患上的疾病,結果,估中了91%患者的疾病。
對此,美國國立人類基因組研究所(NHGRI)臨床遺傳學家Paul Kruszka只好「認輸」:「我們慘敗於Face2Gene。我想未來每個兒科醫生和遺傳學家,都要有一個類似的應用程式,用來當聽診器。」
Face2Gene並非首個達到這種診斷能力的AI系統。過去一、兩年,《自然.醫學》幾乎每幾個月便會有AI診症表現勝過人類醫生的新研究出現。例如去年8月,Google旗下AI公司DeepMind發表了與英國摩爾眼科醫院(Moorfields Eye Hospital)的合作研究成果,他們成功訓練AI系統從光學同調斷層掃描(OCT)診斷出50種眼疾,當中包括青光眼、糖尿眼和老年性黃斑部病變這三種主要眼疾,錯誤率僅為5.5%,與最佳的兩位眼科專家表現相若(6.7%和6.8%),而且沒有錯過任何一個緊急個案。
摩爾眼科醫院顧問眼科醫生Pearse Keane預期這種工具可救助更多病人:「我們進行眼球掃描的次數愈來愈多,其增速之快遠超人類專家解讀的速度。我們把AI系統設計為優先處理迫切需要醫生看診和治療的病人。愈早斷症及治療,愈能拯救病人的視力。」
美國加州大學聖迭戈分校眼科教授張康的團隊開發的AI診症系統,似乎已勝過部分醫生。系統經廣州某大型醫療中心130萬筆18歲以下病人的醫療記錄訓練後,能診斷出感染性單核球增多症(俗稱腺熱,Glandular fever)、玫瑰疹(Roseola)、流行性感冒、手足口病等常見疾病,準確率達90%至97%。
與20名不同資歷的兒科醫生相比,張康的團隊發現,AI系統的表現好過初級兒科醫生,但仍比不上資深兒科醫生。例如AI系統診斷哮喘的準確率為90%,人類醫生則為80%至94%;在腸胃病方面,AI的準確率為87%,醫生則是82%至92%。
準確以外,AI更可看出隱藏其中的規律。紐約大學病理學家Aristotelis Tsirigos的團隊從公開資料庫「癌症基因體圖譜」(TCGA)找來數十萬張照片,訓練一個開源的Google演算法識別癌症和健康組織,繼而學習分辨出肺腺癌(adenocarcinoma)和鱗狀細胞肺癌(squamous cell carcinoma)這兩種最常見的肺癌。之後他們再利用TCGA的數據,這次不但輸入圖片,還把每個腫瘤的連帶基因檔案一同輸入到演算法。當團隊利用演算法未見過的圖片進行測試時,它不但能分辨哪些是癌組織,更能辨認出該腫瘤的基因變異。「真正新穎之處不是展示AI可與人匹敵,而是它能夠看到人類專家看不到的。」Tsirigos說。
解放人類醫生
隨着人口增加和老化,醫療壓力愈來愈大。例如在英國,現時每人平均一年看六次醫生,是十年前的兩倍。據英國智庫King’s Fund調查,2011年至2015年間,平均而言,全科醫生的病人名單增加了10%,與病人接觸(電話或親身)次數增加了15.4%。英國醫學會(British Medical Association)2016年的調查顯示,84%的全科醫生說他們的工作量「過量」或「無法應付」,並直接影響他們照顧病人的質素。
結果,「非緊急」病人看醫生要排長龍預約,部分不想等的就直接到急症室,令英國醫療系統再添壓力。英國醫療科技公司Now Healthcare Group創辦人Lee Dentith指出:「我們常以為看急症的都是老人,其實不是,也有很多是18至35歲的人,他們多數不願意為看病等上一星期。」當然,壓力非英國獨有,先進國家如美國的醫療成本便十分高昂,發展中國家則往往缺乏專業醫護人員。聊天機械人診症服務開發商Babylon的醫療總監Mobasher Butt說:「全球醫療系統都十分緊張,沒有足夠醫療資源,也沒有足夠資金。」
AI診症似乎有望紓緩這些壓力,雖然準確率不是百分百,但張康說人類醫生也同樣做不到:「(醫生)忙的時候,可能一天要看80個病人,只能盡可能地掌握大量病人資訊,這導致人類醫生有機會出錯。AI不需要睡覺,而且記憶力強大,又不會失去動力。」
張康認為AI診症的出現,將可大幅減少病人等候的時間:「你不會希望因為吃錯東西或腸胃炎引致肚痛,而要去急症室等上五個小時。這些疾病都有端倪可循,就如我們醫生問一連串問題後可以作出診斷,AI同樣可以。」他預期AI可應用在急症室分流之上:「只要有足夠數據,AI理應有能力診斷到底昰緊急情況需要轉介,抑或只是感冒。」
兒科醫生Rahul Parikh亦在《麻省理工科技評論》(MIT Technology Review)撰文,指AI可讓他重拾陪伴病人的時間:「這種節省時間的智能可以釋放我,讓我把更多時間花在病人身上。有研究指患有哮喘的兒童有一半時間未按指示接受吸入療程,AI或可讓我有更多時間親身與那些小孩相處,以獲得更好的治療效果。」
這些優點,意味着AI診症可讓醫療資源短缺地區的病人得到更好的治療。例如Google及旗下醫療公司Verily正在印度測試其視網膜疾病自動評估(ARDA)工具,以診斷糖尿病性視網膜病變(diabetic retinopathy),並為病情分級。當地眼科醫生Ramasamy Kim指,傳統的人為診斷約需時三分鐘,AI診斷可把時間縮短至幾秒。
更重要的是,印度是全球最多盲人的國家,卻極缺乏眼科醫生,每100萬人口只有11個眼科醫生,遠低於英國(49)、美國(59)、德國(81)、日本(109)等較先進國家,AI或可彌補醫生不足的問題。
基於這些潛力,AI診症已陸續為一些政府或醫療機構所認可及採用,成為新的醫療趨勢。例如美國食品及藥物管理局(FDA)去年4月批准了一個名為IDx-DR的眼疾AI診斷工具在市場出售,該工具可以在眼科專家不在場下,由一般醫生護士操作使用,或可令更多人及早得到診斷。
在台灣,科技部於2017年10月展開醫療影像專案計劃,建立疾病影像標註資料庫,以開發自動分析醫療影像診斷的AI。有了這些資料為基礎,台北榮民總醫院先在去年11月中在放射線部使用「臨床人工智慧腦瘤自動判讀系統」(DeepMattes),更在上月底開辦AI門診,初期將主要用於心臟、骨科與神經內科。「以往要用十分鐘診斷,現在AI只要20秒。」放射線部主任郭萬祐說。
英國今年分別在列斯、牛津、高雲地利、格拉斯哥及倫敦啟用的五間新醫療中心,也將使用AI加快診斷。日本昭和大學聯同名古屋大學和Cybernet公司合力研發,判斷大腸瘜肉是否惡性的AI軟件,亦獲日本政府准許發售,預計最快今年春季推出市面。
上文節錄自第152期《香港01》周報(2019年3月4日)《協助人類VS取代人類 未來有病就睇AI?》。
更多周報文章︰【01周報專頁】《香港01》周報,各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。更多人工智能議題文章:
人工智能結合生前數據 人類可得「永生」?以數碼化身得「永生」 技術與數據監管成疑