特約內容

中大電子工程X社創|以AI還原病人聲音 扭轉不可能的溝通

撰文:王玥晨
出版:更新:

對於一般人而言,透過語言表達自我,看似理所當然,但對於失去說話能力的病人卻成奢望。「語音合成技術雖無法扭轉病情,無論多像真人,亦只是電腦發出的聲音。但重組聲音並非無意義,病人可以再次以聲音與他人溝通,或許能為生活帶來一絲希望與溫暖。」研發「個人留聲機」的香港中文大學電子工程學系李丹教授說。
攝影:鄭子峰

電子工程學出身,卻對廣東話興趣濃厚,李教授修讀博士課程時,第一個項目便是有關廣東話的語音識別研究,轉眼已鑽研了30多年,至今仍覺有趣。兩年前,他的團隊首次接受委托,為癌症復發、即將接受聲帶切除手術的Jody保留聲音。團隊至今已為6名癌症病人,利用人工智能(AI)語音合成技術,設計「個人留聲機」。透過專屬的手機應用程式,用家可自行輸入文字,文字會再轉化成用家的聲音並發聲,語音更可分享至WhatsApp等通訊軟件。

透過專屬的手機應用程式,用家可自行輸入文字,再轉化成自己聲音的語音,更能分享至WhatsApp等通訊軟件。

其中一位舌癌復發的女士得悉Jody的個案後便向李教授團隊求助,希望於接受聲帶切除手術前完成錄音,以製作語音模型。李教授憶述當時處處受限,因病人已切除大部分舌頭,發音受影響,同時身體狀況不理想,加上時間緊逼,最後可用的錄音只得30分鐘。「一聽錄音便知道情況不樂觀,但也要盡力試。例如以AI借用其他人的聲線,好處是咬字清晰,但卻與原聲具差別;又試過利用病人的聲音,同時糾正一部分發音。多番嘗試後終於成功製作出聲線相似又比較清晰的AI模組。」

成人達己

團隊研發的同時,病人亦正與死神搏鬥,兩次進出深切治療部。李教授坦言,「個人留聲機」雖已完成,但用家卻未能試用,大家只能靜待她的消息,心情非常複雜。幾個月後,病人家屬聯絡李教授,他即急不及待分享成果。病人更於去年聖誕節的宗教見證會中,利用「新聲音」配合簡報分享經歷。病人的正面回應無疑是對團隊的一大認可。兩年過去,「個人留聲機」的發展愈趨成熟,甚至已出現中英雙語版本。李教授卻謙虛地說,坊間也許認為中大團隊的技術貢獻甚大,但到底對病人的生命有多大影響,不應由他單方面衡量。相反,研發過程為他的人生觀帶來啟發。「其實我個性較悲觀,但病人積極的態度感染了我,學懂凡事盡做、抱有希望。他們每一位都是生命勇士,面對着生與死的抗爭,那份積極的力量正是我們繼續堅持的動力。」其中一名因患癌而需切除聲帶,向團隊求助的孫律師更與李教授成為朋友,孫律師的太太更鼓勵團隊向外推廣「個人留聲機」。於是,李教授、孫太與開發「個人留聲機」應用程式的創科公司創辦人合作開設了一間公司。

李教授笑言,「個人留聲機」並非團隊主動將研究實踐的成果,面世的過程是冥冥之中的安排。

語音合成技術具龐大商業潛力,成立公司卻不為賺錢。李教授專注於小眾利益,希望能更有系統地照顧到現有的求助個案,逐步擴大援助範圍。「我的理念好簡單,若中大不做,其他人未必會做。大學的研究雖具實用價值,但距離實踐還差一點。而『個人留聲機』比較特別,是大學研究中少有接近可以使用的成品。」團隊得到利希慎基金的資助,增添高性能計算服務器GPU,大大提高工作效率。

早於「個人留聲機」面世前,團隊已曾利用人工智能結合語音技術,製作內容豐富的有聲兒童故事「故事點播機」。李教授於2019年獲得創新科技基金,與中大校友、著名創新企業家林曉鋒博士合作,開發AI兒童有聲故事生成技術。2020年亦獲得中大知識轉移項目基金(KPF)資助,開展「個性化兒童故事頻道」的社區項目,推出廣東話有聲故事應用程式。家長和小孩不但可以聆聽預先製作的有聲故事,更可以發揮創意,自行創作和修改故事內容,促進親子互動,也可以幫助兒童學習中文。

(資料由客戶提供)


你可能感興趣