立法會過千萬引入AI謄錄系統 一常見字常寫錯 梁君彥:學習當中
立法會去年與內地人工智能公司科大訊飛合作,引入智慧謄錄系統,在10月復會後使用第二期系統,即時逐字記錄會議,準繩度達93%,又能透過聲紋自動辨認發言的官員及議員。據立法會主席梁君彥透露,首兩期系統,立法會合共向政府申請撥款不多於1,500萬元。
到底花費八位數字的系統準確度如何?立法會今日向傳媒展示系統運作,其中系統多次將「係」寫成「系」,又曾多次在議員發言停頓時,誤以為換人,令「李世榮議員」的名字「老是常出現」。秘書處解釋,議員口音、部份不常見字詞等,系統仍需時間學習,仍然有機會出錯,職員會在後台即時修正,又強調對比以往人手逐字記錄,已經節省很多時間,有信心系統會不斷進步。
梁君彥早前透露,立法會秘書處過去一段時間,向科大訊飛提供立法會成立以來,共約2億5,000萬個中英文字,以及提供予大約100小時的會議錄音及80萬字會議謄本,以訓練翻譯引擎。
系統可準確記錄絕大部份議員發言 惟多次將「係」寫成「系」
該智慧謄錄系統上兩周起啟用,立法會今日向傳媒展示系統運作。據記者觀察,騰錄系統能準確記錄議員的絕大部份發言內容,「啲」、「嘅」、「呢」等口語用字,通通難不到系統。
系統亦能聽出英語字詞,例如「O Camp」、「COVID」,並有自動修正錯誤功能,例如將「資訊」一詞記錄為「自信」時 ,又或議員停頓、無法判斷是否要加逗號時,都能自動在數秒內調整。
不過系統似乎仍有沙石,其中多次將「係」寫成「系」,又曾將「上面」,寫成「上便」。聲紋辨認亦不例外,議員發言停頓或換人發言之時,系統多次誤認,重複寫出「李世榮議員」,需要秘書處在後台即時更正。
至於部份議員或廣東話不正,或有懶音等,系統又能否認出?梁君彥表示,系統暫時未處理到,會有職員即時更正。他又透露,有口音的選委界議員譚岳衡議員今日曾視察系統,「都戙起手指公讚我哋system好」。他又笑言,李世榮「老是常出現」,或許是「系統好鍾意李世榮」。
梁君彥:系統學習當中 有信心會繼續提高準確度
梁君彥透露,首期及第二期系統,立法會分別向政府申請撥款不多於500萬及不多於1,000萬,現時系統逐字記錄準繩度達93%。至於聲紋認人準確率,秘書長衛碧瑤指已達70%。二人強調,系統正在學習當中,已比最初「叻」了不少,有信心會繼續提高準確度。
秘書處又正計劃向政府申請撥款多1,000萬元,發展第三期系統,提供即時字幕功能,期望明年第三季推出。而第四期項目,計劃發展政策資料庫及智能分析等,供議員及政府官員使用。
被問到系統啟用後秘書處會否精簡人手,梁君彥指無此想法,又強調引入系統,是不希望同事做「揼石仔嘅嘢」,而是做更多可以幫到秘書處運作的專業升值工作。