【科技.未來】人工智能測謊 將成執法新潮?

撰文:孔祥威
出版:更新:

面世近百年的測謊機(polygraph),測試結果不可靠已是不爭的事實。然而,背後的思路從未消失,近年更有科學家希望結合人工智能(AI),製造新一代甚至未來的測謊機器,有些更已於歐美國家邊境關口測試。到底這些新的工具會把測謊技術提升至另一層次,還是把測謊機那段黑暗歷史以AI之名重演一遍?

有科學家指出,說謊是人類每天生活的一部份。根據美國南加州大學心理學家Jerry Jellison的研究,我們平均每天可聽到高達200個大話,如何辨別謊言,便成為了一個重要問題。早有科學家認為,我們「口裏說謊,身體卻很誠實」,口窒、「鬼拍後尾枕」之餘,也可能心跳加快、滴汗或面部肌肉會有微表情(micro-expression)。難怪心理學大師佛洛伊德(Sigmund Freud)曾說:「沒有凡人可以保守秘密,若他不開口,他的指尖會說話,甚至身上每一個毛孔都會背叛他。」

儘管如此,不代表我們可輕易識破謊言。2006年一個大型分析回顧了206個科學研究,發現人類判斷謊言的成功率只有54%,僅比隨機好一點。美國警員John Larson在1921年發明的測謊機,問測試者問題時持續量度其血壓和呼吸速率,把結果描畫至紙卷上,出了名最不準確。原因很簡單,根本無從得知這些生理變化是由於恐怕被識穿大話,還是擔心會被錯誤指控,感到緊張、有壓力又或極力嘗試回憶時所致。而不同人對在解讀同一幅圖時也可得出不同結論,甚至因地域、種族和性別而有重大差異。一些人權組織主張,測謊機有違美國憲法對於「不自我入罪」的權利保障,現時,美國絕大部份法庭都不接納測謊機的結果。

有專家指自從9.11後,各國執法部門都積極尋找真正有用的測謊方法。(Getty Images)

「9.11(事件)後一切都改變了。」心理學家Paul Ekman在著作《Telling Lies》中寫道。在那場恐襲中,有數名劫機者是騙過邊境官員才得以進入美國境內,這令當局迫切追求新的測謊技術,希望在反恐和邊境檢查上都有真正有效的工具,於是大幅增加對測謊研究的資助。而近年難民危機及法國、比利時、西班牙、德國等地發生的連串恐襲,亦讓歐洲警察和相關保安部門面臨愈來愈大壓力。

Ekman是研發資助增加的得益者之一。他早於上世紀七十年代已將與精神病人面談過程錄影,其中一名多次自殺的42歲女病人Mary,為了取得周末離開醫院的許可,謊稱自己已感覺比較好。被騙的Ekman後來不斷翻看錄影,終於發現她在說謊前會有極短暫一瞬間流露出失落表情。

Paul Ekman(左)主張,人說謊時會流露微表情。(Paul Ekman Group圖片)

往後數十年,Ekman都在研究這些他稱為「微表情」的面部動作如何能揭示隱藏的真相, 2009年的大熱電視劇《Lie to Me》便是改編自其經歷。這項技術其後更被用作新反恐措施,於2006年在真實世界中首次測試,Ekman花了一星期教導美國入境官員如何在邊境檢查的過程中,透過觀察特定微表情來測謊。測試的成果卻相當有意思:往後六年間,至少有16名恐怖分子獲准入境美國。

但這不代表相關科研就此打住,近年甚至有愈來愈多科學家和國家執迷於這套想法,並希望結合AI技術開發邊境審查系統。

歐洲一些國家曾在邊境測試AVATAR,以AI擔任關員。(聖地牙哥大學)

機械人在邊境把關

在2014年,飛往羅馬尼亞首都布加勒斯特的旅客就被一個名為Avatar的虛擬關員檢查。除了電子護照掃描器及指紋讀取器外,Avatar還有一個紅外線眼動追蹤鏡頭和量度身體動作的感應器。它會問過關旅客一系列預先設定的問題,同時拍下他們的反應,再使用演算法把這些數據結合,分析表情、語調、回答內容等有否出現「騙子迹象」,例如因為想要說謊時的認知壓力而不自覺地出現的微表情。最後,它會對被查人士的真誠程度進行評級,分綠、黃或紅色等級,目標在45秒內把判決傳送給人類執法人員。綠色的可毋須再作檢查順利通關,其餘則要接受人類關員的問話。

負責提供這系統軟件的公司Discern Science聲稱,初步研究顯示Avatar的準確率為83%至85%,「遠高過人類平均只有54%」。Avatar似乎配合了保安和航空業界對行為分析愈來愈濃厚的興趣。在今年5月一個會議上,美國運輸安全管理局、倫敦吉域機場(Gatwick Airport)、以色列機場管理局等代表就在邊境管制上加入行為分析技術商討,希望加強旅客安全和降低風險。Discern Science策略總監David Mackstaller透露,正與列根華盛頓國家機場及一些他不願具名的官員洽談,在亞利桑那州美墨邊境進一步測試後永久安裝Avatar。

列根華盛頓國家機場正在洽談安裝AI關員Avatar,協助判斷旅客有否謊報資料。(Getty Images)

拉脫維亞、匈牙利和希臘則測試過另一套名為iBorderCtrl的系統。該系統使用英國曼徹斯特都會大學(MMU)在千禧年代開發的Silent Talker技術,以AI分析超過40種微表情。旅客到達機場前,先要登錄一個網站上載護照相片,網站會有一個虛擬關員問一些常見的海關檢查問題,旅客需要口頭回答,系統之後會給旅客一個二維碼(QR Code)。入境時,關員會以平板電腦掃描二維碼,採集指紋和核實容貌是否脗合上載照片。最後,電腦顯示一個以100為滿分的分數,令關員參考旅客的資料是否可信。這個項目已獲一個歐盟研究計劃注資450萬歐元,由來自多國的科研機構和保安科技公司共13個單位組成的聯盟管理。

Silent Talker指研究顯示其準確率達75%。但MMU計算機智能講座教授Keeley Crockett強調:「不只是由我們的產品提供風險分數,那是一個有人參與的系統……它不會自動決策,只會為每個獨立旅客打分。我們想為大眾創造更快更安全的邊境檢查。」

曼徹斯特都會大學研發的iBorderCtrl,以AI分析旅客微表情並給予分數,判斷是否說謊。(曼徹斯特都會大學)

另一測謊機製造商Converus聲稱,其EyeDetect是「現有最可靠的測謊機」,準確率有86%,比一些研究指測謊機只有65%至75%為高。在測試者回答問題的同時,EyeDetect會以紅外線鏡頭每秒拍下60張影像,觀察眼球活動和瞳孔大小的細微變化。這些數據會傳到Converus的伺服器,機器學習演算法會計算測試者是否說謊。這幾乎是科幻經典電影《2020》(Blade Runner)中,追捕複製人時進行的「孚卡測試」(Voight-Kampff Test)。

Jon Walters是Public Safety Testing創辦人,其公司在美國華盛頓州替警察、消防和救護進行職前測試。他說執法部門開始選用EyeDetect取代現有費時失事的測謊程序。相比起需時2至4小時的測謊機,EyeDetect只需30分鐘,而且幾乎全自動,可繞過測謊機的一大缺憾—通常在解讀結果時帶有偏見的人類考官。Walters說過程也比較舒服:「當我要接上測謊機的線,其實頗為嚇人。若用EyeDetect,只需坐下看着機器。」

聯邦快遞(FedEx)和Uber已分別在巴拿馬和墨西哥使用EyeDetect,以篩查出有犯罪記錄的司機;消費者信貸評級機構Experian亦用它來測試哥倫比亞分部的員工,確保沒有操控公司的數據庫來批核貸款予家屬;英國諾桑比亞的警察則用EyeDetect進行先導試驗,量度性罪犯的改造程度。其他使用者還有阿富汗政府、麥當勞及美國一些地方警察。

字裏行間看出謊言?

有科學家更相信,AI根本不需要觀察這些身體變化也可識穿謊言。英國卡迪夫大學(Cardiff University)和西班牙馬德里卡洛斯三世大學(UC3M)合力研發的VeriPol,去年起協助西班牙警察從報案的文字記錄識別是否報假案。設計者之一的Miguel Camacho Collados曾任警員,他說市民虛報搶劫,有些只想避免告訴家人或朋友他遺失了重要財物,有些則希望索償保險。

西班牙國家警察早前應用人工智能,聲稱可從報案人的文字口供識別是否報假案。(Europa Press)

研究人員以1,122宗已結案的搶劫案件訓練VeriPol,辨別一句陳述中的不同元素,例如形容詞、動詞、標點符號,然後找出假案的規律。據稱,假劫案報案一般較短,而且主要描述失竊物品而非劫案本身,有關案件和劫匪的詳情較少,也缺乏目擊者。然後,他們以659宗案件測試這演算法,結果VeriPol的準確率分別比兩名人類專家高15至20%。2017年6月在梅西亞(Murcia)和馬拉加(Málaga)的先導研究更發現,被VeriPol判斷為虛假的報案中,有83%在進一步盤問原訴人後就成功結案。而VeriPol在一周內總共偵測出69宗假案,馬拉加和梅西亞在過往一般每周只能分辨出12.14和3.33宗。

佛羅里達州立大學訊息學教授Shuyuan Ho希望,測謊不限於執法用途。在今年2月的《人類行為中的計算機》(Computers in Human Behavior)期刊中,她與史丹福大學的科學家提出了所謂的「線上測謊機系統」,聲稱只要觀察二人的打字交談內容和速度就可測謊。他們找來40人參與研究,2人1組用Google Hangout互相問答。參與者被隱藏了真實身份,在每個回合對話開始前才知道自己要扮演的是每句都是真話的「聖人」,還是每句都說謊的「罪人」。這些交談記錄包括了每句回應花了多少時間,研究人員把部份數據用來訓練一個機器學習模型,再用其餘數據測試它可否分辨誰是聖人、誰是罪人。

有科學家聲稱,可從網上交談對話測出是否說謊,可應用至交友平台、銀行等。(Getty Images)

研究中,機器學習模型辨別成功率為82.5%。Ho說,觀看同樣數據的人類表現只是好過瞎猜少許。這演算法憑一些線索找出罪人,例如回答速度比聖人快、溝通過程中也展現更多「負面情緒」和「焦慮」、使用的字數較多、也會用「經常」和「永不」表達肯定。相反,聖人會用較多表達因果關係的字眼,例如「因為」,也用更多表達不確定的字眼如「可能」、「我猜」。

Ho揚言,這技術可作為線上測謊系統的原型,例如可用在線上約會平台,又或成為反恐機構的測謊元素之一,銀行甚至可以用顧客與聊天機械人的記錄來評估他的誠信:「若銀行應用(相關技術),他們可以很快就更加了解更多與他們做生意的人。」

繼續閱讀︰以人工智能測謊 重蹈偽科學歷史覆轍?

相關文章︰新藥研發低迷 AI可如何顛覆生態AI用數據研製新藥 反而是它的最大局限?未來製藥專家 將由AI取代人類?

上文節錄自第182期《香港01》周報(2019年9月30日)《AI測謊:重蹈偽科學歷史覆轍?》。

更多周報文章︰【01周報專頁】《香港01》周報,各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報,閱讀更多深度報道。