【科技．未來】人臉辨識升級　情感辨識應用遍地開花

當人臉辨識在全球各地相繼推出，令人擔心環形監獄時代來臨，更進一步的反烏托邦或許在等着我們。一些科技公司聲稱可以人工智能（AI）分析我們的表情，解讀出情感狀態，有助各行各業了解消費者喜好之外，更可被執法機關用來判斷你是否對公眾安全構成威脅。不過，當人類早已熟練笑裏藏刀，AI又是否真的有能力看穿我們的真正感受？

10月底，深圳舉行中國國際社會安全博覽會，逾1,500個參展商展出多種新科技監視器材。其中，新疆阿勒泰地區公安局治安支隊隊長李曉宇就向《金融時報》介紹：「利用影片錄像，情緒辨識科技可藉由分析精神狀態迅速分辨出疑犯，預防非法行為，包括恐怖主義和走私。我們已經開始使用。」他補充，這科技主要用於海關，分辨某人有否流露緊張的迹象、其壓力水平以及攻擊他人的潛在可能。

李曉宇還透露，正與不同業者合作，包括海康威視、宇視科技、大華科技和天地偉業等內地知名監控公司：「只有在AI方面強大的公司才可在這領域成功，當然，這領域內最大的兩家公司就是阿里巴巴和騰訊。」曠視科技一名不願具名的代表則說，情感辨識科技已在政府內廣泛開發和使用，尤其是公共安全機關。

十月底深圳安博會，多間科技公司展出監控保安技術，包括以情感辨識預監控潛在罪犯。（AP）

以機器解讀情感

據美國麻省理工媒體實驗室情感計算科學家Javier Hernandez解釋，情感AI是一種讓人類與機器更自然互動的工具：「想想你與其他人類互動的方式，你看他們的臉和身體，並相應改變互動。若機器不知道你的情感狀態、感受，對某種內容會有什麼反應，它能夠有效溝通嗎？」

現時，人類在閱讀情感上可能佔上風，但機器正逐漸進步。麻省理工史隆管理學院教授Erik Brynjolfsson說，這是因為機器十分擅長分析大量數據：「就像我們可理解語言而機器可用言語溝通，我們也可以用幽默和其他情感來理解和溝通。能夠說這種情感語言的機器，將與我們有更好、更有效的互動。很高興我們已有點進展，這在過去二十或三十年前根本不可能，現在卻擺在眼前。」

情感辨識牽涉兩種技術，其一為電腦視覺（computer vision），仔細辨識面部表情；另一為機器學習演算法，分析和解讀這些面部特徵的情感內容。後者需要經過監督學習（supervised learning），若你向演算法展示大量標籤為「開心」的開心面孔照片，當它看見一幅新的開心面孔照片就能辨識為「開心」。

Paul Ekman（左）認為，人即使試圖掩飾情感，但臉上仍會流露「微表情」。（Paul Ekman Group圖片）

現時絕大部份情感辨識技術，基本上都是想藉由把臉上的表情和位置如座標般記錄，從而反映出對應的內在情感。這種概念很大程度上來自於美國加州大學柏克萊分校（UC Berkeley）心理學家Paul Ekman，他在上世紀六十年代主張，愉快、傷心、厭惡、恐懼、憤怒和意外，這六種情感不論文化背景為何，都會以普同的方式展現，並可透過分析面部肌肉動作來偵測。為測試這種假設，Ekman向不同群體展示來自世界各地的面孔照片，叫他們分辨看到什麼情感。研究發現，即使存在重大文化背景差異，人類仍可配對出同樣的面部表情和情緒。

過去二十年，Ekman試圖將他的發現發展成辨識人類表情來判斷情感的方法。當某種潛在的情感在某人心中觸發了，相應的面部表情就會自動出現，甚至即使想掩飾這情感，真實、本能的反應仍然會洩露在臉上，即他所謂的「微表情」（micro expression），逃不過識途老馬的「法眼」。

情感辨識遍地開花

微軟聲稱，其演算法可辨識八種核心情感狀態。（Microsoft）

現時，一些科技巨頭已在提供這種服務。微軟（Microsoft）在2015年推出其情感辨識技術時，就聲稱其演算法可「辨識八種核心情感狀態：憤怒、鄙視、恐懼、厭惡、愉快、中性、失落和詫異」。亞馬遜（Amazon）在8月中宣布其人臉辨識服務Rekognition，可在本來已偵測的「快樂」、「傷心」、「憤怒」、「意外」、「厭惡」、「冷靜」和「困惑」之外，加入第八種情緒「恐懼」。網站上還建議了多種用途，例如商店可把顧客的實時影像輸入到這人臉分析工具，在不同零售地點追蹤他們的情感和族群。

Google雖然在內部倫理評估認為會侵犯私隱的壓力下，沒有像亞馬遜和微軟般出售人臉辨識服務，但其人工智能雲端服務仍會在照片中偵測和分析人類面孔，估算年齡、性別和四種情感：喜悅、憂傷、憤怒和意外。在Google照片應用程式中搜尋「喜悅」、「憤怒」等字眼，就會得出它判斷包涵這些表情在內的照片。

有情感辨識公司與影視媒體合作，分析觀眾對電影、廣告等觀感反應，以制定行銷策略。（Kairos）

辨識消費者或潛在顧客的反應，是情感辨識的一大商業用途。情感AI初創公司Realeyes，正是以Ekman的六種基本情感、眼球追蹤和面部表情來分析觀眾對廣告的反應。例如去年聖誕，英國高檔連鎖百貨約翰路易斯（John Lewis）播出了《男孩與鋼琴》的廣告，倒述殿堂級歌手Elton John的成長故事，從天王巨星回到兒時父母買給他作為禮物的鋼琴，配上他膾炙人口的《Your Song》。雖然廣告播出後整體反應不錯，但在Realeyes看來則沒那麼簡單。他們請來200名觀眾看這廣告，並且同意過程中以電腦或手機鏡頭錄下每分每秒的反應，然後，以人工智能分析每人的面部表情和身體語言，綜合注意力和情感後評分。

Realeyes發現這廣告的開頭就已錄到正反觀眾情感。行政總裁Mihkel Jäätma解釋：「英國觀眾其實對片中Elton John那部份不太興奮，負數上升，大家早已聽夠了對這名人的吹捧。」而到他的小孩版出現時，則出現較多正面的情感反應：「當談到家庭和小孩而不再是名人，好感度大增。所以，我們認為這廣告的焦點在於那小孩。幾乎沒有Elton John的話會好很多，或者至少應縮短。」廣告片長2分20秒，「實在太長，只能在電視上播，無人會在網上看。」一些大型食品商如可口可樂（Coca-Cola）、瑪氏（Mars）都是Realeyes的客戶，日本電信電話（NTT）亦有份投資。

類似的做法也見於電影。人臉辨識公司Kairos就與傳奇影業（Legendary Pictures）合作，以這種技術在電影試映時測量觀眾反應。傳奇影業會利用所得大量數據，決定電影中哪些劇情最適合用來製作廣告片，分辨「最有可能分享電影預告的群體」，確保它的電影「同時滿足主流觀眾和針對性的粉絲族群」。

很多其他界別也看中了情感辨識的潛力。初創公司Hirevue就聲稱，其程式可幫助僱主分析應徵者面試錄影，判斷其性格和表現，剔除不合格的應徵者，增加招聘效率。達美航空（Delta）、冬甩專門店Dunkin' Donuts、服飾及生活雜貨品牌Urban Outfitters、聯合利華（Unilever）等知名巨企都是其客戶。

另一情感AI業者Affectiva就推出了專用於汽車的情感辨識功能，聲稱可結合人臉和語言分析測度駕駛者的情緒，確保行車安全；也能辨識乘客的舒適度和睡意來調適車內環境如光線和暖氣，又或在辨識到乘客緊張或不適時，可改變汽車自動駕駛的風格。杭州第十一中學去年則設置了「智慧課堂行為管理系統」，聲稱可以鏡頭捕捉七種情緒，包括高興、難過、憤怒、反感、驚訝、害怕和中性，從而判斷學生上課是否專心，並在學生「雲遊」時知會老師。

使用這技術執法的當然不限於中國，拉脫維亞、匈牙利和希臘就測試過一套名為iBorderCtrl的出入境「測謊」系統，旅客要預先在其網站口頭回答虛擬關員的查問，系統透過鏡頭觀察他的微表情，再在入境時由職員核對指紋、容貌、護照等，得出一個以100為滿分的分數，讓關員參考旅客是否可信。

英國公司WeSee行政總裁David Fulton對《英國廣播公司》（BBC）聲稱：「即使使用低畫質的影像，我們的技術也有能力從一個人的面部表情、姿勢、動作，判斷他的精神狀態。在未來，地鐵月台的監視器可使用我們的科技來偵測可疑行為，並就潛在恐怖襲擊向當局發出警報。同樣也可用於多人聚集的活動如足球比賽或政治集會。」他並補充，「大約有60%至70%準確率。」

曼徹斯特都會大學研發的iBorderCtrl，以AI分析旅客微表情並給予分數，判斷是否說謊。（曼徹斯特都會大學）

而向美國聯邦調查局（FBI）銷售擷取手機數據軟件的Oxygen Forensics，本年7月在其產品中加入人臉及情緒辨識功能。營運總監Lee Reiber說，可幫助警方搜證時在成千上萬的照片中分類，可從中就特定容貌搜尋，也可過濾不同種族、年齡層，以及情緒如「喜悅」和「憤怒」。Reiber承認這工具並非完美，但可助探員加快工作，又強調調查過程中，線索需要以多種方式檢驗：「我希望盡可能取得最多碎片，再把他們重構成完整圖畫。」

繼續閱讀︰辨識人臉表情　等於讀懂「情感」？

相關文章︰

三藩市帶頭立法禁用　多地密切跟進監管人臉辨識

質疑警方執法受阻　多個組織反對禁用人臉辨識

學者力撐禁用　人臉辨識「對社會有毒」

人臉辨識成多國執法新潮　環形監獄時代來臨？

人臉辨識無法可依　是時候監管了？

人工智能測謊　將成執法新潮？

以人工智能測謊　重蹈偽科學歷史覆轍？

冠人工智能之名重臨　測謊機器為何陰魂不散？

上文節錄自第191期《香港01》周報（2019年12月2日）《人臉辨識升級　從表情讀懂情感？》。

更多周報文章︰【01周報專頁】

《香港01》周報，各大書報攤、OK便利店及Vango便利店有售。你亦可按此訂閱周報，閱讀更多深度報道。

【科技．未來】人臉辨識升級 情感辨識應用遍地開花

【科技．未來】人臉辨識升級　情感辨識應用遍地開花