Meta人工智能「外交」玩贏人類 「AI烏托邦」離現實有多遠?

撰文:葉德豪
出版:更新:

隨着近年深度學習的人工智能(AI)興起,人們對於另一個「烏托邦」的到來又有了一番期許——當AI可能取代人類大部分工作、全球生產力急速上升,人們就可以不用上班、永遠放假,並透過政府向企業徵收的「AI稅」大派福利過活。11月22日,前身名為「Facebook」的Meta在《科學》(Science)期刊公布其「西塞羅」(Cicero)AI在「外交」(Diplomacy)遊戲中的驚人成績,被視為AI發展的另一個里程碑。

在各種遊戲中擊敗人類,過去數十年也是AI進展的象徵。1997年,IBM的超級電腦「深藍」(Deep Blue)擊敗了西洋象棋世界冠軍卡斯帕羅夫(Garry Kasparov),震動世界,也完全改變了今天人類象棋比賽的樣態。2016年,Google母公司Alphabet旗下DeepMind的AlphaGo在圍棋上擊敗韓國棋王李世乭,也間接促成了後者在2019年的退役決定。

然而,相比起象棋又或者圍棋,甚至是星際爭霸(StarCraft)的遊戲,「外交」對於AI而言是一個根本上不一樣的難題。「外交」是一種發明於1954年的策略遊戲,遊戲將歐洲分成75個省,玩家可建立和動員軍隊佔領省份,直至有人控制大多數所謂的「供應中心」為止。遊戲的特點是玩家與玩家之間必須以一對一的「私下溝通」嘗試聯合行動、建立同盟又或者欺騙對方等等。經過溝通過後,每一位玩家都寫下自己在一個回合內的行動,然後同時公開執行。

這套遊戲要求AI能夠以人類的自然語言與其他人類溝通,並且將自己計劃中的行動以人類語言讓他人明白、從他人的語言中理解到他們計劃中的行動。而且,由於欺騙等人類溝通特徵的存在,這一套AI還要能夠從對手的言語中猜測到對方是在講真話還是在講假話、懂得不要向對手透露自己的真正意圖等等。這大概需要AI去模擬出一套「心智理論」,可以從別人過去的行動、別人的溝通、別人對自己行動的預測等等去推測出別人到底會作出什麼決定。

西塞羅(CICERO)與人類玩家的談判例子。(Meta論文原圖*)

由於上述這些特徵,「外交」遊戲遠較象棋和圍棋複雜,在AI的訓練上面也更為麻煩——圍棋之類有明顯規則,AI的訓練可透過自我模擬棋局演練而進行。

但最終,Meta的「西塞羅」AI在網絡版的「外交遊戲」中卻有驚人成績:在40場遊戲中,西塞羅在所有玩過一場遊戲以上的玩家中排名前10%,其得分中為數為25.8%,是其82個對手所得的平均數的兩倍;而在有21個玩家參與的8場聯賽中,西塞羅更排名第一。在整個試驗之中,沒有任何人類玩家在賽內溝通中發現西塞羅不是人類而是AI,而只有一位玩家在賽後溝通中曾質疑西塞羅可能是個程式機械人。

Meta在其博客文章中就表示,西塞羅是建立能與人談判、說服別人且與人類合作的AI的一個突破。我們可以想像,如果西塞羅能進一步完善,並運用在不同的領域之中,很多不同行業也能被AI取代,從寬頻網絡的客戶服務員到律師也是如此。雖然行業被取代看起來是一個悲觀的未來,但配合起我們「烏托邦」想像中的政府財富再分配政策,這不失為烏托邦科技基礎中的必要一環。

不過,根據美國人工智能學者和作家Gary Marcus的分析,在「外交」遊戲的具體表現之上,西塞羅確實驚人,在一個動態世界的語言和行動整合中達至廣度和廣度都前所未見的整合,而且能夠與人類進行前所未見的複雜互動。但類似西塞羅的AI真的能輕易擴展到其他範疇之上嗎?

Marcus對此提出了兩點疑慮。首先,西塞羅的的模型結構非常複雜,也全為玩好「外交」這個遊戲而設,很大可能不能簡單複製到其他領域的用途上面。

西塞羅AI模式的大體結構,其具體細節還比此圖例複雜。(Meta論文原圖*)

其次,由於「外交」遊戲遠較圍棋等繁瑣,並不能透過電腦自行模擬賽局作訓練,用於其訓練的據數往往需要人類的介入,成本極高。為了訓練西塞羅,Meta團隊收集了「外交」遊戲網站中的12.53萬場人類玩過的比賽記錄,當中還包括4.04萬組對話,當中總共和1,290萬條個別訊息;而且為免西塞羅在談判時發出沒有意義、劣質或沒有戰略價值的資訊,西塞羅的模型中還包含了資訊過濾模型,此模型的訓練數據也來自人手編製。

目前,如果是純語句的數據,網絡上是有大量供應,但類似「外交」中由遊戲狀態、人類溝通與人類行動互相交纏在一起的數據,卻是極難獲得的。這套遊戲的相關數據幸好有網上遊戲平台代為收集,但試問寬頻客戶服務部有沒有類似的相應系統性數據收集?

Marcus認為,即使建立似類西塞羅這種AI背後的工作模式可用於解決其他問題,但西塞羅的具體架構對於解決其他問題大概是不適用的。而西塞羅在「外交」遊戲上的成功,也間接突顯出AI的局限:其複雜的先天架構,似乎顯示出AI的發展不只是製造愈來愈大的模型,而且其成功也不能支持有一套能用於所有領域的單一普及程式的想像。

AI在個別領域上的成功,是不可忽視的;其在自然語言處理上的成就,更是驚人的,甚至讓一些有識之士從與AI的對話中得出AI是有心靈的結論。但我們離「AI烏托邦」還非常遠,而且AI的發展更未必會向着不斷拉近這段距離的方向發展。

*Meta論文連結:https://www.science.org/doi/10.1126/science.ade9097