拜登電話留言呼籲選民勿投票? 語音深偽或成破壞大選新武器

撰文:藺思含
出版:更新:

美國新罕布什爾州(New Hampshire)1月23日舉行全國首場總統大選的初選,拉開選戰帷幕,然而就在這場初選的幾天前,該州數千名選民接到的一通競選廣告電話卻驚擾了選民、競選團隊和專家。事件再次喚起人工智能「深偽」(Deepfake)技術在美國大選中的潛在影響…..

「你知道投票給民主黨人的重要性......我們需要你來幫助讓選票上的每一個民主黨人當選。」電話中的聲音酷似民主黨總統候選人、現任總統拜登(Joe Biden),他呼籲民主黨選民不要在即將舉行的初選中投票:「周二的選舉只會幫助共和黨讓特朗普再次當選。讓你的選票在11月發揮作用,而不是這周二。」一如普通的電話競選廣告,語音最後還提醒:「如果你以後不想再接到電話,請按2。」

但這並非平常的競選廣告。雖然語音一開頭就使用了拜登標誌性的口頭禪「真是一派胡言(What a bunch of malarkey)」,試圖增強說服力,但人們後來發現這是通過語音深偽技術人工合成的語音。

圖為2024年2月26日,拜登在紐約一間雪糕店吃着雪糕回應者問題。(Reuters)

所幸,由於民主黨今年一改傳統,將黨內首場初選改到南卡羅來納州(South Carolina)進行,而共和黨維持新罕布殊爾州的初選安排,這則AI廣告並沒有造成實質性的影響,但事件仍然在美國敲響警鐘。

隨着近年用深偽技術合成的逼真政治人物影片在網絡上瘋傳,加上前年ChatGPT橫空出世,新AI技術的出現一次次引發干擾民主選舉的討論。眼下,許多專家正發出警告稱,語音深偽可能才是真正的威脅——這些語音易於合成,製作成本低廉,而且特別難以追蹤。

幕後黑手:為警示公眾策劃

假拜登語音出現的兩周後,新罕布什爾州檢察長宣佈查明語音源頭為兩家德州公司,電話營銷公司Life Coporation以及Lingo Telecom,後者將自動電話錄音傳播給數千名選民(當中大多數為民主黨選民),兩家公司均被下令停止選民壓制活動。此外,美國聯邦通信委員會(FCC)同一周宣佈,在自動電話系統中使用人工智能生成語音屬於違法行為。FCC有權對在這類電話中使用人工智能聲音的公司處以高達逾23,000美元(每通電話)的罰款,或封殺提供人工智能聲音的公司。

此前,曾有兩位保守派騙徒用自動撥號電話(非AI合成語音)在非裔美國人聚居區製造假消息,稱郵寄投票可能會增加他們被逮捕、追討債務和強制接種疫苗的風險,最終被處以500萬美元(約3,900萬港元)罰款。

然而,直到2月底一名資深政治顧問Steve Kramer向媒體認罪,人們才找到案件的幕後黑手。Kramer表示,他花了150美元請了一位街頭魔術師幫助用人工智能程式製作拜登的深偽語音,目的是為了提醒美國公眾人工智能的政治風險。他認為當局在該問題上行動力十分落後,有必要加大執法力度,阻止這類事情發生:「即使是單獨行動的個人,也可以快速、輕鬆地利用人工智能達到誤導和破壞的目的。」

Kramer表示自己無意破壞選舉、壓制選民,他從策劃行動時便計劃在事後公開認罪。由於拜登在該州擁有很大優勢,他認為僅數千個電話不會對結果產生影響。

街頭魔術師花1美元、20分鐘假冒拜登

事實上,Kramer策劃的這齣戲確實證明了他的觀點。根據安全公司Pindrop對假拜登語音的分析,這段語音是通過美國人工智能語音公司ElevenLabs開發的產品生成。幫助Kramer生成語音的魔術師Paul Carpenter則對媒體透露,他只花了1美元、用了20分鐘就按照Kramer提供的文稿,複製出拜登的聲音。

2月12日,約旦國王阿卜杜拉(King Abdullah)訪問白容,與拜登會面。(Reuters)

過去一年間,人工智能的文本轉語音工具市場呈現爆炸式增長。除了ElevanLabs,Resemble AI、Respeecher和Replica Studios等初創企業均推出了廉價且有效的工具,Voice AI公司更提供免費的應用程式供用戶複製名人聲音。而微軟去年宣佈開發出的新模型VALL-E,更只需三秒鐘的錄音就能成功複製出聲音。這些面向大眾的產品普及,讓深偽技術不再是專業人士或技術迷的專利。

比深偽視頻更難辨別

有專家警告,這些深偽語音要比影片更難辨別。Meta前公共政策總監Katie Harbath解釋稱,使用深偽技術的影片中往往會有些觀眾容易察覺的蛛絲馬跡,如片段中出現的奇怪的陰影、模糊或不自然的動作等,但深偽語音則令人難以發現問題。事實上,在假拜登語音中,Pindrop分析發現的跡象則只有字母「s」及「f」的讀音較為不自然。此外,製作者更可以通過添加背景音樂、噪音等來掩蓋語音中的瑕疵。

圖為2024年2月27日,美国密歇根州底特律舉行初選,拜登和特朗普分別取得民主及共和黨的初選勝利。(Reuters)

儘管聯邦通信委員會在事件後果斷將這類行動納入違法範疇,但由於虛假電話語音難以追蹤,追查幕後黑手可能十分困難。波士頓大學新聞學和新興媒體助理教授Joan Donovan指,在網絡上傳播的語音會留下數碼痕跡,但電話傳播卻不會。而這次事件也是因兩位始作俑者向媒體認罪才得以真相大白,並非執法機構追查結果。網絡安全公司ZeroFox副總裁AJ Nash曾對美媒表示,電話深偽讓人得以「用非常低廉的成本發起一場聲勢浩大的假信息運動」。

隨着美國大選拉開帷幕,許多專家警告美國社會、政府對於這類身偽技術毫無準備,一旦不懷好意的人利用這些技術和選民登記數據庫採取針對性的行動,他們就如同擁有強大的武器,即使是最先進的選舉系統也無力應對。究竟語音深偽會否為今屆大選造成什麼影響,我們或許可以拭目以待。