美國大選2020|拜登料壓倒性大勝 問題是:民調可信嗎?
2020美國大選臨近,民主黨總統候選人拜登(Joe Biden)在全國民調上一直領先特朗普(Donald Trump/川普),經過數個月來的新冠疫情與反種族歧視示威衝擊更讓此等情況難見轉寰之機。路透社更曾引述共和黨消息人士指慣常在Twitter上批評「假民調」的特朗普曾私下承認自己落後拜登。
無論是根據美國選情網站270toWin、RealClearPolitics等的大選地圖、《紐約時報》按照民調的各州分類,還是《經濟學人》企圖預測大選勝負或然率的複雜模型,拜登都呈現出幾乎「躺贏」的形勢。
然而,有過2016年民調與模型都指向希拉里大勝,而特朗普卻「黑馬跑出」的慘痛教訓,美國選民對民調似乎是「一笑置之」,心中仍有對「特朗普奇蹟」再次出現的預期。根據過去數月的民調,雖然拜登民望穩定領先特朗普,可是較多選民依然認為特朗普會再次證明民調為錯,反勝拜登。
首先,由於沒有任何民調可訪問一個地方的每一個人,因此民調的直接結果不能不加以權重分配,以使得民調採得的樣本能反映當地人口的特徵。例如以固網電話進行的民調,很可能會使民調樣本集中在中年女性之上,因此民調得來的結果就要給予其他年齡層和性別更多的權重,以反映這些群組在民調當地的人口比例。
可是,要選擇什麼特徵去作權重,則是一個爭議不止的難題。在「特朗普奇蹟」的陰影下,民調(以及以民調為基礎的預測)還可以相信嗎?
學歷高低成民調權重關鍵
第一,由於沒有人能夠為所有人口分類去作權重,我們必須選擇一些與投票結果相關的特徵去作衡量。例如,如果一個人的工作地區與他的投票傾向幾乎沒有關係的話,民調就不會以工作地區作為特徵去作權重分配。可是,要篩選出有意義的權重特徵卻非易事——這更造成了2016年選舉民調的一大失誤。
當年的全國性民調顯示希拉里會勝出普選票大約3%,最終希拉里的普選票的確比特朗普多2%,其準確度其實不低。同時,美國大選民調對普選票的預估與實際結果誤差,已從1936年的12個百分點,跌至2016年的兩個百分點左右,屬史上一大低點。其實,當年估計失誤的主要問題不是出於全國民調,而是出於各州民調。
在2016年大選以前,民調機構普遍認為學歷高低並不是影響投票傾向的主要因素,因此即使學歷高低與民調訪問回應率有正向關係,不少州份的民調機構也沒有將學歷作為權重分配的一部份。這在2012年的選舉中影響不大,因為當年佔人口比例較高的本科畢業人士小規模傾向投票給共和黨,而佔人口比例較低的碩士或以上畢業人士則明顯傾向支持民主黨,兩者相減之後,即使高學歷人士更願意接受民調訪問,這現象也不會構成太大影響。
然而,到了2016年的選舉,學歷高低與會否投票支持民主黨卻成為了明顯的正向關係,無論是在全美國的層面,還是在當年特朗普勝選的關鍵州份賓夕法尼亞州(Pennsylvania)、密歇根州(Michigan)、威斯康星州(Wisconsin)亦是如此。然而,當年選舉之前,民調機構當然也沒有「先見之明」,在上述三州有將學歷高低作權重分配的民調只佔總數18%至33%不等,而在全國層面,有近半民調也沒有計算這個因素。最後,當然是大大失算收場。
汲取了這個教訓,本年不少民調機構也將學歷採用為權重特徵之一,相信2016年之誤該可解決。
特朗普支持者拒絕回應民調 或造成誤差
不過,在如今特朗普終日大罵(對他不利的)民調「造假」之際,特朗普的支持者也許會更傾向拒絕民調訪問,民調機構在權重分配問題上似將遇上另一難題:到底「黨派認同」應否作為權重分配的人口特徵之一?
此權重的根本問題在於,與年齡、性別、學歷等相對固定的人口特徵不同,黨派認同並不能從官方人口普查的數據中得到確切數字,因此民調機構若要以黨派認同作權重分配的話,也只能自行估算,或者依賴前次選舉的票站調查數據作準。對此,美國全國民調評議會(NCPP)就批評以黨派認同作權重「是個猜測遊戲多於好的理論」。
雖然根據美國民意研究學會(AAPOR)對2016年大選民調的詳細研究,他們驚訝地發現其實民調即使沒有權重分配,也沒有壓抑特朗普支持者的民意;然而,這會否因為特朗普大罵民調而改變,則尚屬未知之數——如果共和黨人因特朗普的言論而拒絕回應民調的話,黨派認同的權重爭議也可能會構成民調結果與現實之間的落差。
選民拿不定主意的難題
除了難解的權重問題之外,2016年的民調錯估,還有「選民到最後一刻才作出投票決定」的問題。
回顧當年,到了兩黨選情熾熱的8月底,根據當時一項《經濟學人》與YouGov的大選民調,支持第三黨候選人或其他人、不確定投票選擇,以及可能不投票的受訪者佔所有受訪者高達21%。而根據上述美國民意研究學會的報告,美國全國有13%選民到選前最後一個星期才作出投票決定,此類選民投票給特朗普的比例比投給希拉里的高出3個百分點,而在左右大選的賓夕法尼亞州、密歇根州和威斯康星州,這個差距更分別高達17、11和29個百分點。
兩黨之間投票意向不明的選民比例如此高,當然促成了當年民調預測失準。然而,如今美國兩黨分裂成風,選民投票意向的確定性就遠較2016年為高。根據《經濟學人》與YouGov在本年同在8月底進行的民調,表示將投票給其他人、不確定或不投票的受訪者比例只得8%,比上述數字低一倍以上。因此,可以預見,本年的民調預測的準確度,至少在此層面而言,會比2016年為高。
在大選民調較普遍加入學歷水平權重、選民投票意向較早確定的情況下,本年的美國大選民調原則上應該會比2016年更有參考價值。不過,這次大選民調的一大變數卻是網上民調的冒起。
網上民調大行其道
過去,民調通常透過固網或手提電話號碼隨機抽樣進行,然而由於人們的回應率比過去大幅下滑——根據皮尤研究中心(Pew Research Center)的數字,其在1997年的回應率為36%,到了2019年底則只餘6%——使用電話進行民調的成本愈來愈高。於是,隨着互聯網的普及,網上民調就大行其道,目前常被引用的美國選舉民調機構,諸如YouGov、哈里斯民調(Harris Poll)、莫寧諮詢(Morning Consult)也有將民調移至網上。
根據《紐約時報》5月的一篇文章統計所得,本年4月期間美國有半數進行特定州份大選民調的機構皆使用網上民調;相較之下,在2018年中期選舉最後三周,只有10%期間有進行選舉民調的機構使用網上民調。
當然,網上民調也是種類繁多、可靠度不一。例如皮尤研究中心就會以傳統手法隨機揀選目標受訪者,再通知他們回應網上民調問題,並為不能作回應網上民調的目標受訪者提供「網下」的選項。
可是,不少機構為減省成本,則採用「主動選擇加入」(opt-in)的網上民調手法,再透過背後的各種人口數據,以複雜的權重分配方式,去用低成本的手段試圖做到傳統民調反映關乎全體民眾現象的目標——YouGov就是此中的表表者。
然而,由於要求受訪者「主動選擇加入」使民調失去了抽樣的隨機性,此等民調的準確度也未必能有保障。皮尤研究中心一項2016年公布的研究就顯示,網上民調的誤差,與全國性聯邦調查作比較的話,可高達6至10個百分點。網上民調湧現會否導致本年大選民調再次失準,確實值得觀察。
上文分析完大選民調的各種準確性考量後,我們也許可以回到原來的問題:到底此刻的大選民調還可以相信嗎?
答案當然是:可以信,但不能盡信。說到底,民調其實只是以簡單的數字去呈現複雜現象的嘗試。正如我們用一紙大學文憑去代表一個人的知識水平一般,沒有簡單的呈現,我們難以有效了解世事,然而簡單的呈現本身卻不能被等同於複雜的現象。
更重要的是,選舉民調本身其實就是選戰之中的其中一個能夠左右選情的力量,能夠左右候選人整個競選工程的走向。試問一個牌局內的人又怎能確切地反映整個牌局?大選民調的參與價值確有高低之別,可是它們只能是選舉的一個側面,永遠不能觀照全局。