由於星期六日不用上班,而這個研究的數據在公司電腦,故此沒有更新星期六最後衝刺的三個數據,分別是蘋果日報/港大的最後一次滾動調查、港大民意研究計劃的最後一次民調及嶺大的最後一次民調。將數據都加入後,總計民調數字是 41 個,總人次為30283。最終的「薈萃分野」是 11.80% (95% CI: 10.52% to 13.08%) 「森林圖」如下。
最終的點票結果如下:
陳方安生比葉劉淑儀多獲 11.95% 的選票。此數字在「薈萃分野」的 95% CI 之內,亦只比「點估計」 ((Point estimation)) (即 11.80%)多 0.15% ,數字相當準確。「薈萃分野」也比最後一天發表的新鮮民調為準(十二月一日發表的民調 margin 為 0.13, 0.086 和 0.064 )。
大眾傳媒常常將民調支持度的增減大造文章。其實只要民調的次數愈多,愈可能見到兩太支持度極端的差距。將多次民調的分野畫成正方圖 ((histogram)) ,可見到兩太支持度的分野是常態分佈的。 (Shapiro Wilks Test, W = 0.9846, p-value = 0.8437)
我懷疑根本所有的所謂支持度增減只是抽樣誤差 ((Sampling error)) ,其實兩太的支持度是沒有怎樣明顯因為選舉工程而增加減少。
將各民調兩太的分野化為理論上的常態曲線 ((Normal Curve)) ,最終實際的分野 0.1195 ,在常態曲線的 51% 位置。就算不用薈萃分析,僅以中心極限定理去解釋都解得通。
我上了統計學寶貴的一課。希望各位新聞從業員、學者、政黨中人,都學習一下簡單統計學。最後多謝以下團體進行民調,為本計劃提供數據:香港大學民意調查計劃、嶺南大學公共管治研究部、蘋果日報、香港研究協會及南華早報/ TNS 。還有 R 統計軟件的公開源碼開發社群。
前文: How to report a research? 終極篇之 Meta analysis [更新]
延伸閱讀:東南西北