不少人都有看主場新聞的立法會選舉勝算分析,但我覺得這個所謂勝算分析太過 ballpark ((外文 ballpark figure 是指隨便估計的數字,但我認為也可以照字面解,是細路仔玩泥沙)) 。原因有三:
1. 其勝算只建基於一個時間點的民調結果
2. 「五五波」的定義不清
3. 「勝算」不是百分比
由於以上原因,我決定要挑戰這個主場新聞「勝算分析」,推出陳電鋸「勝算分析」 ((最少我的方法要解決了以上三個問題)) 。
我知沒有太多人想知我是怎樣做到,先講結果,有興趣人士才看看下面附上的方法論。大約的方法是用電腦模擬,就像模疑舉行了五千次選舉,再計算各候選人獲得幾多席。
我暫時只計算了港島區的結果。我會更新這個 Post ,再加上其他區的結果。
港島區
cand | name | prob | |
---|---|---|---|
10 | 10 | 陳家洛 | 4953 |
12 | 12 | 曾鈺成 | 4904 |
8 | 8 | 葉劉淑儀 | 4868 |
2 | 2 | 單仲偕 | 4653 |
4 | 4 | 劉嘉鴻 | 3732 |
7 | 7 | 何秀蘭 | 3729 |
3 | 3 | 勞永樂 | 2850 |
9 | 9 | 王國興 | 2589 |
5 | 5 | 鍾樹根 | 1149 |
17 | 10 | 陳淑莊 | 790 |
13 | 13 | 劉健儀 | 681 |
15 | 2 | 楊森 | 98 |
14 | 14 | 吳文遠 | 2 |
16 | 8 | 黃楚峰 | 2 |
1 | 1 | 許清安 | 0 |
6 | 6 | 吳榮春 | 0 |
11 | 11 | 何家泰 | 0 |
九龍西
cand | name | prob | |
---|---|---|---|
5 | 5 | 蔣麗芸 | 4940 |
6 | 6 | 黃毓民 | 4867 |
2 | 2 | 黃碧雲 | 4707 |
9 | 9 | 毛孟靜 | 4360 |
8 | 8 | 梁美芬 | 4266 |
3 | 3 | 譚國僑 | 1811 |
10 | 5 | 葉傲冬 | 38 |
11 | 6 | 嚴達明 | 10 |
12 | 8 | 楊永杰 | 1 |
1 | 1 | 黃以謙 | 0 |
4 | 4 | 黃逸旭 | 0 |
7 | 7 | 林依麗 | 0 |
九龍東
cand | name | prob | |
---|---|---|---|
1 | 1 | 梁家傑 | 4933 |
6 | 6 | 陳鑑林 | 4925 |
2 | 2 | 黃國健 | 4684 |
5 | 5 | 胡志偉 | 4028 |
7 | 7 | 謝偉俊 | 3097 |
8 | 8 | 黃洋達 | 2745 |
3 | 3 | 陶君行 | 435 |
11 | 6 | 黎榮浩 | 103 |
10 | 1 | 譚文豪 | 50 |
4 | 4 | 嚴鳳至 | 0 |
9 | 9 | 譚香文 | 0 |
新界西
cand | name | prob | |
---|---|---|---|
16 | 16 | 譚耀宗 | 4999 |
7 | 7 | 郭家麒 | 4990 |
11 | 11 | 梁耀忠 | 4969 |
4 | 4 | 陳偉業 | 4852 |
8 | 8 | 田北辰 | 4825 |
15 | 15 | 李卓人 | 4795 |
14 | 14 | 李永達 | 4719 |
2 | 2 | 麥美娟 | 3989 |
20 | 16 | 龍瑞卿 | 3086 |
17 | 7 | 余若薇 | 1250 |
3 | 3 | 陳樹英 | 1187 |
1 | 1 | 梁志祥 | 811 |
12 | 12 | 陳恒鑌 | 361 |
19 | 11 | 黃潤達 | 153 |
18 | 8 | 張慧晶 | 7 |
6 | 6 | 曾健成 | 3 |
10 | 10 | 陳一華 | 3 |
5 | 5 | 麥業成 | 0 |
9 | 9 | 何君堯 | 0 |
13 | 13 | 陳強 | 0 |
新界東
cand | name | prob | |
---|---|---|---|
1 | 1 | 梁國雄 | 4957 |
3 | 3 | 劉慧卿 | 4957 |
9 | 9 | 陳克勤 | 4903 |
13 | 13 | 田北俊 | 4903 |
15 | 15 | 湯家驊 | 4525 |
10 | 10 | 張超雄 | 4190 |
7 | 7 | 陳志全 | 3278 |
6 | 6 | 葛珮帆 | 3193 |
2 | 2 | 葉偉明 | 3003 |
5 | 5 | 龐愛蘭 | 2351 |
14 | 14 | 黃成智 | 1731 |
20 | 3 | 柯耀林 | 1048 |
18 | 18 | 方國珊 | 1014 |
12 | 12 | 范國威 | 947 |
4 | 4 | 梁安琪 | 0 |
8 | 8 | 邱榮光 | 0 |
11 | 11 | 蔡耀昌 | 0 |
16 | 16 | 何民傑 | 0 |
17 | 17 | 龐一鳴 | 0 |
19 | 19 | 陳國強 | 0 |
Methods
模擬參數計算
我只利用 NOW 和 HKUPOP 合作的民調數據。我用上的是 8-8-2012 至 5-9-2012 的數據。每個候選名單都會計算綜合多次滾動民調的加權平均支持度及其加權標準差。由於較新近的數據可信性較高,故此加權較重。
蒙地卡羅電腦模擬
根據每個候選名單的加權平均支持度和加權標準差,都代表一個常態的概率分佈,可以根據該分佈來隨機抽出可能的得票率。以電腦進行 5000 次模擬選舉,再計算出這 5000 次模擬選舉每個候選名單所獲得的議席數,再據此計算勝算。假設甲名單在 5000 次模擬選舉有 1000 次可以獲得一席, 500 次可以獲得兩席。那麼,甲名單排第一位候選人的勝算是 (1000+500) / 5000 = 30% ,排第二位候選人的勝算是 500 / 5000 = 10% 。這個蒙地卡羅模擬除以亂數產生器解決支持度難以掌握的問題,更可以將名單人數、議席數等等的因素都計算在內。
Update 6-Sep-2012 : Now TV 九月六日的滾動民調不提供確實數字。可能要改用 Cable 數據。