smallmeta3.png
【摘要】

簡單講,係綜合了多次民調的結果。 ((註:我沒有得到有線的調查數字)) 得出的數字是陳太約比葉太支持度高12.00%(95% CI: 10.67% to 13.34%)。
星期日祝八位候選人好運。投票結果公佈後會看看實際結果與統計結果的差異。


【詳細報告】

數據來源:

數據是來自蘋果日報和香港大學合作的滾動式民調 ((蘋果日報)) 、香港大學民意網站 ((http://hkupop.hku.hk/chinese/features/LC2007/index.html)) 、香港嶺南大學公共管治研究部 ((http://www.ln.edu.hk/pgp/pdf/HKIBElection(20071127).pdf)) 、香港研究協會 ((http://www.rahk.org/research/326/326newsX.pdf)) 及香港南華早報。本分析未能獲得有線電線委托香港大學民意調查計劃進行的滾動式民調的數據。總共獲得 38 次民調的結果,總計參加人數為 27713 人。

分析方法:

主要目的,是要計算陳方安生與葉劉淑儀在多次民調支持度的分野。( Margin )再以薈萃分析( Meta-analysis) 的方法計算出「薈萃分野」( Meta-margin )。以薈萃分析方法分析民調,普林斯頓大學的 Prof Wang 有用於 2004 年美國總統大選。當年他也是以類似手法計算克里及布殊預計獲得的選舉人票,最後得出來的數字竟與實際完全一樣。 ((http://election.princeton.edu/))
本分析將以隨機效果模型 ((Random effect model)) (DerSimonian-Laird 方法 ((DerSimonian R, Laird N. Meta-analysis in clinical trials. Controlled Clinical Trials 1986; 7:177-188.)) )計算的總合「薈萃分野」。使用隨機效果模型而非固定效果模型 ((Fixed effect model)) ,是因為各民調之間,結果有明顯的異質性。(Heterogeneity ((表示結果不一致)) )。各個民調在綜合時,將會以「反變異數」 ((Inverse Variance)) 加權。「反變異數」與民調的參加人數成正比,故此民調參加人數愈高,其於「薈萃分野」所佔比重愈大。
由於薈萃分析樣本數較細,學術界的慣例是將 Type I Error rate 由常用的 5% 增加至 10% ,去降低 Type II error rate 。故此本分析以 p < 0.1 為統計學上明顯。 ((Gavaghan DJ, Moore AR, McQay HJ. An evaluation of homogeneity tests in meta-analysis in pain using simulations of patient data. Pain 2000;85:415-24.)) 本分析使用 R 作為分析軟件,使用的軟件包有 rmeta ((http://cran.r-project.org/src/contrib/Descriptions/rmeta.html)) (繪制 Forest plot)及 meta ((http://cran.r-project.org/src/contrib/Descriptions/meta.html)) (計算)。

詳細結果:

分析顯示各民調結果出現明顯的異質性( Q= 63.54, df=37, p=0.0043) 。故此用隨機效果模型綜合數字。以隨機效果模型計算出的「薈萃分野」為 12.00% (95% CI = 10.67% to 13.34%) 。此數字是明顯高於 0% 。( Z test for overall effect, Z= 17.6, p<0.0001)表示陳方安生比葉劉淑儀的支持度明顯為高。

結論:

綜合多個民調結果,數據顯示陳方安生比葉劉淑儀的支持度明顯為高,「薈萃分野」為 12.00% (95% CI = 10.67% to 13.34%) 。以數據推論,陳方安生可比葉劉淑儀多獲約 10% 的選票。

其他六位候選人有:柳玉成、李永健、蕭思江、蔣志偉、凌尉雲及何來。