Werden wir Helden für einen Tag

Home | About | Archive

1-7 series volume 1: How to interpret the figures from mass media about the 1st of July 2004 strike?

Posted on Jul 2, 2004 by Chung-hong Chan

今天日記想純粹以數學的角度去討論這些數字,而不想帶有任何政治目的。

民陣表示今年遊行人數達五十三萬,警方指為二十萬。

去年七一的數字,分別是民陣的五十萬,警方的三十五萬,以及港大精算系的三十五萬。去年的計算方法沒有公佈出來,但個人相信五十萬為上限。去年曾經在guestbook以統計學的方法爭論這個問題。最後的結論是0.37M +/- 0.11M。

去年民陣的數字比警方的高1.4倍。

今年的差異達到2.7倍。比較兩年的差異,在統計學上是極為顯著的。(卡方測試,p<0.0001)

假如仍以去年的差異去「估計」民陣公佈的數字,今年的數字該為二十八萬。

其實問題在於,兩者以不同的方法去估計遊行人數。

今年沒有港大精算,今天有的第三方數據來自明報。他們以電腦科技分析(包括使用圖片分析和衛星定位地圖)計算,今年的遊行人數該為26.4萬。他們的計算方法誤差為15%,那即是26.4 +/- 3.96。以三個標準差計算,最高上限也只是38.3萬。

我也公佈我diaryland遊行人數指數,去年參加遊行的diaryland團隊有七人,今年參加人數為五人,流失比率約三成。根據這個比例去估計人次流失比率,以diaryland流失指數計算人數為35.7萬。

參加者都應知道,遊行人數比去年少。個人覺得沒有必要將數字誇大過多,只會令人質疑數字的公信力。

民 陣發言人表示,他們的計算方法是建基於警方提供的數據。例如整個遊行路線可容納十七萬人(根據此數字,每平方米人數達到二點二人),維園可容納十一萬人, 而每九十分鐘行一程,共五點五小時。計算方法是,由零分至九十分鐘,街道沒填滿,至第九十分零一秒街道填滿一次,一百八十分鐘填滿第二次,二百七十分鐘第 三次,三百三十分鐘填了零點六六次,而到了第三百三十分鐘所有人都走完。總共填滿了三點六六次,根據以上數據,數字應為六十二萬。而不是他們公佈的五十三 萬。

他們發言人稱這為一個十分科學有科學根據的計算方法,但從他們只是引用警方的數據去計算,我很難相信這個方法有何科學根據。

總結是,今年的遊行人數,應在二十萬以上,因為警方二十萬此數的確是太細,平均計算每平方米只有零點七人。而最高可相信上限為三十八萬多。以上數字未計插隊者。計算插隊者在內,我個人覺得,民陣最多也只應公佈是次遊行人數上限為四十五萬人。

總結以上數據,本年遊行人數總平均估計值為32.6萬,標準差為十二萬。中位數是二十八萬。

當然,以上數字只當是遊戲一種,真正的遊行人數要一個一個的數才成。一切都只是估計。也陳u的有五十三萬人甚至更多也說不定。

17:03 - Friday, Jul. 02, 2004


Powered by Jekyll and profdr theme