Credit: HKUPOP

在討論遊行人數問題,最 vocal 的是港大葉兆輝教授。他說:「如果有 22萬人參加,每一分鐘要有八百幾人,操兵都冇可能。按正常步速計,若民陣數字準確,遊行應該喺凌晨 1時先結束。」
我聲明,我是純粹是以統計學角度去討論這個問題,我在上一篇文已經討論過遊行人數的意義。我並不同意質疑 22 萬這個數字等於抹黑或者淡化今年七一。
網上對葉兆輝教授的質疑,很多都並不科學。葉氏也應詳細公開統計方法,根據明報的報道,計算法是「遊行當天率領8名研究生在銅鑼灣波斯富街和金鐘軍器廠街,每5分鐘抽1分鐘數人,平均數乘以遊行時間,得出數字約為5萬人。工作人員作抽樣調查,約兩成人是中途插隊,因此估計總人數約為6萬」。單看統計法,作為 estimation 是 valid 的,當然要抽秤,也是有方法的,而且一定有差異。例如計算時是抽樣每五分鐘抽一分鐘計算人數平均值,為 sample mean 而不是 population mean ,有 sampling error 。故此有需要作 point estimation ,即 6 萬以外的 Interval estimation 。也即是計算每分鐘行過人數之 sample mean 的 confidence interval 。但是,就算計了 interval estimation ,我認為上下限不會像如今多了十幾萬人。
網上反駁的討論,指 0371 警方估計有 35 萬人,也是多於每分鐘八百人。 ((對葉氏的背景的質疑,是無助討論的。))
流速,是等於途經人數除以時間單位。
零三年的流速,與今年的流速是不能比較。第一,零三年警方開放了軒尼詩道的東西行線,包括電車路,即上圖的一至八號路線。而今年只開放了一半,並不包括電車路,即上圖的一至三號路線。故此,今年途經人數,由於路的闊度減少,人數會減少。流量無論如何都會比零三年少最少一半。
第二,今年遊行人士的步速因為警方不停閘人,也肯定比零三年慢。
集合以上兩個因素,今年的流速,應該是零三年的最少 50% 。 ((未包括警方閘人減慢流速的影響))
另一個質疑,是在 twitter 見到。「平均每秒只有6個人出維園」,也不準確,原因如下。
「平均每秒只有6個人出維園」的計算法,是 54000 人 / 9000 秒 = 每秒 6 人。分母的 9000 秒,是指市民全數步離維園的時間。這個計算法的問題是,分母被誇大了。這個計算法,是假定警方從來沒有在維園門口閘人, 9000 秒都容許遊行人士離開。根據我在維園的經驗,根本有約 80% 時間都在等,其餘時間都只是龜速前進。所以,「警方放行時間」,一定是 9000 秒再打折。至於打幾多折,我不知道。
此外,根據另一學者鍾庭耀的統計 ((其統計法比葉氏嚴格。但是,葉和鍾的統計數字竟然類似,代表兩者的統計法可能在互相 validate 。)) ,人潮最高峰的廿分鐘,共有 5130 人步過軒尼詩道與軍器廠街交界行人天橋。以此計算,每秒鐘只平均有 4.3 人步過 (5130 / 1200 = 4.3) 。