看到HKBlogger Survey的報告,我有份參與填問卷。固然想了解一下結果,我實在敬佩HKBlogger有關人員的工作。
以下言論僅以學術角度討論,也非為Out smart任何人,我永遠只想做一些萬骨,不想一將功成。

看到男女比例。男的比例是46.3%(464/1001),女的比例是53.7%(537/1001)。報告說,受訪者性別比例相若。但其實我試過以此計算男女比例的95%信任週間,男為43%至49%,女為51%至57%。由於兩者的95%信任週間沒有交錯,故此表示女性受訪者明顯地比男性受訪者多。

在分析一欄,他們使用了Pearson's Correlation。Correlation analysis是Parameteric analysis,只能用於Continuous Variables而且呈Guassian's Distribution(例如每天看Blog時間,答案是24小時、15小時、1小時等等),而不是Categorical Variables(例如每天看Blog時間,答案是:5-10、10-15、15-20;或有無和別人寫Blog的經驗,而答案是「有/無」)。根據我的經驗,這樣的分析很多時都會製造假Positive Correlation。就算使用non-parametric analysis如Spearman's Rho也不太妥當。
更妥當的做法,是使用SPSS的Cross Tabulation(= n by n table),例如

有沒有與其他人一起寫blog X 一共參與幾多個Blog
__1個_2個_3個_4個_5個或以上
有_N人_N人_N人_N人_N人
無_N人_N人_N人_N人_N人

再使用Chi-square test for independence對比兩組(有沒有與其他人一起寫blog:有/無)參與Blog數的比例有否明顯差別。

另外,假如是一些Intervals vs Yes/No的,可以使用Chi-square test for trend(SPSS內建沒有此Test,可使用Prism In-Stat,或自行寫Script)看看Intervals增加會否增加Yes的Proportion

由於沒有Raw data,難以再進行分析。

我不是讀Social Science出身,對Social Science的Research method不太執悉。以上僅為Statistics的Basic Assumption,如果Social Science Research有任何Exceptional case,我可不知道的。