以下這一篇我投稿到日月報作讀者來信。日月報論壇版的編輯在我將e-mail寄出之後4分鐘極速Reject,指論壇版只會刊登和時事相關的文章。雖然收到這個極速回應時,我曾經質疑蔡子強以中大前學生會身份投長文到日月報論壇版指港大學生會不應退出專上學生聯會是否「和時事相關的文章」,但我這個Underdog已經慣被Reject的了,也不會想太多背後的Secret Agenda。自己再看這篇文,就像咪咀唱歌已成Norm的今天,在娛樂版一個暗角有記者訪問所謂「唱家班」葉麗儀的兩句文字,老氣橫秋地指出浜崎阿由美開演唱會都咪咀是欺騙歌迷。再講講六七十年代最沒實力的歌手都不會咪咀之類的老套話。三個唱家班所被引述的話,都不及衛蘭衛詩對浜崎阿由美演唱會的讚嘆內文的十分之一。又或像講瑪雅文的電影阿波卡獵逃,只有幾間戲院上畫,每天一場。
- - -
醫學研究,多數是驗證「A和B相關」的假設。例如多吃維生素C可減少患上上呼吸道感染的機會。這個就是A(多吃維生素C)和B(減少患上上呼吸道感染的機會)相關的假設。要證明這個假設,我們要找一群人多吃維生素C,另一群人卻沒有,再比較兩組人患上上呼吸道感染的機會。如多吃維生素C的一組患上呼吸道感染的機會明顯較低,那就可以說多吃維生素C(A)和減少患上上呼吸道感染的機會(B)相關。
科學家宣稱A和B相關,寫在論文的文字,是「A和B統計學上有明顯相關」,因為他們用上了統計學上的假設檢定。假設檢定有一個名為「虛無假設」,這假設是指A和B是無關的。科學家通常會根據數據計算一個名為「P值」的數字。P值為一個概率,它愈細,推翻「虛無假設」的證據愈強。科學家常常會用P值小於0.05作為「統計學上明顯」的分界點。也即是,某科學家發現A和B相關的P值是0.049,他會說A和B是統計學上有明顯相關。如P值是0.051,他卻不會發出以上言論,因為他沒有足夠的證據去推翻虛無假設。以0.05作為分界點,指20次這些「統計學上有明顯相關」,有一次(1/20 = 0.05)純粹是因為事有湊巧所生成的「假相關」。
這在科學界已經引起討論。也因此,就算某人做研究發現A和B相關,也會有另一批人重覆這些研究去確定這些說法。近年甚至流行以薈萃分析(meta-analysis)去將幾個同類型的研究結合再進行分析。
傳媒在引述單一科學研究時,都要緊記這一點。傳媒在引述一萬個單一研究的結論,再引申出同樣數量的生活建議。根據以上的估計,有500個生活建議,是建基於「假相關」。傳媒未必有能力分辨某研究的結論是否為上述所指的假相關。我建議傳媒在引述科學研究時,應同時探討該研究的樣本數量、研究的方法,甚至研究的缺點等等,而非單單強調研究的結果引申出來的建議(take home message)。