metaregression_scale.jpg

我的睡房生物統計研究,已經去到三號機。一號機被某大期刊Accept了,二號機向某小期刊投文了,三號機正在「文心雕龍」當中。其實還有四號機和五號機在腦海中,但因為三號機是最賣錢,所以做三號機先。我甚至想為這些研究改Codename,例如Columbus
要進行三號機研究,先要精進自己的R(一種主要用作統計分析的程式語言)及統計學基礎。最近要精研一種叫Meta-regression的技術,以及在R plot圖的技巧。上圖是其中一個實驗品,數據是來自一個十分經典、在1994年刊登在JAMA的薈萃分析(meta-analysis,將多個研究用統計學方法進行整合的方法)。這個研究綜合了十多個兒童接種卡介苗(Bacillus Calmette-Guérin, BCG)與肺結核(Tuberculosis, TB)關係的研究。收集的研究,是比較有接種卡介苗和沒有接種卡介苗的兒童,患上肺結核的比率。這個研究發現卡介苗可降低兒童患上TB的風險。但此研究意外地發現,研究進行地點的緯度,會影響卡介苗的效能。總的來說,緯度愈增加(即愈離開赤道),卡介苗的效能愈強(Estimated Log(OR)愈Negative)。原作沒有這圖,是我繪製的,圓圈的大小是研究的參加人數。愈大代表人數愈多。
當然,有可能緯度真的有影響。香港其實都幾近赤道,可能卡介苗的效能不強也說不定。但是根據分析,在近赤道的國家當中,只有香港、新加坡和台灣被世界銀行定為高收入國,其他主要為低收入國。其他高收入或中收入國家,主要集中在溫帶及寒帶。近赤道國家經濟差公共衛生自然都差,幾乎肯定TB的風險會更加之高。這也許是解釋BCG在赤道地區效能差的原因。(這一段有點像梁生的皮毛)
其實這一篇是自我陶醉用,無咩人睇得明,因為我用了星期六一整個上午才找出繪製這張圖的方法。