此文不是給 General audience 看。

話說我在上學時,聽到教授如此的說:計算信任周間的時候,如果樣本數大於 30 時,我們應該使用 z 分佈而樣本數少於 30 時,應該使用學生 t 分佈。
無錯,一般的統計書都是這樣的說,這樣的說法,我想在一九七零年或以前都仍然成立。今時今日,根本不成立的了。
信任週間(CI)我記得以前寫過。是以樣本的數字(statistic)估計母數(Parameter)的方法。例如計算平均數的 CI ,計算法是這樣:

mean +/- z1- (Alpha/2) * (standard error)

以 z 分佈(即常態分佈)來計算母數的方法,追索歷史,早於177x 年棣美弗(Abraham de Moivre)的研究已有記載,他用樣本及常態分佈估計擲銀幣公和字出現次數的實質分佈。至數十年後再由拉普拉斯(Pierre-Simon Laplace)發揚光大。此一說法至皮爾生及費雪的年代仍然有效。皮爾生更加是這一派的表表者。但這一派的說法,其實有很大漏洞。例如我們要假定我們知道母體(Population)的變異數(Population Variance),才能計算出標準誤差。(Standard Error)假如我們知道母體的變異數,根本就不用計算信任週間。因為如果有時間做資料搜集得知母體的變異數,根本就會同時知道母體的平均數。完全不用以樣本「以小推大」計算信任週間。皮爾生一派指,如樣本數大於 30 ,樣本的變異數可用作估計母體的變異數。間接鼓勵人要用很大的樣本。
費雪派不認同此說法。他和「學生」戈斯爾認為應用 t 分佈。因為一般情況下我們根本沒有可能知道母數的平均數及變異數,亦不應用樣本變異數估計,由其是樣本數細的時候。 t 分佈不假定我們知道母體變異數。計算方法是

mean +/- t1-(Alpha/2), df= n-1 * (standard error)

為何至今仍存在「如果樣本數大於 30 時,我們應該使用 z 分佈而樣本數少於 30 時,應該使用學生 t 分佈」這個 Rule of thumb ?這是因為以前計算 z 分佈或 t 分佈,需要用到對數表。 z 分佈的對數表,就算相當精確,都只有一頁,而比較精確的 t 分佈對數表,有幾頁紙。 z 分佈計算 95% 信任周間,幾乎只需要記得一個數目字,就是 1.96 。而 t 分佈,卻要因應樣本數調校 t 數值。簡而言之,因為一個字,叫做:懶。現代計算機可以很快速的計出 t 分佈的數值,根本無需再懶。讓這種想法繼續存在,有點不負責任。

tdist.png

上圖是一些 Simulation. 當我們在不同樣本數,以 z 分佈的「神奇數字」 1.96 取代 t 分佈計算 95% 信任周間的偏差。以一般的 rule of thumb ,樣本數為 30 時,以 z 當 t 計 95% 信任周間,只會計出實質上為 94% 的信任周間。樣本數要達到 52 才能以「四捨五入」的方法計算得到 95% 信任周間。(94.45293%) ((你可能會話:「車!1% 啫!咁都要嘈?」我是那些連 Ubuntu 7.10 寫成 7.1 都要嘈的人。))

Update:

This graph is updated for clarification. Thanks to Fongyun for comment.
The previous graph is little bit mixed up with 2 tailed and 1 tailed value. The current graph is standardized to 2 tailed value.

td2.png

Click to enlarge.