chainsawriot

Home | About | Archive

Data visualization series: Warming HK

Posted on Dec 15, 2006 by Chung-hong Chan

這是一個新嘗試。好像梁生找衛星圖片講學
我們時常收到不少數據,但這些數據不會說話。令數據說話的方法,一是進行統計分析,二是畫圖表。與其看報紙那些亂畫的圖表,不如看我這些圖表。也可作為大眾統計教學之用,也可Sharpen我的S Programming技巧。
數據是來自天文台。我將數據用Linux的Gnumeric整理,再用R將本港在1997年及2006年(截至12月14日)的最低溫度數據畫成直方圖(Histogram)。
temp3.png
直方圖是表示了數據出現的頻率。在這副圖是表示某一溫度在該年出現之日數,棒愈長表示日數愈多。圖中粉紅色是1997年的數據,而紅色是2006年的數據。例如在5-10度那條長棒,見到2006年的頻率約是0.00至0.02之間。原來今年曾經有兩天的最低氣溫是低於10度,是在1月7日及1月8日。對比1997年及2006年,發現今年10-15度的頻率減少了。15-20度和20-25度的頻率兩年相約。但26度開始,我每隔1度就畫一條棒,因為出現頻率太多。政府說26度是理想溫度。對比1997及2006年,2006年26度的頻率大降、28和29度的頻率大昇。今年甚至出現過幾次最低溫度為30度。
見到這樣的統計圖片,希望你有一點點的反思。

如果你都想學習分析數據,可下載數據及S代碼(可在R及S-Plus運行)。

數據: weather.txt [是用Tab分隔的text檔,可用一般Spreadsheet如Excel、OO.o Calc軟件開啟。]
S代碼: weather_r1.txt - 可用R執行


Powered by Jekyll and profdr theme