Werden wir Helden für einen Tag

Home | About | Archive

Pareto Principle

Posted on Jul 16, 2007 by Chung-hong Chan

scale-free.png
圖片來自Wikipedia,以GFDL發報

今日聽所謂「名士」討論。我無意加入討論,我反而想講講數學/統計學。
其實整個「名士」討論,講來講去都是Rich get richer.
我們可能錯誤地認為,任何網絡都是Random network,即是A點和B點與A點和C點相聯的可能性是一樣的。要是網絡是這樣的話,一個網誌被聯的可能性,是鐘型分佈的。 ((Normal distribution)) 於是乎有些人覺得A點突然多人連過去,是有人做媒、是製造人氣 ((要是連結數等於人氣的話)) ,將一些人推向鐘型曲線最高的一邊。是造神!
但事實上很多的研究發現,無論互聯網好、人際網絡好甚至一些流行病學的模型都好,任何兩點相聯的可能性都不是一樣的。相反,一個點本來已經有的聯結數目愈多,這個點再被聯結的機會愈高。這就是Rich get richer的原因,數學上叫做Power law distribution。這種網絡叫做Scale-free network。
在Scale-free network,會有一兩點叫做Hubs的物體。是最多人連過去的。那些甚麼Six-degree separation/Small World Phenomenon,是討論在一個Scale-free network之內,你在六個連結之內一定找到一個Hubs。 ((在中文網誌圈,我想你在任何一個網誌,未必需要六個Link就會到達「聞見思錄」。)) 根據柏累托法則, ((Pareto principle)) 這些約佔整體20%的Hubs,會拿掉了80%的連結。
想想你的衣櫃,我絕不相信你衣櫃內每件衫被你選來穿的機會均等。反而,你衣櫃內有20%的衣服是你最愛穿的,而有80%時間你會穿這只佔衣櫃衣服總數20%的衣服。 ((同樣道理,一個圖書館有20%的書本的借出次數,是佔整個圖書館借出館藏次數的80%。更直接的例子,網民瀏覽的網頁時間,有80%是花在整個網絡20%的網站。))
這是自然法則。


Powered by Jekyll and profdr theme