在明報登了一篇文「佔領時代的facebook專頁版塊」,一如所料引起網上極大迴響。
這篇文的內容是我的博士研究最表皮的一層,由於這種數據公眾是想知的,而學術期刊又很少會刊登這樣描述性的研究,於是決定在報紙刊登。日後分析性的部份就只會在學術期刊刊登。
網上就這篇文的疑問,我決定以 faq 方式一一解答。
問:為何研究 facebook 分享網絡?
有人在網上說分享網沒意義。事實上分享網只是這個研究最表面而且公眾可以理解的部份,我有用其他更加怪異的方式建立網絡,詳情暫不公開了。
分享網極有意義可追溯到 Castell 的網絡社會理論,他認為網絡聯繫在一起的社會,每個個體的權力有不同方式量度。他認為在網絡裡其中一種建立權力的方法,是個體在網絡裡與其他個體分享同一興趣,因此再與其他個體建立更緊密的關係。故此,研究分享網有助我們認清哪個專頁具有較高權力。
此外,網上迷因(meme)也是透過分享網散播,現代的民意研究也發現,民意也是以分享觀點而建立。這是本研究的社會科學肌理,也是我們最先研究分享網的原因。
問:何謂中介度?與資訊提供者有何分別?
首先要講講研究的網絡是怎樣建成。假設有以下事實:
陳電鋸轉發了譚劍四次
陳電鋸轉發了陳浩基五次
陳電鋸轉發了喬靖夫六次
陳浩基轉發了譚劍兩次
陳浩基轉發了喬靖夫三次
譚劍轉發了喬靖夫二次
譚劍轉發了陳浩基二次
譚劍轉發了陳電鋸一次
喬靖夫轉發了譚劍二次
如果將以上事實轉成 adjacency matrix 就是這個樣子:
轉換成網絡圖就會是這樣:
圖中圓圈代表一個 Page ,箭咀代表資產流動方向。箭上的數字是引用次數。
先講講何謂資訊提供者,其實就是總引用次數。根據上表,可以計出:
陳電鋸被引用 1 次
陳浩基被引用 7 次
譚劍被引用 8 次
喬靖夫被引用 11 次
故此,喬靖夫是網絡內最強的資訊提供者。
順帶一提,另有一個計法叫 outdegree centrality ,都可量化資訊提供程度,就是每個圈箭咀射出次數。
陳電鋸射出 1 次
陳浩基射出 2 次
譚劍射出 3 次
喬靖夫射出 3 次
以 outdegree centrality 計算,喬靖夫也是網絡內最強的資訊提供者,譚劍也是三次。
好了,係時候說說甚麼是中介度。某個圈的中介度是指資訊流動時,步經該圈的次數。
我們可以找出由一個圈去另一個圈的所有 shortest path (geodesic) 。
譚劍去喬靖夫: 直達
譚劍去陳浩基: 直達
譚劍去陳電鋸: 直達
喬靖夫去譚劍: 直達
喬靖夫去陳浩基: 直達
喬靖夫去陳電鋸: 直達
陳浩基去譚劍: 直達
陳浩基去喬靖夫: 無法直達,陳浩基 -> 譚劍 -> 喬靖夫
陳浩基去陳電鋸: 直達
陳電鋸去譚劍: 直達
陳電鋸去喬靖夫: 無法直達,陳電鋸 -> 譚劍 -> 喬靖夫
陳電鋸去陳浩基: 無法直達,陳電鋸 -> 譚劍 -> 陳浩基
從以上的所有 shortest path 所見,步經譚劍次數最多,由此可見譚劍的中介度最高。
真實的 betweenness centrality 是比這個算法複雜一些,但精神就是這樣。
總而言之,如果某一個 Page 常被引用,也有不時引用別人,就較有機會有高中介度。正如我在文中所言,如果網絡內的 Page 常常經過你的 Page 與其他 Page 造成互動,中介度就會高。
由於資訊會常常流經中介度高的 Page ,故此這類 Page 就有如網絡內的中轉站。他們選擇轉發何類資訊,是有潛力影響整個網絡內的資訊流動。
問:為何 XYZ Page (Insert your page here) 不是本土派?
要講講 Page 到底是怎樣歸類派系的。
文中的派系其實是 Hidden Community ,是根據引用關係以電腦算法計算出來,是並沒有考慮該 Page 裡引用及發表的內容是否本土派論調。
因此,如果 XYZ Page 常常引用及被引用其他本土派 Page 的內容, XYZ Page 就會是本土派。但若然 XYZ Page 常常引用蘋果日報、學民思潮、謎米等等主流派,但以本土派論調大力批評之,而 XYZ Page 又會被主流派引用來作回應。在這個情況之下,雖然 XYZ Page 論調本土,但程式會將它歸類為主流派。我重申一次,那個分類純粹根據引用關係計算出來,與內容論調無關。
問:為何 XYZ Page (Insert your page here) 沒有入圍?
沒有入圍有兩個意思。第一個意思是網絡圖不見 XYZ Page 。那是因為該圖只展示最高 5% 中介度的 Page ,如果 XYZ Page 有被納入研究但中介度不高,那就不會出現在圖中。
另一個意思是沒有被分析,這一方面只有我才知道。這是因為 XYZ Page 從來沒有引用別人,也沒有人引用過你,那麼 XYZ Page 就不會被納入研究。