當你真的去調查選委數據,就發現選委的數據並非全透明。
上次講過寫了個 web scrapper 去挖網頁資料,此東西成功挖出 1043 名選委數據。
根據選委網頁,選委應包括 60 名宗教人士及「96名香港地區全國人民代表大會代表及立法會議員為選舉委員會的當然委員」。此 60 名宗教人士,可於政府新聞公告找到。立法會議員中英文名列表也可以於2008年立法會選舉網站找到。香港地區全國人民代表大會代表,可於共產黨網站找到。但此列表是簡體,要先轉成繁體,而且是沒有英文名。故此,我只好一個一個的問 google 大神。
事實上香港地區全國人民代表大會代表和立法會議員有五人重疊,此五人省去。故此,選舉委員會的當然委員只應有 91 人,而非網站所指的 96 人。
另外,文化小組少選了一人:選委一人去世(脫志賢),故此今屆總選委有效票數是 1193 票,而非 1200 票。這些數據政府全無公佈。
以下是由本人整理的 1194 名選委數據之 csv 檔。數據並未係最 clean ,例如自己改的英文名,但肯定是姓氏行頭。

ElectComm

如果要刪除去世的一名選委,可以用以下的 R Code

ElectComm[-1154,]

如此無聊研究前後花了幾日,有了如此數據才可以找出哪個選委提名誰。做過如此研究才發現這批小圈子選舉選委的數據是如此的穩秘不透明,政府網站資料分散搵死人。希望以上整理後的數據有助各位理解小圈子選舉。