• 功課關係要設定 XML query 系統。對比 SQL , XML query 真是好麻煩。在 Linux 設定 Query 系統,也不簡單。 ((在 Linux 安裝 sqlite 甚至 MySQL 也不算煩。)) 要安裝一個叫 Saxon-b 的東西。

    sudo apt-get install libsaxonb-java

    此物要用 Java 運行,而我一直不太喜歡 Java 軟件。請確定在 Terminal 輸入 java 是有反應。裝完之後,並不如網上的文章,是安好了一個 .jar 的物體,要用 java -cp xyz.jar 般執行。找尋之下找到了 saxonb-xquery 此一物體,原來是 Saxon-b 那個 .jar 的 wrapper 。如果要執行 XML query ,可以用 pipe 的方法

    echo "doc('BookstoreQ.xml')/Bookstore/Magazine/Title" | saxonb-xquery -

    當然也可以用文字編輯器將以上 XQuery 寫成一個 .xq 的檔,再執行。

    saxonb-xquery xyz.xq

  • 本周要急速完成所有本周日到期的 Machine Learning 的功課,原因是 Database 那邊本周日是 midterm 考試。
  • 學了 Machine Learning 一段時間,都搞不清它與統計學的分別。拜讀完 Statistical modelling: the two cultures 一文,總算明白傳統統計學的數據模型與其他用到統計模型學科的 algorithmic modelling 之分別。我依然覺得以下學科有大量 overlap: [Applied] Statistics, Machine Learning, Artificial Intelligence, Data Mining 甚至 Operations Research ,最近更流行起一個新 term 叫 Data Science 。同樣都是用一些類似的 technique 和 tool ,目的也類近。
  • 據說妻子識人的子女真是 Stanford 畢業,是可以寫在 CV 的。但是,我可以寫在 CV 的,有 "Watching Youtube" ,都好勁。
  • 泛民區選「大敗」之後,坊間流傳大量討論泛民失敗之原因,而大部份旨在聲討而非檢討。在討論此一問題之前,先要討論泛民是否大敗?泛民有否「大敗」與六四是「屠城」還是「屠殺」般,有著色字眼。有人會認為輸一個位就是大敗,有人會認為輸清光才是大敗。而泛民大敗,是指泛民整體大敗,還是泛民個別團體都大敗?在討論大敗的原因,基本上有如馬德鐘,是萬能 key 。原因無他,是因為「大敗」發生在先,分析發生在後。醫學上叫做 Post-mortem 。但是,這不是科學的分析,而是一種有如 Fishing Expedition 般的調查。你心中有個原因,只要說出來,都可以言之有理的。現時市面上流行的泛民大敗原因有以下:地區工作不足、外傭官司、狙擊、內訌、市民反公投、市民反粗口、反激進、支持香港 status quo 、泛民參選無延續性、泛民無財、阿爺操控、蛇齋餅糭、高投票率 (對比上屆)、低投票率(對比 03 )、派六千、愛港力量、抹黑... 每一個都言之成理。我在此也提出我的理論,就是市民喜歡「聯」字,故此民建及工會當選比率高。而沒有聯字的社團,如民主黨、公民黨、社民連、人民力量、民協,卻失敗。我想,這個理論的 Goodness of fit 比以上所有理論為高。故此,泛民政黨可改名為民主聯、公民聯、社民聯、人民力聯、民協聯,應都可以獲得市民支持。事後孔明人人會做,但有幾多人可以在選舉之前預測未來?
  • Drive 此電影,香港漢文譯名完全失敗。此片,我想香港是完全不會成功,因為是一套玩 Style 的電影,故事甚至演員的演技都欠奉。如看過大量的 Film Noir ((德國表現主義及低光度攝影)) 及八九十年代 B 片 ((螢光求其字體、偏紅的畫面)) ,你會發現本片的美學是向此類電影致敬。涉及女主角 Carey Mulligan 的畫面,卻突然變成歐洲式的黃金日光拍攝。難怪此片深得海外影評人推薦,因為可以依著畫面吹一大堆水。
  • 英語讀音規則,有時令人覺得好煩。例如 ov- 的讀音,書本上是寫如果 o 後面跟 v 、 m 、 th 、 n,而那個 o 的音節是 stress 的話,是讀成 /ʌ/ ,而不是 /əʊ/ 、 /ɒ/ 或 /ɔː/ 。如 Oven 是讀成 /ʌvn/ 、 Love 讀成 /lʌv/ 、 Glove 讀成 /glʌv/ 、 Money 是讀成 /ˈmʌni/ 、 Sponge 是讀成 /spʌndʒ/ 。但是,有時卻不會如此,如 Over 是讀成 /ˈəʊvər/ ((奇在 Cover 卻讀成 /ˈkʌvə / 。)) 、 Ovary 是讀成 /ˈəʊvəri/ 。難怪本地人讀 Glove 會讀成 /gɒlf/ (Golf) 甚至 /grəʊv/ (Grove) 。英語語音最麻煩的,就是這些 Exception 。最終都是要查字典。
  • 工作沉悶,其中一個樂趣是在 Youtube 建立 Playlist 。這是我的 noon D playlist ,近乎全部都是 12 吋 extended version ,絕大部份都是 80 年代歐陸新浪漫時代的經典。在建立此 playlist 時,發現迪柏芝舞真是很正。原隊員 Vince Clarke 不喜歡迪柏芝舞變得愈來愈黑暗的曲調,離隊另組 Yazoo 。上面 Yazoo 的 Don't go ,個人認為是此 playlist 內最嗆耳的音樂,實在太有型了。