chainsawriot

Retrospective case series

Posted on Apr 7, 2011 by Chung-hong Chan

我的 research 生涯，做得最多的研究類型是 Retrospective case series (RCS, 也稱為 Chart review ) ， Prospective 的反而不多。
RCS 有其限制，但是 Clinicians 們卻以為 RCS 是平靚正的選擇，以為 reviewer 見到其 sample size 夠大就會刊登。
多年來，已經知道怎樣才能將 RCS 做好寫好，而且送到「較佳」期刊刊登的法門。講真，期刊連 Randomized Controlled Trial 甚至 Systematic Review 都要 Reject 的時侯，為何要刊登你的 RCS ？你有甚麼新鮮蘿蔔皮？
但是，醫生從來不相信我的一套 Theory 。但是他們是主宰我出糧，他們說甚麼，我已經不太想去堅持己見。 I'm sick and tired of correcting people.
當我可以更加自由地 apply 這套 theory 時，成品多數更加美觀(elegant)，更有機會獲得期刊的接納。反而任何 bossy 人物突入「要乜要物」，結果多數是 half-baked cake ，根本就不能完成。就算完成，樣貌不美觀之餘，行文更加是自掘墳墓。這些東西的最終歸宿通常是不知道有否進行 peer reviewed 、沒有人看的本地學會期刊。
如果你相信我，以下是 RCS 非常阿媽係女人的所謂教訓，是一個老屎忽但長年低級的「研究助理」經年累積下來的經驗。

清楚你的 outcome 及 exposure

腦中沒有 outcome and exposure ，這個 study 即是沒有任何 hypothesis ，是為找 data 而找 data ，單單給人這樣的 impression ，這個 study 已經是死梗的了。看看 local journal 或者大陸 Journal ，最常見就是這類為找而找的 study 。這類研究的標題十之有九是:

Clinical characteristics of foobar patients admitted to the foorbar hospital: a n-year retrospective review

或

N-year experience with foobar diseases in n hospitals in Hong Kong

這類「研究」更正確的學名是 audit ，而 audit 從來都不是 science 。這些所謂 study 會標榜自己是 prevalence / descriptive study 去隱藏自己為找 data 而找 data 的事實，但學過實驗設計 101 的都知道 Prevalence 並不能用 Retrospective study 求出來的。

中小學學過的科學方法說明：

1,Define the question
2.Gather information and resources (observe)
3.Form hypothesis
4.Perform experiment and collect data
5.Analyze data
6.Interpret data and draw conclusions that serve as a starting point for new hypothesis
7.Publish results
8.Retest (frequently done by other scientists)

RCS 是有點不同的， Observation 及 routine data collection 是已經做了。但是卻沒有 Research Question 及 Hypothesis 。沒有 Hypothesis 的「研究」，不是 science 。
當然，亦有另一個 extreme ，就是有一批沒有整理的 clinical data ，卻要驗證九百條 research questions 及 hypotheses ，渴望求其扑中一題。這是研究專案變成 half-baked cake 的決定性心態。驗證九百個 hypotheses ，就要 collect 最少一百種的 outcome/exposure 關係了吧。先不談人力物力的 practicality 問題，講到明是 RETROSPECTIVE ，原始數據是已經寫了在 medical record (俗稱「牌版」)，「牌版」上寫了幾多，你所有的數據就有幾多。愈增加 variables 數量，就更加大機會有 missing data 。 ((你知道醫生們寫「牌版」通常寫得「好清楚」的。)) Retrospective 加 missing data ，我對這個研究的喜愛就大打折扣，這是 reviewer 的常識。問題是你的 study 如果又 retrospective 又 missing data ，又同你三唔識七，我為何要原諒你？ ((這解釋了為何這些 study 見諸於 local journal ，就是因為研究人員及 reviewer 並不是三唔識七。))
所以我的建議，是非常阿媽係女人的： one exposure, one outcome.
就算是要增加，只可以增加 exposure 的數目，而且最好不要多於三款。夠晒的了。
舉個例：

The Correlation Among Obesity, Apnea-Hypopnea Index, and Tonsil Size in Children.

這個 study 如果不根據以上經驗進行，就會變成 The clinical characteristics of patients admitted to sleep laboratory: a 10-years retrospective review. 屆時就真是牛頭角村村長個女-「李愛」了。
單看 title 就清楚，只有兩個 exposure ，就是 obesity 及 Tonsil size 。 outcome 只有一個，就是 apnea-hypopnea index 。要解答的問題就是三者的關係，並不是為找 data 而找 data 。真真正正找 data 時， dataset 只有少於十個 variable 。簡單清爽。

Inclusion / exclusion criteria

另一個常見的問題，是行文中見到此 study 有 600 個 subjects ，很大的 sample size 喎。但是某一個 exposure 的數據，只有 100 個 subjects 有紀錄。另一個 outcome 數據，只有 40 個 subjects 有紀錄。故此，在分析時，只有這 100 人及 40 人有份被分析。
這是自掘墳墓。在我當 Reviewer 時，簡直是覺得這篇 paper 在時刻提點我 RCS 的最大缺點。
這一點是與以上一點有關的。要是你只有一兩款的 exposure 、一款的 outcome ，根本不會出現這個問題。假如你只有一兩款 exposure 及一款 outcome 都這樣甩甩漏漏的話，根本代表你的 data 並不適合用於驗證你的 hypothesis 。
我通常會將其中一個 inclusion criteria 設定在有進行 exposure/outcome 的 test ，而且有數據的 subject 。這樣就可以保證有 complete data 。這樣當然可能有 selection bias 的問題。但是你納入來的 subject 連 exposure/outcome 的數據都沒有，請問你在做甚麼研究？再者，你講到明是 Retrospective 的研究，就從來沒有人要求你的 sample 是要 100% representative of the population 。
這也引申另一個問題。
例如某研究的 outcome 是 drug compliance 。「牌版」上未必會找到 drug compliance 的字眼。這個時侯就會有 bossy 人士跳入來，問為何不致電病人問返他的 drug compliance ？這樣的結果，就會總人數 N 個病人，有 y 個病人由於「牌版」上沒有 compliance ，是致電問的。另有 N - y 人是看「牌版」得知的。我做 reviewer 的時候，就會問以上 y 的數目，並要求研究人員做 sensitivity analysis 。即是代表：我對你的數據毫無信心。
Measurement 的簡單要求，是同一個 outcome 不應用兩個不同的方法收集。例如要計算人類體溫的正常值，你也不能有些人量耳溫、有些人肛探、有些人用紅外線探熱針、有些人用水銀。但當去了 RCS 的範團，人們就覺得這樣做是理所當然。
在 RCS ，要是某個 variable 是用兩個不同的方法收集，你有責任證明兩者的 agreement 。但是要證明「牌版」上的紀錄和致電詢問的 agreement ，等於自殺，再次提點 reviewer RCS 的缺點，就是你的「牌版」根本不可靠。

Hypothesis generation, no clinical recommendation

由於 RCS 沒有 randomization ， confounding variables 的控制也差，所以有以下的缺點：

1. 不能證明 exposure 及 outcome 的先後次序
2. 不能保證 exposure 及 outcome 的關係有 confounding variable 影響
3. Past may not (always) predict the future

故此，不單止不能確立任何的 causal relationship ，更加不能「證實」任何 hypothesis 。所以，任何的 RCS 目的只能夠是 hypothesis-generating ，並由未來的 prospective study 證明之。故此，在 discussion 除了要不停數落 RCS 之缺點之外，也要明確聲明研究的任何結果都要由 prospective study 驗證。
有些人又真的以為自己個 RCS 有甚麼新鮮蘿蔔皮，在 discussion 狂寫因應此一研究的結果，臨床應該要有甚麼甚麼的轉變。這個又是另一死罪，是 egomaniacs 的死罪。
現實的情況是，就算 Systematic Review 及 RCT ，都並不一定可以提供任何臨床建議，屬於 observational study 的 RCS 更加不可以提供任何臨床建議。「更年期女士的 hormone replacement therapy 醫心臟病」 ((Observational study 發現接受 HRT 的婦女心臟較健康，認為是一個 prophylaxis 。於是乎美國醫生大力建議女士更年期後接受 HRT 。但是臨床卻發現接受 HRT 的女性，心臟健康更差。後來的 RCT 也發現 HRT 會令心臟健康差。原來是因為原來的 observational study ，進行 HRT 醫療保險不能 claim 錢。於是乎接受 HRT 的女性都是較為有錢，有錢人就較為緊張自己的健康，當然心臟健康會較好。當做 RCT 時，平衡了 Socioeconomic status 的影響， HRT 破壞心臟的真相才浮現出來。)) 或「疫苗引致自閉症」 ((之前已經寫過 Andrew Wakefield 案。)) 的經典公共衛生災難案例，已經寫在流行病學的書藉。但是災難永遠都會重演的，這就是因為臨床人員的自大和狂莽。