從我Blog,以隨機抽取三十個Post,再計算「Comment數」和「文章長度」(Number of characters)的關係。
我以Poisson Regression將兩者關運在一起。
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.4425655 0.1696176 8.505 <2e-16 ***
Text -0.0006512 0.0002864 -2.274 0.0230 *
Text是指「文章長度」。結果顯示,文章長度的Comment數的Predictor。(p=0.023)
一篇文的Comment數可以用以下Formula預計。
log (x) = 1.44 + -0.0007 (y)
x= Number of comments
y= Number of characters
y愈大,x愈細。所以,如果以獲得最多Comment為目的的Blogger,應該寫得愈短愈好。
For statistician only:
由於Poisson Regression有Assumption,是估計(x/time)的數據,以上分析假定「觀察時間」是每個post一樣。我用post的id作為觀察時間的surrogate marker,再用log(postid)作為offset,結果同樣顯示,文章長度是Comment數的Predictor。(p=0.046)