當前位置:才華齋>財會職務>統計師>

醫學統計中的常見誤區有哪些

統計師 閱讀(1.02W)

醫學統計學是運用概率論與數理統計的原理及方法,結合醫學實際,研究數字資料的蒐集、整理分析與推斷的一門學科。醫學研究的物件主要是人體以及與人的健康有關的各種因素。下面是yjbys小編為大家帶來的關於醫學統計中的常見誤區的知識,歡迎閱讀。

醫學統計中的常見誤區有哪些

  一,真正差異和統計學差異

常常有人和我說: P值越小,試驗結果的差異就越大!而且還有依據 [P < 0.05 是有顯著性差異; P < 0.01 是有極顯著性差異]。

其實,這些人忽略了 n 這個樣本數的作用,n 的大小會影響 P 值。但更應該澄清一下的是: P 值代表的是統計學差異,並不是真正的差異!真正的差異只能靠平均值或者頻度的比較才能得到。

  二,卡方檢驗的侷限性

我們知道各組之間的計數資料的比較,要用卡方檢驗,但有些情況是不行的!!!

1,當樣本有小於5的值2X2表時,必須要用 Fisher 檢驗才正確!

2,當組與組之間有不同的背景,而這些背景因子還可能會影響到組與組之間結果差異,這是就必須要用 Mantel-Haenszel 檢驗!

這第2條可能大家不要理解,那我就舉兩個例子:

1) 關於男性和女性對於不同顏色的喜好的統計學分析

但這裡應該注意到年齡可能會對這個分析造成影響,這就要用Mantel-Haenszel 檢驗了。

***紅色 藍色 黃色

男性 5 7 8

女性 15 10 6

可以按大人和小孩(比如我們以15歲為分界)分層,在SPSS中要把這個因素放到[行] [列]下邊的[層化]一欄裡,並在統計指標選項裡,選 Cochran和Mantel-Haenszel的統計量選項,這樣出來的結果就可靠了!

2)兩種治療(A和B)效果的評價分析:

*****A法 B法

生存 41 54

死亡 47 31

用卡方檢驗 X2=4.35; P < 0.05

但是,病人的臨床分期將影響著分析結果:

********生存**************死亡

——————————***——————————

————A****B————————A*****B———

1期-----18-----21--------------------0--------0-------

2期-----23-----33-------------------13------- 8-------

3期------0------0--------------------34-------23-------

再用Mantel-Haenszel檢驗: X2=3.65; P > 0.05

說明實際上A法和B法兩組的統計學差異,是這個不同的分期造成的!!!

1,當樣本有小於5的值2X2表時,必須要用 Fisher 檢驗才正確!

討論:當樣本有小於5的值2X2表時,必須要用 Fisher 確切概率法。

當樣本有小於5的值R×C表時,將某兩組合並,用pearson卡方檢驗。

  三,t 檢驗的侷限性

1,我們經常用 t 檢驗來判別兩組病人血清中某種標記物水平上的差異,但這裡要注意,有一些血清標記物的水平是不能用 t 檢驗的!

比如: 血清標記物 PSA和AFP,在正常人的水平是很低的,而在病人則明顯增加,呈現指數冪次改變,這樣一來,血清 PSA和AFP水平在每組病人中很容易不是呈現正態分佈!

這時應該用 非引數性檢驗---即 Mann-Whitney U test (Wilcoxon U test)。

2,關於用不用配對t 檢驗,我個人認為當同一組樣本在不同時點,不同處理方式的比較上,應該用配對t 檢驗。

  四,ANOVA 檢驗的侷限性

1,在2組以上計量資料樣本比較時,ANOVA 檢驗非常常用。但這個檢驗只是說明了一個趨勢的比較結果,並不能說明真正的統計學差異,真正的差異還要通過每兩個點的直接比較,也就是說應該在ANOVA 檢驗後,還必須做兩兩比較或多重比較,這樣才能從全貌上反映出統計的全部結果。

2,既然方差分析得到差別有顯著性意義的結論後,還需進行兩兩比較,有人認為還不如一開始就進行多次t檢驗更方便,其實,這種認識是不妥當的。t檢驗用於ANOVA的兩兩比較將增大第一類錯誤,產生假陽性,因此要採用特定的方法,在SPSS的one-way ANOVA或General linear models中操作時,Post Hoc(多重比較)對話方塊內有多種方法可供選擇,象兩兩比較一般用SNK法,而多個試驗組和一個對照組的比較則多用dunnett檢驗。

3,我們經常用 ANOVA 檢驗來判別幾組病人血清中某種標記物水平上的差異,但這裡要注意,與 t 檢驗一樣,有一些血清標記物的水平是不能用 ANOVA 檢驗的!

如上所說的: 血清標記物 PSA和AFP,在正常人的水平是很低的.,而在病人則明顯增加,呈現指數冪次改變,這樣一來,血清 PSA和AFP水平在每組病人中很容易不是呈現正態分佈!

這時應該用 非引數性檢驗---即 Kruskal-Wallis rank test 。

  五,單元線性相關分析

有時我們常常只注意到了 P 值大小,可最重要的是 r 值!

樣本數 n 對 P 值 結果的影響很大,容易讓我們產生錯覺,其實,相關的存在與否的評價是與 r 值最直接相關的,如下:

當 P 值小於0.05時: r 值

0.00--0.20 幾乎沒有相關關係

0.20--0.40 弱的相關關係

0.40--0.70 有相關關係

0.70--0.90 強相關關係

0.90--1.00 極強相關關係

P 值只是證明這個相關在統計學上是否成立!!!

1,當樣本有小於5的值2X2表時,必須要用 Fisher 檢驗才正確!

討論:當樣本有小於5的值2X2表時,必須要用 Fisher 確切概率法。

當樣本有小於5的值R×C表時,將某兩組合並,用pearson卡方檢驗。

不是說樣本小於5

而是說:在R×C表中

理論頻數不應該小於1,並且1≤T≤5的格子數不應該超過總格子數的1/5,若出現上述情況可以通過以下方法:

a.增加樣本含量,使理論頻數增大;

b.根據專業知識,刪除理論頻數太小的行和列;或者將理論頻數太小的行或列與性質相近的鄰行和鄰近列合併。

c.改用雙向無序的R×C表的fishher確切概率法。

還有一點

四格表卡方檢驗的適應指標:(T為理論頻數)

1。n≥40,且T≥5時用卡方檢驗基本公式。但是當p≈α應該用fisher確切概率法

2。n≥40,但是1≤T≤5時,用四格表校正公式

3。n<40,或者T<1時,用fisher四格表確切概率法

4。四格表卡方檢驗的連續性校正僅僅用於自由度為1的四格表尤其是n較小時。

補充幾點:

1. 關於P值:P值的大小並不是各組差異的大小,而是統計學差異顯著性的大小。P值越小,說明得出各組沒有差異的概率越小,越有理由說明各組存在差異(可以說,P值的大小反映了做出統計結論的“理由”的大小,而不是被比較的各組的實際差異的大小,得出有意義的結論後,其差異的大小可直接通過各組的均數或率進行比較)。

2. 關於t檢驗和方差分析:katalyster兄上面提到的t檢驗及方差分析在某些時候不適用,實際上就是每種方法都有其應用條件,不服從正態分佈當然不能用。對這樣的資料首先可考慮變數變換(如抗體滴度等資料,為指數或冪次的關係,可用對數轉換),如變換後,服從正態分佈,可用上述方法;若還不符合,則考慮非引數檢驗。

3. 關於相關分析:兩個變數間是否存在相關關係,要看P值,而不是r值,r值用來說明相關關係的大小。當P<0.05,才能講兩變數間存在相關關係,再看r值,r值越大,相關關係越強,反之越小;否則,P>0.05,不能講兩變數間存在相關關係,r值毫無意義。

感謝kushuya, xiaoxiongzjh兩位專家的補充和指正!之所以開這個專題,是真心想讓初學者從這些<誤區>中走出來!

  六,Logistic regression 分析

在判斷某因子對疾病的危險度時常用的方法。

1,假設要判斷某因子對疾病的危險度(OR),要了解這個OR是一個相對危險度,即是有某因子存在和沒有某因子存在之間比較的OR值。

2,OR 和 RR 不一樣,OR是在Logistic regression model中使用,RR是在Cox proportional hazard model中使用。

3,假設要判斷某因子對疾病的危險度,要在多變數Logistic regression model中校正一些混擾因素,如常見的年齡,性別,吸菸等等,並最後得出這個 Adjusted OR。但並不是說有了這些校正,我們就可以在實驗設計上就不考慮這些混擾因素,相反,必須在實驗設計上就把這些混擾因素在實驗組和對照組配平,光靠在多變數Logistic regression model中校正是不可靠的。

其它方法---生存分析 (Kaplan-Meier法+ Logrank法):

我們有時在臨床研究只注意到了用這種方法分析與生存相關的研究,其實,在疾病復發上也常用這種方法!前者是以生---死為判別,後者則以復發---不復發為判別。