多個(gè)樣本比較時(shí),如何計(jì)算秩和檢驗(yàn)的H值?
在進(jìn)行多個(gè)樣本之間的非參數(shù)檢驗(yàn)時(shí) 常用的方法之一是Kruskal-Wallis H檢驗(yàn) 這是一種秩和檢驗(yàn) 它用于判斷兩個(gè)或更多個(gè)獨(dú)立樣本是否來自相同的總體。H值的計(jì)算步驟如下:
首先 將所有樣本的數(shù)據(jù)混合 并從小到大排序 給出每個(gè)數(shù)據(jù)點(diǎn)一個(gè)秩次 如果有相同的數(shù)據(jù) 則取這些數(shù)據(jù)的平均秩次。
接下來 計(jì)算各個(gè)樣本的秩和Ri 其中i代表不同的樣本編號(hào) 例如如果有三個(gè)樣本 分別為1 2 和3 那么就需要計(jì)算R1 R2 和R3。
然后 根據(jù)公式 H = [12 / (N (N 1))] Σ[(Ri^2) / ni] - 3 * (N 1) 計(jì)算H值 其中N是所有樣本數(shù)據(jù)點(diǎn)的總數(shù) 即所有ni之和;ni代表第i個(gè)樣本的數(shù)據(jù)點(diǎn)數(shù)量 Ri則是第i個(gè)樣本的秩和。
在計(jì)算出H值之后 需要與卡方分布表中的臨界值進(jìn)行比較 以確定拒絕原假設(shè)的概率。如果計(jì)算得到的H值大于選定顯著性水平下的卡方臨界值 則可以認(rèn)為不同組之間的差異具有統(tǒng)計(jì)學(xué)意義 反之 如果H值小于或等于卡方臨界值 則不能拒絕所有樣本來自同一總體的假設(shè)。
需要注意的是 當(dāng)某些條件不滿足時(shí) 如每組樣本量過小 或者有太多相同的數(shù)據(jù)點(diǎn) 使得秩次出現(xiàn)大量并列情況 這時(shí)Kruskal-Wallis H檢驗(yàn)的結(jié)果可能會(huì)受到影響 因此需要謹(jǐn)慎解讀結(jié)果。在實(shí)際應(yīng)用中 如果數(shù)據(jù)符合正態(tài)分布 建議優(yōu)先考慮使用ANOVA等參數(shù)檢驗(yàn)方法。
首先 將所有樣本的數(shù)據(jù)混合 并從小到大排序 給出每個(gè)數(shù)據(jù)點(diǎn)一個(gè)秩次 如果有相同的數(shù)據(jù) 則取這些數(shù)據(jù)的平均秩次。
接下來 計(jì)算各個(gè)樣本的秩和Ri 其中i代表不同的樣本編號(hào) 例如如果有三個(gè)樣本 分別為1 2 和3 那么就需要計(jì)算R1 R2 和R3。
然后 根據(jù)公式 H = [12 / (N (N 1))] Σ[(Ri^2) / ni] - 3 * (N 1) 計(jì)算H值 其中N是所有樣本數(shù)據(jù)點(diǎn)的總數(shù) 即所有ni之和;ni代表第i個(gè)樣本的數(shù)據(jù)點(diǎn)數(shù)量 Ri則是第i個(gè)樣本的秩和。
在計(jì)算出H值之后 需要與卡方分布表中的臨界值進(jìn)行比較 以確定拒絕原假設(shè)的概率。如果計(jì)算得到的H值大于選定顯著性水平下的卡方臨界值 則可以認(rèn)為不同組之間的差異具有統(tǒng)計(jì)學(xué)意義 反之 如果H值小于或等于卡方臨界值 則不能拒絕所有樣本來自同一總體的假設(shè)。
需要注意的是 當(dāng)某些條件不滿足時(shí) 如每組樣本量過小 或者有太多相同的數(shù)據(jù)點(diǎn) 使得秩次出現(xiàn)大量并列情況 這時(shí)Kruskal-Wallis H檢驗(yàn)的結(jié)果可能會(huì)受到影響 因此需要謹(jǐn)慎解讀結(jié)果。在實(shí)際應(yīng)用中 如果數(shù)據(jù)符合正態(tài)分布 建議優(yōu)先考慮使用ANOVA等參數(shù)檢驗(yàn)方法。

學(xué)員討論(0)
相關(guān)資訊












掃一掃立即下載


