檢驗兩個樣本均數相差的顯著性時,我們先有假定:第一個樣本系從均數為μ1、方差為σ12的正態(tài)總體中隨機取出,第二個樣本取自另一個類似的總體,相應的總體參數為μ2與σ22,兩個總體的方差應相等即σ12=σ22,然后才可用上述方法進行顯著性檢驗,如果資料呈顯著偏態(tài),或兩組方差相差懸殊,就要考慮用第十章非參數統計方法處理,或者通過變量代換,使上述條件得到滿足。那么,怎樣知道手頭的樣本資料是否服從正態(tài)分布及兩組方差是否相差顯著呢?要對手頭資料作正態(tài)檢驗及方差齊性檢驗。下面分別用實例介紹常用的正態(tài)性檢驗和兩方差齊性檢驗的方法。
有些統計方法只適用于正態(tài)分布或近似正態(tài)分布資料,如用均數和標準差描述資料的集中或離散情況,用正態(tài)分布法確定正常值范圍及用t檢驗兩均數間相差是否顯著等,因此在用這些方法前,需考慮進行正態(tài)性檢驗。
正態(tài)分布的特征是對稱和正態(tài)峰。分布對稱時眾數和均數密合,若均數-眾數>0,稱正偏態(tài)。因為有少數變量值很大,使曲線右側尾部拖得很長,故又稱右偏態(tài);若均數-眾數<0稱負偏態(tài)。因為有少數變量值很小,使曲線左側尾部拖得很長,故又稱左偏態(tài),見圖7.1(a)。
正態(tài)曲線的峰度叫正態(tài)峰,見圖7.1(b)中的虛線,離均數近的或很遠的變量值都較正態(tài)峰的多的稱尖峭峰,離均數近或很遠變量值都較正態(tài)峰的少的稱平闊峰。
圖7.1 頻數分布的偏度和峰度
正態(tài)性檢驗的方法有兩類。一類對偏度、峰度只用一個指標綜合檢驗,另一類是對兩者各用一個指標檢驗,前者有W法、D法、正態(tài)概率紙法等,后者有動差法亦稱矩法。現僅將W法與動差法分述于下;
1.W法 此法宜用于小樣本資料的正態(tài)性檢驗,尤其是n≤50時,檢驗步驟如下;
(1)將n個變量值Xi從小至大排隊編秩。
X1<X2<……<XN<p
見表7.5第(1)欄,表中第(2)、第(3)欄是變量值,第(2)欄由上而下從小至大排列,第(3)欄由下而上從小至大排列。第(4)欄是第(3)欄與第(2)欄之差。
(2)由附表5按n查出ain系數列入表7.5第(5)欄,由于當n為奇數時,對應于中位數秩次的ain為0,所以中位數只列出,不參加計算。第(6)欄是第(5)欄與第(4)欄的乘積。
(3)按式(7.8)計算W值
(7.8)
式中分子的∑,當n是偶數時,為 的縮寫,當n是奇數時為 的縮寫,表7.5
第(6)欄的合計平方后即為分子。分母按原始資料計算。
(4)查附表6得P值,作出推斷結論,按n查得W(n,α),α是檢驗前指定的檢驗水準,若W>W(n,α)則在α水準上按受H0,資料來自正態(tài)分布總體,或服從正態(tài)分布;若W≤W(n,α),則在α水準上拒絕H0,接受H1,資料非正態(tài)。
例7.8 測得20例40—49歲健康人右側腓總神經的傳導速度(m/sec)如表7.5第(2)、第(3)欄,試檢驗此資料是否服從正態(tài)分布。
H0:總體服從正態(tài)分布
H1:總體為非正態(tài)分布
α=0.05
計算表7.5各欄。
表7.5 W法正態(tài)性檢驗計算表
秩號 | 傳導速度(m/sec) | ||||
i (1) | Xi (2) | Xa-i+1 (3) | Xa-i+1-Xi (4)=(3)-(2) | ain (5) | ain(Xa-i+1-Xi) (6)=(5)(4) |
1 | 40.7 | 56.7 | 16.0 | 0.4734 | 7.5744 |
2 | 40.9 | 56.0 | 15.1 | 0.3211 | 4.8486 |
3 | 46.0 | 55.0 | 9.0 | 0.2565 | 2.3085 |
4 | 47.6 | 54.9 | 7.3 | 0.2085 | 1.5221 |
5 | 47.7 | 53.5 | 5.8 | 0.1686 | 0.9779 |
6 | 48.3 | 52.9 | 4.6 | 0.1334 | 0.6136 |
7 | 49.1 | 51.8 | 2.7 | 0.1013 | 0.2735 |
8 | 50.0 | 50.9 | 0.9 | 0.0711 | 0.0640 |
9 | 50.1 | 50.9 | 0.8 | 0.0422 | 0.0338 |
10 | 50.2 | 50.8 | 0.6 | 0.0140 | 0.0084 |
18.2240∑ain(Xa-i+1-Xi) |
∑Xi=1004 ∑Xi2=50756.16 ∑(X-x)2=355.36
代入式(7.8)
W=(18.2240)2/355.36=0.9347
查附表6,n=20,α=0.05,W(20,0.05)=0.905
W>W(20,0.05) P>0.1,在α=0.05水準上接受H0,該資料服從正態(tài)分布。
2.動差法 又稱矩法。既能用于小樣本資料,亦可用于大樣本資料的正態(tài)性檢驗。本法運用數學上三級動差和四組動差分別組成偏度系數與峰度系數,然后檢驗資料中否服從正態(tài)分布。當頻數分布為正態(tài)時,偏度系數與峰度系數分別等于0,但從正態(tài)分布總體中抽出的隨機樣本,由于存在抽樣誤差,其樣本偏度系數g1與樣本峰度系數g2不一定為0,為此,需檢驗g1、g2與0的相差是否有顯著性。其檢驗假設為①偏度系數等于O,即頻數分布對稱;②峰度系數等于0,即為正態(tài)峰。
偏度系數g1、峰度系數g2的公式見式jfsoft.net.cn(7.9)與(7.11)。當用頻數表資料計算時可用式(7.10)與式(7.12),式中n為例數,f為頻數。
(7.10)
(7.11)
(7.12)
g1、g2的抽樣誤差分別為Sg1與Sg2,見式(7.13)與式(7.14)
(7.13)
(7.14)
假設檢驗用u檢驗,其公式為
u1=g1/Sg1 (7.15)
u2=g2/Sg2 (7.16)
u的顯著性界限為
∣u∣<1.96P>0.05在α=0.05的水準上接受H0。
1.96≤∣u∣<2.580.05≥P>0.01在α=0.05的水準上拒絕H0。
∣u∣≥2.58P≤0.01在α=0.01的水準上拒絕H0。
例7.9 用動差法檢驗例7.8的資料是否服從正態(tài)分布。
1.H0:頻數分布對稱,H1:頻數分布不對稱。
2.H0:頻數分布為正態(tài)峰,H1:頻數分布不是正態(tài)峰。
α=0.05
∑(X-x )2=355.36,∑(X-x )3=-1032.45
∑(X-x )4=20150.4316 n=20
u2=0.6221/0.9924=0.627 P&gjfsoft.net.cn/pharm/t;0.20
在α=0.05的水準上接受H0,頻數分布對稱(P>0.05),并為正態(tài)峰(P>0.20)。因此可認為該資料服從正態(tài)分布。
方差齊性檢驗的方法是以兩方差中較大的方差為分子,較小的方差為分母求一比值(稱為F值),然后將求得的F值與臨界值比較,看相差是否顯著,現舉一例說明。
例7.10 某單位測定了蓄電池廠工人32號,得尿氨基乙酰丙酸(mg/l)的平均含量為7.06,方差為42.3072,又測定了化工廠工人6名,得平均含量為3.48,方差為0.9047,試比較兩方差的相差是否有顯著意義?
檢驗假設H0:σ12=σ22,H1:σ12≠σ22α=0.05
定方差較大的一組為第1組,較小者為第2組,求出F值,公式為
F=S12/S22,S1>S2 。ü7.17)
本例F=42.3072/0.9047=46.76
現將F值與附表7中的F.05(ν1,ν2)比較。該表上端數值是較大均方(即方差)的自由度,用v1表示,左側的數值是較小均方的自由度,用ν2表示。本例ν1=n1-1=32-1=31(表內ν1縱行沒有31,可查鄰近的數值30),ν2=n2-1=6-1=5,查得F.05(30,5)=6.23,本例F=46.76>F.05(30,5),P<0.05,故在α=0.05水準處拒絕H0,接受H1。兩方差的差別顯著。