一、正態(tài)分布
。ㄒ)正態(tài)分布的圖形
將表18-1的110名20歲健康男大學(xué)生身高頻數(shù)分布繪成圖18-1中的(1),可見(jiàn)高峰位于中部,左右兩側(cè)大致對(duì)稱?梢栽O(shè)想,如果抽樣觀察例數(shù)逐漸增多,組段不斷分細(xì),就會(huì)逐漸形成一條高峰位于中央(均數(shù)所在處)、兩側(cè)完全對(duì)稱地降低、但永遠(yuǎn)不與橫軸相交的鐘型曲線(圖18-1中的(3)),這條曲線近似于數(shù)學(xué)上的正態(tài)分布(normal distribution)曲線。
統(tǒng)計(jì)學(xué)家按其變化參數(shù),推導(dǎo)出正態(tài)分布密度函數(shù)f(X)
。蓿糥<+∞公式(18.16)
式中μ為均數(shù);σ為標(biāo)準(zhǔn)差;π為圓周率;е為自然對(duì)數(shù)的底,即2.71828。以上均為常數(shù),僅X為變量。
為了應(yīng)用方便,常將式(18.16)進(jìn)行變量變換—u變換(即u=(X-μ)/σ),u變換后,μ=0,σ=1,使原來(lái)的正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)亦稱u分布,如圖18-2。
圖18-1 頻數(shù)分布逐漸接近正態(tài)分布示意
圖18-2 正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的面積與縱高
此時(shí),式( 18.16)化成
- ∞<u<+∞ 公式(18.17)
式中,φ(u)為標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù),即縱軸高度。
根據(jù)X和u的不同取值,分別按式(18.16)和式(18.17)可以繪出正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的圖形(圖18-2)。
(二)正態(tài)分布的特征
由式(18.16 )gn (18.17)可看出正態(tài)分布有下列特征:①正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高。②正態(tài)分布以均數(shù)為中心,左右對(duì)稱。③正態(tài)分布兩個(gè)參數(shù)(parameter),即均數(shù)μ和標(biāo)準(zhǔn)差σ;常用N(μ,σ)表示均數(shù)為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布;所以標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。④正態(tài)曲線在±1σ處各有一人拐點(diǎn)。⑤正態(tài)曲線下的面積分布有一定的規(guī)律。
二、正態(tài)曲線下面積的分布規(guī)律
正態(tài)曲線下一定區(qū)間的面積可以通過(guò)對(duì)式(18.16)和式(18.17)積分求得。為了省去計(jì)算的麻煩,有人按式(18.17)編成了附表18-1“標(biāo)準(zhǔn)正態(tài)分布曲線下的面積”通過(guò)查表可求出正態(tài)曲線下某區(qū)間的面積,進(jìn)而估計(jì)該區(qū)間的觀察例數(shù)占總例數(shù)的百分?jǐn)?shù)或變量值落在該區(qū)間的概率。查表時(shí)應(yīng)注意:①表中曲線下面積為自-∞到u的面積;②當(dāng)μ,σ已知時(shí),先根據(jù)u變換(即u=(X-μ)/σ)求得u值,再查表;③當(dāng)μ,σ未知且樣本含量n足夠大時(shí),常用樣本均數(shù)x和樣本標(biāo)準(zhǔn)差s分別代替μ和σ進(jìn)行u變換[即u=(X-μ)/S],求得u的估計(jì)值,再查表;④曲線下對(duì)稱于0的區(qū)間面積相等,如區(qū)間(-∞,-1.96)與區(qū)間(1.96,+∞)的面積相等;⑤曲線下橫軸上的總面積為100%或1。
下面三個(gè)區(qū)間的面積應(yīng)用較多,要求記住,并結(jié)合圖18-3理解其意義。①標(biāo)準(zhǔn)正態(tài)分布時(shí)區(qū)間(-1,1)或正態(tài)分布時(shí)區(qū)間(μ-1σ,μ+1σ)的面積占總面積的68.27%;②標(biāo)準(zhǔn)正態(tài)分布時(shí)間(-1.96,1.96)或正態(tài)分布時(shí)區(qū)間(μ-1.96,μ+1.96)的面積占總面積的95.00%;③標(biāo)準(zhǔn)正態(tài)分布區(qū)間(-2.58,2.58)或正態(tài)分布時(shí)間區(qū)(μ-2.58,μ+2.58)的面積占總面積的99.00%。
圖18-3 正態(tài)與標(biāo)準(zhǔn)正態(tài)曲線及其面積分布
三、醫(yī)學(xué)正常值范圍的估計(jì)
。ㄒ)正常值范圍(normal range)的意義
正常值是指正常人體或動(dòng)物體的各種生理常數(shù),正常人體液和排泄物中某種生理、生化指標(biāo)或某種元素的含量,以及人體對(duì)各種試驗(yàn)的正常反應(yīng)值等。由于存在變異,各種數(shù)據(jù)不僅因人而異,而且同一個(gè)人還會(huì)隨機(jī)體內(nèi)外環(huán)境的改變而改變,因而需要確定其波動(dòng)的范圍,即正常值范圍。
制定正常值范圍,①首先要確定一批樣本含量足夠在的“正常人”。所謂“正常人”不是指機(jī)體任何器官、組織的形態(tài)及機(jī)能都正常的人,而是指排除了影響所研究指標(biāo)的疾病的有關(guān)因素的同質(zhì)人群。②根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值:若某種指標(biāo)過(guò)高或過(guò)低均屬異常,需要確定正常值范圍的下限和上限,如白細(xì)胞計(jì)數(shù);若某指標(biāo)過(guò)高為異常,需確定上限,如尿鉛;若某指標(biāo)過(guò)低為異常,需確定下限,如肺活量。③根據(jù)研究目的的和實(shí)用要求選定適當(dāng)?shù)陌俜纸缰担S?0%、90%、95%或99%,其中最常用的是95%。④根據(jù)資料的分布特點(diǎn),選用恰當(dāng)?shù)慕缰涤?jì)算方法,如正態(tài)分布資料用正態(tài)分布法;對(duì)數(shù)正態(tài)分布資料用對(duì)數(shù)正態(tài)分布法;偏態(tài)分布資料用百分位數(shù)法。
。ǘ)正常值范圍估計(jì)
計(jì)算正常值百分界值的方法甚多,如正態(tài)分布法、對(duì)數(shù)正態(tài)分布法、正態(tài)概率紙法、百分位數(shù)法、曲線擬合法、容許區(qū)間法等,F(xiàn)以95%正常值范圍為例,主要介紹以下三種。
1.正態(tài)分布法:適用于正誠(chéng)或近似正態(tài)分布資料。
雙側(cè)界值:x±1.96s
單側(cè)上界:x+1.645s
單側(cè)下界:x-1.645s
2.對(duì)數(shù)正態(tài)分布法:適用于對(duì)數(shù)正態(tài)分布資料。
雙側(cè)界值:lg-1(xlgx±1.96slgx)
單側(cè)上界:lg-1(xlgx+1.645slgx)
單側(cè)下界:lg-1(xlgx-1.645slgx)
3.百分位數(shù)法:常用于偏態(tài)分布資料。
雙側(cè)界值:P2.5和P97.5
單側(cè)上界:P95
單側(cè)下界:P5
例18.13 試估計(jì)表18-1中110名20歲健康男大學(xué)生身高的95%正常值范圍。
該指標(biāo)計(jì)算雙側(cè)界值
x±1.96s=172.73±1.96×4.09
該指標(biāo)的95%正常值范圍為 164.71~180.75(cm)
例18.14 某年某市調(diào)查了200例正常成人血鉛含量(μg/100g)如下,試估計(jì)該市成人血鉛含量95%正常值范圍單側(cè)上界。
3 | 4 | 4 | 4 | 4 | 4 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 6 | 6 | 6 | 6 |
6 | 6 | 6 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 8 | 8 | 8 | 8 |
8 | 8 | 8 | 8 | 8 | 8 | 8 | 9 | 9 | 9 | 9 | 9 | 9 | 9 | 10 | 10 | 10 | 10 | 10 | 10 |
10 | 10 | 10 | 11 | 11 | 11 | 11 | 11 | 12 | 12 | 12 | 12 | 12 | 12 | 12 | 13 | 13 | 13 | 13 | 13 |
13 | 13 | 13 | 13 | 13 | 13 | 13 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 14 | 15 | 15 | 15 |
15 | 15 | 15 | 15 | 16 | 16 | 16 | 16 | 16 | 16 | 17 | 17 | 17 | 17 | 17 | 17 | 17 | 17 | 17 | 17 |
17 | 17 | 18 | 18 | 18 | 18 | 18 | 19 | 19 | 19 | 19 | 19 | 19 | 20 | 20 | 20 | 20 | 20 | 20 | 20 |
20 | 21 | 21 | 21 | 21 | 21 | 22 | 22 | 22 | 22 | 22 | 22 | 23 | 23 | 23 | 24 | 24 | 24 | 24 | 24 |
24 | 25 | 25 | 26 | 26 | 26 | 26 | 26 | 27 | 27 | 28 | 28 | 29 | 29 | 30 | 30 | 31 | 31 | 31 | 31 |
32 | 32 | 32 | 32 | 32 | 32 | 33 | 33 | 36 | 38 | 38 | 39 | 40 | 41 | 41 | 43 | 47 | 50 | 53 | 60 |
該資料為偏態(tài)分布,經(jīng)對(duì)數(shù)變換(即原始數(shù)據(jù)取對(duì)數(shù))后,整理成頻數(shù)表,見(jiàn)表18-5。從頻數(shù)分布看,近似正態(tài)分布,計(jì)算對(duì)數(shù)形式的均數(shù)與標(biāo)準(zhǔn)差,得:
xlgx=Σflgx/Σf=230.0/200=1.15
其95%正常值范圍的單側(cè)上界為lg-1xlgx+1.645slgx)=lg-11。5942=39(μg/100g)
即該市正常成人血鉛含量的95%正常值為39μg/100g以下。
例18.15 試用百分位數(shù)法估計(jì)例18.14資料的95%正常值的單側(cè)上界。
該資料不經(jīng)對(duì)數(shù)轉(zhuǎn)換時(shí)為偏態(tài)分布,也可用百分位數(shù)法估計(jì)。先整理成頻數(shù)表,見(jiàn)表18-6。
P95=L+i/f95(n×95%-ΣfL)=38+5/7(200×95%-189)=38.7(μg/100g)
表18-5 200名血鉛值對(duì)數(shù)變換后的頻數(shù)表及gx slgx計(jì)算表
對(duì)數(shù)組段 | 頻數(shù)f | 組中值(lgX) | flgX | FlgX2 |
0.45~ | 1 | 0.5 | 0.5 | 0.25 |
0.55~ | 5 | 0.6 | 3.0 | 1.80 |
0.65~ | 10 | 0.7 | 7.0 | 4.90 |
0.75~ | 20 | 0.8 | 16.0 | 12.80 |
0.85~ | 11 | 0.9 | 9.9 | 8.91 |
0.95~ | 21 | 1.0 | 21.0 | 21.00 |
1.05~ | 29 | 1.1 | 31.9 | 35.09 |
1.15~ | 25 | 1.2 | 30.0 | 36.00 |
1.25~ | 30 | 1.3 | 39.0 | 50.07 |
1.35~ | 20 | 1.4 | 28.0 | 39.20 |
1.45~ | 16 | 1.5 | 24.0 | 36.00 |
1.55~ | 8 | 1.6 | 12.8 | 20.48 |
1.65~ | 3 | 1.7 | 5.1 | 8.67 |
1.75~1.84 | 1 | 1.8 | 1.8 | 3.24 |
合計(jì) | 200 | 230.00 | 279.04 |
表18-6 200名血鉛值頻數(shù)表及P95計(jì)算表
組段 | 頻數(shù)f | 累計(jì)頻數(shù)Σf | 累計(jì)頻率(%) |
3~ | 36 | 36 | 18.0 |
8~ | 39 | 75 | 37.5 |
13~ | 47 | 122 | 61.0 |
18~ | 30 | 152 | 76.0 |
23~ | 18 | 170 | 85.0 |
28~ | 16 | 186 | 93.0 |
33~ | 3 | 189 | 94.5 |
38~ | 7 | 196 | 98.0 |
43~ | 1 | 197 | 98.5 |
48~ | 1 | 198 | 99.0 |
53~ | 1 | 199 | 99.5 |
58~62 | 1 | 200 | 100.0 |
附表18-1 標(biāo)準(zhǔn)正態(tài)分布曲線下的面積
[本表為自-∞到一u的面積Φ(-u),Φ(u)=1-Φ(-u)]
u | .00 | .01 | .02 | .03 | .04. | .05 | .06 | .07 | .08 | .09 |
-3.0 | .0013 | .0013 | .0013 | .0012 | .0012 | .0011 | .0011 | .0011 | .0010 | .0010 |
-2.9 | .0019 | .0018 | .0018 | .0017 | .0016 | .0016 | .0015 | .0015 | .0014 | .0014 |
-2.8 | .0026 | .0025 | .0024 | .0023 | .0023 | .0022 | .0021 | .0021 | .0020 | .0019 |
-2.7 | .0035 | .0034 | .0033 | .0032 | .0031 | .0030 | .0029 | .0028 | .0027 | .0026 |
-2.6 | .0047 | .0045 | .0044 | .0043 | .0041 | .0040 | .0039 | .0038 | .0037 | .0036 |
-2.5 | .0062 | .0060 | .0059 | .0057 | .0055 | .0054 | .0052 | .0051 | .0049 | .0048 |
-2.4 | .0082 | .0080 | .0078 | .0075 | .0073 | .0071 | .0069 | .0068 | .0066 | .0064 |
-2.3 | .0107 | .0104 | .0102 | .0099 | .0096 | .0094 | .0091 | .0089 | .0087 | .0084 |
-2.2 | .0139 | .0136 | .0132 | .0129 | .0125 | .0122 | .0119 | .0116 | .0113 | .0110 |
-2.1 | .0179 | .0174 | .0170 | .0166 | .0162 | .0158 | .0154 | .0150 | .0146 | .0143 |
-2.0 | .0228 | .0222 | .0217 | .0212 | .0207 | .0202 | .0197 | .0192 | .0188 | .0183 |
-1.9 | .0287 | .0281 | .0274 | .0268 | .0262 | .0256 | .0250 | .0244 | .0239 | .0233 |
-1.8 | .0359 | .0351 | .0344 | .0336 | .0329 | .0322 | .0314 | .0307 | .0301 | .0294 |
-1.7 | .0446 | .0436 | .0427 | .0418 | .0409 | .0401 | .0392 | .0384 | .0375 | .0367 |
-1.6 | .0548 | .0537 | .0526 | .0516 | .0505 | .0495 | .0485 | .0475 | .0465 | .0455 |
-1.5 | .0668 | .0655 | .0643 | .0630 | .0618 | .0606 | .0594 | .0582 | .0571 | .0559 |
-1.4 | .0808 | .0793 | .0778 | .0764 | .0749 | .0735 | .0721 | .0708 | .0694 | .0681 |
-1.3 | .0968 | .0951 | .0934 | .0918 | .0901 | .0885 | .0869 | .0853 | .0838 | .0823 |
-1.2 | .1151 | .1131 | .1112 | .1093 | .1075 | .1056 | .1038 | .1020 | .1003 | .0985 |
-1.1 | .1357 | .1335 | .1314 | .1292 | .1271 | .1251 | .1230 | .1210 | .1190 | .1170 |
-1.0 | .1587 | .1562 | .1539 | .1515 | .1492 | .1469 | .1446 | .1423 | .1401 | .1379 |
-0.9 | .1841 | .1814 | .1788 | .1762 | .1736 | .1711 | .1685 | .1660 | 1635 | .1611 |
-0.8 | .2119 | .2090 | .2061 | .2033 | .2005 | .1977 | .1949 | .1922 | .1894 | .1867 |
-0.7 | .2420 | .2389 | .2358 | .2327 | .2296 | .2266 | .2236 | .2206 | .2177 | .2148 |
-0.6 | .2743 | .2709 | .2676 | .2643 | .2611 | .2578 | .2546 | .2514 | .2483 | .2451 |
-0.5 | .3085 | .3050 | .3015 | .2981 | .2946 | .2912 | .2877 | .2843 | .2810 | .2776 |
-0.4 | .3446 | .3409 | .3372 | .3336 | .3300 | .3264 | .3228 | .3192 | .3156 | .3121 |
-0.3 | .3821 | .3783 | .3745 | .3707 | .3669 | .3632 | .3594 | .3557 | .3520 | .3483 |
-0.2 | .4207 | .4186 | .4129 | .4090 | .4052 | .4013 | .3974 | .3936 | .3897 | .3859 |
-0.1 | .4602 | .4562 | .4522 | .4483 | .4443 | .4404 | .4364 | .4325 | .4286 | .4247 |
-0.0 | .5000 | .4960 | .4920 | .4880 | .4840 | .4801 | .4761 | .4721 | .4681 | .4641 |