什么叫非參數(shù)統(tǒng)計(jì)?先從參數(shù)統(tǒng)計(jì)說(shuō)起?傮w的特征值叫參數(shù),一些特定分布都有其參數(shù),如正態(tài)分布由μ、σ兩個(gè)參數(shù)所決定。有些統(tǒng)計(jì)方法是根據(jù)特定分布設(shè)計(jì)出來(lái)的,如估計(jì)正常值范圍的正態(tài)分布法、U檢驗(yàn)等是根據(jù)正態(tài)分布設(shè)計(jì)出來(lái)的,這樣的一些方法統(tǒng)稱(chēng)為參數(shù)統(tǒng)計(jì),前邊已學(xué)過(guò)的t檢驗(yàn)和方差分析都屬于參數(shù)統(tǒng)計(jì)。但在實(shí)際工作中,有些資料不易判定或不符合所要求的分布,因此就需要有這樣一些統(tǒng)計(jì)方法,它不受由參數(shù)所決定的特定分布的限制而適用于任意分布,這類(lèi)統(tǒng)計(jì)方法稱(chēng)為非參數(shù)統(tǒng)計(jì)(non-parametric Statistics)或稱(chēng)不拘分布distribution-free)的統(tǒng)計(jì)。
用非參數(shù)統(tǒng)計(jì)法處理資料時(shí)所比較的是分布而不是參數(shù)。它不考慮資料的分布類(lèi)型,直接用樣本數(shù)據(jù)的符號(hào)、大小順序號(hào)、綜合判斷劃分的名次、嚴(yán)重程度、優(yōu)劣等級(jí)等作比較。
非參數(shù)統(tǒng)計(jì)的優(yōu)缺點(diǎn)是:
方法簡(jiǎn)便、易學(xué)易用,要求資料所具備的條件不像參數(shù)法那樣嚴(yán)格,因而易于推廣使用。另外,參數(shù)法難以處理的等級(jí)資料,非參數(shù)法卻能加以分析,故其應(yīng)用范圍廣泛。
但如果已知資料所屬總體近似于正態(tài)分布,或者資料經(jīng)代換后可呈某種特定分布,那末,非參數(shù)統(tǒng)計(jì)法所得信息就不及參數(shù)統(tǒng)計(jì)法多,當(dāng)檢驗(yàn)假設(shè)錯(cuò)誤時(shí),非參數(shù)統(tǒng)計(jì)發(fā)現(xiàn)差異的靈敏度也較低。
當(dāng)資料中例數(shù)并不太少時(shí),用非參數(shù)統(tǒng)計(jì)所得的結(jié)論常和用參數(shù)統(tǒng)計(jì)法相同,但當(dāng)統(tǒng)計(jì)結(jié)果在顯著性界線附近時(shí),兩者結(jié)論可能不同,此時(shí),若資料具備參數(shù)統(tǒng)計(jì)要求的條件,則以參數(shù)統(tǒng)計(jì)結(jié)論較合理,若資料不具備參數(shù)統(tǒng)計(jì)要求的條件,則非參數(shù)統(tǒng)計(jì)的結(jié)論可能準(zhǔn)確些。
在下述情況下非參數(shù)統(tǒng)計(jì)可作為首選方法:
1.各種資料的初步分析;
2.某種標(biāo)志不便準(zhǔn)確的測(cè)量,而只能以嚴(yán)重程度、優(yōu)劣等級(jí)、成效大小、名次先后或綜合判斷等方式定出次序時(shí);
3.資料的分布類(lèi)型不能確定時(shí);
4.綜合分析同質(zhì)性較差的資料時(shí),如不同地點(diǎn),不同年份的某種實(shí)驗(yàn)結(jié)果等;
5.組內(nèi)個(gè)別數(shù)據(jù)偏離過(guò)大,或各組內(nèi)變異相差懸殊時(shí)。