一、相關(guān)概念
1、極差
最直接也是最簡(jiǎn)單的方法,即最大值-最小值(也就是極差)來(lái)評價(jià)一組數據的離散度。這一方法在日常生活中最為常見(jiàn),比如比賽中去掉最高最低分就是極差的具體應用。
2、離均差平方和
由于誤差的不可控性,因此只由兩個(gè)數據來(lái)評判一組數據是不科學(xué)的。所以人們在要求更高的領(lǐng)域不使用極差來(lái)評判。其實(shí),離散度就是數據偏離平均值的程度。因此將數據與均值之差(我們叫它離均差)加起來(lái)就能反映出一個(gè)準確的離散程度。和越大離散度也就越大。
但是由于偶然誤差是成正態(tài)分布的,離均差有正有負,對于大樣本離均差的代數和為零的。為了避免正負問(wèn)題,在數學(xué)有上有兩種方法:一種是取絕對值,也就是常說(shuō)的離均差絕對值之和。而為了避免符號問(wèn)題,數學(xué)上最常用的是另一種方法--平方,這樣就都成了非負數。因此,離均差的平方和成了評價(jià)離散度一個(gè)指標。
3、方差
由于離均差的平方和與樣本個(gè)數有關(guān),只能反映相同樣本的離散度,而實(shí)際工作中做比較很難做到相同的樣本,因此為了消除樣本個(gè)數的影響,增加可比性,將離均差的平方和求平均值,這就是我們所說(shuō)的方差成了評價(jià)離散度的較好指標。
樣本量越大越能反映真實(shí)的情況,而算術(shù)平均值卻完全忽略了這個(gè)問(wèn)題,對此統計學(xué)上早有考慮,在統計學(xué)中樣本的均差多是除以自由度(n-1),它的意思是樣本能自由選擇的程度。當選到只剩一個(gè)時(shí),它不可能再有自由了,所以自由度是n-1。
二、標準差意義
由于方差是數據的平方,與檢測值本身相差太大,人們難以直觀(guān)的衡量,所以常用方差開(kāi)根號換算回來(lái)這就是我們要說(shuō)的標準差。
在統計學(xué)中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到只剩一個(gè)時(shí),它不可能再有自由了,所以自由度是n-1。