索欲言 | |
2006.03.07 | |
不同圖形在班級考試分數所代表意義 | |
有些資料的分布並非呈現常態分布,例如國小的教師所出的平時測驗考高分的人居多,是呈現負偏態的分布。 【偏態(skewness)】:指大部份的數值落在平均數的左邊或右邊。種類有二: 【峰度(kurtosis)】:決定數值分布的同質性與異質性,越接近高狹峰表示越同質,越趨向低闊峰表示越異質。種類有二: |
https://mx.nthu.edu.tw/~mhlee/07III/talk/950307.htm
https://zh.wikipedia.org/zh-tw/%E5%B3%B0%E5%BA%A6
峰度[編輯]
峰度(英語:Kurtosis),亦稱尖度,在統計學中衡量實數隨機變數機率分布的峰態。峰度高就意味著變異數增大是由低頻度的大於或小於平均值的極端差值引起的。

定義
[編輯]母體峰態係數定義為:
在更通常的情況下,峰度被定義為四階累積量除以二階累積量的平方,它等於四階主動差除以機率分布變異數的平方再減去3:
這也被稱為超值峰度(excess kurtosis)。「減3」是為了讓常態分布的峰度為0。
假定為個獨立變量之和,且這些變量和具有相同的分布,那麽:, 但如果峰度被定義為:,公式可變得更加複雜。
更一般地說,假定為變異數相等的獨立隨機變數,那麼:
而定義中如果不包含「減3」就無法成立。
如果超值峰度為正,稱為高狹峰(leptokurtic)。如果超值峰度為負,稱為低闊峰(platykurtic)。
樣本峰度
[編輯]對於具有個值的樣本,樣本峰度為:
其中是四階樣本主動差,是二階主動差(即使樣本變異數),是第個值,是樣本平均值。注意此處計算變異數的時候除數是,而不是單獨計算樣本變異數的。
有時候也使用公式:
- ,
其中,為樣本大小,為事先計算的變異數,為第個測量值,為事先計算的算術平均數。
在一些統計軟體中,其公式有所差別。如EXCEL,計算樣本的峰度公式如下:
參見
[編輯]參考資料
[編輯]- Joanes, D. N. & Gill, C. A. (1998) Comparing measures of sample skewness and kurtosis. Journal of the Royal Statistical Society (Series D): The Statistician 47 (1), 183–189. doi:10.1111/1467-9884.00122
https://zh.wikipedia.org/zh-tw/%E5%81%8F%E5%BA%A6
偏度[編輯]

偏度(英語:skewness),亦稱歪度,在機率論和統計學中衡量實數隨機變數機率分布的不對稱性。偏度的值可以為正,可以為負或者甚至是無法定義。在數量上,偏度為負(負偏態;左偏)就意味著在機率密度函數左側的尾部比右側的長,絕大多數的值(不一定包括中位數在內[1])位於平均值的右側。偏度為正(正偏態;右偏)就意味著在機率密度函數右側的尾部比左側的長,絕大多數的值(不一定包括中位數[1])位於平均值的左側。偏度為零就表示數值相對均勻地分布在平均值的兩側,但不一定意味著其為對稱分布。

介紹
[編輯]偏度分為兩種:
如果分布對稱,那麼平均值=中位數,偏度為零(此外,如果分布為單峰分布,那麽平均值=中位數=眾數)。
定義
[編輯]隨機變數的偏度為三階標準動差,可被定義為:
其中是三階主動差,是標準差。是期望值算子。等式的最後以三階累積量與二階累積量的1.5次方的比率來表示偏度。這和用四階累積量除去二階累積量的平方來表示峰度的方法向類似。
偏度有時用來表示。老教科書過去常常用來表示偏度,可是由於偏度可為負,這樣的表示法較為不便。
對上面的等式進行擴展可導出用非主動差E[X3]來表示偏度的公式:
樣本偏度
[編輯]具有個值的樣本的樣本偏度為:
其中是樣本平均值,是三階樣本主動差,是二階樣本中心距,即樣本變異數。
性質
[編輯]當: 時,偏度可以是無窮大的。
或者當: (為負)及
(為正)時,偏度無法定義。
在後面的這個例子中,三階累積量是無法定義的。 其他分布形式比如:
二階和三階累積量是無窮大的,所以偏度也是無法定義的。
如果假定為個獨立變量之和並且這些變量和具有相同的分布,那麽的三階累積量是的倍,的二階累積量也是的倍,所以: 。根據中央極限定理,當其接近高斯分布時變量之和的偏度減小。
參見
[編輯]註釋
[編輯]參考資料
[編輯]- Groeneveld, RA; Meeden, G. Measuring Skewness and Kurtosis. The Statistician. 1984, 33 (4): 391–399 [2010-10-30]. doi:10.2307/2987742. (原始內容存檔於2020-08-20).
- Johnson, NL, Kotz, S, Balakrishnan N (1994) Continuous Univariate Distributions, Vol 1, 2nd Edition Wiley ISBN 0-471-58495-9
- MacGillivray, HL. Shape properties of the g- and h- and Johnson families. Comm. Statistics - Theory and Methods. 1992, 21: 1244–1250.