在介紹t-test以及獨立性檢定(test of independence)之前 , 我想應該有幾件事情應該先說明 , 這些包含了:
1. Normal distribution (Gaussian distribution)
2. Student - t distribution
3. Chi Square distribution
在介紹完前面的這些distribution的介紹後 , 接下來才是進到我們所要的主題 , 也就是:
4. t-test
5. test of independence
Normal distribution
常態分配 , 又稱做高斯分配(或bell distribution) , 在統計學上 , 它是一個很重要的distribution.
而它之所以重要的原因 , 主要有幾個原因:
1. 在實際的現實中 , 很多東西的出現機率都是符合常態分配的狀況.
2. 其它的機率分布 , 在取樣數達到一定數目時 , 其分布的形態都會偏向normal distribution(according to Law of central limit theorem )
3. 在normal distribution中 ,只要我們知道mean 與variance , 我們就可以很簡單的估算出一個人的raw score是位於整個分佈的percentile rank.
Student - t distribution
在一般狀況 , 我們通常只能知道目前的sample variance而無法知道正確的population variance ,
所以對於這樣的狀況我們必須要以sample variance來替代population variance ,
但是當我們以sample variance來代替population variance後 , 我們會發現整個distribution的狀況會與
常態分佈不一樣 , 所以我們便將這樣的distribution命名為student's t distribution.
Chi Square distribution
在一個variable下 , 我們可以使用normal distribution 來mesaure 觀測到的data value與我們所期望的value
差異程度.
但是對兩個以上的variable , 便很難可以用常態分配來達成 , 於是我們便想定義一個統計量來描述這些data與
其expected value的差異性 , 而這樣的統計量我們就稱為卡方(Chi Square) , 即:
其中Oi為observation data value, 而Ei則是Expected data value.