什么是假設檢驗:假設檢驗(Hypothesis Testing)是數理統計學(xué)中根據一定假設條件由樣本推斷總體的一種方法。具體作法是:根據問(wèn)題的需要對所研究的總體作某種假設,記作H0;選取合適的統計量,這個(gè)統計量的選取要使得在假設H0成立時(shí),其分布為已知;由實(shí)測的樣本,計算出統計量的值,并根據預先給定的顯著(zhù)性水平進(jìn)行檢驗,作出拒絕或接受假設H0的判斷。常用的假設檢驗方法有u—檢驗法、t檢驗法、χ2檢驗法(卡方檢驗)、F—檢驗法,秩和檢驗等。
假設檢驗的基本步驟如下:
1、提出檢驗假設又稱(chēng)無(wú)效假設,符號是H0;備擇假設的符號是H1。
H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
H1:樣本與總體或樣本與樣本間存在本質(zhì)差異;
預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀(guān)察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類(lèi)型和特點(diǎn),可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>;α,結論為按α所取水準不顯著(zhù),不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著(zhù),拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實(shí)驗因素不同造成的,故在統計上成立。P值的大小一般可通過(guò)查閱相應的界值表得到。
教學(xué)中的做法:
1.根據實(shí)際情況提出原假設和備擇假設;
2.根據假設的特征,選擇合適的檢驗統計量;
3.根據樣本觀(guān)察值,計算檢驗統計量的觀(guān)察值(obs);
4.選擇許容顯著(zhù)性水平,并根據相應的統計量的統計分布表查出相應的臨界值(ctrit);
5.根據檢驗統計量觀(guān)察值的位置決定原假設取舍。
統計學(xué)假設檢驗主要有T檢驗、Z檢驗兩種方法,具體內容是:
1、T檢驗,亦稱(chēng)student t檢驗(Student's t test),主要用于樣本含量較小(例如n<30),總體標準差σ未知的正態(tài)分布資料。
2、z檢驗(U檢驗),是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗的方法。它是用標準正態(tài)分布的理論來(lái)推斷差異發(fā)生的概率,從而比較兩個(gè)平均數的差異是否顯著(zhù)。
除以上兩種主要方法外,還有F檢驗和卡方檢驗。
假設檢驗是不可能做到完全正確的,它只能保證假設在最大概率上的成立。
一般雙側U-檢驗的做法就是你列出的檢驗法1。
利用檢驗法2或3,表面上結果是檢驗水來(lái)平a下進(jìn)行的,但實(shí)際內在的結果是:假設是在檢驗水平為b時(shí)成立;其中b可能大于a,也可能小于a。也就是說(shuō)
(1)(當假設值與真實(shí)值差別非常小時(shí)) b≥a,即在比a更高的檢驗水平下也能成立,若使用這種檢驗法,則“棄真”的概率就更大;
(2)(當假設值與真實(shí)值差別比較大時(shí)) b≤自a,即只有在比a低的檢驗水平下才能成立,若使用這種檢驗法,則“納偽”的概率就更大。
所以一般不采用檢驗法2和3。
可以想像,檢驗法1中,u2和u1的大小關(guān)系是由契比學(xué)夫不等式確定的,只有成立與不成立的情況,沒(méi)有程度關(guān)系。
而在檢驗法2和3中,u0或xx落在置信區間內的具體位置對其概率的影響是很大的,所以檢驗的結果也不一定準確,至少檢驗的結果不是對應于檢驗水平a的。
如果是通過(guò)矩估計法得到的u0,那么你列出的檢驗法2和檢驗法3就是一回事zhidao,u0=xx。
假設檢驗的一般步驟
假設檢驗的一般步驟:
(一)根據所研究問(wèn)題的要求,提出原假設 和備擇假設 。
有三種類(lèi)型的原假設和備擇假設,以總體均值的假設檢驗為例加以說(shuō)明。
1. : ; :
2. : ; :
3. : ; :
其中,1. 是雙側假設檢驗;2. 是右側假設檢驗;3. 是左側假設檢驗。因為假設檢驗是根據概率意義下的反證法來(lái)否定原假設,所以原假設必須包含等號。究竟采用哪一種檢驗要視具體問(wèn)題而定,尤其是選擇右側檢驗還是左側檢驗時(shí),更要慎重。
(二)找出檢驗的統計量及其分布。
與參數估計一樣,假設檢驗也要根據樣本數據進(jìn)行統計推斷。用于判斷是否接受原假設 的統計量稱(chēng)為檢驗統計量。在實(shí)際應用時(shí),檢驗統計量的選擇及其分布要根據檢驗的具體內容、抽樣的方式、樣本容量的大小和總體方差是否已知等多種因素來(lái)確定,常用的檢驗統計量有 統計量、統計量、統計量及 統計量等。
(三)規定顯著(zhù)性水平 ,就是選擇發(fā)生第一類(lèi)錯誤的最大允許概率。
顯著(zhù)性水平 的大小,取決于發(fā)生第一類(lèi)錯誤和第二類(lèi)錯誤產(chǎn)生的后果。如果 取的較小,那么 將會(huì )較大,雖然否定一個(gè)真實(shí)原假設(棄真)的風(fēng)險小了,其代價(jià)是增加了接受一個(gè)不真實(shí)原假設(取偽)的概率;反之,如果 取的較大,那么 將會(huì )較小,雖然接受一個(gè)不真實(shí)原假設(取偽)的的風(fēng)險小了,其代價(jià)是增加了否定一個(gè)真實(shí)原假設(棄真)的概率。因此,要根據研究問(wèn)題的需要選擇一個(gè)合適的 ,通常 選為 、或 等。
(四)確定決策規則。
在選擇好檢驗統計量和規定了顯著(zhù)性水平后,就可以根據
求出否定原假設和接受原假設的臨界值,從而也就確定了否定域 。
(五)計算檢驗統計量的值,作出統計決策。
如果檢驗統計量的值落在否定域 里,則否定 ;否則,不否定 。
需要說(shuō)明的是,顯著(zhù)性檢驗只對發(fā)生第一類(lèi)錯誤的概率進(jìn)行了控制,而不對發(fā)生第二類(lèi)錯誤的概率加以限制。因此,當我們決定接受 時(shí),并不意味著(zhù) 一定為真,因為我們不能確定該決策有多大的可靠性。確切的說(shuō)法是:在顯著(zhù)性水平為 時(shí),根據這次試驗得到的樣本數據,不足以否定 。鑒于發(fā)生第二類(lèi)錯誤的不確定性,通常在做決策時(shí),統計學(xué)家建議我們采用“不否定 或不拒絕 ”的說(shuō)法,而不采用“接受 ” 的說(shuō)法。但是,要否定 ,只要一個(gè)反例就足夠了。否定了 ,也就避免了第二類(lèi)錯誤,所以根據樣本數據,作出否定 的決策就具有了可靠性。
-------------我已經(jīng)盡力了,你是高中生嗎?
假設檢驗是不可能做到完全正確的,它只能保證假設在最大概率上的成立。
一般雙側U-檢驗的做法就是你列出的檢驗法1。利用檢驗法2或3,表面上結果是檢驗水來(lái)平a下進(jìn)行的,但實(shí)際內在的結果是:假設是在檢驗水平為b時(shí)成立;其中b可能大于a,也可能小于a。
也就是說(shuō)(1)(當假設值與真實(shí)值差別非常小時(shí)) b≥a,即在比a更高的檢驗水平下也能成立,若使用這種檢驗法,則“棄真”的概率就更大;(2)(當假設值與真實(shí)值差別比較大時(shí)) b≤自a,即只有在比a低的檢驗水平下才能成立,若使用這種檢驗法,則“納偽”的概率就更大。所以一般不采用檢驗法2和3。
可以想像,檢驗法1中,u2和u1的大小關(guān)系是由契比學(xué)夫不等式確定的,只有成立與不成立的情況,沒(méi)有程度關(guān)系。而在檢驗法2和3中,u0或xx落在置信區間內的具體位置對其概率的影響是很大的,所以檢驗的結果也不一定準確,至少檢驗的結果不是對應于檢驗水平a的。
如果是通過(guò)矩估計法得到的u0,那么你列出的檢驗法2和檢驗法3就是一回事zhidao,u0=xx。
所謂假設檢驗,就是根據研究目的,對樣本所屬總體特征提出一個(gè)假設,然后用適當方法根據樣本所提供的信息,對所提出的假設作出拒絕或不拒絕的結論的過(guò)程。
假設檢驗一般分為五個(gè)步驟: ① 建立假設:包括: H0,稱(chēng)無(wú)效假設;H1: 稱(chēng)備擇假設;② 確定檢驗水準:檢驗水準用α表示,α一般取0.05;③ 計算檢驗統計量:根據不同的檢驗方法,使用特定的公式計算;④確定P值:通過(guò)統計量及相應的界值表來(lái)確定P值;⑤推斷結論:如P>α,則接受H0,差別無(wú)統計學(xué)意義;如P≤α,則拒絕H0, 差別有統計學(xué)意義。
1、提出檢驗假設又稱(chēng)無(wú)效假設,符號是H0;備擇假設的符號是H1。
H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
H1:樣本與總體或樣本與樣本間存在本質(zhì)差異;
預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀(guān)察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類(lèi)型和特點(diǎn),可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>;α,結論為按α所取水準不顯著(zhù),不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;
如果P≤α,結論為按所取α水準顯著(zhù),拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實(shí)驗因素不同造成的,故在統計上成立。P值的大小一般可通過(guò)查閱相應的界值表得到。
擴展資料
注意事項
要進(jìn)行統計假設的檢驗, 必須利用各種不同的判據, 即利用規則來(lái)選擇。假設的采用與拒絕, 通常在判據的前件中應有某個(gè)數量指標(稱(chēng)為統計判據)。
根據判據方式, 假設分為參數假設和非參數假設。按照參數統計結論, 通常應提出被研究特征在總體中分布的具體形式, 因為在這種情況下, 統計學(xué)通常是以分布參數(平均值、方差、回歸系數)的利用為依據的。非參數判據的優(yōu)點(diǎn)是能把判據用于只靠名義級或次序級完成的特征度量上。
否定零假設的判據值總體能構成否定域。如果某一點(diǎn)能將否定域與接受零假設的區域劃分開(kāi)來(lái), 這一點(diǎn)就稱(chēng)為臨界點(diǎn)。
參考資料來(lái)源:百度百科-假設檢驗
參考資料來(lái)源:百度百科-統計假設檢驗
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.951秒