1、第七讲第七讲 假设检验假设检验一、基本概念一、基本概念二、单个正态总体的检验二、单个正态总体的检验三、两个正态总体的检验三、两个正态总体的检验五、非正态总体大样本参数检验五、非正态总体大样本参数检验六、六、Pearson检验法检验法四、似然比检验四、似然比检验一、一、基本概念基本概念在在自然科学和社会科学等中,常常要对某自然科学和社会科学等中,常常要对某些重要问题做出回答:些重要问题做出回答:是是或或否否。如如月球比地球月球比地球早早形成吗?形成吗?一种新药对某种病有效吗?一种新药对某种病有效吗?某种某种股票会涨吗?股票会涨吗?新推出的电视节目收视率高吗?新推出的电视节目收视率高吗?等等。等等
2、。为了回答这些问题,为了回答这些问题,我们需要对感兴趣我们需要对感兴趣的的问题进行试验或观察获得相关数据,问题进行试验或观察获得相关数据,根据这根据这些数据决定些数据决定是是或或否否的过程称为的过程称为假设检验假设检验。(Hypothesis Testing)在在这节,给出一般的这节,给出一般的Neyman-Pearson假设假设检验构架。检验构架。原假设和备择假设原假设和备择假设布或布或关于参数关于参数 的推测,的推测,称为称为假设假设,其中其中 是是 的非空真子集。的非空真子集。在在一个假设检验中,常涉及两个假设。一个假设检验中,常涉及两个假设。所所要检验的假设称为要检验的假设称为原假设原
3、假设或或零假设零假设,记记为为 。而与而与 不相容的假设,称为不相容的假设,称为备择假设备择假设或或对立对立假设假设,记为记为 。对参数统计模型对参数统计模型 而而言,原假设和备择假设这对矛盾的统一体言,原假设和备择假设这对矛盾的统一体称为称为假设检验问题假设检验问题。在在假设检验问题中,假设检验问题中,不相交的非空子集,不相交的非空子集,一定成立。一定成立。保留这个的灵活性,保留这个的灵活性,不仅是理论的不仅是理论的需要,需要,也有其实际意义。也有其实际意义。则称则称为为简单假设简单假设(Simple Hypothesis),否则称为否则称为复复合假设合假设(Composite Hypoth
4、esis),对对备择假设也有备择假设也有简单假设和复合假设。简单假设和复合假设。拒绝域、接受域、检验统计量拒绝域、接受域、检验统计量检验一个假设,就是根据某一法则在原检验一个假设,就是根据某一法则在原假设和备择假设之间做出选择,假设和备择假设之间做出选择,而而基于样本基于样本做出拒绝做出拒绝 或接受或接受 所依赖的法则称为所依赖的法则称为检验检验。这样一个检验就等同于将样本空间分成这样一个检验就等同于将样本空间分成两个互不相交的子集两个互不相交的子集 和和 ,绝绝 ,称称 为为拒绝域拒绝域,(Rejection Region)称称为为接受域接受域(Acceptance Region)。这样检验
5、和拒绝这样检验和拒绝域域就建立起一一对应关系。就建立起一一对应关系。为了确定拒绝域,为了确定拒绝域,往往根据问题的直观背往往根据问题的直观背景,景,寻找合适的统计量寻找合适的统计量 ,要要能由统计量能由统计量 确定出拒绝域确定出拒绝域 ,这样的统这样的统计量计量 称为称为检验统计量检验统计量(Test Statistic)。两类错误两类错误由于样本时随机的,由于样本时随机的,进行检验时可能犯进行检验时可能犯两类错误,两类错误,其一是当其一是当 为真时,却拒绝为真时,却拒绝 ,称为称为第一类错误第一类错误,其概率为其概率为其二是当其二是当 为假时,却接受为假时,却接受 ,称为称为第二类第二类错误
6、错误,其概率为其概率为定义定义8.1一个检验的一个检验的功效功效(Power)定义为当定义为当 不不成成立时立时拒绝拒绝 的概率,的概率,即即检验的显著性水平检验的显著性水平当当样本容量样本容量 固定时,固定时,要减少犯第一类错要减少犯第一类错误的概率,误的概率,就会增大犯第二类错误的概率;就会增大犯第二类错误的概率;反反之,之,若要减少犯第二类错误的概率,就会增大若要减少犯第二类错误的概率,就会增大犯第一类错误的概率。犯第一类错误的概率。即就是说当样本容量固即就是说当样本容量固定时,定时,不可能同时减少犯两类错误的概率,不可能同时减少犯两类错误的概率,这这是一对不可调和的矛盾。是一对不可调和
7、的矛盾。类类错误的概率在给定的范围内,错误的概率在给定的范围内,寻找检验使得寻找检验使得犯第二类错误的概率尽可能的小,犯第二类错误的概率尽可能的小,即就是使检即就是使检验的功效尽可能的大。验的功效尽可能的大。这样就是在给定一个较这样就是在给定一个较小的数小的数 (一般取为一般取为0.01,0.05,0.1等等),在满足在满足的的检验方法中,检验方法中,寻找使得功效寻找使得功效尽可能大的检验方法。尽可能大的检验方法。Neyman-Pearson检验原理就是控制犯第一检验原理就是控制犯第一将将 称为称为显著性水平显著性水平。假设检验的步骤假设检验的步骤(1)提出假设检验问题,提出假设检验问题,(2
8、)根据根据 ,选,选取适当的统计量,并确定其取适当的统计量,并确定其分布;分布;(3)给定显著性水平给定显著性水平 ;(4)确定拒绝域;确定拒绝域;(5)由样本观测值,计算统计量的值;由样本观测值,计算统计量的值;(6)作出推断,是拒绝作出推断,是拒绝 ,还是接受,还是接受 。二、二、单个正态总体的检验单个正态总体的检验(一)(一)总体方差已知时,总体均值的检验总体方差已知时,总体均值的检验检验统计量检验统计量的简单样本,的简单样本,设设 是来自正态总体是来自正态总体方差方差 已知,已知,考虑检验问题考虑检验问题给定显著性水平给定显著性水平 ,拒绝域拒绝域(双侧假设检验双侧假设检验)单侧假设检
9、验单侧假设检验(1)(2)(3)(4)理论上,可以证明理论上,可以证明(1)与与(2)、(3)与与(4)的检验法的检验法相同,相同,而而(1)和和(3)的拒绝域容易求出,分别为的拒绝域容易求出,分别为(二)(二)总体方差未知时,总体均值的检验总体方差未知时,总体均值的检验检验统计量检验统计量给定显著性水平给定显著性水平 下,拒绝域为下,拒绝域为给定显著性水平给定显著性水平 下,拒绝域为下,拒绝域为给定显著性水平给定显著性水平 下,拒绝域为下,拒绝域为(三)(三)总体方差的检验总体方差的检验的简单样本,的简单样本,设设 是来自正态总体是来自正态总体考虑检验问题考虑检验问题当当 未知时,未知时,检
10、验统计量为检验统计量为拒绝域拒绝域当当 已知时,已知时,检验统计量为检验统计量为拒绝域拒绝域类似的也有相应形式单侧检验,在此就不列出。类似的也有相应形式单侧检验,在此就不列出。三、三、两个正态总体的检验两个正态总体的检验设设 是来自正态总体是来自正态总体的样本容量为的样本容量为 简单样本,简单样本,是来是来自正态总体自正态总体 的样本容量为的样本容量为 的简单的简单样本,且两样本独立。样本,且两样本独立。考虑检验问题考虑检验问题 两个正态总体均值的检验两个正态总体均值的检验给定显著性水平给定显著性水平 ,拒绝域拒绝域(一)(一)已知时,总体均值的检验已知时,总体均值的检验(二)(二)未知但相等
11、,总体均值的检验未知但相等,总体均值的检验检验统计量检验统计量 成立时,成立时,当当 成立时,检验统计量为成立时,检验统计量为拒绝域拒绝域其中其中 两个正态总体方差的检验两个正态总体方差的检验考虑检验问题考虑检验问题当当 未知时,未知时,当当 成立时,检验统计量为成立时,检验统计量为拒绝域拒绝域当当 已知时,已知时,当当 成立时,检验统计量为成立时,检验统计量为拒绝域拒绝域类似的也有相应形式单侧检验,在此就不列出。类似的也有相应形式单侧检验,在此就不列出。0.0 0.0-1.0-0.1-0.4 0.0-1.9 0.3 0.0 1.2 0.0-1.0 0.9-1.4-0.5标准正态分布标准正态分
12、布 产生的随机数产生的随机数 ,One-sample t-Testdata:x1 t=-1.2344,df=14,p-value=0.2374 alternative hypothesis:true mean is not equal to 0 95 percent confidence interval:-0.7117407 0.1917407 sample estimates:mean of x,-0.26四、四、似然比检验似然比检验设设 是来自密度函数(或分布率)是来自密度函数(或分布率)为为 的总体的简单样本,的总体的简单样本,考虑检验考虑检验问题:问题:一个比较直观且自然方法是考虑似
13、然比一个比较直观且自然方法是考虑似然比当当 较大时,拒绝原假设较大时,拒绝原假设 ,这种检验方法称为,这种检验方法称为似然比检验似然比检验。例例 对正态总体,方差已知,检验问题对正态总体,方差已知,检验问题似然比为似然比为否则,接受否则,接受令令 ,则则拒绝域为拒绝域为因为因为 均已知且均已知且 ,的单调增函数,故由等式的单调增函数,故由等式所以所以 是是可得可得 。这样检验统计量可取为这样检验统计量可取为这是通常的单边这是通常的单边 检验。检验。对一般的假设检验问题对一般的假设检验问题检验的拒绝域为检验的拒绝域为定义似然比检验统计量为定义似然比检验统计量为其中临界值其中临界值 可由可由确定。
14、确定。下面也通过例子说明其具体应用。下面也通过例子说明其具体应用。例例似然比似然比对正态总体,方差未知,检验问题对正态总体,方差未知,检验问题这里这里当当 未知时,其极大似然估计分别为未知时,其极大似然估计分别为当当 已知时,已知时,极大似然估计为极大似然估计为所以似然比为所以似然比为若令若令 ,则则当当 成立时,成立时,且且 是是 单调增函数,因此由单调增函数,因此由可得临界值为可得临界值为这样检验统计量为这样检验统计量为拒绝域为拒绝域为当当 成立时,成立时,且且 是是 单调增函数,因此由单调增函数,因此由当然也可令当然也可令,则,则这是通常的双边这是通常的双边 检验。检验。拒绝域为拒绝域为
15、这样检验统计量也可以为这样检验统计量也可以为可得临界值为可得临界值为可以证明这时的可以证明这时的 检验和检验和 检验是等价的。检验是等价的。从上述两个例子可得求似然比检验的一般步骤:从上述两个例子可得求似然比检验的一般步骤:(1)在在 内求内求 的极大似然估计的极大似然估计 ,在在 内求内求 的极大似然估计的极大似然估计(2)计算并化简计算并化简使成形式使成形式 ,满足两个要求,满足两个要求,是是 的单调增函数或单调减函数;的单调增函数或单调减函数;当当 成立时,成立时,的分布完全已知。的分布完全已知。(3)增函数时,由增函数时,由 求临界值求临界值减函数时,由减函数时,由 求临界值求临界值(
16、4)检验统计量取为检验统计量取为增函数时,拒绝域为增函数时,拒绝域为减函数时,拒绝域为减函数时,拒绝域为其一:其一:其二:其二:注:注:(1)正态总体下参数的检验基本都是似然比检验正态总体下参数的检验基本都是似然比检验(2)似然比检验可用于检验样本来自两个不同类似然比检验可用于检验样本来自两个不同类型分布之一,型分布之一,样本来自正态总体族样本来自正态总体族样本来自双参数指数分布族样本来自双参数指数分布族其中其中如如(3)似然比检验适应面广,似然比检验适应面广,(4)一般情形下,一般情形下,难获得,难获得,总体均可以构造,总体均可以构造,且构造的检验常具有一且构造的检验常具有一些优良性质,些优良性质,如在某种意义下具有最有性。如在某种意义下具有最有性。因此临界值的求法有两种。因此临界值的求法有两种。其一,其一,利用利用Monte-Carlo模拟计算;模拟计算;其二,其二,当样本当样本容量容量 很大时,很大时,利用似然比统计量的极限利用似然比统计量的极限分布近似给出。分布近似给出。正态总体和非正态正态总体和非正态似然比统计量的精确分布很似然比统计量的精确分布很五、五、非正态总体大样本参数