Biostatistics(14)假设检验:基础概念

如题所述

第1个回答  2022-06-06

假设检验 是指根据以往的经验和已知信息对总体提出假设,然后利用样本信息检验假设是否符合事实,最后作出接受还是拒绝这个假设的判断。根据检验内容是否涉及总体分布而分为 参数的假设检验和非参数检验

统计假设,简称为假设,通常用字母H表示,针对某一个问题,我们一般会提出两个完全相反的假设,并将其中的一个称为 原假设或者零假设,用H0表示 。而另一个假设则称为 对立假设或者备择假设,用H1或者Ha表示

关于总体参数θ的假设有三种情况:
(1) H0:θ>=θ0 H1:θ<θ0
(2) H0:θ<=θ0 H1:θ>θ0
(3) H0:θ=θ0 H1:θ!=θ0
以上三种情况中,(1)(2)称为单边检验,(3)称为双边检验。

那么我们要如何对提出的各种不同假设进行检验呢?
一般地,在假设检验问题中,若寻找到某个统计量,其取值大小和原假设H0是否成立有密切联系时,我们将该统计量称为该假设检验问题的 检验统计量 ,而对应于拒绝原假设H0时,样本值的范围称为拒绝域,其补集为接受域。

因为我们是根据样本推断总体,由于抽样的随机性,所以也有可能推出错误的结论。因此,在假设检验推断中可能会出现下述四种情况:

拒绝了一个真实的原假设,我们称为 第I类错误或者弃真错误 ,而接受了一个错误的假设,我们称为 第II类错误或者取伪错误 ,用α表示第I类错误的概率,β表示第II类错误的概率。
α=P(第I类错误)=P(拒绝H0|H0是真实的)
β=P(第II类错误)=P(接受H0|H0是错误的)

通常在假设检验中,我们会确定一个 显著水平α ,常取0.05或者0.01以控制第I类错误的概率,即要求检验犯第I类错误的概率不超过α,然后在满足这个约束条件的检验中,再寻找检验使得犯第II类错误的概率尽可能晓。上述即为假设检验理论中的 奈曼-皮尔逊原则
通常犯这两类错误的概率相互制约,当α减小时,β会增加,所以如果想要同时使得犯两类错误的概率都很小,就必须有足够大的样本容量。

提到这两类错误,我们就要介绍几个在生物统计中经常碰到的概念: 特异性(specificity)和敏感性(sensitivity)

所以也就是:

那么我们经常提到的P值又是什么呢?
当原假设H0为真时,检验统计量取比观察到的结果更为极端的数值的概率,称为P_值,我们会使用该值来衡量拒绝H0的理由是否充分,P_值较小说明观察到的结果在一次实验中发生的可能性较小,拒绝H0的理由越充分;相反,P_值越大说明观察到的结果在一次试验中发生的可能性较大,所以没有足够的理由拒绝H0。
当假设检验的显著性水平为α,若P_值小于等于α,则拒绝原假设,此时我们称检验结果在水平α下是统计显著的。

相似回答