【假设检验中的P值是什么意思?】在统计学问题中,我们经常会见到P值或者P-value,比如回归分析中,通过P值来判断回归变量的合理性 。
翻开统计学书籍,会得到一个解释:P值就是原假设为真时所得到的样本观察结果或更极端结果出现的概率 。
这句话其实很容易理解,但是,初学者看到这句话,一脸懵逼,感觉说了跟没说一样 。
对于假设检验来说,一般我们根据计算出来的z值和临界值进行比较 , 来决定是否拒绝原假设 。
如下图所示,如果落在两侧的拒绝域,就拒绝原假设 , 反之,则接受原假设 。
但是,在实际应用中,我们往往是根据P值来检验统计量 。
那么,这个P值是什么意思?
假设显著性水平是0.05,也就是,那么两侧的面积,相当于概率,其实就是0.05 。
如果,此时计算出来的z值落在了下图中左侧蓝色这个小区域内,图中红色标记 。
那么,这个z值对应的概率 , 也就是红线左侧曲线下方的面积可以计算出来 。
举个例子,z值计算出来为:-2.5,则可以计算出对应的概率为:0.00621 。
用Excel公式就可以计算出来 , 公式如下 。
计算出来之后,再乘以2,即
0.00621×2=0.01242,因为两边都有 , 对称的(假设是双侧检验) 。
计算出来的这个概率值就叫作P值(P-value) 。
如果这个值很小,也就是小于0.05,那么,说明原假设代表的这个事件是一个小概率事件,不会发生 。所以,就拒绝原假设 。
再来看本文开头的解释:P值就是原假设为真时所得到的样本观察结果或更极端结果出现的概率 。
P值其实就是原假设所代表的这个事件出现的概率,如果小于规定的显著性水平 , 则拒绝原假设 。
以上就是假设检验中的P值 。
如果想系统学习数据分析,请查看以下专栏 。