假设检验、显著性水平、P值、Z值的理解

2024-06-02 12:13| 来源: 网络整理| 查看: 265

目录一、什么是假设检验二、弃真错误、取伪错误三、显著性水平 α \alpha α、 p p p值、 z z z值、置信区间、置信度的含义四、原假设同备择假设是否可以互换

一、什么是假设检验

假设检验(hypothesis testing)，又称统计假设检验，是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法，也是一种最基本的统计推断形式，其基本原理是先对总体的特征做出某种假设，然后通过抽样研究的统计推理，对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。

一般来说会将想要拒绝的假设设为原假设或零假设H0，想要接受的假设为备择假设H1，如何设计原假设以及备择假设可以参考文献1。假设检验可以分为两大类：

单侧检验：包括左侧检验，右侧检验，比如检验男生平均身高是否大于女生。

双侧检验：两边都需要检验，比如男生身高是否等于女生。

二、弃真错误、取伪错误

我们通过样本数据来判断总体参数的假设是否成立，但样本时随机的，因而有可能出现小概率的错误。这种错误分两种，一种是弃真错误，另一种是取伪错误。

弃真错误也叫第I类错误或α错误：它是指原假设实际上是真的，但通过样本估计总体后，拒绝了原假设。明显这是错误的，我们拒绝了真实的原假设，所以叫弃真错误，这个错误的概率我们记为α。这个值也是显著性水平，在假设检验之前我们会规定这个概率的大小。

取伪错误也叫第II类错误或β错误：它是指原假设实际上假的，但通过样本估计总体后，接受了原假设。明显者是错误的，我们接受的原假设实际上是假的，所以叫取伪错误，这个错误的概率我们记为β。

根据以上描述，我们大概可以推出原假设一般设为想要被拒绝的假设。假如原假设备被拒绝，如果出错的话，只能犯弃真错误，而犯弃真错误的概率已经被规定的显著性水平所控制了。这样对统计者来说更容易控制，将错误影响降到最小。

三、显著性水平 α \alpha α、 p p p值、 z z z值、置信区间、置信度的含义

置信水平(置信度)是指总体参数值落在样本统计值某一区内的概率；而置信区间是指在某一置信水平下，样本统计值与总体参数值间误差范围。置信区间越大，置信水平越高。比如小明声称他这次期末考试的总分数有95%的概率在600至650之间，这里的置信度就是95%，置信区间就是[600,650]

P P P值是用来判定假设检验结果的一个参数，也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。 P P P值（P-value）就是当原假设为真时，比所得到的样本观察结果更极端的结果出现的概率。如果 P P P值很小，说明原假设情况的发生的概率很小，而如果出现了，根据小概率原理，我们就有理由拒绝原假设， P P P值越小，我们拒绝原假设的理由越充分。总之， P P P值越小，表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

Z Z Z值代表随机变量经过列维-林德伯格中心极限定理的变形后，服从标准正态分布Φ（0,1），并且Z为该标准正态分布下的新变量。在数量上表示该新变量为该标准正态分布下标准差σ=1的倍数。

通过一个例子，来阐述 P P P值， Z Z Z值以及显著性水平的统计含义。设在机器正常情况下，生产出的样本长度均值为 u 0 u_{0} u0，某个批次的样本均值为 x ‾ \overline{x} x，在显著性水平为 α \alpha α时，现在我们要判断机器是否出了问题。我们构造一个中间量

z = x ‾ − u 0 σ ～ N ( 0 , 1 ) z =\frac {\overline{x} - u_0} {\sigma} ～ N(0,1) z=σx−u0～N(0,1)

假设机器正常，那么 z z z应该服从均值为0，标准差为1的标准正态分布，其中 σ \sigma σ为总体标准差。但绝大部分情况下，我们只拥有部分样本，因而需要用样本标准差去近似总体标准差。需要注意的是样本标准差公式的分母是n-1，即 ∑ ( x i − x ˉ ) 2 / ( n − 1 ) \sqrt{\sum\left(x_i-\bar{x}\right)^2/(n-1)} ∑(xi−xˉ)2/(n−1) ;而不是总体标准差公式的n；因为拥有的样本量少，很有可能把极端的数据排除在外，导致一般样本的标准差都会小于总体，因此特地除以n-1来纠正。我们将 x ‾ \overline{x} x带入上式，求得 Z Z Z值，记为 Z ‾ \overline{Z} Z。

假设 x ‾ < u 0 \overline{x}

【本文地址】

公司简介

联系我们