显著性检验

1、显著性检验

只对犯第Ⅰ类错误的概率加以控制,而不考虑犯第二类错误的概率的检验称为显著性检验。

2、假设检验原理

小概率事件在一次实验中几乎是不可能发生的。
如果一个小概率实验在一次随机试验中发生了,那么我们有理由拒绝原假设!

3、两类错误的定义

  • 第Ⅰ类错误是原假设 H0H_0为真却被我们拒绝了,犯这种错误的概率用 αα 表示,所以也称 αα 错误或弃真错误;
  • 第Ⅱ类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用 ββ 表示,所以也称 ββ 错误或取伪错误。

4、两类错误的概率

  • 对于一定的样本量 nn ,如果减少 αα 错误,就会增大犯 ββ 错误的机会;若减少 ββ 错误就会增大犯 αα 错误的机会。
  • 增大样本量可以同时减少 ααββ (贾俊平说)。(腾讯面试官说减少的是 ββ )

5、两类错误的控制

  • 一般来说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。
  • 在假设检验中,一般首先控制犯 αα 错误。主要的原因在于,原假设是什么通常是明确的,而备择假设是什么通常是模糊的。

6、两类错误的地位

在进行显著性检验时,犯第Ⅰ类错误的概率是由我们控制的,αα 取得小,则概率P{H0为真时拒绝H0}P\{当H_0为真时拒绝H_0\}就越小,这保证了当原假设为真时错误地拒绝原假设的可能性很小。这意味着原假设是受到保护的,也表明原假设和备择假设的地位不是对等的。

7、“不拒绝” 与 “接受”

从假设检验的原理看,不拒绝原假设意味着我们所构造的与原假设相矛盾的事件没有发生,但可能会有许多其他的与原假设矛盾的小概率事件,我们没有也无法证实所有的这些小概率事件不会发生,因此,我们把假设检验中出现接受H0H_0 的结果解释为“没有发现充足的证据反对H0H_0”,或更严格地的解释为,“在显著性水平 αα 下没有发现充足的证据反对H0H_0”,而不是“接受原假设H0H_0”,因为我们无法证明原假设是正确的。即接受备择假设一定意味着原假设错误;没有拒绝原假设并不能表明备择假设一定是错的。

8、假设检验的流程

  • 根据实际问题的要求,提出原假设和备择假设;
  • 给定显著性水平 α\alpha 以及样本容量nn
  • 确定检验统计量及拒绝域的形式;
  • PP{当 H0H_{0} 为真拒绝 H0H_{0}} ≤ α\alpha 取样;
  • 根据样本观察值做出决策,是接受原假设还是拒绝原假设。

9、tt 检验

  • 适用场景tt 检验的前提是要求样本服从正态分布或近似正态分布,不然可以利用一些变换(取对数、开根号、倒数等等)试图将其转化为服从正态分布是数据,如若还是不满足正态分布,只能利用非参数检验方法。
    当样本量大于3030的时候,可以认为数据近似正态分布。

  • 单样本均值检验(One-sample t-test):用于检验 总体方差未知、正态数据或近似正态的 单样本的均值 是否与 已知的总体均值相等。

  • 两独立样本均值检验(Independent two-sample t-test):用于检验 两对独立的 正态数据或近似正态的 样本的均值 是否相等,这里可根据总体方差是否相等分类讨论。

  • 配对样本均值检验(Dependent t-test for paired samples):用于检验 一对配对样本的均值的差 是否等于某一个值。

  • 回归系数的显著性检验(t-test for regression coefficient significance):用于检验 回归模型的解释变量对被解释变量是否有显著影响。

10、样本量的确定

n=(Zα+Zβ)22σ2δ2n = \frac{(Z_{\alpha} + Z_{\beta})^{2}*2\sigma^{2}}{\delta^{2}}

其中,nn为样本量,ZαZ_{\alpha} 双侧临界值,α\alpha 一般为0.050.05ZβZ_{\beta}为单侧临界值,σ\sigma 为标准差,δ\delta 为实验组与对照组的差值。


显著性检验
https://www.lihaibao.cn/2022/04/28/显著性检验/
Author
Seal Li
Posted on
April 28, 2022
Licensed under