显著性检验
1、显著性检验
只对犯第Ⅰ类错误的概率加以控制,而不考虑犯第二类错误的概率的检验称为显著性检验。
2、假设检验原理
小概率事件在一次实验中几乎是不可能发生的。
如果一个小概率实验在一次随机试验中发生了,那么我们有理由拒绝原假设!
3、两类错误的定义
- 第Ⅰ类错误是原假设 为真却被我们拒绝了,犯这种错误的概率用 表示,所以也称 错误或弃真错误;
- 第Ⅱ类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用 表示,所以也称 错误或取伪错误。
4、两类错误的概率
- 对于一定的样本量 ,如果减少 错误,就会增大犯 错误的机会;若减少 错误就会增大犯 错误的机会。
- 增大样本量可以同时减少 和 (贾俊平说)。(腾讯面试官说减少的是 )
5、两类错误的控制
- 一般来说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。
- 在假设检验中,一般首先控制犯 错误。主要的原因在于,原假设是什么通常是明确的,而备择假设是什么通常是模糊的。
6、两类错误的地位
在进行显著性检验时,犯第Ⅰ类错误的概率是由我们控制的, 取得小,则概率就越小,这保证了当原假设为真时错误地拒绝原假设的可能性很小。这意味着原假设是受到保护的,也表明原假设和备择假设的地位不是对等的。
7、“不拒绝” 与 “接受”
从假设检验的原理看,不拒绝原假设意味着我们所构造的与原假设相矛盾的事件没有发生,但可能会有许多其他的与原假设矛盾的小概率事件,我们没有也无法证实所有的这些小概率事件不会发生,因此,我们把假设检验中出现接受 的结果解释为“没有发现充足的证据反对”,或更严格地的解释为,“在显著性水平 下没有发现充足的证据反对”,而不是“接受原假设”,因为我们无法证明原假设是正确的。即接受备择假设一定意味着原假设错误;没有拒绝原假设并不能表明备择假设一定是错的。
8、假设检验的流程
- 根据实际问题的要求,提出原假设和备择假设;
- 给定显著性水平 以及样本容量;
- 确定检验统计量及拒绝域的形式;
- 按{当 为真拒绝 } ≤ 取样;
- 根据样本观察值做出决策,是接受原假设还是拒绝原假设。
9、 检验
-
适用场景: 检验的前提是要求样本服从正态分布或近似正态分布,不然可以利用一些变换(取对数、开根号、倒数等等)试图将其转化为服从正态分布是数据,如若还是不满足正态分布,只能利用非参数检验方法。
当样本量大于的时候,可以认为数据近似正态分布。 -
单样本均值检验(One-sample t-test):用于检验 总体方差未知、正态数据或近似正态的 单样本的均值 是否与 已知的总体均值相等。
-
两独立样本均值检验(Independent two-sample t-test):用于检验 两对独立的 正态数据或近似正态的 样本的均值 是否相等,这里可根据总体方差是否相等分类讨论。
-
配对样本均值检验(Dependent t-test for paired samples):用于检验 一对配对样本的均值的差 是否等于某一个值。
-
回归系数的显著性检验(t-test for regression coefficient significance):用于检验 回归模型的解释变量对被解释变量是否有显著影响。
10、样本量的确定
其中,为样本量, 双侧临界值, 一般为,为单侧临界值, 为标准差, 为实验组与对照组的差值。