菜鸟学统计(三)

假设检验

上一部分提到了置信区间,这一部分提到的假设检验与置信区间一样都是深受中心极限定理的恩惠.

什么是假设检验?

之前提到,我们手上数据实际并不能代表总体,它只是总体的一部分,是样本.
而假设检验与置信区间一样,想通过样本数据来了解整体.
假设检验是对对总体参数做了一个尝试性的假设,该尝试性的假设称为原假设,然后定义一个和原假设完全对立的假设叫做备选假设.假设检验就是通过样本数据对两个对立假设进行检验

也有一种理解为带概率性质的反正法

怎么做?

这有点像福尔摩斯的推理游戏

1. 提出假设

现在我们得到了一个问题:
问题:是鸡生蛋还是蛋生鸡?
根据这个问题我们可以提出两个互为相反的假设:
原假设:鸡生蛋
备选假设:蛋生鸡

显然只要其中有一个不成立,那么另一个必定成立.

2. 搜集证据

根据中心极限定理,我们知道,合理足够多的样本可以代表总体.这就需要我们前面提到的中心极限定理的条件了,样本大小必须要大于30.

什么是证据??在统计上,这个证据需要用统IM计量来表示.


什么是统计量?
X1,X2,…Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何参数,则称函数T(X1,X2,..,Xn)是一个统计量
通常,又称T(X1,X2,…,Xn)为样本统计量.当获取样本的一组具体观测值$x_1,x_2,…,x_n$时,代入T,计算出$T(X1,X2,…,Xn)$的数值,就获得了一个具体的统计量


这里确定统计量,其实是一个复杂的过程,后面再说.

如何断案

这里常常的做法是假设我们的原假设为真,然后从我们的样本中找不利于原假设的证据.
但是样本毕竟是样本不是总体,所以其难以做到与总体完全一样,所以我们需要一个误差范围.这里会有一个拒绝域的概念,拒绝域就是来告诉我们证据收集到什么程度我们可以拒绝原假设.

但是拒绝域是不会明明白白告诉你的,而是拐着弯给你,他会先定下显著性水平.
这个显著性水平如果用1减一下,我们可以将它理解为容错比例.比如,如果显著水平为5%,我们会说他有95%的容错比.容错比越高,说明原假设更容易被接受.
pic1
如上图,若落在黄色区域内,就有足够证据拒绝原假设了.
这样就确定了一个拒绝域。
拒绝域有两种形式:单尾检验(上图)和双尾检验(左右两侧都有)
双尾和单尾的形式不同主要还是由于原假设中用的不等式符号的不同而引起的.双尾的原假设符号应该是等号,而单尾的原假设符号是大于符号(拒绝域会出现在左侧,called 左尾),而小于符号(拒绝域出现在右侧,called 右尾).

确定了拒绝域之后就是计算了,计算这个概率P,看他是不是真的落在拒绝域内

真相只有一个

就是断案了,如果P落在算出的拒绝域内,我们就说H0应该被拒绝,如果不在拒绝域内,则接收原命题。(有点像法律上的谁提出谁矩阵,如果有人提出反对原假设,那么除非它找到足够的证据,否则原假设就是对的.)

回顾一下

有没有觉得置信区间和假设检验有相通的地方?
首先就是两者都依赖于中心极限定理.两者都需要求一个区间的概率来作为证据.不同的是置信区间主要是推断参数的真实准确性,而假设检验要判断假设的真实准确性。
(如果说的不对请指出)
附上知乎上的讨论

其他

统计量的问题

pic3
这是出自《商务与经济统计》的一张图.尽管不清楚,但是能大致概括什么时候用什么统计量.

这里新增了一个分布:一个是t分布.而z分布就是我们的正态分布.

两类错误

pic4
这种长得像混淆矩阵的图表,一直很头痛….
就像前面说的α,就是在假设H0为真的情况下,给定的一个弃真的概率范围.在α的概率内的是我们的拒绝域.可以类比得到β,β是在假设H0为假的情况下保真的概率范围(就是判定H0为真).

有没有发现,这里的α与β的取值都是表示在已知条件A为真的情况,条件A为假的概率值.这就是我们在开头说的概率上的反证.
这里α表示的就是第一类错误,在原假设正确的条件下,拒绝了原假设
而β表示的是第二类错误,在原假设错误的条件下,没有拒绝原假设.

均值差的置信区间

  1. 当$\sigma_1$和$\sigma_2$已知的正态总体情况下,要我们去估计均值差的置信区间.像前面介绍的可以变换到标准正态分布后,再求置信区间
    $\mu_1-\mu_2$的置信度为1-α的置信区间为
  2. 当$\sigma_1,\sigma_2未知$,假定$\sigma_1=\sigma_2$,两样本容量小于30
    在假设检验里说统计量的时候已经知道,这满足t分布(所以说假设检验和置信区间还有很多相似处)

    上式中的$s_p^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$
    $s_p$是$\sigma_1和\sigma_2$的联合无偏估计.
    此时置信区间为

  3. 对于$n_1$≥30,且$n_2$≥30的任何总体
    根据中心极限定理,都能表示成正态分布.
    所以还是如1的情况处理.

总结

pic2

-------------本文结束感谢您的阅读-------------