六西格玛培训统计工具设计-假设检验分析介绍?

假设检验是六个适马团队项目中使用最广泛的统计工具。例如,需要判断以下结论是否正确:“新员工比老员工投诉多”、“改进工作后平均产量有所提高”、“加工温度为180度时垫圈的断裂强度高于160度时”等等。因为我们观察的总是有误差的数据,不能从简单的样本统计的结果得出结论,必须使用严格的统计假设检验方法,才能得出准确的判断结论。

一、假设检验问题

参数估计和假设检验是统计推断的两个重要方面。参数估计以“数”为输出结果,假设检验以“判断”为输出结果。为了说明它的基本思想,我们先来看一个例子。

二、假设检验步骤

1,建立一个假设。

假设检验的第一步是建立假设,通常需要建立两个假设:原假设Ho和备选假设H1。

2.选择检验统计并确定拒绝域的形式。

如果我们检验总剩余的平均值,那么我们将使用样本平均值来导出检验统计量;如果我们检验正态总体的方差,我们将从样本方差中得到检验统计量。

根据统计量的值,将整个样本空间分为拒绝域w和非拒绝域a两部分,当样本统计量的值落在拒绝域内时,将拒绝原假设,否则不拒绝原假设。因此,我们必须找出假设检验中的拒绝域。

根据不同的替代假设;拒绝域可以是双向的,也可以是单向的。在确定拒绝域的类型之后,还应该确定临界值。这个要根据允许出错的概率来确定。

3.在测试中给出显著性水平A。

在判断原假设是否成立时,由于样本的随机性,在判断中可能出现两种错误,其含义如下表所示。1误差是当原假设为真时,由于样本的随机性,样本的观测值落在拒绝域W内,从而做出拒绝原假设的决策。这种误差称为1误差,也称为弃真概率。

第二种错误的解释:如果钢筋的平均抗拉强度真的比原来的高,那么钢筋的平均抗拉强度就不再是2 000kg了,但是我们并没有拒绝H0没有提高的错误,就是把“提高了”误认为“没有提高”。一般来说,当H0失败时,我们没有拒绝H0,这是第二种错误。

4.给出临界值并确定拒绝域。

在显著性水平为a的情况下,可以根据给定的检验统计量的分布,通过查表得到临界值,从而确定具体的拒绝域。在不同的替代假设下,拒绝域、临界值和显著性水平A之间的关系是不同的。

5、根据样本观测值,计算检验统计值。收集样本数据并计算测试统计值。

6.根据检验统计值是否属于拒收域进行判断。

①将检验统计值与拒绝域的临界值进行比较,当其落入拒绝域时,做出拒绝。

定下结论,或者做出无法拒绝原假设的结论。

(2)从测试统计中计算P值。所谓P值,就是原假设成立时的现状概率(严格来说,原假设成立时的现状或对原假设更不利的情况,即对备选假设更有利的情况的概率)。当这个概率很小时(比如小于0.05),在原假设成立的情况下,这个结果不应该出现在一个实验中;但现在确实出现了,所以我们有理由认为“原假设成立”的前提是错误的,应该拒绝原假设,接受替代假设。因此,可以有一个最一般的规则:如果P

(3)根据样本的观测值,可以得到总体参数的置信区间。如果原假设的参数值不落入这个置信区间,则得出原假设被拒绝的结论,否则得出原假设不能被拒绝的结论。目前大多数统计软件都提供了相应的置信区间,用这种方法判断比较方便。