第一步:建立虚无假设,即先假定两个平均数之间没有显著差异。
第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。
1、如果检验一个样本平均数x与一个已知的总体平均数μ的差异是否显著。其Z值计算公式为:
其中:
x是检验样本的平均数;
μ是已知总体的平均数;
S是总体的标准差;
n是样本容量。
2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:
其中:
,是样本1,样本2的平均数;是样本1,样本2的标准差;是样本1,样本2的容量。第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示:
Z
P值
差异程度
非常显著显著不显著第四步:根据是以上分析,结合具体情况,作出结论。
Z检验举例
某项教育技术实验,对实验组和控制组的前测和后测的数据分别如下表所示,比较两组前测和后测是否存在差异。
实验组和控制组的前测和后测数据表
前测 实验组
控制组
后测 实验组
控制组
由于,属于大样本,所以采用Z检验。由于这是检验来自两个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显著,所以采用双总体的Z检验方法。
计算前要测Z的值:
∴ 前测两组差异不显著。
再计算后测Z的值:
∴ 后测两组差异显著。
语法
描述
X为样本值,M为,sigma为标准差,ALPHA为显著性水平。时,表示备择假设为“期望值不等M”(双边检验);时,表示备择假设为“期望值大于M”(单边检验);时,表示备择假设为“期望值小于M”(单边检验)。
当标准差sigma已知时,函数执行一正态检验来判断是否来自一正态分布的样本的期望值,M作为评判标准来估计。在没有重新设置的情况下,ALPHA和TAIL的默认值分别为0.05和0。
SIG为当原假设为真时得到的观察值的概率,当SIG为小概率的时候则对原假设提出置疑。表示在显著水平为ALPHA的情况下,不能拒绝原假设;表示在显著性水平为ALPHA的情况下,拒绝原假设。
举例
例题:给定一组某厂生产的纽扣直径的数据,假设其直径,已知,并且在标准情况下,纽扣的平均直径应该是,问:是否可以认为这批纽扣的直径符合标准?()
解:总体均值和已知,则,问题就化为根据样本值来判断还是,为此提出假设:
原假设:
备择假设:
Matlab实现过程如下:
程序运行结果如下:
x=
Columns 1 through 6
26.0100 26.0000 25.9800 25.8600 26.3200 25.5800
Columns 7 through 10
25.3200 25.8900 26.3200 26.1800
程序运行结果如下:
H=
0
SIG=
0.9622
结果,说明在0.05的水平下,不能拒绝原假设,即认为这批纽扣的直径符合标准。
设?为取自正态总体?的一个容量为?的样本,与?分别为样本均值与样本方差,为已知常数,?. 以下分别是关于未知参数?的U检验方法。
(1)已知,检验
选择统计量
在?成立的假定下,服从?分布,对给定的显著性水平,查标准正态分布表可得临界值,使得
这说明
为小概率事件。将样本值代入算出统计量的值。如果,则表明在一次试验中小概率事件?出现了,因而拒绝,接受。在以上的假设检验问题中,当构造小概率事件时,利用了统计量?的概率密度曲线两侧尾部的面积,这样的检验称为双侧检验。这里采用双侧检验有直观的解释:因为任何情况下,都是未知参数?的无偏估计,所以当?成立时,即?时,与?不应相差太大。因此,对于固定的样本容量,如果?太大,则有理由怀疑?的正确性,从而认为?与?有显著差别。大到什么程度才有足够的理由拒绝?呢?这需要由给定的显著性水平?查得的临界值?来决定。
(2)已知,检验
选择统计量
并令
则. 若?成立,还有
对给定的,由标准正态分布表可得临界值,使得
即
这说明事件“”为小概率事件。因此的拒绝域为. 将样本值代入算出统计量的值,若,则拒绝,接受;否则可接受。
在以上的假设检验问题中,当构造小概率事件时,利用了的分布概率密度曲线的单侧尾部的面积,这样的检验称为单边检验。直观解释是:如果?成立,即?比?的值就不能大得太多。因此,对于固定的样本容量,如果太大,则有理由怀疑?的正确性。至于大到什么程度才有足够的理由拒绝?呢?这需要由给定的显著性水平?查得的临界值来决定。