跳到主要内容

Z检验_Z-Test

什么是Z检验?

Z检验是一种统计检验,用于当已知方差且样本量较大时,判断两个总体均值是否存在差异。它也可以用来比较一个均值与假设值之间的差异。

数据必须大致符合正态分布,否则该检验将无法有效进行。在进行Z检验之前,需计算方差和标准差等参数。

关键要点

  • Z检验是一种统计检验,用于确定两个总体均值是否不同或将一个均值与假设值进行比较,前提是已知方差且样本量较大。
  • Z检验是针对符合正态分布数据的假设检验。
  • Z统计量或Z分数是表示Z检验结果的数字。
  • Z检验与T检验密切相关,但T检验更适合样本量较小的实验。
  • Z检验假设标准差已知,而T检验则假设其未知。

理解Z检验

Z检验也是一种假设检验,其中Z统计量遵循正态分布。Z检验最适用于样本量大于30的情况,因为根据中心极限定理,样本数量越大,样本将被视为近似正态分布。

在进行Z检验时,需要说明零假设和备择假设,以及显著性水平。应计算Z分数(即检验统计量),并陈述结果和结论。Z统计量或Z分数表示从Z检验中得到的分数距离总体均值的标准差数。

可作为Z检验进行的测试示例包括单样本位置检验、双样本位置检验、配对差异检验和最大似然估计。Z检验与T检验紧密相关,但T检验在样本量较小的实验中效果最佳。此外,T检验假设标准差未知,而Z检验假设标准差已知。如果总体的标准差未知,则假设样本方差等于总体方差。

Z分数计算公式: Z分数的计算公式为:

z = ( x - μ ) / σ

其中:

z = Z分数
x = 待评估的值
μ = 均值
σ = 标准差

单样本Z检验示例

假设一位投资者希望测试某支股票的平均日收益是否大于3%。计算得出一个简单随机样本,样本量为50,平均收益为2%。假设收益的标准差为2.5%。因此,零假设为平均值等于3%。

相反,备择假设则是平均收益是否大于或小于3%。假设选择显著性水平α为0.05%并进行双侧检验。由此,样本的每个尾部包含0.025%的样本,α的临界值为1.96或-1.96。如果Z值大于1.96或小于-1.96,则拒绝零假设。

Z值的计算方法是将用于检验的平均日收益值(在此情况下为3%)从观察到的样本平均值中减去。接下来,将得到的值除以标准差和观察值数量的平方根的商。

因此,检验统计量为:

投资者拒绝零假设,因为Z值小于-1.96,并得出结论,平均日收益小于3%。

T检验与Z检验的区别

Z检验与T检验密切相关,但T检验在样本量较小(即少于30个数据点)的情况下表现更好。此外,T检验假设标准差未知,而Z检验假设标准差已知。

何时使用Z检验?

如果总体的标准差已知且样本量大于或等于30,则可以使用Z检验。无论样本量为多少,如果总体标准差未知,则应使用T检验。

什么是Z分数?

Z分数或Z统计量是一个数字,表示从Z检验得出的分数距离总体均值的标准差数。实质上,它是一个描述某个值与一组值均值之间关系的数值测量。如果Z分数为0,则表示该数据点的分数与均分相同。Z分数为1.0则表示该值与均分相距一个标准差。Z分数可以是正值也可以是负值,正值表示该分数高于均值,负值则表示低于均值。

什么是中心极限定理(CLT)?

在概率论的研究中,中心极限定理(CLT)指出,随着样本量的增大,样本的分布趋近于正态分布(也称为“钟形曲线”),前提是所有样本大小一致,并且不论总体分布的形状如何。样本量等于或大于30被认为足以使CLT准确预测总体的特征。Z检验的准确性依赖于CLT的有效性。

Z检验的假设条件是什么?

为了使Z检验有效,总体必须呈正态分布,并且样本必须具有相同的方差。此外,所有数据点应彼此独立。

总结

Z检验用于假设检验,以评估某一发现或关联是否具有统计显著性。具体而言,它测试两个均值是否相同(零假设)。只有在已知总体标准差且样本量为30个数据点或更多的情况下,Z检验才能使用。否则,应使用T检验。

参考文献

[1] Newcastle University. "Z-Test."