跳到主要内容

残差标准差_Residual Standard Deviation

什么是残差标准差?

残差标准差是一个统计术语,用于描述观察值与预测值之间的标准差差异,这在回归分析中以点的形式体现。

回归分析是一种统计方法,用于展示两个不同变量之间的关系,并描述如何根据一个变量的行为预测另一个变量的行为。

残差标准差也称为拟合线周围点的标准差或估计的标准误差。

主要要点

  • 残差标准差是残差值的标准差,即一组观察值与预测值之间的差异。
  • 残差的标准差计算数据点围绕回归线的分散程度。
  • 该结果用于衡量回归线的可预测误差。
  • 如果残差标准差相对于样本标准差较小,则模型的预测能力或实用性更强。

理解残差标准差

残差标准差是一种拟合优度的测量方法,可用于分析数据点与实际模型之间的契合程度。例如,在商业环境中,经过对多组成本随时间变化的数据进行回归分析后,残差标准差可以为企业主提供实际成本与预测成本之间差异的信息,以及预测成本可能与历史成本数据均值的波动程度的概念。

残差标准差的公式

Residual=(YYest)Sres=(YYest)2n2其中:Sres=残差标准差Y=观察值Yest=估计值或预测值n=样本总数\begin{aligned} &\text{Residual}=\left(Y-Y_{est}\right)\\ &S_{res}=\sqrt{\frac{\sum \left(Y-Y_{est}\right)^2}{n-2}}\\ &\textbf{其中:}\\ &S_{res}=\text{残差标准差}\\ &Y=\text{观察值}\\ &Y_{est}=\text{估计值或预测值}\\ &n=\text{样本总数}\\ \end{aligned}

如何计算残差标准差

要计算残差标准差,首先必须计算围绕拟合线的预测值与实际值之间的差异。这个差异被称为残差值,简单来说就是已知数据点与模型预测的数据点之间的距离。

要计算残差标准差,将残差值代入残差标准差公式中进行求解。

残差标准差的示例

首先计算残差值。例如,假设你有四个观察值的数据集,下面的表格显示了对于特定的 x 值观察到和记录的 y 值:

xy
11
24
36
47

如果该模型中预测的线性方程或斜率为 yest = 1× + 2,其中 yest 为预测的 y 值,则可以找到每个观察值的残差。

残差等于 (y - yest),所以对于第一组数据,实际的 y 值为 1,而根据方程给出的预测 yest 值为 yest = 1(1) + 2 = 3。因此,残差值为 1 – 3 = -2,说明是一个负残差值。

对于第二组数据,当 x 为 2 和 y 为 4 时,预测的 y 值可以计算为 1 (2) + 2 = 4。

在这种情况下,实际值和预测值是相同的,所以残差值将为零。对于其余两组数据,采用相同的过程来得出预测值。

一旦使用表格或图形计算所有点的残差,就可以使用残差标准差公式进行计算。

扩展上述表格,你可以计算残差标准差:

xyyest残差 (y - yest)每个残差平方的总和, 或 Σ(y - yest)2
113-24
24400
36511
47611

观察到残差平方的总和为 6,这代表了残差标准差公式中的分子。

对于残差标准差公式的分母部分,n 表示数据点的数量,在此情况下为 4。计算分母为:

  • (残差数 - 2) = (4 - 2) = 2

最后,计算结果的平方根:

  • 残差标准差: √(6/2) = √3 ≈ 1.732

典型残差的大小可以让你大致了解你的估计有多接近实际数据。残差标准差越小,估计与实际数据的契合度越高。从某种意义上说,较小的残差标准差相对于样本标准差表明模型的预测能力或实用性更强。

在进行回归分析以及方差分析(ANOVA)时,可以计算残差标准差。在确定定量极限(LoQ)时,可以使用残差标准差作为代替标准差。

残差标准差是什么类型的测量?

残差标准差是一种拟合优度的测量,可以用于分析数据点集与实际模型之间的契合程度。拟合优度是一种统计检验,用于确定样本数据与具有正态分布的总体分布之间的契合程度。

在商业中如何使用残差标准差?

经过对多组成本随时间变化的数据进行回归分析后,残差标准差可以为企业主提供实际成本与预测成本之间差异的信息。它还可以揭示预测成本可能与历史成本数据均值的波动程度。

如何计算残差标准差?

首先,你必须计算围绕拟合线的预测值与实际值之间的差异。这个差异被称为残差值。要计算残差标准差,将残差值代入残差标准差公式中进行求解。

结论

残差标准差是统计学中的一个术语。它描述了观察值与预测值之间的标准差差异,这在回归分析中得以体现。回归分析显示了两个不同变量之间的关系,并描述了如何根据一个变量的行为预测另一个变量的行为。