快捷搜索:  汽车  科技

标准差为什么要用n-1(样本标准差分母为什么是n-1)

标准差为什么要用n-1(样本标准差分母为什么是n-1)那么:定义一个公式:有偏样本方差为:无偏样本方差为:先声明一下期望的两个重要属性:

当我们对数据总体进行统计时,由于每一个数据都被使用到 所以计算得到的标准差和方差是能够准确体现整个数据集特征的。而当从总体中提取出某个样本时,该样本当中的数据在一定程度上会集中在某个范围之中,由此计算出来的标准差和方差不能准确体现出数据总体的情况,通常来说得到的结果会比总体的要小。

举一个例子,如果一个数据集满足高斯分布(Normal Distribution),那当我们提取样本的时候,数据基本上会集中在中间的部分,而边缘值的数目可能会比较少,所以最后得到的样本方差和样本标准差会比总体要小。为了修正这个偏差,在计算样本的方差和标准差时,我们将使用 n-1 代替 n。这样处理后最直接的结果是,公式中的分母变小,得到的结果将会变大,能够更加准确地通过该样本预测总体的情况。

对于一个随机变量X进行n次抽样,获得样本

标准差为什么要用n-1(样本标准差分母为什么是n-1)(1)

,那么样本均值为

标准差为什么要用n-1(样本标准差分母为什么是n-1)(2)

有偏样本方差为:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(3)

无偏样本方差为:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(4)

先声明一下期望的两个重要属性:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(5)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(6)

定义一个公式:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(7)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(8)


那么:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(9)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(10)

设:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(11)


对于证明,我还需要样本平均值平方的期望值:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(12)

在继续之前,我可以找到平均值的期望值和平均值的方差的表达式:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(13)

期望值运算符是线性的:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(14)

同理:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(15)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(16)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(17)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(18)

那么:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(19)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(20)

又:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(21)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(22)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(23)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(24)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(25)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(26)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(27)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(28)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(29)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(30)

前面已经得到:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(31)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(32)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(33)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(34)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(35)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(36)

我们知道:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(37)

我使用前面的结果表明,除以n-1可以提供无偏估计:

标准差为什么要用n-1(样本标准差分母为什么是n-1)(38)

标准差为什么要用n-1(样本标准差分母为什么是n-1)(39)

​样本方差的期望值等于无偏估计的总体方差。

猜您喜欢: