样本方差为什么除n-1 概率的数学期望和方差

小草青青2022-08-25 22:08:121650

方差与样本方差的区别？为什么方差是除以N，样本方差是除以N-1？方差为什是是除以(n-1)而不是除以n啊，样本方差为什么是n-1分之一？概率统计中计算样本的方差，为什么除以n-1而不是除以n？样本方差为什么除以n-1？

本文导航

样本的方差和总体的方差的关系
和差的n次方公式
样本方差是固定的吗
概率的数学期望和方差
方差为什么要除以n减1

样本的方差和总体的方差的关系

1.研究某随机变量的方差，有无穷多个样本，可以通过抽取一个样本集，以它的方差作为该随机变量方差的估计。

当该样本集的样本数N趋于正无穷时，可以证明除以N－1才是无偏的，即收敛于该随机变量的方差；除以N是有偏的。

因此采用无偏估计时除以N-1,而不是除以N。

2.仅研究某样本集内样本数据的分散情况，除以N即可，这是方差原始的定义。

和差的n次方公式

这是为了达到对总体方差的无偏估计。你可以计算下样本方差的期望值：

这样，当样本数量足够多时，样本方差就可以逼近总体方差（因为其期望是总体方差）。也就是说达到了总体方差的无偏估计。

【要分清样本方差和总体方差的区别】

样本方差是固定的吗

为什么样本方差的分母为n-1而不是n？

样本方差与样本均值，都是随机变量，都有自己的分布，也都可能有自己的期望与方差（由此进一步讨论估计量的无偏性与有效性）。取分母n-1，可使样本方差的期望等于总体方差，即这种定义的样本方差是总体方差的无偏估计。

这样看，x1,x2,...xn是n个可以自由变化的样本，互不影响。

而x1-xbar, x2-xbar,...xn-xbar是否也是n个自由变化的呢？不是……因为这n个统计量受到一个约束条件的影响就是之和等于0。如果我们记 yi=xi-xbar,也就是说y1+y2+...yn=0,这样我们可以任意变动其中n－1值，比如取定了y1,y2,...y(n-1)，那么yn就不能任意变化，yn=-(y1+y2+y(n-1))。

这个只是从自由变化的角度直观解释，实际上证明分布比较烦琐……

举个例子：

比如说让十跟人任意取十个数,很容易理解可以随便取.十个都是自由的.

如果我加一个条件,十个人取十个数,但是这是个书加起来必须得零.第一个人可以随便取,第二个人也可以,第九个也可以,都是自由的,但是第十个人不能随便自由取,只能取特定的数,才能保证这十个数的和是零.所以加了一个条件就丢了一个自由度

由于有一个约束条件，所以最后一个变量不能随便取。为了满足这个约束条件，第n个变量不能随机取值，它的值由前n-1个变量确定了。问题是：虽然第n个变量不能随机取，假设取10以满足约束条件，但10与均值的离差仍然存在。分子中，包括了这个离差平方，但分母却不考虑它。

是不是可以这样理解：按照方差的“定义”，分母仍应取n。只是为了保证无偏性，对样本方差进行调整。通过计算，分母应当取n-1。这时的方差实际是“调整后的样本方差”，只不过我们仍将它叫做“样本方差”。

用样本去估计总体，当然就要评估估计的好坏如何。第一个评估方面就是先要评估这个估计是有偏估计还是无偏估计，无偏估计更为有效。除以n所得到的样本方差虽然也是总体方差的估计量，但是不是无偏估计量，而除以n-1所得到的样本标准方差则是无偏估计量。正因为除以n-1所得到的样本标准方差是总体的无偏估计，所以它更科学点，误差小些。之所以选择n-1，不是巧合，而是数学推导下的结果。

摘自ITPUB bestsong的博文：为什么样本方差的分母为n-1而不是n？