样本方差为什么除n-1 概率的数学期望和方差
方差与样本方差的区别?为什么方差是除以N,样本方差是除以N-1?方差为什是是除以(n-1)而不是除以n啊,样本方差为什么是n-1分之一?概率统计中计算样本的方差,为什么除以n-1而不是除以n?样本方差为什么除以n-1?
本文导航
样本的方差和总体的方差的关系
1.研究某随机变量的方差,有无穷多个样本,可以通过抽取一个样本集,以它的方差作为该随机变量方差的估计。
当该样本集的样本数N趋于正无穷时,可以证明除以N-1才是无偏的,即收敛于该随机变量的方差;除以N是有偏的。
因此采用无偏估计时除以N-1,而不是除以N。
2.仅研究某样本集内样本数据的分散情况,除以N即可,这是方差原始的定义。
和差的n次方公式
这是为了达到对总体方差的无偏估计。你可以计算下样本方差的期望值:
这样,当样本数量足够多时,样本方差就可以逼近总体方差(因为其期望是总体方差)。也就是说达到了总体方差的无偏估计。
【要分清样本方差和总体方差的区别】
样本方差是固定的吗
为什么样本方差的分母为n-1而不是n?
样本方差与样本均值,都是随机变量,都有自己的分布,也都可能有自己的期望与方差(由此进一步讨论估计量的无偏性与有效性)。取分母n-1,可使样本方差的期望等于总体方差,即这种定义的样本方差是总体方差的无偏估计。
这样看,x1,x2,...xn是n个可以自由变化的样本,互不影响。
而x1-xbar, x2-xbar,...xn-xbar是否也是n个自由变化的呢?不是……因为这n个统计量受到一个约束条件的影响就是之和等于0。如果我们记 yi=xi-xbar,也就是说y1+y2+...yn=0,这样我们可以任意变动其中n-1值,比如取定了y1,y2,...y(n-1),那么yn就不能任意变化,yn=-(y1+y2+y(n-1))。
这个只是从自由变化的角度直观解释,实际上证明分布比较烦琐……
举个例子:
比如说让十跟人任意取十个数,很容易理解可以随便取.十个都是自由的.
如果我加一个条件,十个人取十个数,但是这是个书加起来必须得零.第一个人可以随便取,第二个人也可以,第九个也可以,都是自由的,但是第十个人不能随便自由取,只能取特定的数,才能保证这十个数的和是零.所以加了一个条件就丢了一个自由度
由于有一个约束条件,所以最后一个变量不能随便取。为了满足这个约束条件,第n个变量不能随机取值,它的值由前n-1个变量确定了。问题是:虽然第n个变量不能随机取,假设取10以满足约束条件,但10与均值的离差仍然存在。分子中,包括了这个离差平方,但分母却不考虑它。
是不是可以这样理解:按照方差的“定义”,分母仍应取n。只是为了保证无偏性,对样本方差进行调整。通过计算,分母应当取n-1。这时的方差实际是“调整后的样本方差”,只不过我们仍将它叫做“样本方差”。
用样本去估计总体,当然就要评估估计的好坏如何。第一个评估方面就是先要评估这个估计是有偏估计还是无偏估计,无偏估计更为有效。除以n所得到的样本方差虽然也是总体方差的估计量,但是不是无偏估计量,而除以n-1所得到的样本标准方差则是无偏估计量。正因为除以n-1所得到的样本标准方差是总体的无偏估计,所以它更科学点,误差小些。之所以选择n-1,不是巧合,而是数学推导下的结果。
摘自ITPUB bestsong的博文:为什么样本方差的分母为n-1而不是n?
概率的数学期望和方差
因为不是除以n。
n-1时,和总体方差一样,是总体方差的无偏估计。
样本方差先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。
在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。 当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。
扩展资料:
n-1的使用称为贝塞尔校正,也用于样本协方差和样本标准偏差(方差平方根)。 平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。
标准偏差的无偏估计是一个技术上涉及的问题,尽管对于使用术语n-1.5的正态分布,形成无偏估计。无偏样本方差是函数ƒ(y1,y2)=(y1-y2)2/2的U统计量,这意味着它是通过对群体的两个样本统计平均得到的。
参考资料来源:百度百科——样本方差
方差为什么要除以n减1
自由度的问题。在n个中随机选,选了n-1个,剩下的一个是确定的了,不能再选。所以除n-1,小生才疏学浅,还望抛砖引玉。嘿嘿,我们认识不诶,mai生人