样本方差公式中为什么要除以(n-1)而不是n呢?谁能讲讲其中的奥妙???

来源:百度知道 编辑:UC知道 时间:2024/06/06 21:19:07
样本方差公式中为什么要除以(n-1)而不是n呢?谁能讲讲其中的奥妙???

总体方差为σ²,均值为μ
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示样本均值=(X1+X2+...+Xn)/n

设A=(X1-X)^2+(X2-X)^2....+(Xn-X)^2
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=E[(X1)^2-2X*X1+X^2+(X2)^2-2X*X2+X^2+(X2-X)^2....+(Xn)^2-2X*Xn+X^2]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(X1+X2+...+Xn)]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(nX)]
=E[(X1)^2+(X2)^2...+(Xn)^2-nX^2]

而E(Xi)^2=D(Xi)+[E(Xi)]^2=σ²+μ²
E(X)^2=D(X)+[E(X)]^2=σ²/n+μ²
所以E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=n(σ²+μ²)-n(σ²/n+μ²)
=(n-1)σ²
所以为了保证样本方差的无偏性
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
E(S)=(n-1)σ²/(n-1)=σ²

样本方差与样本均值,都是随机变量,都有自己的分布,也都可能有自己的期望与方差。取分母n-1,可使样本方差的期望等于总体方差,即这种定义的样本方差是总体方差的无偏估计。 简单理解,因为算方差用到了均值,所以自由度就少了1,自然就是除以(n-1)了。
再不能理解的话,形象一点,对于样本方差来说,假如从总体中只取一个样本,即n=1,那么样本方差公式的分子分母都为0,方差完全不确定。这个好理解,因为样本方差是用来估计总体中个体之间的变化大小,只拿到一个个体,当然完全看不出变化大小。反之,如果公式的分母不是n-1而是n,计算出的方差就是0——这是不合理的,