标准差的定义为啥不能用各个数字到平均数的距离的绝对值的和的平均数?而要用方差的开方?

来源:百度知道 编辑:UC知道 时间:2024/06/04 07:18:47

这个问题问得好。其实楼主说的问题统计学上叫做平均差,使用距离的平均数来衡量样本中间的离差情况。但是如果你比较熟悉统计学的话,统计学体系就是根据数学期望来研究的,而且数学期望的性质很容易推到。我帮你举一个例子吧。

我们都知道一阶距是总体平均数,这个毫无疑问。但是如何衡量样本之间的离差呢,假设我们用楼主说的平均差的概念,就非常难以计算,也就是E|X-EX|,而E(x-EX)^2则相对好计算得多。这样统计学的体系就非常简单而又完整了。从而产生偏度和峰度。

另一方面我们使用样本来估计总体的情况,使用平均差的话,就很难估计,但是如果使用方差其实就容易多了,就差一个n/(n-1)。统计学里面有一个结论的就是拿样本平均差去估计总体平均差,一般的分布是没有办法计算的,当正太分布下我记得还是有偏的,偏离的系数大概是2/根号(pai),总之使用你说的平均差来构建统计学整个体系会比较复杂。

怎么又看到1L这种帖子。。
这个问题很难解释,在多元统计的聚类分析里面本来就有很多种度量样本距离的方法:比如重心法,最短距离法,最长距离法,也包括LZ说的那种距离,不过用得最多的还是欧氏距离(就是以一个点为中心,也就是这里的标准差),这种度量具有很多优点,比如说便于求导,而且高阶可导,这会影响到样本的各阶矩,而绝对值是不可导哦!其他的原因还有很多啦,比如欧氏距离多维的推广简便,运算单位的统一,也可能是习惯什么的。。。