请教一下分层抽样是否具有等可能性,先谢谢了!

来源:百度知道 编辑:UC知道 时间:2024/06/11 03:30:15
请教一下分层抽样是否具有等可能性,先谢谢了!
一个单位职工有500人,其中不到35岁的有126人,35岁~49岁的有278人,50岁以上的有96人.为了了解这们单位与身体状况有关的某项指标,要从中抽取一个容量为100的样本.由于职工年龄与这项指标有关,决定采用分层抽样的方法进行抽取.
问:每层各抽多少人?

我想问的是:
每个人被抽到的可能性是不是一样,如果是,为什么?如果不是,那是不是说分层抽样不一定具有等可能性?
请注意100/500×126,100/500×278,100/500×96均不是整数,实际中又不能抽取零点几个人该怎么办?
有人说这是题目的问题,不过我想实际中不可能每一层的人数都一定刚好被5整除,所以我认为问题本身不能说它有错.
在我看来,分层抽样的等概率性只能说是大致的.或者说当总体中个体的数量非常大的时候,这点误差可以忽略不计,不知道对不对,谢谢!

这问题问得好。
在分层抽样中,每个个体被抽到的概率依然相等。
以你的题目为例,总体500,样本100,所以在35— 中要抽取100/500×126人,每人被抽到的概率为100/500×126/126=0.2;同理,在35~49中,要抽100/500×278人,每人被抽到的概率为100/500×278/278=0.2;50+ 也一样,每人概率0.2。
所以在分层抽样中,每个个体被抽到的概率相等(不论是哪一层),都为 样本容量/总体。
不知道这样解释你是否满意~
补充:那是题目的问题,不影响概率相等的结论。

再补充:我的理解是这样:
假设把题目中的所有数据都乘以10,你说的问题就不存在了,由上述的计算可知概率一定相等(不是大致相等,而是完全相等)。现在的问题是所有的数据并没有像假设的那样乘以10,所以这个问题要分数学模型和实际情形两种情况分析。数学模型方面,小数点的存在不影响概率的计算,换言之,概率完全相等;实际情形方面,由于抽人不可能出现零点几人的情况,所以必定要做取舍,比如在35-中,理论上要抽25.2人,那么实际中可能抽取25人,这样别的层中的样本人数也会相应变化,造成的结果是每一层的概率出现了微小的差别(但大致还是一样的)。但是,请注意,导致这种概率不完全一致的原因不是分层抽样模型本身,而是在抽样过程中由于样本的特殊性导致的不能完全按理论上的数据要求抽取。或者说,不是分层抽样本身不具有等概率性,而是由于抽样对象的客观原因造成你无法完全按要求去抽样。
举个不太恰当的例子,假如把这道题里面的对象由人换成水,即有来自不同地区的水,共500升,然后分层抽多少多少升,你说的问题就不存在了,还能说概率不等吗?
所以,分层抽样模型本身一定具有等可能性。这是我的理解~

一样.假设样本容量为x,要分y层,抽取n个样本,则每层抽取样本数为a/x*n(a为该层总样本数),该层每个样本被抽取概率为上式除以a,即每个样本被抽取的概率为n/x.抽样调查要求每个样本被抽取的可能性一样,分层抽样是为了减少误差,每层要抽取的样本数的多少与该层总样本数占总样本数的多少有关,即占的份额越多被抽取的样本越多.但概率是一样的.

一样