不等几乎分类聚类抽样下的均值估计及其性质_整群抽样论文

不等概分类整群抽样下的均值估计及其性质,本文主要内容关键词为:均值论文,性质论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、问题的基本提法

设总体π[,N]分为K组,即π[,N]=π[,N[,1]]∪π[,N[,2]]∪…∪π[,N[,K]],第i组π[,N[,i]](i=1,2,…,K)称为第I群,以N[,i]表示第I群的容量,N表示总体的容量。在π[,N]中每个总体单位对应一数量指标,依次为Y[,1],Y[,2],…,Y[,N],其中N是已知的正整数。在π[,N]中,随机地将群按先后顺序排列,群中的个体任意先后排列,并加以编号(不编也可)。抽样分为两步:先随机从总体中抽取容量为n的子样,再观察子样中个体的来源,若抽到的个体属于N[,i]群,则N[,i]群被抽中,然后对N[,i]群中的个体逐个观察。

设每个个体的某一数量指标分别为y[,i1],y[i2],…,y[,iN[,i]]。这个群被抽中的概率显然与群的容量有关,第i个群被抽中的概率为,i=1,2,…,K。设采用这种方法抽到m个群(含抽取的重复群数),t[,k]表示第k个群在这包含m个群中出现的次数(t[,k]=0,1,2,…,m),这样t[,k](k=1,2,…,K)的联合概率分布是多项式分布:

若采用这种方法抽到n个个体,测得数量指标为y[,1],y[,2],…,y[,n](y[,1],y[,2],…,y[,n]系Y[,1],Y[,2],…,Y[,N]的一部分),记y[,jl]为第j个群中第l个个体得数量指标,j=1,2,…,K;l=1,2,…,N[,j]。据此估计总体π[,N]的下列数字特征:

现基于群在总体中所处的地位,运用式(1)对(2)和(3)的估计问题进行深入的研究。

当总体π[,N]中的个体较多而又缺乏必要的档案资料,无法以个体为单位进行取样;或者当总体π[,N]中的个体数目较多,而各个群间的差异较大,此时若需对总体有个概括了解,常采用分类整群抽样方法。

例如,欲调查某省乡镇企业2001年的产值,则该省2001年所有乡镇企业组成总体π[,N],2001年现有的每个乡镇企业为个体,也即调查对象。由于缺乏2001年全省乡镇企业的档案资料,且各市、县乡镇企业的发展水平不平衡,全省乡镇企业的个数N也相当庞大,因此不宜于按个体取样进行一次普查,因而可按所辖行政区域划分成K个群(即该地区有K个行政管理区域),采用这种分类整群抽样法,对被抽到的群,按工商行政管理注册登记进行普查,此时我们的调查目标为乡镇企业的平均产值,为乡镇企业的总产值。诸如调查某地区已婚年轻女子平均生育子女数,某地区优良品种的亩产量等均可采用不等概分类整群抽样方法。不等概分类整群抽样方法充分而科学地考虑了群在总体中所占的地位对抽样误差的影响,能较好地克服由于群的代表性带来的系统误差。

在考虑式(1)的情况下,我们有:

二、的估计及其性质

考虑各个群在总体中所处的地位,也就是说某群包含的总体单位越多,它在样本中重复出现的可能性就越大,对总体的影响就越大,因此式(1)表示的概率也相应增大,样本的代表性也相应增大,抽样的系统偏差相应减少。

由[4]可知分布(1)的常见数字特征为:

至此,我们已经完成总体中各单位某一数量标志总和的无偏估计及其方差估计的证明。下面我们对第一部分给出的定理1加以证明。

三、定理1的证明

四、特殊情况

我们的定理仍然成立,这时可依此结论来估计产品的合格率、文盲率、某种疾病的发病率等指标。

以上结论只是定理的推论,很容易从定理的证明方法中获得,这里不再赘述。

标签:;  ;  

不等几乎分类聚类抽样下的均值估计及其性质_整群抽样论文
下载Doc文档

猜你喜欢