不等几乎分类聚类抽样下的均值估计及其性质_整群抽样论文

不等概分类整群抽样下的均值估计及其性质，本文主要内容关键词为：均值论文,性质论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

一、问题的基本提法

设总体π[,N]分为K组，即π[,N]=π[,N[,1]]∪π[,N[,2]]∪…∪π[,N[,K]]，第i组π[,N[,i]](i=1,2,…,K)称为第I群，以N[,i]表示第I群的容量，N表示总体的容量。在π[,N]中每个总体单位对应一数量指标，依次为Y[,1],Y[,2],…,Y[,N]，其中N是已知的正整数。在π[,N]中，随机地将群按先后顺序排列，群中的个体任意先后排列，并加以编号（不编也可）。抽样分为两步：先随机从总体中抽取容量为n的子样，再观察子样中个体的来源，若抽到的个体属于N[,i]群，则N[,i]群被抽中，然后对N[,i]群中的个体逐个观察。

设每个个体的某一数量指标分别为y[,i1],y[i2],…,y[,iN[,i]]。这个群被抽中的概率显然与群的容量有关，第i个群被抽中的概率为,i=1,2,…,K。设采用这种方法抽到m个群（含抽取的重复群数），t[,k]表示第k个群在这包含m个群中出现的次数(t[,k]=0,1,2,…,m)，这样t[,k](k=1,2,…,K)的联合概率分布是多项式分布：

若采用这种方法抽到n个个体，测得数量指标为y[,1],y[,2],…,y[,n]（y[,1],y[,2],…,y[,n]系Y[,1],Y[,2],…,Y[,N]的一部分），记y[,jl]为第j个群中第l个个体得数量指标，j=1,2,…,K;l=1,2,…,N[,j]。据此估计总体π[,N]的下列数字特征：

现基于群在总体中所处的地位，运用式(1)对(2)和(3)的估计问题进行深入的研究。

当总体π[,N]中的个体较多而又缺乏必要的档案资料，无法以个体为单位进行取样；或者当总体π[,N]中的个体数目较多，而各个群间的差异较大，此时若需对总体有个概括了解，常采用分类整群抽样方法。

例如，欲调查某省乡镇企业2001年的产值，则该省2001年所有乡镇企业组成总体π[,N],2001年现有的每个乡镇企业为个体，也即调查对象。由于缺乏2001年全省乡镇企业的档案资料，且各市、县乡镇企业的发展水平不平衡，全省乡镇企业的个数N也相当庞大，因此不宜于按个体取样进行一次普查，因而可按所辖行政区域划分成K个群（即该地区有K个行政管理区域），采用这种分类整群抽样法，对被抽到的群，按工商行政管理注册登记进行普查，此时我们的调查目标为乡镇企业的平均产值，为乡镇企业的总产值。诸如调查某地区已婚年轻女子平均生育子女数，某地区优良品种的亩产量等均可采用不等概分类整群抽样方法。不等概分类整群抽样方法充分而科学地考虑了群在总体中所占的地位对抽样误差的影响，能较好地克服由于群的代表性带来的系统误差。