答复误差和它的估计

更新时间:2024-04-15 作者:用户投稿原创标记本站原创 点赞:7445 浏览:30674

摘 要:为估计总体某特征(如收入)的答复误差,需要进行重复抽样调查.重复抽样调查样本分两步抽取:第一步,从Ω中抽取大样本S1,其中某个单位的“调查值”记为y,“真值”记为μ,两者之差为单个单位的答复误差;第二步,从S1中抽取子样本S2.答复误差估计的关键是“真值”的估计.

关 键 词 :重复调查;答复误差;答复方差;答复偏差;误差模型

中图分类号:C81文献标识码:A文章编号:1672-3198(2008)01-0094-02

1.介绍

在数字性和敏感性问题调查中,回答者提供的问题答复值可能与问题真值不同.统计上把问题答复值与其真值的差异称为“答复误差”,包括系统性误差和随机性方差.

答复误差通常使用重复调查方法估计.重复调查就是从总体中抽取一部分单位,对抽取的单位对在原始调查中问过了的问题再问一遍.这样同一回答者在同一问题上就给出两个答复.比较这两个答复,看它们是否相同.如果相同,就认为原始调查答复正确,反之,就认为是答复误差.国外统计学家一般使用重复调查的答复值与真值之差构造答复误差模型.

2.答复误差模型及其估计量

2.1 总体未分层情况下

式(3)的优点是简单直观,易于理解和操作.缺点有二:(1)没有利用与y和μ的辅助信息;(2)遗漏了(n1-n2)个单位的信息.如果充分利用这些被遗漏的信息,将提高答复误差估计的精度.

为克服这些缺点,在总体分层情况下的答复误差模型及其估计量中将引入辅助变量n和利用(n1-n2)个单位的信息.

2.2 总体分层情况下

3.答复误差估计量的方差、偏差和均方误差的估计

在前面,我们讨论了答复误差 的五个估计量:R12st,R2st,Rx2stR,RSSW和RM.现在讨论它们的方差、偏差和均方误差的估计.由于这些估计量十分复杂,一般误差公式无力解决它们的估计问题.国外统计学家发明的大方差估计和带状方差估计方法能有效用来估计复杂估计量的方差估计.进一步研究表明,在这两种方法中,带状方差估计方法更适合于两阶段抽样情形下答复误差 的方差估计.为叙述方便,在此只讨论总体未分层的情况.如果总体分层,在每一层使用这里叙述的方法.

3.1 答复误差估计量的方差估计

4 模拟研究

美国农业统计怎么写作机构(NASS)每年都要组织农业调查以了解各州和全国各个地区农业生产发展的情况.为估计农业调查中的答复误差,农业调查后又进行了重复调查.根据这两次调查的结果,以及使用上述公式,我们计算出偏差 的5个估计量12st,2st,x2stR,SSW和M,以及它们的偏差、方差和均方误差,见下表1.在计算中,取Q等于300.