目的:在抽样调查中,若关心的变量或特征是涉及个人隐私或不被社会舆论认可的敏感性问题,则采用直接调查的方法就会使部分被调查者出于保护自我隐私的心理而产生一定程度的不合作甚至拒绝回答或虚假回答,从而使调查结果难以反映总体的真实特征。1965年,Warner通过引入随机化装置,成功实现了在不暴露应答者隐私的情况下获得人群中某敏感性问题的发生比例,开创了随机应答技术(Randomized Response Technique,RRT)的先河。几十年来,随机化回答技术经过不断的发展,不断地被改进并出现了一些新的调查方法。然而,在本项目组研究之前,国内外对敏感问题抽样调查设计研究,主要局限于简单随机抽样,实际应用也主要局限于小范围特殊人群小样本的简单随机抽样调查,或将复杂抽样方法的调查资料误用简单随机抽样调查的有关公式来统计分析,且对于敏感问题抽样调查的信度与效度评价也极少研究。本文选定了加法模型、乘法模型、无关联问题模型三种数量特征敏感问题随机应答技术,旨在探讨在二阶段整群抽样条件下应用随机应答技术调查数量特征敏感问题的统计方法,科学估计北京市艾滋病高危人群——男同性恋人群的有关总体特征,并通过应用实例和计算机模拟调查,对本文研究的调查方法及其统计公式进行信度评价,为大规模复杂抽样条件下进行数量特征敏感性问题的调查提供科学的、可靠的调查方法及其统计量计算公式,为制订艾滋病、性病预防控制规划、措施提供科学的调查数据。方法:本文根据数理统计学的基本理论、方法,全概率公式以及随机应答技术理论,推导在二阶段整群抽样条件下应用加法模型、乘法模型、无关联问题模型三种RRT调查数量特征敏感性问题时总体均值的估计量及其方差的计算公式。于2010年8至10月,采用二阶段整群抽样方法,随机抽取北京市6个区30个男同性恋活动场所,对其1523名男同性恋者应用RRT加法模型进行男男性行为情况的调查,使用本文推导出的数量特征敏感性问题二阶段整群抽样调查的有关公式对此调查资料作统计计算,且首次通过对抽样过程的蒙特卡洛法计算机模拟调查来评价本文所研究统计方法的可靠性。结果:本文推导出数量特征敏感问题加法模型、乘法模型及无关联问题模型在二阶段整群抽样调查条件下总体均值的估计量及其方差的计算公式。应用本文提供的数量特征敏感问题二阶段整群抽样的调查方法及统计公式,调查计算得北京市男同性恋人群:首次发生男男性行为的平均年龄为20.24岁;每月发生男男性行为的不同男性性伴的平均个数为2.09个;每月发生男男性行为的平均次数为4.72次。蒙特卡洛计算机模拟抽样调查结果与实际调查结果的差别,经假设检验P值均大于0.1,无统计学意义。结论:本研究将抽样技术的理论和随机应答技术的理论相结合,首次推导出在二阶段整群抽样条件下应用RRT模型调查数量特征敏感性问题时总体参数的估计量及其方差的计算公式,具有创新意义;并成功应用于北京市男男性行为发生情况的调查;蒙特卡洛计算机模拟抽样调查结果表明本文研究的调查方法及其统计公式信度较高,在复杂抽样条件下应用随机应答技术调查敏感性问题具有广泛的应用前景。