与多变量和尺度比例概率抽样有关的问题

一、多变量与规模成比例概率抽样的有关问题（论文文献综述）

郝淑玲^[1]（2021）在《抽样调查无响应问题研究》文中研究表明抽样调查中的无响应问题,是影响调查信度和数据品质的重要因素之一。无论是入户访问或街头拦截等面访调查,还是基于互联网介质的在线调查,受访者面对调查问卷的无响应行为均受到多源复杂因素影响。抽样调查中,不仅要在设计阶段采用科学的抽样方案和技术以降低抽样误差,而且要在调查执行阶段充分关注受访者无响应带来的深远影响。受访者对调查问卷或者问题的无响应,主要有两个来源,一是随机无响应,二是主观无响应。随机无响应可以通过抽样设计做出积极的改进和规避,而主观无响应可能来自受访者对调查主题的敏感程度、隐私保护意识或者对调查本身的价值判断。同时,样本群体的复杂度、样本单元的流动性、调查环境等外部要素也对无响应问题有较大影响。因此,仅仅采用问卷回收率、响应率等传统指标来评估抽样调查的质量和数据质量显然是不够的。来自流动人口的抽样调查具有典型性。流动人口是在中国固定户籍制度背景下产生的一个特殊群体,为中国经济社会的发展做出了重大的贡献。流动人口的抽样调查受到复杂的社会经济因素影响,无响应问题比较突出,导致调查数据不可避免地出现缺失,影响了数据质量。本文以流动人口抽样调查中出现的项目无响应问题为切入点,深入分析了抽样调查中的无响应问题,对主观无响应的成因进行了剖析,阐述了由此造成的数据缺失的机理和数据插补方法,并以流动人口调查数据为研究对象,对流动人口抽样调查中的代表性响应进行了测度,以达到评估调查质量的目的,同时就如何处理流动人口抽样调查中的项目无响应问题进行深入研究。第二章是本文的逻辑起点,对抽样调查中的无响应问题造成的数据缺失的机理进行了详细分析,为无响应问题的研究提供理论基础。第三章是项目无响应的处理方法研究,为项目无响应问题的处理提供方法论支持。第四章阐述了我国流动人口抽样调查的方案设计,是研究流动人口抽样调查中的项目无响应问题的基础,从抽样设计的角度反思出现项目无响应的原因。第五章是流动人口调查中项目无响应插补的实证研究,从实证角度测度流动人口抽样调查中的项目无响应问题,并基于单插值方法、多重插值方法和结构逻辑插值方法对流动人口抽样调查中的缺失数据进行插值;第六章是对流动人口抽样调查中项目无响应问题研究的相关结论、政策建议和研究展望。本文在抽样调查中的无响应问题及数据插补方法等方面,主要做了以下四个方面的工作:第一,深入探究了抽样调查中的无响应问题引致的数据缺失的机理。调查中受访者的无响应行为必然引起数据缺失,解决数据缺失问题首先是要识别引起受访者无响应的数据缺失机制。本文详细分析了完全随机缺失（missing-completely-at-random,MCAR）、随机缺失（missing-at-random,MAR）和非随机缺失（not-missing-at-random,NMAR）三种数据缺失机制,这是后文进行无响应问题研究的理论基础。无响应产生的后果是使总体特征估计量有偏,本文将无响应与抽样理论相结合探究了无响应对总体特征估计量的影响。第二,进一步完善了R统计量对抽样调查质量评估的理论基础和应用方法,设计了抽样调查质量评价的R算法,构建了抽样调查评估的一类新体系。关于抽样调查质量的探讨,现有文献主要集中在使用响应率对抽样调查质量进行评估,响应率越高,响应样本的代表性越强。但相关研究表明,响应率和响应样本的代表性之间没有必然关系,而R统计量可以测度响应样本的代表性,可以在更深入和细致的问题层面描述和估计调查质量。本文将R统计量视为响应率的重要补充指标,对测度响应代表性的R统计量和偏R统计量进行了扩展,构造出R统计量的标准误差和置信区间,最后基于2017年的中国流动人口动态监测数据进行了实证分析,完善了R统计量的落地与应用。本文同时编写了实现R统计量和偏R统计量的计算机程序。值得说明的是,表示响应代表性的R统计量和偏R统计量是对现有文献的统一整合,R统计量的标准误差和置信区间的计算是本文完成的对R统计量测度的重要补充。第三,对项目无响应的处理方法进行了系统研究。插值方法是处理项目无响应的常用方法,首先详细分析了插值方法的理论机制,然后对现有的单插值、EM插值、多重插值和分数插值方法进行了系统比较,并探讨了现有插值方法的适用条件和优缺点,最后提出了结构逻辑插值方法。本文设计的结构逻辑插值方法是包含分类插值、关联插值和多重取优插值的一个综合插值方法;结构逻辑插值方法是问题导向的插值方法;结构逻辑插值方法是抽样学习的一个方法,通过机器学习中的算法学习到分类规则、关联规则、多重取优规则,或更具体地说,通过抽样学习的方法,学习到个体的群特征、统计特征和个体行为特征,并基于这些特征对缺失样本进行插值,本文根据这个理论构建了项目无响应插值的完整体系。第四,从实证角度对流动人口调查中的项目无响应问题进行了测度,从而评估无响应对流动人口抽样调查质量的影响,然后基于单插值方法、多重插值方法和结构逻辑插值方法对影响流动人口居留意愿中的缺失数据进行了插值,并从不同角度对各种插值方法的效果进行了评估。具体来说,除了使用传统的方差比较的方法及将插值后的数据与原始数据进行对比的方法比较各种插值方法的效果外,本文提出在结构逻辑插值分析中使用Kappa一致性分析用于比较各种插值方法的优劣。抽样调查中的无响应问题直接导致不同程度的数据缺失,在不同程度上影响了抽样调查的质量。本文的创新之处在于完善R统计量的理论基础和算法设计,将R统计量作为响应率的补充指标来评估抽样调查中的无响应问题,从而评估抽样调查的质量,进一步改进了多重插值方法,最后提出新的结构逻辑插值方法对抽样调查中的项目无响应问题进行插值和评估。

郭旗^[2]（2020）在《基于全民健康理念的寒地大众体育建筑设计研究》文中研究指明健康是影响未来经济和社会发展的重大议题,全民健身与全民健康的密切联系,使体育运动成为健康生活的基石。本文基于全民健康理念,以提升大众体育建筑的全民健康服务能力为目标,研究寒地大众体育建筑的设计策略及方法。当代寒地大众体育建筑设计研究存在严重的信息缺失,本文通过梳理寒地大众体育建筑的发展历程,明确大众体育建筑的发展阶段及数量分布。并以哈尔滨、长春、沈阳三个典型寒地城市为例,通过文献资料调查法及对比分析法,Python网络爬虫大数据调查及Arc GIS地理数据分析法,24个大众体育建筑的实地调查及现场观察法,538份问卷调查法及主成分分析（PCA）、结构方程模型建立（SEM）等数据分析法,进行寒地大众体育建筑的设计限制调查、现状问题调查及期望需求调查。本文解析了全民健康理念的外延理论,提出全民健康理念的健康公平内涵、全生命周期内涵及人类发展内涵,构建目标、手段、过程框架下完整人口覆盖、多元服务协同、高效资源利用的全民健康实现路径。总结归纳我国寒地大众体育建筑的外部环境、内部结构及作用方式,在实践层面对设计对象进行原型解构,提出群体空间、个体空间及单一空间的设计层次。揭示不同设计层次目标、手段、过程框架下,寒地大众体育建筑设计实现全民健康的核心机制。从而提出实现完整空间覆盖的群体网络分级、实现完整需求覆盖的多维功能复合、实现完整感知覆盖的综合环境舒适的设计导向,构建基于全民健康理念的寒地大众体育建筑设计框架。实现完整空间覆盖的群体网络分级设计,是寒地大众体育建筑的群体空间设计部分,指通过设施体系的结构性优化,实现在寒地大众体育建筑的完整空间覆盖前提下,土地资源的高效利用。利用寒地城市大众体育建筑空间分布数据,明确寒地大众体育建筑的规模分级模式。提出实现资源高效利用的建筑分级模式、提高空间覆盖效率的可达性演进、加强弱势群体倾斜的类型混合促进的策略方法。实现完整需求覆盖的多维功能复合设计,是寒地大众体育建筑的个体空间设计部分,指通过体育需求的精细化供给,实现在寒地大众体育建筑的完整需求覆盖前提下,空间资源的高效利用。利用寒地大众体育需求调查数据,明确寒地大众体育建筑的需求等级及发展模式。提出需求等级要求的复合式功能重构、需求兼容要求的交互式尺度转译、需求可变要求的适应性场所更新的策略及方法。实现完整感知覆盖的综合环境舒适设计,是寒地大众体育建筑的单一空间设计部分,指通过健康感知的体验性优化,实现在寒地大众体育建筑的完整感知覆盖前提下,能源的高效利用。利用寒地大众体育建筑规范调查,提出寒地大众体育建筑空间要素分类模式。提出空间无害基础保障的控制性设计、运动风险外因防御的保障性设计、环境舒适空间干预的增强型设计的策略及方法。本文立足于通过寒地大众体育建筑设计实现全民健康,具有较强的实践意义与社会意义,研究所得的寒地大众体育建筑调查方法体系、设计理论解析、策略方法集成可对寒地大众体育建筑的相关政策、标准制定、规划及设计提供指导,可为今后的大众体育建筑设计提供一定借鉴。

吴默妮^[3]（2020）在《广义平衡抽样及其模型辅助估计方法研究》文中指出在我国现行的大部分抽样调查中,抽样设计环节很少采用平衡抽样方法。但在信息化时代,辅助信息的获取较为容易,有利于采用平衡抽样方法获取更具有代表性的样本,并且对提高抽样估计精度具有关键作用。当辅助变量和目标变量之间的关系为线性关系,传统平衡样本具有较强的代表性,且平衡样本下的Horvitz-Thompson估计量的估计效果也较好。在实际抽样中,常常存在超总体模型为非线性回归模型或模型形式未知的情况,因此本文在传统平衡抽样的基础上对平衡抽样的条件进行扩展,提出适应性更强的广义平衡抽样。但是当平衡变量的总体单元信息不完全已知时,如果只利用已知的辅助变量进行平衡抽样,抽取的样本对总体的代表性不足,因此本文提出与双重抽样相结合的广义平衡抽样设计方法,首先在第一重抽样中获取必要的辅助变量信息,其次在第二重抽样中进行广义平衡抽样。在平衡变量信息完全已知或不完全已知两种情况下,广义平衡抽样均提高了样本的代表性。在抽样估计阶段,由于平衡样本不一定完全满足平衡条件,本文采用广义回归估计的思路,对传统的平衡Horvitz-Thompson估计量进行调整,提出广义平衡回归估计量。在平衡变量信息完全已知或不完全已知两种情况下,广义平衡回归估计量比传统估计量具有更高的估计精度,方差更具稳定性,并满足渐近设计无偏性和一致性。本文把广义平衡抽样及其广义平衡回归估计量运用到我国的住户调查中,并提出抽样设计思路。此外,数值模拟和实证分析的结果表明了当平衡变量与目标变量之间存在紧密相关性时,广义平衡抽样及广义平衡回归估计量的优越性。

杨贵军,沈文静^[4]（2020）在《广义回归估计量在中国农业抽样调查中的应用研究》文中研究表明当前对中国农业抽样调查总体参数估计方法的研究不足,对可充分利用辅助信息的总体参数广义回归估计量的研究也较少,为此剖析广义回归估计量应用于中国农业抽样调查的可行性和适用性。首先,探索中国背景下潜在的辅助信息来源及其具体用途,研究广义回归估计量的构造方法,以及如何使用刀切法构建广义回归估计量的方差估计。其次,利用第三次全国农业普查数据,针对中国畜禽抽样调查,对广义回归估计量和赫维茨—汤普森估计量进行模拟比较,验证广义回归估计量的优良性。最后,通过实例演示广义回归估计量及其方差估计在中国农业抽样调查中具有有效性。该研究有助于提高中国农业抽样调查总体参数估计的可靠性,并为未来中国农业抽样调查的方案设计提供了理论依据。

刘传奇^[5]（2020）在《研究生支教团志愿者身体活动及其体质健康研究》文中研究表明为响应西部大开发战略和坚决打赢脱贫攻坚战方针,按照习总书记“扶贫必扶智,治贫先治愚”的脱贫思想,教育部、团中央等部门联合组织实施研究生支教团计划,每年招募一定数量优秀应届本科毕业生或在读研究生到国家中西部贫困地区中小学开展为期一年的支教服务。研究生支教团志愿者的身体健康是适应中西部地区恶劣气候、更好开展支教扶贫任务的先决条件,为增强研究生支教团志愿者体质健康,本文通过文献资料法、测试法、回顾性调查法、数理统计法等方法,以全国第二十一届研究生支教团志愿者为被试与调研对象,对其进行体质健康测试和身体活动调查,分析不同性别、年龄、服务地区的志愿者的体质健康和身体活动差异性,探讨身体活动和体质健康的影响因素,研究其身体活动量与体质健康得分的相关性并对其量化。最终得到如下结论:1.研究生支教团男性志愿者下肢力量与爆发较好,上肢力量偏弱。女性志愿者身体形态较好,下肢爆发力和弹跳力较弱,核心力量较弱。2.研究生支教团志愿者中高身体活动量偏低,相对中高强度身体活动站立和步行耗能比重较大。相对服务于乡村的志愿者,城镇志愿者步行身体活动量较低。3.研究生支教团志愿者每天静坐累计时长过多且每天睡眠（包括午睡）时间在8小时及以下的比例过高,研究生支教团志愿者睡眠整体出现不足情况。4.身体活动量和体质健康得分之间有着显着的正相关关系,静坐时长与睡眠时长、身体活动量有负相关关系,睡眠时长与身体活动量具有正相关关系。该论文有图9幅,表39个,参考文献87篇。

王雅坤^[6]（2020）在《基于车籍的区域道路货物运输统计调查方案研究》文中进行了进一步梳理道路货物运输是货物运输业的重要组成部分,道路货物运输统计是衡量道路货物运输业发展情况的重要基础,但我国道路货物运输统计调查方案尚不成熟,仍处于发展完善阶段,还存在抽样误差较大、区域发展情况无法准确反映等问题,需要深入持久研究,不断优化道路货物运输统计调查方案,提高统计数据质量。本文首先对近10年我国开展的4次道路货物运输统计调查方案展开对比分析,以最新的2019年方案为重点,分析我国道路货物运输调查方案存在的8个抽样调查误差问题。进而按照调查方案设计步骤,从调查目的、调查范围、调查内容、调查单位、抽样单位、抽样方法共6方面进行基于车籍的区域道路货物运输调查方案设计研究。再次,对调查方案的核心部分“抽样方法”,深入研究探讨了抽样框的修正、层划分的规范、抽样方法的选择和样本量的确定相关内容。本文主要研究结论有:提出通过外地驻点运输证以及车辆年度检审平台严格区分本地车与外地车在区域内发生的道路货物运输;结合运输挂靠类型企业参与调查的实现方式将抽样单位分为“具有一定特性的企业经营业户”、“具有一定特性的个体经营业户”、“外地经营业户”共3类;前两类抽样单位的抽样框编制原理与抽样方法相同,均采用初级单位大小不等的分层二阶不等概率抽样开展道路货物运输调查,第一阶段以经营业户运力规模为分层标志,层内采用按比例分配的分层随机抽样,第二阶段以标记吨位均值为分层标志,层内以经营业户标记吨位变异系数权重进行PPS抽样;对于外地经营业户抽样单位,采用事后分层抽样。本文最后形成了基于车籍的区域道路货物运输统计调查方案,可用于省级和地市的区域道路货物运输数据的采集和推算,实现了区域道路货物运输抽样调查所得数据与调查目标相一致,提高了我国道路货物运输统计调查方案的适用性和准确性。

杨延飞^[7]（2019）在《基于超总体模型的设计效应研究》文中研究指明设计效应是抽样调查中的一个重要指标,是复杂抽样设计中确定样本量的关键。对设计效应的研究存在“基于设计”和“基于模型”两种模式。在基于设计的模式下,总体单元是固定的,样本的随机性来源于样本的随机抽取,设计效应要通过基于设计的方差估计来得到,而在复杂抽样设计下往往无法得到方差的简洁表达,也就无法得到设计效应的计算公式,只能通过重抽样方法（刀切法、自助法等）或泰勒线性化方法得到设计效应的计算结果;在基于模型的模式下,总体被认为是超总体模型的一次具体实现,也具有随机性,设计效应可以由基于超总体模型的方差估计得到,而对于各种抽样设计包括复杂抽样设计,只要得到对应的超总体模型,就能得到方差的简洁表达,也就能得到设计效应的计算公式,而公式的正确性又可通过仿真来验证。基于超总体模型的设计效应研究日益受到国外研究者的重视,但目前国内研究较少。本文首先进行了一些基本的梳理和辨析工作,主要包括:一是通过公式推导和仿真模拟相结合的方法,系统梳理了设计效应的影响因素,明确调查变量、估计量、抽样方法和样本量均可对设计效应造成显着影响;二是对基于设计的设计效应测算进行梳理分析,一方面梳理了基于设计的设计效应基本测算方法,另一方面研究了用复杂抽样的样本估计简单随机抽样下估计量方差的问题,通过仿真对比研究了方差的简单估计和无偏估计,发现文献所给的无偏估计相对于简单估计来说并不存在明显优势,却增加了估计的难度和计算量;三是提出了基于设计的设计效应测算框架,并提出当简单估计不存在时,可采用原始刀切法来估计简单随机抽样下估计量的方差,最后还进行了仿真验证。本文的核心工作:一是丰富发展了抽样方法对应的超总体模型,基于随机效应模型提出了分层、多阶段、不等概率等抽样因素单独存在或同时存在时对应的一系列超总体模型;二是基于所给模型推导出分层、类集、加权单因素设计效应的计算公式和二因素、三因素同时存在时的组合设计效应计算公式,公式表明多因素同时存在的组合设计效应等于对应单因素设计效应的乘积,进一步还通过抽样模拟仿真验证了公式的有效性。所推导出的计算公式,一方面与Kish等人所给传统公式吻合,另一方面,内容也比传统公式更加丰富。通过这些公式,本文实现了对设计效应的分解,也使得对设计效应的内部结构和规律的认识更加深入。本文还基于超总体模型,研究了一些特定情形下设计效应的计算问题。具体来说,一是针对极致的分层和加权同时存在的情况下设计效应计算公式低估真实设计效应的问题,给出了修正因子表达式,并通过大量仿真得到了修正因子的简洁的近似表达;二是针对权与调查变量相关的情况下,设计效应计算公式失效的问题,采用非线性函数泰勒展开的思路,基于超总体模型推导得出了权与调查变量相关情况下设计效应的计算公式,并进行了仿真验证;三是针对类集效应计算公式在三阶段抽样下无法使用的问题,基于超总体模型推导得出了与传统公式形式一致但更具一般性的类集效应计算公式,同样也进行了仿真验证;四是基于超总体模型研究了多层估计情况下,各域或层对应的设计效应和总体对应的设计效应之间的关系,给出了关系表达式,并进行了仿真验证。最后,本文还探讨了所推导出的设计效应的一系列计算公式的估计和应用问题。一方面,探讨了仅有抽样设计和样本信息的情况下设计效应计算公式中参数的估计问题,梳理给出了每个公式的估计方法,并对自己所提出的估计方法进行了仿真验证;另一方面,基于湖北省武汉“1+8”城市圈育龄妇女信息数据库,以其中潜江市育龄妇女为总体,进行了多种抽样设计,并计算了对应的设计效应,从而对实际总体下估计量的设计效应有了直观的认识。最后,还提出了在实际抽样中减小设计效应的具体意见建议。本文的创新之处在于:第一,丰富发展了抽样方法对应的超总体模型。本文在文献所给的简单随机抽样和二阶段抽样对应的超总体模型的基础上,提出了超总体模型的设计思路,并依据思路设计出分层、多阶段、不等概率等抽样因素单独存在或同时存在时对应的一系列的超总体模型。第二,初步建立起基于超总体模型的设计效应测算体系。基于超总体模型,不但推导出分层、类集、加权单因素设计效应和多因素同时存在时组合设计效应的计算公式和估计公式,并且推导出权与变量相关时的加权效应、三阶段抽样下的类集效应的计算公式和估计公式,以及多层估计时设计效应的合成公式和估计公式。这些公式初步构成了基于超总体模型的设计效应测算体系。第三,发现并初步解决了一些设计效应相关问题。比如,发现极致分层和加权同时存在时设计效应的低估问题,并通过设计修正因子初步解决了该问题;再比如,针对类集效应计算公式在三阶段抽样下不适用的问题,给出了三阶段抽样下类集效应的计算公式;又比如,针对分层抽样下各层对应设计效应和总体对应设计效应之间关系问题,给出了简洁的关系表达式。

牛成英^[8]（2019）在《非概率抽样网络调查统计推断问题研究》文中认为随着信息技术的发展,互联网在人们的生活及工作中得到了广泛应用和普及,抽样调查技术也从传统纸笔调查发展到以互联网为媒介的网络调查。当前,网络调查在利用抽样调查进行的科学研究中应用十分普遍,然而,以互联网为媒介的网络调查也有其自身的局限性,主要表现在以下两个方面:一是通过互联网进行的网络调查,其样本的选取已无法完全保证概率抽样;二是在网络调查中,实际抽样的网络总体与研究者关注的目标总体间通常会存在较大的覆盖误差,这些局限性将导致不能直接利用网络调查样本对目标总体进行统计推断。针对上述两个问题,论文主要从以下几个方面进行探索研究:首先,针对非概率抽样网络调查样本的非随机性选取问题,论文讨论了在目标总体单元的辅助信息已知条件下,利用概率抽样方法从目标总体中抽取概率样本作为辅助样本,基于倾向值匹配样本的方法,对非概率抽样的网络调查样本与辅助样本进行倾向值匹配,产生一个来自网络调查样本的匹配样本,论证了该匹配样本具有与辅助样本相同的随机性,研究结果表明利用匹配样本对目标总体进行统计推断具有可行性。其次,在利用倾向值匹配方法对非概率抽样网络调查样本进行随机化的基础上,论文讨论了基于匹配样本对目标总体参数进行估计时,对总体参数的简单估计量和倾向值加权估计量的构建,论证了估计量的无偏性和渐近无偏性,并对估计量的方差及其性质进行了讨论。进一步研究了利用匹配样本,采用事后分层估计方法估计总体参数时,估计量的构建及其性质,并对非概率抽样网络调查的样本选择性偏差进行估计。探索利用非概率抽样网络调查样本对目标总体进行统计推断的有效方法,研究结果表明,利用非概率抽样网络调查样本对目标总体进行统计推断具有可行性,但在分层估计中,估计量的精度提高与样本匹配结果密切相关。最后,针对在网络调查中目标总体与实际能够参与网络调查的群体之间存在较大覆盖误差的问题,论文提出基于倾向值匹配样本的方法,利用生物统计中的捕获—再捕获思想估计未知总体规模的方法,结合网络调查样本单元的人口统计特征,利用Logistic回归捕获—再捕获模型估计方法,对网络调查样本实际代表的网络总体规模进行估计。在此基础上,利用倾向值匹配样本估计目标总体参数的过程中,采用样本追加抽样域估计的方法估计目标总体参数,在未完成匹配的辅助样本单元中进行追加概率抽样,并对追加样本进行调查,综合来自网络调查样本的匹配样本和追加样本,对目标总体参数进行统计推断,并进一步对网络调查样本的选择性偏差和网络总体覆盖误差进行估计。解决了存在覆盖误差时,利用网络调查样本对目标总体进行统计推断的问题。

罗薇^[9]（2016）在《住户调查一体化设计研究》文中提出为了在有限调查资源下满足日益增长的统计需求,将相互关联的住户调查项目进行整合,实施一体化设计,已成为各国住户调查体系改革的重要方向。在理论方面,本文首先按内容特征和内在逻辑关系将住户调查项目分为基本情况类调查、经济特征类调查和社会特征类调查,依据三者的内在逻辑确定调查的主辅关系,进而确定三类调查的调查方法、调查频率和调查方式等设计内容,为住户调查一体化设计奠定理论基础。其次,从内外部衔接两个方向对住户调查一体化设计进行系统研究:从外部衔接的角度对住户调查、人口普查和行政记录进行整体性设计,建立人口普查和行政记录与住户调查抽样框设计以及更新维护的衔接路径,为住户调查一体化设计确立了外部衔接理论基础。从内部衔接的角度,以满足全部住户调查项目需要的主样本设计为切入点,以设计效应和最终类集为工具,构建多阶段抽样下的复杂样本设计的理论分析框架,分析影响复杂样本估计量设计效应的基本要素,解析其对复杂样本估计量设计效应的影响机理及相互作用机制,建立各种要素的设计效应模型及要素组合的设计效应模型,为主样本设计的分析和选择提供有效的方法路径,为住户调查一体化设计建立了内部衔接理论方法基础。在应用方面,在充分利用现行国家调查制度的渠道和机制的基础上,构造出我国住户调查一体化设计的基础框架,对住户调查项目按其调查内容特征和内在逻辑关系进行精简、整合,形成以劳动力调查和住户收支与生活状况调查为核心的住户调查体系,并给出以主样本为主体的我国住户调查的一体化设计思路,其思路和方法可以复制推广到其它调查领域。

谭志军^[10]（2014）在《人群健康测量与评价方法研究—复杂抽样与EQ-5D测量》文中研究表明研究目的（1）分析和比较不等概率、分层以及整群三个典型复杂抽样特征对点估计和抽样效率的影响，为有限总体人群健康测量数据的复杂抽样参数估计方法提供依据。（2）采用Rasch模型，从量表项目水平评价中文版EQ-5D量表的整体以及5个维度在不同慢性病人群中的适用性。（3）在系统掌握陕西省居民健康现状及其人群分布特征的基础上，采用复杂抽样多变量模型，分析EQ-5D的5个维度、EQ-5D指数和VAS的主要影响因素。（4）基于健康效用、健康效用的边际效用、卫生服务利用、患病率和人口数，构建效用调整卫生服务利用指标，并利用该指标开展常见慢性病人群的卫生服务利用成本-效用分析。研究方法（1）以基础抽样权重、比例权重和标准化权重的联合权重校正样本的差异代表性。根据区域（陕南、关中和陕北）和城乡（城市和农村）的联合分类，将全省分为6层。将县区设置为群标识。设定仅加权（CSw）、分层加权（CSsw）、分层整群加权（CSscw）三种复杂抽样校正方法。通过比较三种校正方法与完全随机法（SRS）的设计效应，分析不等概率、分层和加权对参数估计及参数方差估计的影响。选用的估计对象包括均数、率、线性回归的系数和Logistic回归的系数。（2）采用基于Rasch模型的软件RUMM2030分析EQ-5D量表。在项目水平评价量表整体以及5个维度在12类常见慢性病人群的适用性。量表整体测量效果的评价方法包括RSM和PCM模型的比较、总体拟合效果、个体离散指数、标的性、残差主成分分析；量表各维度测量效果的评价方法包括项目拟合残差、阈值、DIF。（3）采用单变量统计分析方法系统描述陕西省全人群的健康现状及健康的人群分布特征。通过构建多变量模型确定5个健康维度、EQ-5D指数和EQ-5D VAS的主要影响因素。EQ-5D维度的影响因素分析采用Logistic回归模型，EQ-5D指数和EQ-5D VAS的影响因素分析采用Tobit回归模型。统计分析的工具为SAS和STATA，分析过程采用CSscw法进行校正。。（4）基于健康效用、健康效用的边际效应、卫生服务利用、患病率以及人口数构建效用调整卫生服务利用指标，利用该指标开展慢性病人群卫生服务利用的成本-效用分析。采用复杂抽样Tobit模型估计健康效用的边际效应。利用患病率、人数和健康效用的边际效用计算慢性病患病的QALY损失。计算和比较不同慢性病的效用调整卫生服务利用及其总量。主要研究结果（1）经过三类权重对差异代表性的校正，20-24岁、25-29岁、30-34岁三个年龄段的人口构成比分别由4.91%、5.23%、4.72%增加至10.32%、7.47%和6.86%。校正后的全省以及各层年龄-性别结构与总体基本一致。人均卫生支出和慢性病患病率的估计值由校正前的932元和19.2%下降至897元和14.1%。三种校正方法的设计效应显示，对抽样效率影响由大到小依次是整群、不等概率和分层。例如，在家庭人均卫生支出的估计中，CSw法、CSsw法和CSscw法的设计效应分别为1.6、1.58和46.6；在慢性病患病率的估计中，CSw法、CSsw法和CSscw法的设计效应分别为1.04、1.04和14.52。考虑复杂抽样特征后，回归模型中部分因素的系数的标准误和P值增加较多，且P值跨越了0.05的置信水准。例如，CSscw法线性回归模型中区域（陕南）的P值由<0.0001增大至0.45，就业（在业）的P值由<0.01增大至0.11；CSscw法Logistic回归模型中区域（关中）的P值由0.03增大至0.31，饮酒的P值由<0.001增大至0.11。（2）单个维度的缺失率均低于1%，五个维度的不完整率为0.13%。健康状态为“11111”和“33333”的调查对象各占81.8%和0.14%。除贫血和精神类疾病外，所有人群的PCM模型和RSM模型比较的似然比检验P值都小于0.001。慢性病人群的个体离散指数均大于未报告慢性病人群和全人群，在0.5-0.8之间。个体位置均数都大于0且偏度系数都小于0。残差主成分分析的结果显示所有人群的第一主成分特征值均大于1.4，小于1.4的特征值方差百分比在50%和70%之间。全人群、未报告慢性病人群和其它慢性病人群的5个项目的残差都比较严重地偏离了[-2.5，2.5]区间。有8个人群在焦虑/沮丧维度的项目残差大于2.5。12类常见慢性病的城乡-DIF和性别-DIF分析的P值均大于0.05，全人群的有无慢性病-DIF分析的P值小于0.01。（3）（A）在城乡调查对象的特征方面：农村的在业人口和文盲的比例比城市分别高22.3和18.1个百分点，高等教育（大专及以上）和从不参加体育锻炼的比例比农村分别低10和25.1个百分点。（B）在人群健康的总体现状方面：五个维度报告健康问题的比例由高到低依次是疼痛/不适（10.9%）、焦虑/沮丧（5.6%）、行动能力（4.6%）、日常活动（3.9%）、自我照顾（2.4%）。EQ-5D指数和VAS的中位数分别为0.89和84.51。VAS与EQ-5D指数的相关系数为0.47，疼痛/不适维度与VAS和EQ-5D指数的相关系数分别为-0.42和-0.89。（C）从不同健康指标的人群分布特征来看，女性、年龄较高者、陕北地区人群、农村地区人群、两周患病者、患慢性病种类较多者、丧婚离婚者、无业失业者、受教育程度较低者、人均家庭收入较低者、参加农合或城乡合作医疗者的健康状态较差。各类健康指标在年龄、教育水平、人均家庭收入和共患慢性病数量四个因素上呈现梯度分布。例如，四个年龄段人群的EQ-5D指数中位数分别为0.899、0.894、0.881和0.848，报告的疼痛/不适健康问题的比例分别是1.27%、3.56%、6.96%和13.14%。（D）未报告慢性病人群健康状态的主要影响因素包括年龄、文化程度、家庭人均收入和两周患病，其中年龄、文化程度、家庭人均收入在各个健康指标上的作用呈现梯度效应。例如，三个较高年龄段人群在行动能力维度的OR值分别为3.41、10.23和23.18，在EQ-5D指数上的系数分别为-0.183、-0.355和-0.507。（E）慢性病人群健康状态的主要影响因素包括文化程度、家庭人均收入、共患慢性病数量和两周患病，其中文化程度、家庭人均收入和共患慢性病数量在各个健康指标上的作用呈现梯度效应。例如，三个共患慢性病数量较多人群在日常活动维度的OR值分别为1.65、2.82和3.62，在VAS得分上的系数分别为-4.8、-7.7和-12.8。年龄对未报告慢性病人群健康的影响比慢性病人群大。（4）（A）15岁以上人群中，患病率最高的是高血压病（9.92%），边际效用最大的是肿瘤（-0.3863）。每年因患肌肉运动系统疾病的QALY损失最大（828.3年）。但是，以上指标在60岁以上年龄组中有些差异。例如60岁以上人群中边际效用最大的是精神类疾病（-0.3831），QALY损失最大的是高血压病（473年）。（B）在15岁以上人群中，慢性病人群的门诊量和门诊费用分别占总量的56.6%和61.99%。门诊病人中健康状态相对较差的是脑血管病（0.74）和肿瘤（0.78），肿瘤的两周门诊就诊率（33.1%）和次均门诊费用（1045元）都最高；单位门诊服务利用最高的也是肿瘤，单位效用门诊次数为11.1次/年，单位效用门诊费用为1342元。（C）15岁以上人群中，慢性病患者的住院次数、住院费用和住院天数分别占总量的45%、49%、51%。住院病人中健康状态最差的是脑血管病（0.76），住院率和住院费用最高的是肿瘤，分别为67.4%和10043元，精神类疾病的住院天数最多（32.6天）。单位效用住院次数和住院费用最高的是肿瘤，分别为0.8次/年和11882元，单位效用住院天数最高的是精神类疾病（39.4天）。以上指标在60岁以上年龄组中也有一些差异。例如，住院率最高的是脑血管病（51.7%），住院天数最高的是传染病（23.1天），单位效用住院次数最高的是脑血管病（0.72次/年），单位效用住院天数最高的是传染病（28.7天）。（D）15岁以上人群中，肌肉运动系统疾病的效用调整卫生服务利用总量最高，门诊次数约为179万次，门诊费用约为4200万，住院次数约为56000次，住院费用约为12亿元。15-59岁与60岁以上人群中，不同慢性病的效用调整卫生服务利用总量的构成具有一定的差异；15-59岁人群中，肌肉运动系统疾病、消化系统疾病和肿瘤的比重相对更高，而60岁以上人群的脑血管病、高血压病、心脏病和糖尿病的比重更高。研究结论（1）不等概率主要影响点估计的偏度，整群主要影响标准误的大小。复杂抽样人群健康测量的评价方法必须考虑复杂抽样特征，忽略复杂抽样特征很可能带来有偏估计和错误的统计推断。（2）中文版EQ-5D量表的项目设置基本符合测量假设，但模型拟合效果不是很好。发现的主要问题是量表对较好健康状态的敏感性不强，易产生较高天花板效应。总体上，慢性病人群的拟合效果好于非慢性病人群，生理维度的拟合效果好于心理维度。（3）人群健康状态的主要影响因素包括年龄、文化程度、家庭收入、共患慢性病数量。以上因素内的不同水平对健康指标的影响呈现梯度分布的特点。四个重要影响因素有两个属于社会经济因素，反应了社会经济发展不均衡引起的健康公平性问题。（4）效用调整卫生服务利用指标的构建，为基于横断面调查数据的卫生服务利用的成本-效用分析提供了新方法。慢性病人群效用调整卫生服务利用的分析结果，确定了人群中慢性病的防治重点，可为慢病防治项目的资源优化配置提供参考依据。

二、多变量与规模成比例概率抽样的有关问题（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、多变量与规模成比例概率抽样的有关问题（论文提纲范文）

（1）抽样调查无响应问题研究（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 研究背景和选题意义

1.1.1 抽样调查无响应问题的产生

1.1.2 影响调查无响应的主要因素

1.1.3 研究意义

1.2 文献综述

1.2.1 调查准备和实施阶段的无响应问题综述

1.2.2 调查数据整理阶段校正由于无响应而导致的偏差

1.2.3 国内学者调查无响应问题研究进展

1.2.4 解决无响应问题的推广应用价值

1.2.5 文献述评

1.3 研究思路、内容与方法

1.3.1 研究思路和目标

1.3.2 研究内容和章节安排

1.3.3 研究方法与技术路线

1.4 本文的创新点

1.4.1 完善R统计量的算法设计与应用,提出了抽样调查质量评估的新方法

1.4.2 对多种插值方法的进行比较分析,提出了根据不同变量类型分类插值的基本思想

1.4.3 引进决策树思想,提出结构逻辑的插值方法对项目无响应进行插值

第2章无响应的机理研究

2.1 无响应概念的界定

2.1.1 无响应内涵

2.1.2 无响应产生的原因

2.2 与无响应相关的基本概念

2.2.1 误差的分类

2.2.2 无响应和欠覆盖

2.2.3 响应率

2.3 缺失数据机制

2.4 不同的响应类型

2.4.1 固定响应模型

2.4.2 随机响应模型

2.5 无响应的影响

2.5.1 无响应的一般影响

2.5.2 无响应对置信区间的影响

2.6 本章小结

第3章 R统计量相关理论及其研究

3.1 R统计量的产生

3.2 代表性响应的概念

3.2.1 代表性的含义

3.2.2 响应者子样本的代表性定义

3.3 R统计量

3.3.1 总体的R统计量

3.3.2 样本的R统计量

3.4 R统计量的特征

3.4.1 R统计量的一般特征

3.4.2 R统计量的可解释性

3.4.3 R统计量的可标准化性质

3.5 R统计量的标准误和置信区间

3.6 代表性响应的偏R统计量

3.7 本章小结

第4章项目无响应处理方法研究

4.1 项目无响应的逻辑成因分析

4.2 插值方法的数理基础

4.2.1 插值方法的产生

4.2.2 插值方法的理论机理

4.3 常用插值方法比较

4.3.1 单插值方法

4.3.2 EM插值

4.3.3 多重插值

4.3.4 分数插值

4.3.5 对常用插值方法的解读和评论

4.4 结构逻辑插值方法

4.4.1 结构逻辑插值方法的内涵

4.4.2 结构逻辑插值方法的性质

4.4.3 结构逻辑插值图

4.4.4 结构逻辑插值方法的评估

4.5 本章小结

第5章流动人口抽样调查无响应问题的实证研究

5.1 研究目的

5.1.1 居留意愿

5.1.2 流动人口居留意愿的理论分析

5.1.3 研究目标

5.2 R统计量的计算

5.2.1 宏观辅助变量的选取

5.2.2 并行变量数据

5.2.3 V统计量测度

5.2.4 R统计量的测度

5.3 插值变量选择及缺失数据说明

5.3.1 变量选择及说明

5.3.2 缺失数据说明

5.4 项目无响应插补前的估计值及其方差估计值

5.4.1 项目无响应插补前的估计值

5.4.2 项目无响应插补前方差估计值

5.5 基于单插值方法的项目无响应插补研究

5.5.1 项目无响应插补后的估计值及其方差研究

5.5.2 项目无响应插补后的实证结果分析

5.6 基于多重插值方法的项目无响应插补研究

5.7 基于结构逻辑插值方法的项目无响应插补研究

5.8 实证结果的总体分析

第6章结论和建议

6.1 主要结论

6.2 建议

6.2.1 使用R统计量测度无响应问题,可以提高问卷调查的质量

6.2.2 结构逻辑插值方法对缺失数据进行插值的可靠性更高

6.3 展望

参考文献

致谢

攻读博士学位期间发表的论文和其它科研情况

（2）基于全民健康理念的寒地大众体育建筑设计研究（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 研究背景

1.1.1 世界范围内健康城市运动的兴起

1.1.2 我国体育需求的不断扩张

1.1.3 寒地大众体育建筑的设计困境

1.2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.2.3 国内外研究现状综述

1.3 课题研究的目的及意义

1.3.1 研究目的

1.3.2 研究意义

1.4 概念界定与研究内容

1.4.1 健康

1.4.2 大众体育建筑

1.5 研究方法与论文结构

1.5.1 研究方法

1.5.2 论文结构

第2章寒地大众体育建筑的发展历程与现状调查

2.1 我国寒地大众体育建筑的发展脉络

2.1.1 我国寒地大众体育建筑的发展历程

2.1.2 我国大众体育建筑的宏观数量分布

2.1.3 当代寒地大众体育建筑的调研方法

2.2 各国大众体育建筑的设计规范资料对比

2.2.1 建议模式对比

2.2.2 场地标准对比

2.3 规划布局的大数据调查

2.3.1 Python网络爬虫的构建

2.3.2 调查结果的可视化表达

2.3.3 布局问题的提出

2.4 设计问题的现场观察

2.4.1 对象选取与现场观察

2.4.2 空间问题的提出

2.5 使用者需求的问卷调查

2.5.1 功能需求调查的问卷设计

2.5.2 调查结果的描述统计与检验

2.6 本章小结

第3章基于全民健康理念的寒地大众体育建筑设计架构

3.1 当代全民健康理念的内涵解析

3.1.1 全民健康理念的健康公平内涵

3.1.2 全民健康理念的全生命周期内涵

3.1.3 全民健康理念的人类发展内涵

3.2 当代全民健康理念的实现路径

3.2.1 目标——完整人口覆盖

3.2.2 手段——多元服务协同

3.2.3 过程——高效资源利用

3.3 寒地大众体育建筑实现全民健康的原型基础

3.3.1 寒地大众体育建筑的外部环境

3.3.2 寒地大众体育建筑的内部结构

3.3.3 寒地大众体育建筑的作用方式

3.4 寒地大众体育建筑设计实现全民健康的核心机制

3.4.1 设施系统的结构性调整

3.4.2 体育需求的精细化供给

3.4.3 健康感知的体验性优化

3.5 基于全民健康理念的寒地大众体育建筑设计导向

3.5.1 实现完整空间覆盖的群体网络分级设计

3.5.2 实现完整需求覆盖的多维功能复合设计

3.5.3 实现完整感知覆盖的综合环境舒适设计

3.6 本章小结

第4章寒地大众体育建筑群体网络分级设计

4.1 实现完整空间覆盖的网络分级设计原理

4.1.1 设施分级的动力机制

4.1.2 设施布局的组构法则

4.1.3 设施类型的组合规律

4.2 实现资源高效利用的建筑分级模式

4.2.1 规模等级的模式建议

4.2.2 潜在选址的框架适应

4.2.3 设施数量的弹性调控

4.3 提高空间覆盖效率的可达性演进

4.3.1 场域联系的柔性渗透

4.3.2 道路连接的适停控制

4.3.3 界面衔接的效率提升

4.4 加强弱势群体倾斜的类型混合促进

4.4.1 季节特征的补偿开放

4.4.2 运动类型的互补组合

4.4.3 场馆组合的融合促进

4.5 本章小结

第5章寒地大众体育建筑多维功能复合设计

5.1 实现完整需求覆盖的功能复合设计基础

5.1.1 大众体育建筑的体育需求等级

5.1.2 大众体育建筑的功能复合路径

5.1.3 体育工艺的尺度要求

5.2 需求等级要求的复合式功能重构

5.2.1 基础功能的单元衍生

5.2.2 复合功能的分类路径

5.2.3 空间组织的效率连接

5.3 需求兼容要求的交互式尺度转译

5.3.1 结构选型的单元组合

5.3.2 跨度转换的空间集约

5.3.3 形态变形的结构适应

5.4 需求可变要求的适应性场所更新

5.4.1 多义空间的设施预留

5.4.2 可变设施的结构附加

5.4.3 开放空间的模块转换

5.5 本章小结

第6章寒地大众体育建筑综合环境舒适设计

6.1 实现完整感知覆盖的环境舒适设计要素

6.1.1 评价标准的指标差异

6.1.2 相关规范的要素筛选

6.1.3 建筑设计的干预效率

6.2 空间无害基础保障的控制性设计

6.2.1 混合通风的健康风险规避

6.2.2 过滤系统的污染物渗透管理

6.3 运动风险外因预防的保障性设计

6.3.1 运动界面的材料防护

6.3.2 专项设施的运动辅助

6.3.3 节点更新的安全提示

6.4 物理环境靶向干预的增强性设计

6.4.1 视觉环境的心理舒适性调节

6.4.2 热舒适性能的分时分区控制

6.4.3 空间氛围的可供性交流促进

6.5 本章小结

结论

参考文献

附录1 各国运动场地尺度对比

附录2 寒地大众体育建筑使用现状调查问卷

附录3 哈尔滨、长春、沈阳大众体育建筑大数据调查结果

附录4 哈尔滨、长春、沈阳大众体育建筑大数据调查案例

攻读博士学位期间发表的论文及其成果

致谢

个人简历

（3）广义平衡抽样及其模型辅助估计方法研究（论文提纲范文）

中文摘要

英文摘要

1 前言

1.1 选题背景与意义

1.2 文献综述

1.3 研究框架及技术路线图

1.4 创新之处

2 抽样设计和抽样估计方法

2.1 抽样设计方法概述

2.2 抽样估计方法概述

2.3 广义平衡抽样及其估计方法的研究思路

3 广义平衡抽样及其模型辅助估计方法

3.1 平衡变量信息完整情形下的广义平衡抽样

3.2 平衡变量信息完整情形下的广义平衡回归估计量及其性质

3.3 数值模拟

4 广义平衡抽样及其模型辅助估计方法的扩展

4.1 平衡变量信息不完整情形下广义平衡抽样的改进

4.2 平衡变量信息不完整情形下的广义平衡回归估计量及其性质

4.3 数值模拟

5 广义平衡抽样及其模型辅助估计方法在中国住户调查中的应用

5.1 中国住户收支与生活状况调查的演变历程

5.2 中国住户收支与生活状况调查的的实施现状及存在的问题

5.3 中国住户收支与生活状况调查的抽样设计思路

5.4 基于广义平衡抽样及其模型辅助估计方法的实证分析

6 研究结论与展望

6.1 研究结论

6.2 研究展望与应用前景

参考文献

附录

在学期间发表的学术论文清单

致谢

（4）广义回归估计量在中国农业抽样调查中的应用研究（论文提纲范文）

一、引言

二、广义回归估计量的构造

(一)辅助信息的选择

(二)广义回归估计量

(三)广义回归估计量的方差估计

三、广义回归估计量性质的模拟分析

四、广义回归估计量的应用研究

五、结论

（5）研究生支教团志愿者身体活动及其体质健康研究（论文提纲范文）

致谢

摘要

abstract

1 绪论

1.1 研究背景

1.2 研究目的

1.3 研究意义

2 文献综述

2.1 研究生支教团

2.2 身体活动

2.3 体质健康

2.4 身体活动与体质健康的相关性研究

2.5 相似人群的身体活动和体质健康

3 研究对象与方法

3.1 研究对象

3.2 研究方法

4 结果与分析

4.1 研究生支教团志愿者基本情况分析

4.2 研究生支教团志愿者体质健康情况分析

4.3 研究生支教团志愿者身体活动情况分析

4.4 研究生支教团志愿者身体活动和体质健康相关性分析

4.5 研究生支教团志愿者体育锻炼意愿数学模型构建

5 结论与建议

参考文献

附录1

附录2

作者简历

学位论文数据集

（6）基于车籍的区域道路货物运输统计调查方案研究（论文提纲范文）

摘要

abstract

第一章绪论

1.1 研究背景与意义

1.1.1 研究背景

1.1.2 研究目的与意义

1.2 国内外研究综述

1.2.1 统计调查方法

1.2.2 道路货物运输调查方案

1.2.3 国内外研究现状评述

1.3 研究内容

1.4 研究思路与方法

第二章相关基础理论

2.1 道路货物运输相关理论

2.1.1 道路与公路的界定

2.1.2 道路货物运输

2.1.3 道路货物运输调查主要目标变量

2.2 统计调查相关理论

2.2.1 比例分配的分层随机抽样

2.2.2 分层比率估计抽样

2.2.3 等概率系统抽样

2.2.4 初级单位大小不等的二阶段等概率抽样

第三章我国道路货物运输统计调查方案比较与分析

3.1 我国道路货物运输统计调查方案发展历史

3.2 我国道路货物运输调查方案对比分析

3.3 我国道路货物运输调查方案抽样调查误差分析

3.3.1 非严格区域调查范围引致实际与目标存在偏差

3.3.2 调查单位覆盖偏差

3.3.3 运输挂靠型经营业户填报信息误差大

3.3.4 估计量总体因非主营货物重量存在高估或低估偏差

3.3.5 未控制与主要目标变量高度相关的标记吨位指标均匀分布

3.3.6 系统抽样随机起点引致趋向性误差

3.3.7 样本量小引致抽样理论有偏误差

3.3.8 分层抽样与系统抽样控制抽样精度要求冲突

第四章基于车籍的区域道路货物运输统计调查方案设计

4.1 调查目的

4.2 调查范围

4.3 调查内容

4.3.1 主要调查内容

4.3.2 调查内容兼容性

4.4 调查单位

4.4.1 目标总体与调查总体

4.4.2 确定目标总体

4.4.3 确定调查总体

4.5 抽样单位

4.5.1 道路货物运输挂靠型经营业户分类

4.5.2 抽样单位分类

4.6 抽样方法初探

第五章基于车籍的区域道路货物运输抽样方法研究

5.1 抽样框的修正

5.1.1 辅助信息的选择

5.1.2 具有一定特性的企业经营业户抽样框

5.1.3 具有一定特性的个体经营业户抽样框

5.1.4 外地经营业户的抽样框

5.2 层划分的规范

5.2.1 层数确定方法

5.2.2 层级界限确定方法

5.3 抽样方法的选择

5.3.1 具有一定特性的企业经营业户的抽样方法

5.3.2 具有一定特性的个体经营业户的抽样方法

5.3.3 外地经营业户的抽样方法

5.4 样本量的确定

5.4.1 样本量控制的必要性及原则

5.4.2 阶段间样本量

5.4.3 阶段内样本量

5.4.4 样本量调整

5.5 基于车籍的区域道路货物运输统计调查方案总结

第六章结论与展望

6.1 研究结论

6.2 创新点

6.3 展望

参考文献

攻读硕士学位期间取得的研究成果

致谢

（7）基于超总体模型的设计效应研究（论文提纲范文）

摘要

abstract

导论

一.研究背景

二.理论意义

三.实际意义

四.国内外研究综述

五.研究方法和基本框架

六.研究创新

第一章设计效应及其影响因素分析

第一节分析框架和术语符号

第二节调查变量的影响

一.调查变量影响的仿真策略

二.调查变量影响仿真结果

三.调查变量影响的分析与结论

第三节估计量的影响

一.估计量影响的仿真策略

二.估计量影响的仿真结果

第四节抽样方法的影响

一.抽样方法影响的分析策略

二.抽样方法影响的分析结果

第五节样本量和量纲的影响

一.样本量和量纲影响的仿真策略

二.样本量和量纲影响的仿真结果

本章小结

第二章基于设计的设计效应测算

第一节基于设计的方差估计方法

一.Taylor线性化方法

二.刀切法

第二节复杂样本下简单随机抽样方差的估计问题

一.基于复杂样本的简单随机抽样方差的简单估计的偏差分析

二.基于复杂样本的简单随机抽样方差的无偏估计

三.简单估计和无偏估计的对比

四.无偏估计的尴尬

第三节基于设计的设计效应测算方法

一.简单估计的适用范围

二.原始刀切法的新用途

三.基于设计的设计效应测算框架

四.仿真研究

本章小结

第三章基于模型的设计效应的分解

第一节基本超总体模型

第二节单因素设计效应

一.类集效应

二.加权效应

三.分层效应

第三节组合设计效应

一.类集与加权的组合效应

二.分层与类集的组合效应

三.分层与加权的组合效应

四.分层、类集和加权三因素组合效应

第四节仿真研究

一.仿真策略

二.仿真步骤

三.仿真结果

本章小结

第四章基本公式不适用的情况下设计效应的计算问题研究

第一节分层加权组合设计效应计算公式的修正

一.低估的定位

二.低估的原因

三.组合效应计算公式的修正

第二节权与变量相关时的加权效应

一.加权单因素设计效应公式

二.加权单因素设计效应公式的仿真研究

第三节三阶段抽样下类集效应的计算问题

一.三阶段抽样下类集效应计算公式

二.三阶段抽样下类集效应计算公式仿真研究

第四节多层估计下设计效应的合成问题

一.各域采取同类抽样设计时的设计效应合成问题

二.分层抽样时各层设计效应的合成问题

三.设计效应合成公式的仿真研究

本章小结

第五章基于模型的设计效应测算和应用

第一节设计效应测算问题

一.基本公式中参数的估计问题

二.特殊情形下设计效应计算公式中参数的估计问题

第二节基于真实数据的设计效应测算

一.数据介绍和抽样准备

二.基本抽样方法的设计效应

三.复杂抽样的设计效应

四.对减小设计效应的意见建议

本章小结

结语

一.研究结论

二.不足与展望

参考文献

致谢

个人简历、在学期间发表的学术论文与研究成果

（8）非概率抽样网络调查统计推断问题研究（论文提纲范文）

摘要

Abstract

第一章引言

1.1 研究背景与意义

1.1.1 研究背景

1.1.2 研究意义

1.2 研究方法

1.3 研究内容与技术路径

1.3.1 主要研究内容

1.3.2 技术路径

1.4 主要创新

第二章相关概念与统计推断理论综述

2.1 网络调查概念界定及其误差

2.1.1 网络调查的概念

2.1.2 网络调查的分类

2.1.3 网络调查的误差

2.2 抽样调查统计推断理论综述

2.2.1 概率抽样统计推断理论综述

2.2.2 非概率抽样统计推断理论综述

2.2.3 网络调查统计推断理论综述

第三章基于倾向值匹配的非随机样本不完全随机化

3.1 辅助信息

3.2 倾向值定义及估计

3.2.1 倾向值匹配基本思想

3.2.2 倾向值定义

3.2.3 倾向值估计

3.3 基于倾向值样本匹配

3.3.1 倾向值匹配的假设条件

3.3.2 倾向值匹配方法

3.3.3 匹配样本生成

3.4 匹配样本随机性论证

3.5 数值模拟

3.5.1 模拟1

3.5.2 模拟2

3.6 本章小结

第四章非概率抽样网络调查总体参数Horvitz-Thompson估计

4.1 相关符号及说明

4.2 基于网络调查样本的倾向值匹配样本

4.2.1 倾向值定义

4.2.2 倾向值估计

4.2.3 匹配样本

4.3 总体参数Horvitz-Thompson估计量及其性质

4.3.1 简单估计量及其性质

4.3.2 倾向值加权估计量及其性质

4.3.3 简单估计量与倾向值加权估计量的比较

4.4 数值模拟检验

4.4.1 数据来源与说明

4.4.2 抽样与样本匹配

4.4.3 模拟结果分析

4.5 本章小结

第五章非概率抽样网络调查总体参数事后分层估计

5.1 分层估计和事后分层估计

5.1.1 分层估计

5.1.2 事后分层估计

5.2 事后分层层权估计

5.2.1 分层标志的确定

5.2.2 层数的确定

5.2.3 层界的确定

5.2.4 层权的估计

5.3 总体参数事后分层估计

5.3.1 完全匹配样本的事后分层估计

5.3.2 不完全匹配样本的事后分层估计

5.4 样本选择性偏差估计

5.5 数值模拟检验

5.5.1 数据来源与处理

5.5.2 分层与样本匹配

5.5.3 模拟结果分析

5.6 本章小结

第六章基于捕获—再捕获模型和Logistic回归的网络总体规模估计

6.1 捕获-再捕获模型估计未知总体规模的基本思想

6.2 倾向值匹配平衡样本与样本代表性

6.2.1 倾向值匹配平衡样本的性质

6.2.2 样本代表性

6.3 基于倾向值匹配样本的捕获-再捕获模型

6.3.1 倾向值匹配样本的匹配—再匹配方法

6.3.2 异质性捕获—再捕获模型

6.4 基于捕获—再捕获模型的网络总体规模估计

6.4.1 网络总体规模估计量

6.4.2 网络总体规模估计量的性质

6.5 网络总体单元入样概率的Logistic回归估计

6.5.1 网络总体单元匹配概率的Logistic回归模型

6.5.2 网络总体单元入样概率的极大似然估计

6.6 数值模拟检验

6.7 本章小结

第七章基于样本追加抽样的网络调查总体参数域估计

7.1 样本追加抽样域估计基本思想

7.1.1 符号说明

7.1.2 样本追加抽样域估计

7.2 倾向值匹配样本及追加抽样设计

7.2.1 基本初始概率样本的倾向值匹配

7.2.2 未覆盖域追加抽样设计

7.3 目标总体参数估计

7.3.1 网络总体参数估计

7.3.2 未覆盖域参数估计

7.3.3 目标总体参数估计及其性质

7.4 样本选择性偏差及覆盖误差估计

7.4.1 样本选择性偏差估计

7.4.2 网络调查样本覆盖误差估计

7.5 数值模拟检验

7.6 本章小结

总结及展望

研究总结

研究展望

参考文献

致谢

个人简历

在学期间研究成果

（9）住户调查一体化设计研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景与研究意义

1.1.1 研究背景

1.1.2 研究意义

1.2 研究现状及评述

1.2.1 理论研究现状及述评

1.2.2 应用研究现状及述评

1.3 主要研究内容和创新点

1.3.1 研究内容

1.3.2 创新点

第2章住户调查一体化设计基础框架研究

2.1 引言

2.2 住户调查一体化设计定义与模式

2.3 住户调查一体化设计的必要性

2.4 住户调查一体化设计的基本要求

2.5 住户调查一体化设计的衔接路径

2.5.1 外部衔接路径

2.5.2 内部衔接路径

2.6 本章小结

第3章基于人口普查和行政记录的外部衔接研究

3.1 引言

3.2 政府统计数据的来源及互补性

3.2.1 政府统计数据的来源

3.2.2 各种数据来源的互补性

3.3 住户调查与人口普查和行政记录的衔接路径

3.3.1 人口普查与抽样框设计的衔接路径

3.3.2 行政记录与抽样框维护的衔接路径

3.3.3 人口普查及行政记录与抽样框及样本周期性更新的衔接路径

3.3.4 人口普查与样本调整的衔接路径

3.4 本章小结

第4章住户调查一体化设计的主样本

4.1 引言

4.2 住户调查一体化设计的主样本实践应用

4.4 主样本的特征

4.5 主样本设计概述

4.5.1 主样本设计要求

4.5.2 主样本设计内容

4.6 本章小结

第5章基于设计效应的主样本设计研究

5.1 引言

5.2 设计效应概述

5.2.1 设计效应定义

5.2.2 基于设计效应的主样本设计的依据

5.2.3 影响设计效应的要素

5.3 基于分层设计效应的主样本设计

5.3.1 分层抽样概述

5.3.2 分层抽样的方差估计

5.3.3 比例分配的分层设计效应

5.3.4 非比例分配的分层设计效应

5.3.5 分层设计效应下的主样本设计

5.4 基于类集设计效应的主样本设计

5.4.1 类集概述

5.4.2 最终类集样本对复杂样本的近似

5.4.3 基于最终类集设计效应的复杂样本设计分析

5.4.4 最终类集设计效应下的主样本设计

5.5 基于加权调整设计效应的主样本设计

5.5.1 权数概述

5.5.2 权数的调整

5.5.3 加权调整的设计效应

5.5.4 加权调整设计效应下的主样本设计

5.6 基于要素组合设计效应的主样本设计

5.6.1 均等选择概率的情况

5.6.2 不均等选择概率的情况

5.6.3 综合设计效应模型

5.6.4 综合设计效应模型下的主样本设计

5.7 本章小结

第6章我国住户调查一体化设计研究

6.1 引言

6.2 我国住户调查回溯

6.3 我国住户调查体系存在的问题

6.4 我国住户调查一体化设计的可行性

6.5 我国住户调查一体化设计的基础框架

6.6 我国住户调查一体化设计的主体内容

6.6.1 确定核心调查项目

6.6.2 协调设计管理工作

6.6.3 设计主样本

6.7 本章小结

第7章总结与展望

7.1 研究结论

7.2 研究展望

参考文献

攻读博士学位期间发表论文及参与项目清单

致谢

（10）人群健康测量与评价方法研究—复杂抽样与EQ-5D测量（论文提纲范文）

缩略语表

中文摘要

Abstract

前言

1. 研究背景

2. 研究内容

文献回顾

1 人群健康测量与评价

2 人群健康的影响因素

3 健康效用与卫生服务利用

4 Rasch 模型及在 EQ-5D 测量项目反应评价中的应用

5 Tobit 模型及在人群健康评价中的应用

6 人群健康测量资料的复杂抽样分析方法

第一部分人群健康测量复杂抽样的参数估计与校正

1 数据来源

2 方法

2.1 差异代表性的加权校正

2.2 复杂抽样精度的测量

2.3 泰勒级数线性化方差估计

3 结果

3.1 抽样设计和样本的基本特征

3.2 差异代表性的校正

3.3 均数和率的估计及设计效应

3.4 线性回归模型及系数的设计效应

3.5 Logistic 回归模型及系数的设计效应

4 讨论

第二部分 EQ-5D 量表在慢性病人群中的适用性评价

1 数据来源

2 方法

3 结果

3.1 EQ-5D 量表项目应答的基本情况

3.2 完好健康状态者的人群特征

3.3 EQ-5D 量表整体在慢性病人群中的测量效果

3.4 EQ-5D 量表各维度在慢性病人群中的测量效果

4 讨论

第三部分人群健康测量结果及复杂抽样多变量分析

1 数据来源

2 方法

3 结果

3.1 调查对象的基本特征

3.2 人群健康的总体现状

3.3 人群健康的分布特征

3.4 未报告慢性病人群健康影响因素多变量分析

3.5 慢性病人群健康影响因素多变量分析

4 讨论

第四部分慢性病人群的效应调整卫生服务利用分析

1 数据来源

2 方法

2.1 分析步骤

2.2 指标的计算方法和意义

2.3 统计分析方法

3 结果

3.1 慢性病人群的健康现状及慢性病患病 QALY 损失

3.2 慢性病的单位效用门诊卫生服务利用

3.3 慢性病的单位效用住院卫生服务利用

3.4 慢性病人群的效用调整卫生服务利用

4 讨论

小结

参考文献

附录

个人简历和研究成果

致谢

四、多变量与规模成比例概率抽样的有关问题（论文参考文献）

[1]抽样调查无响应问题研究[D]. 郝淑玲. 山西财经大学, 2021(09)
[2]基于全民健康理念的寒地大众体育建筑设计研究[D]. 郭旗. 哈尔滨工业大学, 2020(02)
[3]广义平衡抽样及其模型辅助估计方法研究[D]. 吴默妮. 暨南大学, 2020(04)
[4]广义回归估计量在中国农业抽样调查中的应用研究[J]. 杨贵军,沈文静. 统计与信息论坛, 2020(06)
[5]研究生支教团志愿者身体活动及其体质健康研究[D]. 刘传奇. 中国矿业大学, 2020(11)
[6]基于车籍的区域道路货物运输统计调查方案研究[D]. 王雅坤. 长安大学, 2020(06)
[7]基于超总体模型的设计效应研究[D]. 杨延飞. 中南财经政法大学, 2019(08)
[8]非概率抽样网络调查统计推断问题研究[D]. 牛成英. 福州大学, 2019
[9]住户调查一体化设计研究[D]. 罗薇. 暨南大学, 2016(07)
[10]人群健康测量与评价方法研究—复杂抽样与EQ-5D测量[D]. 谭志军. 第四军医大学, 2014(01)

标签：概率抽样论文; 样本均值的抽样分布论文; 回归模型论文; 抽样调查法论文; 多阶段抽样论文;

与多变量和尺度比例概率抽样有关的问题

一、多变量与规模成比例概率抽样的有关问题（论文文献综述）

二、多变量与规模成比例概率抽样的有关问题（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、多变量与规模成比例概率抽样的有关问题（论文提纲范文）

（1）抽样调查无响应问题研究（论文提纲范文）

（2）基于全民健康理念的寒地大众体育建筑设计研究（论文提纲范文）

（3）广义平衡抽样及其模型辅助估计方法研究（论文提纲范文）

（4）广义回归估计量在中国农业抽样调查中的应用研究（论文提纲范文）

（5）研究生支教团志愿者身体活动及其体质健康研究（论文提纲范文）

（6）基于车籍的区域道路货物运输统计调查方案研究（论文提纲范文）

（7）基于超总体模型的设计效应研究（论文提纲范文）

（8）非概率抽样网络调查统计推断问题研究（论文提纲范文）

（9）住户调查一体化设计研究（论文提纲范文）

（10）人群健康测量与评价方法研究—复杂抽样与EQ-5D测量（论文提纲范文）

四、多变量与规模成比例概率抽样的有关问题（论文参考文献）

猜你喜欢