谨慎使用逐步判别分析的SAS程序设计

谨慎使用逐步判别分析的SAS程序设计

一、慎用逐步判别分析的SAS程序设计(论文文献综述)

范洪彬[1](2017)在《上海市6~14岁学生力量素质测评体系优化研究》文中研究指明学生力量素质测量与评价是体质测评工作的重要组成部分,但不同国家(地区)的力量素质测试指标具有较大分歧甚至混乱;同一指标存在多种规格,相同指标在不同体系中亦有不同的性别、年龄测试要求;现行学生力量素质测量与评价体系的健康关联度也差强人意。本研究旨在通过对当前国内外体质测试中的力量素质指标进行理论筛选、表面肌电测试优选及专家咨询优选,从中选取一定数量理论依据相对充实,可靠性及有效性较高,能较科学地反映儿童青少年力量素质发育特征的指标并建立相应标准,优化学生力量素质测量及评价体系,以相对科学、客观、准确地反映6~14岁学生的力量素质特征、健康状况及其发展变化规律,实现对青少年儿童群(个)体力量素质的测评和比较,衡量各地、各级学校的体育卫生工作水平,开展学校健康促进活动及主动采取干预措施,为改善我国学生当前的力量素质下滑等健康问题提供一定科学依据。该研究通过文献法完成了学生力量素质指标的理论优选;通过表面肌电测试和特尔菲法专家咨询,完成了力量素质指标的实验和专家优选;通过测量法完成了上海市6~14岁学生优选力量素质指标横断面的测试;利用数理统计法进行了表面肌电测试数据的描述性统计、标准化、单(双)因素分析,完成了特尔菲法专家咨询数据的描述统计、平均数、满分率、变异系数、协调系数、专家积极程度及专家权威程度的计算,通过LMS法和直接计算法建立了上海市6~14岁学生力量素质百分位数常模参照标准,并对标准进行了判别分析。研究结果:1.上肢表面肌电测试结果6~14岁学生屈膝俯卧撑年龄、性别及交互效应差异显着的肌肉分别为2、7、6块,年龄效应差异显着的年龄对为110个,性别效应差异显着的肌肉为13块,年龄组为22个;修正引体向上年龄、性别及交互效应差异显着的肌肉分别为3、3、6块,年龄效应差异显着的年龄对为116个,性别效应差异显着的肌肉为9块,年龄组为18个;12~14岁男生屈膝俯卧撑、修正引体向上及90°俯卧撑的年龄效应差异显着的肌肉分别为0、2、2块,年龄对分别为0、2、2个。2.躯干表面肌电测试结果6~14岁学生双臂胸前交叉仰卧起坐年龄、性别及交互效应差异显着的肌肉分别为1、7、2块,年龄效应差异显着的年龄对为45个,性别效应差异显着的肌肉为9块,年龄组为5个;双手大腿上仰卧起坐年龄、性别及交互效应差异显着的肌肉分别为5、6、5块,年龄效应差异显着的年龄对为101个,性别效应差异显着的肌肉为11块,年龄组为13个;双臂体侧仰卧起坐年龄、性别及交互效应差异显着的肌肉分别为2、10、3块,年龄效应差异显着的年龄对为82个,性别效应差异显着的肌肉为13块,年龄组为11个。90°俯卧背伸年龄、性别及交互效应差异显着的肌肉分别为3、7、4块,年龄效应差异显着的年龄对为54个,性别效应差异显着的肌肉为11块,年龄组为9个。平板支撑贡献率最大肌肉为肩部三角肌。3.下肢表面肌电测试结果6~14岁学生下蹲跳年龄、性别及交互效应差异显着的肌肉分别为4、5、8块,年龄效应差异显着的年龄对为147个,性别效应差异显着的肌肉为13块,年龄组为25个;摆臂下蹲跳年龄、性别及交互效应差异显着的肌肉分别为2、7、6块,年龄效应差异显着的年龄对为37个,性别效应差异显着的肌肉为13块,年龄组为15个;立定跳远年龄、性别及交互效应差异显着的肌肉分别为2、8、3块,年龄效应差异显着的年龄对为38个,性别效应差异显着的肌肉为11块,年龄组为6个。4.特尔菲法研究结果(1)专家积极程度:两轮专家积极性系数分别为0.47、0.93。(2)专家权威程度:两轮专家权威系数分别为0.86~0.98和0.85~0.98。(3)专家评价的协调程度:①变异系数:首轮修正引体向上评分变异系数整体等于0.50,屈膝俯卧撑、90°俯卧撑评分变异系数均小于0.50;二轮变异系数均小于0.50。躯干5个力量素质指标中,90°俯卧背伸在男生6~7岁组、平板支撑在学生6~7岁组评分变异系数大于0.50,其余均小于0.50;二轮变异系数均小于0.50。下肢3个力量素质指标两轮评分变异系数均小于0.50。②协调系数6~14岁学生上肢屈膝俯卧撑、修正引体向上首轮的W=0.221,x2=24.753,P=0.000,二轮分别为0.866、90.043、0.000;12~14岁男生上肢屈膝俯卧撑、修正引体向上和90°俯卧撑的首轮W=0.221,x2=24.753,P=0.000,二轮分别为 0.665、17.282、0.000。躯干双臂胸前交叉仰卧起坐、双手大腿上仰卧起坐、双臂体侧仰卧起坐、90°俯卧背伸和平板支撑首轮的W=0.063,x2=28.142,P 0.000,二轮分别为0.358、148.829、0.000。下肢下蹲跳、摆臂下蹲跳和立定跳远首轮的W=0.119,X2=26.577,P=0.000,二轮分别为 0.719、149.556、0.000。(4)专家评价的集中程度①平均分6~14岁学生上肢指标屈膝俯卧撑的首轮平均分为7.75,修正引体向上为5.79,二轮分别为8.56、5.37;12~14岁男生上肢指标屈膝俯卧撑、90°俯卧撑及修正引体向上的首轮平均分分别为8.71、7.93和7.36,二轮分别为9.54、9.23 和 6.92。6~14岁学生躯干指标双臂胸前交叉仰卧起坐、双手大腿上仰卧起坐、双臂体侧仰卧起坐、90°俯卧背伸和平板支撑的首轮平均分分别为7.68、6.39、6.30、6.66 和 6.98,二轮分别为 8.72、5.98、6.15、5.70 和 6.21。6~14岁学生3个下肢指标下蹲跳、摆臂下蹲跳和立定跳远的首轮平均分分别为 6.36、6.96、7.74,二轮分别为 5.88、6.77、8.90。②满分率6~14岁学生上肢指标屈膝俯卧撑的首轮满分率为20.54%,修正引体向上为16.07%,二轮分别为36.54%、0.96%;12~14岁男生上肢屈膝俯卧撑、90°俯卧撑及修正引体向上的首轮满分率分别为28.57%、14.29%和28.57%,二轮分别为 69.23%、44.44%和 7.69%。6~14岁学生躯干指标双臂胸前交叉仰卧起坐、双手大腿上仰卧起坐、双臂体侧仰卧起坐、90°俯卧背伸和平板支撑的首轮满分率分别为:12.50%、2.68%、5.36%、16.96%和 22.32%,二轮分别为 40.38%、1.92%、1.92%、3.85%和 1.92%。6~14岁学生下肢指标下蹲跳、摆臂下蹲跳和立定跳远的首轮满分率分别为5.36%、14.29%、24.11%,二轮分别为 0.96%、0.96%、50.96%。5.力量素质评价标准的研制结果各力量素质指标P50实测值与LMS法拟合值的差值绝对值为:屈膝俯卧撑男生为0.41~2.05个,女生为0.10~2.47个;双臂胸前交叉仰卧起坐男生为0.12~2.60个,女生为0.53~2.29个;立定跳远男生为0.32~11.17厘米,女生为0.38~6.87厘米。按照"P3、P10、P25、P50、P75、P90、P97"对三个指标进行了百分数建模;对[P3,P10)、[P10,P25)、[P25,P50)、[P50,P75)、[P75,P90)、[P90,P100)分别进行了 0、1、2、3、4、5分赋值建立了单项评分表。各指标各性别年龄组评分等级判别函数的Wilks’ Lambda检验P=0.000,正判率区间为:屈膝俯卧撑男生为94.80%~98.70%,女生为89.70%~100.0%;双臂胸前交叉仰卧起坐男生为91.10%~98.70%、女生为92.10%~98.70%;立定跳远男生为87.30%~100.00%、女生为87.20%~100.00%。研究结论:1.6~14岁学生上肢年龄、性别通用性最大力量素质指标为屈膝俯卧撑,躯干为双臂胸前交叉仰卧起坐,下肢为立定跳远;三者为表面肌电测试优选指标。6~14岁学生上肢力量素质指标专家意见集中程度和协调程度最高者为屈膝俯卧撑,躯干为双臂胸前交叉仰卧起坐,下肢为立定跳远;三者为特尔菲法专家优选指标。特尔菲法优选与表面肌电测试优选结果一致,所选三个力量素质指标够满足力量素质属性的考察要求。2.屈膝俯卧撑与双臂胸前交叉仰卧起坐采用了 LMS法、立定跳远采用直接计算法建立了百分位数常模参照标准;于国内首次绘制了 6~14岁学生屈膝俯卧撑、双臂胸前交叉仰卧起坐的生长曲线;所建标准建立方法得当,评价等级清晰,判别效果较好,符合标准的使用要求。

龚鹏[2](2014)在《地球化学矿致异常空间分析与定量评价 ——以九瑞铜矿和大湖塘钨矿为例》文中研究表明地球化学勘查作为一门重要的找矿方法在矿产资源勘查中占据重要的地位,尤其适宜于贵金属Au、Ag以及有色金属Cu、Pb、Zn等矿种的勘查。在地球化学勘查活动中,对获取的地球化学数据进行矿致异常的识别和评价及其矿质来源的辨析是十分关键的一个环节,直接关系到下一步勘查决策的制定和找矿实践的成败。通常认为地球化学异常是指某一元素(同位素)含量在采样介质中富集或贫化的一种异常现象,若元素趋于富集称为正异常,反之则称为负异常。由于成矿元素是一个逐步富集的过程,由矿床或矿化引起的异常(称为矿致异常)往往是正异常,也是评价的主要对象。就矿致异常的提取和评价而言,空间分析技术和定量评价方法的研究一直是国内外勘查地球化学家角逐的热点。近年来,不同学科的主题数据呈几何指数急剧膨胀,互联网技术和数据库技术也得到极大发展,使得传统的数据分析成为一门独立的交叉学科,称为数据挖掘或数据科学,其基本含义为通过某一主题数据的分析和挖掘,从而获取有价值的专业知识,实现从数据工厂到数据黄金的变革。当勘查地球化学家对勘查地球化学空间数据进行空间分析和定量评价时,实际上是扮演着数据科学家或数据挖掘师的身份,即针对多来源和多尺度的高维地球化学数据进行分析,从而挖掘其中隐藏的地球化学找矿知识。基于上述研究背景,以现代统计学、稳健统计学、成分数据分析和空间分析理论与技术为指导,充分利用GIS和R编程语言为数据分析工具,针对勘查地球化学主题数据实现两个目标,一是提出地球化学矿致异常空间分析和定量评价的新方法与新技术,二是所挖掘的找矿知识直接服务于区域和矿区两种尺度的矿产勘查决策。根据上述研究目标,研究内容主要包括:(a)深入认识和系统总结地球化学空间数据固有的基本特征,尤其是离群性、封闭性和自相关性等基本特征的理论分析和实证研究;(b)设计一套地球化学空间数据检查的解决方案和总结几种常用的数据变换方法,重点讨论对数比数据变换的优越性和必要性;(c)开展单元素和多元素的探索性空间数据分析,包括单元素分布形式的各种判定方法和多元素之间相关关系、组合规律和空间趋势变化的可视化显示;(d)对比不同方法计算单元素异常下限的结果,实现多元素离群点自动检测和可视化显示技术,辨析Cu、W等地球化学矿致异常的矿质来源和示踪其空间过程(成矿作用);(e)研究聚类分析、判别分析和回归分析等基于数据驱动的矿致异常评价方法,分析其应用效果并评价结果的有效性。研究基于知识驱动(“标准样本”找矿模型)的矿致异常定量评价新方法。本论文选取九瑞铜矿和大湖塘钨矿作为研究对象,数据源以九瑞和大湖塘地区的区域地球化学数据为主(九瑞地区1081件组合样,大湖塘地区3142件组合样),还包括在大湖塘地区野外采集的6条风化土壤剖面分析数据和收集的石门寺矿区4号勘探线剖面分析数据(6516件样品),数据具有多介质(水系沉积物、土壤和岩石)、多元素(高达39种)和多尺度(区域和矿区)的特点。在充分认识九瑞和大湖塘地区不同尺度地质矿产特征的基础上,分别对Cu、W矿致异常的空间分析与定量评价展开了系统研究。取得了如下6个方面的研究成果:1)针对勘查地球化学数据分析元素种类多且样本量大的特点,尤其是区域地球化学数据分析的元素达39个,首次系统明确了勘查地球化学数据具有10个方面的固有基本特征,依次为:非负性、连续性、批次性、变异性(异质性)、自相关性(依赖性)、尺度不变性(自相似性)、叠加性(混合性或不均一性)、删失性(截尾性)、离群性和封闭性。在充分认识这10个基本特征的基础上,设计出5个地球化学数据检查的可选方案和总结了5种重要的数据变换方法,进一步指出了地球化学成分数据为消除其封闭性产生的伪相关,须进行对数比数据变换。2)结合地球化学数据的基本特征,提出了一套单元素和多元素探索性空间分析的完整解决方案。(a)关于单元素的探索性分析,提出了单元素分布形式的4种判定方法,主要为图解法、偏度和峰度概要统计参数、Kolmogorov-Smirnov和Shapiro-Wilk正态检验以及C-A分形法,并指出了各种方法的优缺点。直观的图解法包括一维散点图、直方图、密度图、经验分布函数图、QQ图、累积概率图、PP图和箱图,其中直方图、累积概率图和Tukey箱图等应用十分广泛,尤其适用于探查勘查地球化学数据的离群性、删失性和叠加性等。另外,指明了直方图中分组数目的合理划分是其制图分析的关键参数。最后,推荐联合多个图解共同探索单元素的分布形式和数据结构,这样才能全面认识数据的基本特征。(b)除了单元素探索性分析,讨论了多元素可视化探索性分析的4种图解,分别是相关图、平行坐标图、空间趋势图和空间距离图。相关图即是两两元素之间相关系数的矩阵化表达,对比相关图中的Pearson相关系数和稳健相关系数发现,稳健相关系数一般小于Pearson相关系数,其反映的是数据的主体信息。当进一步用颜色和图案直观区分相关图中相关系数的大小后,这对于多元素之间相关系数的对比将十分便捷和高效。平行坐标图用于探查多元素之间的组合关系。设计出多元素在任意方向和区带上关联分析的空间趋势图和空间距离图,为地球化学矿致异常的空间分析和定量评价提供了一个新的思路。3)地球化学矿致异常正确识别的前提是背景与异常的合理分割,对单元素而言,实际上是异常下限的计算,本次研究采用了基于经典统计学的均值标准差法(Mean+2SD)、基于稳健统计学的中位数绝对偏差法(Median+2MAD)和Tukey箱图法(Q3+1.5·IQR)以及基于百分数的累积频率法(98%)等4种计算方法。对比这4种方法所计算的异常下限结果发现:基于经典统计学的均值标准差法不适宜于计算成矿元素含量的异常下限;基于稳健统计学的中位数绝对偏差法计算的异常下限能够最大程度避免极端值的影响;基于百分位数的累积频率法始终能各自识别出占总样本数一定比例(如2%)的高值样本和低值样本;推荐异常下限的计算方法使用基于稳健统计学的中位数绝对偏差法和Tukey箱图法,但二者在计算之前须进行Log10变换或Logit变换。除了单元素的异常下限计算,实现了多变量离群点的自动检测和可视化技术,基于城门山铜矿床和石门寺钨矿床的特征元素组合,在九瑞地区检测出Cu+Mo+Au+Ag+W+Sb+Zn元素组合的离群点,呈高度聚集分布和随机离散分布,其高度聚集的离群点对应已知的大型铜矿床或Cu元素成矿概率较大的地区;在大湖塘地区检测出W+Cu+F+Ag+As元素组合的离群点,也呈高度聚集分布和随机离散分布,其高度聚集的离群点对应已知的大型钨矿床或W元素成矿概率较大的地区。4)在Cu、W矿致异常识别的基础上,按照多尺度和多介质的聚焦找矿思路,辨析了Cu、W矿致异常的矿质来源,有如下3点认识:(a)通过辨析九瑞地区Cu异常和大湖塘地区W异常的矿质来源发现,“高、大、全”Cu异常的矿质来源于深源中酸性岩浆岩,如形成的城门山矽卡岩型-斑岩型铜矿床和武山矽卡岩型铜矿床,而“高、大、全”W异常的矿质来源则来源于壳源的酸性花岗岩,如形成的石门寺岩浆热液型钨矿床、狮尾洞岩浆热液型钨矿床和香炉山矽卡岩型钨矿床。(b)通过区域→空间子区再到矿床邻域的多尺度分析,以元素的地球化学性质为理论依据,按照元素组合的关联性和区分性,获得了城门山铜矿、武山铜矿、曾家垅锡矿、石门寺钨矿、狮尾洞钨矿和香炉山钨矿的特征元素组合,依次为:Cu+Mo+Au+Ag+W+Sb+Zn, Cu+Au+Ag+Pb+As+Sb, Sn+F+As+Sb, W+Cu+F+Ag+As, W+Cu+F+Ag+As+Sb, W+Cu+F+Ag,可作为区域上发现类似矿床的找矿标志。(c)从元素“量”的视角出发,以大湖塘地区6个典型土壤风化剖面为例,发现了W等成矿元素含量在垂向土壤风化剖面上呈逐渐递增的变化趋势,进一步证明了土壤B层是该区最佳的采样层位。再以石门寺矿区4号勘探线剖面为例,首先对主成矿元素W、Cu在不同含量区间和不同岩石单元中的含量展开分析,揭示了钨矿体和铜矿体有两个显着的浓集中心和二者富矿体的空间叠合度高且主要分布在热液角砾岩和含钨石英脉中;然后利用Fry图解分析了W、Cu成矿元素空间迁移轨迹的方向和倾角,其迁移轨迹均为从NE向SW方向运移,但倾角略有不同,分别为25°~30°和30°。这为W、Cu矿体在剖面上的空间分布形态提供了定量证据。(d)选择九瑞地区的Cu+Mo+Au+Ag+W+Sb+Zn元素组合和大湖塘地区的W+Cu+F+Ag+As+Sb元素组合,分别开展主成分分析(PCA)和因子(FA)分析。结果表明:双标图和主成分(因子)得分图是示踪Cu和W等成矿作用过程的有力工具,由于成分数据受数据离群性的影响和封闭性的约束,故在数据分析前推荐原始数据进行clr变换,就结果的解释度而言,PCA比FA能够获得更高的解释度。5)以九瑞和大湖塘地区的区域地球化学数据为例,研究了聚类分析、判别分析和回归分析等3个基于数据驱动的矿致异常定量评价方法。结果发现:聚类分析能够用于优化九瑞和大湖塘地区的指示元素组合;判别分析适宜于九瑞地区3个空间子区(Cu矿化区、Sn矿化区和深海相沉积地层区)的样本分类,且Sn矿化区的分类误判率最低;通过回归分析,分别建立了城门山、武山、曾家垅、石门寺、狮尾洞和香炉山等6个典型矿床邻域内的多元线性回归方程,经过回归系数t检验、回归方程F检验和校正可决系数(Adjusted R2)等3个指标的综合判别以及进一步的诊断分析,认为6个多元线性回归方程对于Cu、Sn和W等成矿元素含量的预测精度较高。这将为基于知识驱动的定量评价奠定坚实的基础。6)提出了基于知识驱动(“标准样本”找矿模型)的矿致异常定量评价新方法——相似系数法,主要应用于定量判别相似矿致异常的矿化类型。阐释了地球化学相似系数的内涵,制定出相似系数法的5个实施步骤,依次是:选典型矿床→挑元素组合→制“标准样本”→算距离值和转相似系数→绘相似系数图。重点对欧氏距离公式中的数据变换、“标准样本”指示元素的含量赋值和权重系数的计算、欧氏与兰氏距离公式、相似系数符号图的分级方案、相似系数等值区图的插值参数以及相似系数的自相关模式等几个方面进行了详细的讨论与分析。经反复试验和深入比较后获知:(a)在欧氏距离计算公式中,对数变换优于匀化变换。(b)标准样本”中各个指示元素含量的赋值推荐采用异常平均值,并建议使用相对权重方法计算各个元素的权重系数。(c)九瑞地区优选兰氏距离公式作为计算2个铜矿“标准样本”(城门山和武山)相似系数的最佳距离公式,而大湖塘地区优选欧氏距离公式作为计算3个钨矿“标准样本”(石门寺、狮尾洞和香炉山)相似系数的最佳距离公式。(d)当绘制相似系数符号图或等值区图时,为了便于对比,其分级方案推荐采用5级累积频率法(50th,90th,95th,98th)。(e)以九瑞和大湖塘地区的区域地球化学数据为例,当绘制5个“标准样本”的相似系数等值区图时,建议其最佳搜索半径为4.5km,对应于最大全域型Moran’s Ⅰ指数:再由5个“标准样本”相似系数的局域型LISA聚集图得出:高高聚集模式(High-High)和高低聚集模式(High-Low)是下一步的重点勘查区。按照证据层组合决策的思想,最终给出九瑞和大湖塘地区具体的勘查决策建议为:在九瑞地区,下一步铜矿勘查优先部署在城门山兰氏距离相似系数≥0.298且武山兰氏距离相似系数≥0.405的样本分布区,其次部署在仅城门山兰氏距离相似系数≥0.298或武山兰氏距离相似系数>≥0.405的样本分布区;在大湖塘地区,下一步钨矿勘查优先部署在同时满足石门寺欧氏距离相似系数≥0.602、狮尾洞欧氏距离相似系数≥≥0.578、香炉山欧氏距离相似系数≥0.717等3个条件的样本分布区,其次部署在同时满足前述3个条件中任意2个的样本分布区,最后部署在只满足前述3个条件中任意1个的样本分布区。综上所述,本文的3个创新点为:(a)针对多元素的可视化探索性分析,设计出多元素在任意方向和任意形状区带上关联分析的空间趋势图和空间距离图,为地球化学矿致异常的空间分析和定量评价提供了一个新的思路。(b)提出了基于知识驱动(“标准样本”找矿模型)的矿致异常定量评价新方法—相似系数法,主要应用于定量判别相似矿致异常的矿化类型。阐释了地球化学相似系数的内涵,制定出相似系数法的5个实施步骤,依次是:选典型矿床→挑元素组合→制“标准样本”→算距离值和转相似系数→绘相似系数图。(c)提出了矿致异常多尺度和多介质源辨析的新途径,查明了九瑞地区Cu矿致异常和大湖塘地区W矿致异常的矿质来源,并揭示了Cu、W成矿元素的空间过程(成矿作用),从而为矿致异常的定量评价提供了理论基础。

沈丽静[3](2014)在《ν-支持向量分类机在心肌梗塞疾病诊断中的应用》文中研究说明支持向量分类机(Support Vector Classifier, SVC)是Vapnik等人于1995年提出的一种非常有潜力的分类技术,它是一种基于统计学习理论的模式识别方法,90年代时得到了迅速完善和发展,在解决小样本、非线性及高维数等实际问题中表现出特别的优势,成功应用于生物信息学、文本和手写识别等领域.但是该支持向量分类机中的参数C本身没有定量的含义,取值范围为(0,+∞),在实际应用中很难得到合适的取值.Scholkopf等人于2000年提出了ν-支持向量分类机(v-SVC),用参数ν代替C,其中0<ν<1,且ν与间隔错误样本比例和训练集支持向量比例存在一定的大小关系.Chih-Chung Chang和Chih-Jen Lin证明了C-支持向量分类机和ν一支持向量分类机在一般情况下可以建立C与ν的映射,得到相同的最优化解集.本文研究了ν与训练集错分率的大小关系,由于训练集错分率不涉及间隔错误样本,比间隔错误样本比例更易求得,所以在实际应用中更为直观方便,既可以预先设定训练集错分率来确定较为合理的ν的取值范围,也可以用ν值来控制训练集错分率在可接受范围之内.本文采用ν-支持向量分类机,把Physionet网站上PTB数据库的12导联心电图中的Ⅱ导联心电图数据作为分析的样本(含正常类和心肌梗塞类两类样本),主要做了如下工作:(1)介绍支持向量分类机的思想及其算法;(2)研究ν-支持向量分类机理论,证明了参数ν与训练集错分率和训练集支持向量比例之间的关系及其取值范围;(3)对每个心电图信号数据的Ⅱ导联数据进行特征提取;(4)利用逐步判别分析进行特征选择;(5)训练ν-支持向量分类机,用Matlab编程实现算法,验证ν与训练集错分率和训练集支持向量比例之间的大小关系,预先给定训练集错分率上界,选择在训练过程中分类效果较好的支持向量分类机;(6)用训练得到的ν-支持向量分类机对测试集进行分类,评价分类的有效性,给出在训练和测试过程中分类效果稳定的ν-支持向量分类机的参数选择.针对本文数据样本,用于判断心肌梗塞的心电图特征选择为RR期间,QRS波期间,QRS波上升速率,ST段速率,T波下降速率,正常T波比例和倒置T波比例.作为本文数值实验的最佳ν-支持向量分类机的参数选择是:核函数为多项式核函数,当d=2时,ν=0.27,0.28,0.29,0.30,0.33;当d=3时,ν=0.15,0.27.得到测试集错分率最低为12.37%,对应训练集错分率最高为1146%.此时,ν-支持向量分类机保持了在训练集和测试集较为稳定和较为低的错分率.

孟英民[4](2012)在《税务稽查选案管理信息系统的设计与实现》文中研究表明随着税务信息化建设的不断发展,税务信息系统中积累了大量的涉税数据信息,如何从这些庞杂的数据中提取税务稽查工作需要的信息,成为税务稽查部门需要迫切解决的一个问题。截至目前,在我省国税稽查选案过程中,选案工作手段还主要停留在依靠人工经验为主,缺少科学的行业数据模型。另一方面,也没有很好的重视大量涉税信息的信息化收集、开发和利用工作。因此,如何对税收征管工作中形成的大量涉税数据进行分析和利用,并在此基础上建立一套科学、严密、合理的计算机选案分析模型,是我们面临解决的一个重要课题。本文力图从税务稽查工作现阶段实际情况出发,通过对国内外税务稽查选案信息化现状的学习与借鉴,以数据仓库及数据挖掘技术为突破口,着重研究了数据挖掘异常分析方法在税务稽查选案工作中的应用。提出了通过“基于属性异常检测的税务稽查选案方法”,对CTAIS(China Taxation Administration InformationSystem,CTAIS)征管信息系统和其他相关涉税信息系统的大量数据进行数据分析,提取稽查选案所需信息的解决方案,并依照《税务稽查工作规程》的相关规定,设计出了稽查选案管理信息系统,该系统的开发符合J2EE技术开发规范,系统采用B/S架构模式,方便系统的维护与升级,系统中间件采用Weblogic8i,后台数据库采用Oracle9i,操作系统选择Windows2003Server,硬件平台选择Intel Pentium4Xeon2.8GHz,双CPU处理器,内存为8GB,硬盘大小为1TB的服务器。该系统具有选案计划管理、待查纳税人清册管理、系统数据查询、案件检查情况跟踪反馈、汇总上报及将选案数据导入CTAIS等功能,完全满足了税务稽查选案工作的需求。值得一提的是系统提供的案源筛选、个案分析模块,案源筛选模块实现了计算机辅助选案功能,个案分析模块提供了纳税人相关涉税信息,便于对被检查纳税人的涉税情况进行分析,大大提高了稽查选案人员的工作效率。该系统通过了系统软、硬件环境测试,通过测试表明,该系统具有数据覆盖面广,使用操作简单,适合工作实际需要等特点。该系统的使用,改变了陕西国税稽查选案工作方法和技术手段落后的现状,提高了稽查选案的准确性,是一套高效、准确的稽查选案辅助系统,为国税稽查选案工作提供了准确的辅助资料,促进了我省稽查选案工作由人工工作方式向信息化、科学化工作方式的迈进。

戚俊伟[5](2012)在《基于SAS的客户营销响应模型设计》文中认为信用卡是国际流行的现金支付工具和消费信贷工具,被称为现代社会的电子货币,以其安全、方便、快捷的优势,显示出强大的生命力,是金融业现代化的象征。中国被称为全球信用卡发展潜力最大的市场,由于起步较晚,无论是理论基础、信用卡的应用与发达国家相比,有较大的差距。不过,作为支付体系的一个重要组成部分,自从2003年信用卡元年之后,全国各家银行积极发展信用卡业务,信用卡业务的支付份额不断得到提高。近两年来,随着社会公众对信用卡使用意识不断提高,受理环境不断改善,信用卡支付已经成为刺激消费需求,推动社会消费品零售市场发展,拉动内需的重要指标。但随着信用卡发卡量的增加,各家银行信用卡产品同质化,发展进入瓶颈期,规模增速放慢,如何在激烈的竞争中取得优势、如何在每一次的信用卡产品营销前筛选合适的目标客户成为各家商业银行始终关心的问题。因此数据挖掘已经成为构建信用卡客户营销响应模型,发掘蕴含在数据中的规律和模式,为信用卡营销管理提供决策的重要技术。本文主要介绍数据挖掘技术的发展过程,分析了目前我国商业银行数据管理存在的问题,并以一个营销案例为背景,设计了客户响应模型并最终实现了对客户营销响应概率的预测。在模型设计过程前期花费了大量时间对数据进行清洗和处理,去除杂质以免影响模型的预测能力,接来下运用Logistic回归设计了客户营销响应模型,并通过训练集数据样本和验证集数据样本对模型的表现进行评估,从两个数据集样本建立的LIFT图来看两者的差别不大,说明模型本身的预测效果还是比较令人满意。最后阐述了模型运行方面所要注意的细节问题。

江林[6](2011)在《多元统计分析在核勘查数据处理中的应用研究》文中提出我国对矿产资源的需求与日俱增,而目前我国矿产资源的形势非常严峻。为了改变这种形势,我们必须积极探索新的有效的数据处理方法,整体提升矿产资源勘查水平,增加矿产资源的储备,为我国经济安全、高效、持续发展提供资源保证。在资源勘查中,元素含量的空间分布是极其复杂的,随着资源勘查工作的不断加深,除了方法和技术手段,传统的数据处理方法也越来越表现出局限性,所以除了新方法和新技术手段的应用外,寻求新的有效的数据处理方法,以提取更多的有用信息,也成为勘查工作的追求目标。在勘查数据处理与异常的解释推断工作中,日益增多地使用各种统计学方法,如趋势面分析、多元回归分析、判别分析、因子分析、聚类分析等,提高了找矿效果和预测水平,促进了找矿工作的发展。本论文的开展是以四川省地调院金矿勘查项目为依托,对多元统计分析用于核勘查数据处理中进行应用研究。主要采用X荧光分析测量可能与金伴生的元素的含量,如:Fe,V,Ti,Ni,Zn,Pb,Cu;对各元素进行单元素处理,得到各元素的含量分布图,及各元素与金元素的简单相关程度;在此基础上进行聚类分析和多元回归分析,建立金与其它元素的相关关系,以用一种或几种元素的含量预测另一种难于分析的元素(Au)含量,从而用来建立新的找矿线索;通过趋势分析,进一步提炼隐没在样本中的信息,揭示数据中隐含的信息,反映不同地质体引起的场晕特征。

张娜[7](2010)在《基于灰色理论与关联规则的中药注射剂不良反应成因研究 ——以双黄连注射剂为例》文中认为目的:本研究引入灰色系统理论中的灰色关联分析法、数据挖掘中的关联规则法,探讨其在中药注射剂临床应用中的ADR成因研究模式。通过实例分析,旨在以定量、直观的方式反映中药注射剂临床应用过程中ADR影响因素与ADR的关联程度,筛选出影响ADR发生的关键因素及关键主元素,并挖掘出能反映中药注射剂ADR发生规律及其影响因素间关联的规则,以期为现有的中药注射剂ADR成因研究提供新的思路,并为正确认识中药注射剂的ADR、为临床合理用药提供有意义的参考。方法:(1)文献研究法:全面查阅近10年公开发表的中药注射剂ADR成因研究文献及书籍,对现有中药注射剂ADR成因研究的现状进行全面了解,根据研究方法的不同将现有研究分类,并概括其优势及不足。(2)灰色关联分析法:探讨灰色关联分析法在中药注射剂ADR成因分析中的应用模式。利用灰色关联分析法,定量分析中药注射剂临床应用过程中ADR影响因素与ADR之间的关联程度,通过对关联度的大小排序,找出影响中药注射剂ADR发生的关键因素及关键主元素。(3)数据挖掘法:探讨数据挖掘法中的关联规则法在中药注射剂ADR成因分析中的应用模式。利用关联规则法挖掘中药注射剂ADR发生规律及其影响因素间的关系,以规则的方式直观反映各影响因素间的相互关联,揭示中药注射剂ADR的发生规律。(4)实例分析法:对国内公开发表的中药注射剂ADR病例报告进行全面的检索,选定报告数量较多且具有一定代表意义的中药注射剂作为实例分析对象。结合中药注射剂临床应用中ADR成因的灰色关联分析及关联规则挖掘模式,对该中药注射剂ADR病例报告数据进行分析和挖掘。结果:(1)文献研究:根据方法学的不同,将现有中药注射剂ADR成因研究分为三类,即中药注射剂ADR成因的实验研究、综述研究、流行病学研究。由于本身方法学亦或是客观条件的限制,致使现有研究仍然存在着一些不足,如研究散乱、研究周期长、缺乏大型数据库支持、未考虑因素间存在的联系等,使得现有中药注射剂ADR成因研究难以取得大的突破。(2)中药注射剂临床应用中ADR成因的灰色关联分析模式及关联规则挖掘模式探讨:简要解析灰色关联分析法、关联规则法原理,确定了分析所需的资料来源于中药注射剂ADR病例报告,对所要研究的问题进行简要描述,提出中药注射剂临床应用中ADR成因的灰色关联分析步骤、关联规则挖掘步骤及注意要点(如数据预处理方式等)。(3)实例分析:收集公开发表的双黄连注射剂ADR病倒报告共520例,经数据清理和筛选,得到517例有效样本。灰色关联分析结果:双黄连注射剂临床应用过程中,各影响因素与双黄连注射剂ADR的关联度排序如下:“是否初次用药>有无过敏史>配液类型>患者性别>配液用量>年龄>水针剂量>粉针剂量>原患疾病>合并用药”。各影响因素下的主元素与ADR的关联度排序如下:非初次用药>初次用药、有过敏史>无过敏史、GS>NS>GNS.男性>女性、水针>粉针、原患呼吸系统疾病<其他、与抗生素类药品合并用药>与非抗生素类药品合并用药,另外,年龄因素中“0-24岁”的青少年元素与ADR关联度最大、配液用量越小与ADR关联度越大、剂量越大与ADR关联度越大。经筛选确定:“是否初次用药”、“有无过敏史”、“配液类型”、“患者性别”是影响双黄连注射剂ADR的关键因素,而“非初次用药”、“有过敏史”、“与GS配液”、“男性”、“配液501ml-”、“年龄0-24岁”、“水针”、“剂量21ml-或2.5-4.2g”、“原患其他疾病”、“与抗生素类联用”则为双黄连注射剂ADR危险主元素。关联规则挖掘结果:将minsup和min conf分别设为10%、50%时,得到了41条表示双黄连注射剂ADR发生规律的规则。根据之前灰色关联分析及文献分析的结果,对规则的有趣性进行评价和筛选,得到了18条有趣的强规则。这些规则对各因素之间的联系、可能的ADR风险组合以及ADR风险概率的大小都有鲜明而直观的表达。同时,在关联规则挖掘出的“有趣”强规则中,因素、主元素组合不同,所可能导致的ADR类型及置信度也不一,进一步证实中药注射剂ADR影响因素间的确是存在着相互作用的。结论:(1)灰色关联分析法、关联规则挖掘法在研究中药注射剂临床应用中的ADR成因方面是行之有效的。一方面在对双黄连注射剂的实例分析中,得到了直观、有效且“有趣”的结果,对指导临床合理用药具有一定的实际参考意义;另一方面,两方法所得结果相互印证,在关联规则挖掘的规则中,出现最频繁的因素亦是灰色关联分析中关联度较大的因素,而灰色关联分析的结果又很好的用于关联规则“有趣性”的评价当中,两者有了很好的结合。(2)对双黄连注射剂ADR成因进行讨论,得到结论:在双黄连注射剂ADR的发生中,患者个体差异决定了ADR最初的风险差异和可能的ADR类型,医生、护士用药方式的选择可在很大程度上规避亦或是加促这种风险的发生,而药品本身质量的不可控性及不稳定性则可能是导致双黄连注射剂ADR发生的最根本因素。

罗海燕[8](2009)在《浙江省余杭区竹卵圆蝽预测预报模型的建立》文中研究指明竹卵圆蝽Hippotiscus dorsalis(Stal.)是近年来在竹子上新发生的重要害虫,是一种突发性害虫,主要对毛竹、黄古竹等造成严重危害;防治该虫主要采取利用天敌防治、人工捕杀、药剂防治等方法。目前竹卵圆蝽危害在浙江省乃至全国逐渐严重,因此,对竹卵圆蝽危害的准确预测以及在此基础上建立相应的预警机制,是预防竹卵圆蝽的前沿和关键。本论文的目的是研究竹卵圆蝽预测预报的方法,并建立竹卵圆蝽的预测预报模型。本研究利用浙江余杭2001-2008年竹卵圆蝽的危害程度(小班平均株虫口)和浙江余杭1-12月的平均温度、平均降水量、平均相对湿度等气象资料,采用SAS软件进行相关性分析和逐步回归分析,得出影响竹卵圆蝽危害程度的主导因子和预测模型,结果如下:1.8月平均温度(X21)是影响竹卵圆蝽危害程度的主导因子。8月平均温度(X21)、2月平均温度(X15)的参数估计(Parameter estimate)值分别为-35.59678、3.88038,而且8月平均温度是负值,与竹卵圆蝽危害程度负相关,即8月平均温度越高,危害程度越小,8月平均温度越低,危害程度越大;2月平均温度与竹卵圆蝽危害程度正相关,即2月平均温度越高,危害程度越大,2月平均温度越低,危害程度越小;而8月平均温度(X21)的参数估计值的绝对值最大,说明8月平均温度是影响竹卵圆蝽危害程度的主导因子;2.相对湿度是影响竹卵圆蝽危害程度的重要因子,10月平均相对湿度(X35)对小班平均株虫口(Y)的参数估计值为-15.85940,与竹卵圆蝽危害程度负相关;3.降水量也是影响竹卵圆蝽危害程度的重要因子,11月平均降水量(X11)对小班平均株虫口(Y)的参数估计值为-1.17289,与竹卵圆蝽危害程度负相关;4.用8月平均温度(X21)、10月平均相对湿度(X35),2月平均温度(X15)、11月平均降水量(X11),将其与代表竹卵圆蝽危害的小班平均株虫口(Y),运用逐步回归法得出了多元回归预测模型,即: Y=2186.11356-35.59678X21-15.85940X35+3.88038X15-1.17289X11。

冯小霞[9](2009)在《基于财务指标的中国旅游上市公司的成长性研究》文中研究说明本选题立足于当前国内外旅游业蓬勃发展,旅游上市公司越来越多且不断发展壮大的现状,以及企业成长性日益成为企业理论研究热点的大势所趋,以中国旅游上市公司为研究对象,基于经济学、管理学、证券投资学、统计学、会计学等学科理论,通过文献资料法、深度访谈法、理论与实际相结合方法、跨学科研究法、对比类比法、因子分析法和主成分分析法等大量定性和定量分析,客观深入的研究了我国旅游上市公司成长性的评价方法及其成长性的现状。本选题的研究目的在于:①确定影响旅游上市公司成长性大小的因素,并将这些因素按体系进行分类,建立一套基于财务指标的旅游上市公司成长性评价体系,为以后的旅游上市公司的成长性研究提供必要的参考:②在已建立的评价指标体系的基础上,对我国所有旅游上市公司成长性进行系统的实证研究,分析每家旅游上市公司的成长性评价结果:③在实证分析的基础上,依据成长性的不同,将我国旅游上市公司分类,为普通投资者提供投资的科学依据。选题主要解决:①旅游上市公司成长性评价指标和各指标权重的确定,进而得出完整的基于财务指标的旅游上市公司成长性评价的指标体系:②26家旅游上市公司成长性结果的纵横向比较,分析我国旅游上市公司成长性近10年变化的原因;③依据实证分析的结果,根据成长性的不同,对旅游上市公司进行分类。选题研究过程:①背景分析:我国旅游上市公司成长性研究现状与国外企业成长性理论差距的分析,论述研究旅游上市公司成长性的必要性:②提出问题:文章在分析企业成长性的本质、特征和财务影响因素的基础上,总结旅游上市公司研究的已有成果,分析其未来发展趋势,提出基于财务指标的旅游上市公司成长性的研究非常有必要且具有很强的可行性;③解决问题:基于财务指标的旅游上市公司成长性评价指标体系的研究和我国旅游上市公司成长性的实证研究;④研究目标:在之前研究的基础上,争取达到以下的研究目标:基于财务指标的旅游上市公司成长性评价指标体系的建立,旅游上市公司成长性实证研究结果的分析,根据实证分析结果给予经营者和投资者投资必要的参考。主要研究结论:①依据旅游上市公司的盈利能力、企业规模、偿债能力、营运能力、增长惯性、多元化能力、资本结构和股东获利能力和上市公司成长性之间的关系,本文据此选取的17个财务指标衡量企业的成长能力是合理可行的;②实证分析的横向比较发现:我国旅游上市公司总体成长性欠佳,稳定成长的公司不到总数的20%,仅有罗顿发展、兰州民百、华天酒店、丽江旅游和西安饮食5家;③对26家旅游上市公司近10年成长性的纵向比较和分析(其中世博股份由于不适合做因子分析和主成分分析,仅对其选取的17个指标的变化做了简单分析)发现,大多数旅游上市公司近10年内成长性极不稳定,波动大,存在大起大落的情况:④企业的盈利能力、营运能力和增长惯性是影响上市公司成长能力的主要因素;⑤ST东海A、蛾眉山A、东方宾馆、华天酒店、华侨城A、金陵饭店、黄山旅游、首旅股份、通程控股、中航地产和中青旅的10年成长性交化总体呈现上上升的趋势,一定程度上表明其未来发展势头较好。本研究创新之处在于:①提出了旅游上市公司成长性评价的财务指标体系,运用定性与定量相结合的方法加以论述;②建立了旅游上市公司成长性的评价模型,并与旅游上市公司实证研究相结合,实现理论与实践的结合;③旅游上市公司成长性的研究是前瞻性的研究,前人很少涉足。有待进一步研究的课题:全面而不是局限于财务指标的评价模型的建立;其他统计工具和方法的尝试;中国宏观经济的发展与变化对旅游上市公司的成长性的影响;旅游上市公司成长性变化的预测。

杜红英[10](2009)在《化学信息学新算法及在化学、生物与食品科学中的应用研究》文中研究说明近年来,随着信息科学、计算机科学与互联网的高速发展,一种新的交叉学科-化学信息学(Chemoinformatics)也迅速成长起来了。化学信息学是一门利用信息学的方法来解决化学的问题,同时得到有关化学本质规律的的学科。化学信息学的研究范围十分广泛,内容丰富,例如化学试验设计与优化、定量校正理论、分析信号处理、化学模式识别、模型与参数估计、人工智能等。化学信息学产生于科学家们对化学知识规律的不断需要的过程中。化合物结构与性质/活性定量关系(quantitative structure-property /activityrelationship,QSPR/QSAR)是化学信息学研究中的一个重要应用分支。该方法是指将化合物的结构参数同其生物活性数据以一定的数学模型相联系起来的定量关系。QSPR/QSAR的研究最初应用于生物领域是为了适应合理设计生物活性分子的需要而发展起来的。由于计算机技术的发展和应用,QSPR/QSAR的研究提高到了一个新的水平,且日趋成熟,其应用范围也迅速扩大,研究涉及生物,化学,药物科学,以及食品科学等诸多学科。人们期望用一个成功的数学模型,能从分子水平上理解其微观结构同其宏观性质/活性之间的关系,根据已有的知识,探求化合物性质/活性与结构的相互作用规律,从而推论呈现化合物某些性质的影响因素,然后为设计,筛选或预测具有人们期望性质的化合物提供信息。化学信息学的发展为化学各分支学科的发展提供了多种解决问题的新思路,新方法。本学位论文主要对化学信息学研究中的一些新算法进行了探讨,并把这些新算法成功应用于QSAR/QSPR研究领域中。该论文共包括五章节内容,每一个章节的具体内容如下所示:第一章:简述了化学信息学的基本概念和研究现状,以及多种化学信息学算法,也详细讲述了化学信息学研究的分支之一——QSAR,包括QSAR演变历史,基本原理以及实现的步骤等等。第二章:主要讨论了Quantitative structure-retention relationship (QSRR)方法在多肽色谱保留行为预测的应用研究。具体内容如下:(1)基于线性和非线性建模方法对反相液相色谱(RPLC)的101种多肽保留时间进行了定量结构保留关系建模研究。最佳多元线性回归(BMLR)方法用来选择与保留行为最为密切的分子描述符,并建立线性模型。另外两种非线性回归方法(径向基函数神经网络(RBFNN)和投影寻踪回归(PPR))用来构建非线性模型。RBFNN和PPR模型的训练集的相关系数(R2)分别为0.9787和0.9881;均方根误差(RMSE)为0.5666和0.4207。结果表明,RBF神经网络和投影寻踪回归将是蛋白质组研究中一种简单且有效的工具,并有望应用于其他类似的研究领域。(2)新颖的化学信息学方法—局部懒惰回归(LLR)首次应用于预测278个多肽在固定金属亲和色谱(镍柱)的保留行为研究。该工作分别用BMLR,PPR和LLR三种方法建立线性和非线性QSRR模型。最佳的LLR模型的训练集和测试集的R2分别为0.9446和0.9252。该工作证明新颖机器学习算法LLR是一个非常有前途的研究工具,它可用于色谱保留行为研究领域,为协助设计和分离纯化蛋白质和多肽发挥一定的作用。第三章主要描述了QSAR方法在农业和食品科学领域的应用研究,具体内容如下:(1)三种机器学习方法:遗传算法-多元线性回归(GA-MLR),最小二乘支持向量机(LS- SVM),PPR用于100个稻瘟病抑制剂噻唑啉衍生物的杀菌活性研究。线性模型GA-MLR和非线性模型LS-SVM和PPR都得到了良好的预测结果,但非线性模型提供了更加精确的预测能力。结果表明,非线性LS-SVM和PPR方法可以更加准确地模拟噻唑啉分子结构与杀菌活性之间的关系,能够成为研究稻瘟病抑制剂良好的建模工具。此外,这项研究为稻瘟病抑制剂的设计和开发提供了一种新的,简单而且有效的办法,同时得到的与其密切相关的分子结构信息。(2)运用定量结构保留关系方法对藏红花内43种芳香组分的SPME-GC-MS保留时间进行了预测。应用最佳多元线性回归(BMLR)和投影寻踪回归(PPR)方法分别建立了线性和非线性模型,两种方法均得到了较好的结果:线性模型的训练集和测试集的相关系数(R2)分别为0.9434和0.8725,非线性模型则给出了较好的预测结果分别为0.9806和0.9456。通过对模型的稳定性和预测能力的比较,可以看出非线性PPR方法可以较好的应用到SPME-GC-MS保留行为研究领域内,同时该工作又可以为其他植物和中草药的分离研究提供一种简便有效的方法。第四章主要讨论了定量构效关系在生命科学和医药研究领域内的应用,主要有以下几部分组成:(1)利用QSRR方法对55种药物在固相人工膜色谱内的保留指数进行了线性和非线性建模研究。在该工作中,线性BMLR方法被用来选取与保留指数最为相关的参数,同时建立线性回归模型;利用选取的描述符,应用PPR和LLR方法来建立更加准确的预测模型。通过模型对比,我们发现LLR作为一种新的建模方法,体现出较完美的预测能力,其训练集和测试集的预测结果为:复相关系数(R2),0.9540,0.9305;均方根误差(RMSE),0.2418,0.3949。结果显示,新型LLR建模方法在QSRR方法研究中表现出了较好的预测能力,同时该方法定会成功的应用于其它类似的色谱研究领域内。(2)利用线性和非线性建模方法研究了80个N-羟基-a-苯磺酰乙酰胺(N-hydroxy-aphenylsulfonylacetamidederivatives,HPSAs)衍生物对三种类型的基质金属蛋白酶的抑制活性。其中线性BMLR方法用来选取关键的结构参数,同时建立线性模型对所选化合物的抑制活性进行了预测;然后以全局格式搜索PPR方法利用选取的参数建立非线性回归模型。最终,线性和非线性模型均能提供较为满意的预测结果。在该工作中,非线性PPR方法首次与格式搜索(GS)方法相结合并成功应用于对HPSAs的抑制活性的建模研究,得到了令人满意的预测结果。该方法的成功为其他模型参数的优化与选取提供了一种捷径。(3)利用线性回归方法和非线性回归方法-格式搜索支持向量机(GS-SVM)和PPR方法对MT3褪黑激素结合位点的亲和性进行了研究。在该工作中,遗传算法被用来选取与研究对象最为相关的结构参数,并建立线性回归模型对MT3褪黑激素结合位点的亲和性进行预测;利用选取的五个结构变量,采用非线性回归方法GS-SVM和PPR方法建立更加准确的模型。通过模型对比,我们发现非线性PPR方法能够对MT3褪黑激素结合位点的亲和性具有比较准确的预测能力。该方法的建立,为设计和开发新型MT3褪黑激素的新型配体提供了一种新型的研究方法。第五章:QSAR方法在化学感应系统相对灵敏度的预测研究。在本章中,BMLR,SVM和LLR三种方法用来完成64种VOCs的气味检测阀值(ODTs)和鼻腔辛辣味阀值(NPTs)相对敏感性的QSAR建模研究,所得的预测结果和相应的实验数据基本吻合。相比之下,LLR方法能够获得更好的预测能力,因此,它在QSAR研究中是一种有效的机器学习算法。此外,本研究还确定了一些重要的分子结构信息,它们与VOC的相对敏感性密切相关。这些信息可以用来选择或制造一些新型的化学传感器,同时也说明LLR方法是一种很有前途的QSAR建模方法,可用于其他类似的化学传感器建模预测研究。

二、慎用逐步判别分析的SAS程序设计(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、慎用逐步判别分析的SAS程序设计(论文提纲范文)

(1)上海市6~14岁学生力量素质测评体系优化研究(论文提纲范文)

内容摘要
ABSTRACT
1 绪论
    1.1 研究背景
        1.1.1 现代生活方式对体质健康的影响
        1.1.2 力量素质对体质健康的重要作用
        1.1.3 当前我国学生力量素质状况堪忧
        1.1.4 当前我国学生力量素质测评体系有待完善
    1.2 研究目的与意义
        1.2.1 研究目的
        1.2.2 研究意义
    1.3 相关概念界定
        1.3.1 体质
        1.3.2 体质测定
        1.3.3 力量素质
        1.3.4 测评体系
    1.4 论文框架与创新
        1.4.1 论文框架
        1.4.2 研究创新
2 文献综述
    2.1 新中国体质测评体系中力量素质指标的演进
        2.1.1 60年来学生体质测评中的力量素质指标设置
        2.1.2 全国学生体质与健康调研中的力量素质指标设置
        2.1.3 国民体质监测中的力量素质指标设置
    2.2 国内外不同体质测试体系中的力量素质指标设置
        2.2.1 指标的身体位置分布
        2.2.2 指标的数量限定
        2.2.3 上肢指标的问题呈现
        2.2.4 下肢指标的问题呈现
        2.2.5 指标应用的年龄、性别差异
    2.3 国内体质测试中力量素质指标体系研究
        2.3.1 国家主导研究
        2.3.2 非国家主导研究
    2.4 力量素质指标测试方法研究
        2.4.1 上肢力量素质指标及测试方法研究
        2.4.2 躯干力量素质指标及测试方法研究
        2.4.3 下肢力量素质指标及测试方法研究
    2.5 力量素质评价标准研究
        2.5.1 关于常模参照标准的研究
        2.5.2 关于效标参照标准的研究
        2.5.3 常模参照标准与效标参照标准的比较研究
    2.6 文献总结
        2.6.1 上肢测试指标及方法有待精选
        2.6.2 仰卧起坐测试方法需要优选,躯干屈伸力量应予兼顾考察
        2.6.3 下肢力量为力量素质测试的必测内容
        2.6.4 力量素质评价标准的建立可结合不同的评价理念综合考虑
3 研究设计
    3.1 研究的总体思路
    3.2 研究策略与方法
        3.2.1 定性研究的策略与方法
        3.2.2 定量研究的策略与方法
    3.3 研究的质量控制
        3.3.1 实验测试环节
        3.3.2 特尔菲法调查环节
        3.3.3 横断面普测环节
    3.4 本章小结
4 力量素质指标的优选
    4.1 基于表面肌电测试法的力量素质指标优选
        4.1.1 表面肌电技术的理论基础及使用依据
        4.1.2 上肢力量素质指标的优选结果与讨论
        4.1.3 躯干力量素质指标的优选结果与讨论
        4.1.4 下肢力量素质指标的优选结果与讨论
        4.1.5 本部分小结
    4.2 基于特尔菲法的力量素质指标优选
        4.2.1 第一轮咨询结果
        4.2.2 第二轮咨询结果
        4.2.3 两轮咨询综合的结果
        4.2.4 力量素质指标属性的相关分析
        4.2.5 本部分小结
    4.3 本章小结
5 上海市6~14岁学生力量素质评价标准的研制
    5.1 力量素质评价标准建立的依据
        5.1.1 现行体质相关评价标准分类
        5.1.2 现行不同评价标准的实际类属
        5.1.3 评价标准类型及方法的确定
    5.2 标准研制结果
        5.2.1 标准数据筛选
        5.2.2 各指标的P50实测值与LMS法拟合值
        5.2.3 上海市6~14岁学生各优选力量素质指标的百分位数
        5.2.4 上海市6~14岁学生各优选力量素质指标单项评分表
        5.2.5 上海市6~14岁学生新建力量素质评价标准的回代检验
    5.3 讨论
        5.3.1 三个力量素质指标评分表的制定
        5.3.2 三个力量素质指标测试分数的年龄、性别变化特征
        5.3.3 三个力量素质指标评价标准的判别效果
    5.4 本章小结
6 研究结论、建议与展望
    6.1 结论
        6.1.1 体质测试中的力量素质测评体系亟待优化
        6.1.2 综合筛选出学生体质测试中的力量素质指标
        6.1.3 建立了与新的力量素质指标相对应的评价标准
    6.2 建议
        6.2.1 学生力量素质指标设置应考虑学生的自然生长因素与指标通用性
        6.2.2 学生力量素质指标设置研究应多结合生理、解剖学科
        6.2.3 学生力量素质指标的选择应注重应用经验与实验验证相结合
    6.3 研究展望
        6.3.1 被试者的年龄跨度有待加大
        6.3.2 研究的深度有望加强
        6.3.3 研究的内容有待补充
参考文献
附录
    附录1 术语中英文对照表
    附录2 6~14岁学生表面肌电测试方案
    附录3
        6 ~14岁学生力量素质指标优选专家咨询问卷(第一轮)
        6 ~14岁学生力量素质指标优选专家咨询问卷(第二轮)
    附录4 上海市6~14岁学生力量素质测试方案及细则
后记
作者简历及在学期间的科研成果
    一、作者简历
    二、博士期间科研成果
        (一) 发表论文
        (二) 骨干参与课题
        (三) 参加学术会议

(2)地球化学矿致异常空间分析与定量评价 ——以九瑞铜矿和大湖塘钨矿为例(论文提纲范文)

作者简介
摘要
ABSTRACT
第一章 绪论
    §1.1 选题来源、目的和意义
        1.1.1 选题来源
        1.1.2 选题目的和意义
    §1.2 国内外研究现状与趋势
        1.2.1 勘查地球化学学科进展
        1.2.2 空间分析理论与定量评价方法
        1.2.3 R编程语言
        1.2.4 发展趋势
        1.2.5 存在问题
    §1.3 研究区特征及数据源概况
        1.3.1 区域地质矿产特征
        1.3.2 九瑞和大湖塘地质特征
        1.3.3 研究区勘查地球化学数据
    §1.4 研究技术路线
    §1.5 论文组织结构
第二章 勘查地球化学数据特征及其空间探索性分析
    §2.1 数据特征
    §2.2 数据整理
        2.2.1 数据检查
        2.2.2 数据变换
    §2.3 单元素分布形式探索性分析
        2.3.1 图解法
        2.3.2 概要统计参数
        2.3.3 正态分布检验
        2.3.4 分形分布探查
    §2.4 多元素组合可视化探索性分析
        2.4.1 相关图
        2.4.2 平行坐标图
        2.4.3 空间趋势图
        2.4.4 空间距离图
    §2.5 小结
第三章 地球化学异常分割方法研究
    §3.1 异常下限的计算方法
        3.1.1 基于经典统计学方法
        3.1.2 基于稳健统计学方法
        3.1.3 基于分形统计学方法
    §3.2 单元素异常下限计算
    §3.3 多元素离群点检测
    §3.4 小结
第四章 地球化学矿致异常源辨析
    §4.1 多尺度矿致异常源辨析
        4.1.1 区域分析
        4.1.2 空间子区分析
        4.1.3 矿床邻域分析
        4.1.4 风化土壤剖面分析
        4.1.5 勘探线剖面分析
    §4.2 区域异常的空间过程示踪
        4.2.1 PCA和FA的异同辨析
        4.2.2 主成分(因子)个数提取
        4.2.3 双标图、得分图及载荷图分析
    §4.3 小结
第五章 基于数据驱动的矿致异常定量评价
    §5.1 指示元素组合优化
    §5.2 空间子区样本分类
    §5.3 成矿元素含量预测
    §5.4 小结
第六章 基于知识驱动的矿致异常定量评价
    §6.1 相似系数法的基本原理
    §6.2 计算模型的优化分析
        6.2.1 匀化与对数变换
        6.2.2 “标准样本”元素含量赋值
        6.2.3 权重系数的计算
    §6.3 欧氏与兰氏距离相似系数的对比分析
    §6.4 相似系数的空间自相关模式分析
    §6.5 综合应用案例
    §6.6 小结
第七章 结论与展望
    §7.1 结论
        7.1.1 研究成果
        7.1.2 创新点
    §7.2 展望
致谢
参考文献
附表

(3)ν-支持向量分类机在心肌梗塞疾病诊断中的应用(论文提纲范文)

摘要
ABSTRACT
1 引言
    1.1 支持向量分类机的研究背景
    1.2 心肌梗塞疾病自动诊断的研究现状和意义
2 支持向量分类机理论
    2.1 支持向量分类机相关概念
    2.2 线性可分支持向量分类机
    2.3 线性支持向量分类机
    2.4 支持向量分类机
    2.5 v-支持向量分类机
3 心电图数据样本及特征提取与选择
    3.1 心电图的概念与特征提取
    3.2 基于逐步判别法的特征选择
4 数值实验和结果分析
    4.1 ν-支持向量分类机参数训练
    4.2 v-支持向量分类机的效果评价
5 总结与展望
附录
参考文献
致谢

(4)税务稽查选案管理信息系统的设计与实现(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 课题研究背景及意义
    1.2 国内外研究现状
    1.3 税务稽查信息化简介
        1.3.1 税务稽查介绍
        1.3.2 税务稽查信息化简介
    1.4 论文的主要内容
第二章 数据挖掘技术
    2.1 数据仓库技术简介
        2.1.1 数据仓库的概念
        2.1.2 数据仓库的特性
        2.1.3 数据仓库的规划设计与开发
    2.2 数据挖掘技术简介
        2.2.1 数据挖掘技术的起源与发展
        2.2.2 数据挖掘技术的分类与算法介绍
        2.2.3 孤立点挖掘算法分析
第三章 稽查选案管理信息系统需求分析
    3.1 系统功能需求分析描述
        3.1.1 系统运行环境需求分析
        3.1.2 系统用户需求分析
    3.2 系统业务概述
    3.3 需求分析中所用的图表
第四章 稽查选案管理信息系统设计
    4.1 稽查选案管理信息系统总体设计
        4.1.1 稽查选案管理信息系统总体设计原则
        4.1.2 稽查选案管理信息系统总体流程描述
    4.2 稽查选案管理信息系统详细模块设计
    4.3 人机界面设计
    4.4 总体设计中的图表
    4.5 数据库设计
第五章 稽查选案管理信息系统实现
    5.1 稽查选案管理信息系统开发要求
    5.2 编码设计
    5.3 部分功能界面展示
    5.4 系统测试与调试
        5.4.1 测试环境要求
        5.4.2 测试方式
第六章 结束语
    6.1 总结
    6.2 展望
致谢
参考文献

(5)基于SAS的客户营销响应模型设计(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 课题研究背景
    1.2 国外数据挖掘现状
    1.3 国内研究现状
    1.4 数据挖掘商业价值及研究意义及本文工作
    1.5 论文结构
第二章 数据挖掘技术及其在客户响应模型中的应用
    2.1 数据挖掘技术概况
        2.1.1 数据挖掘产生
        2.1.2 数据挖掘技术流程
        2.1.3 数据挖掘功能
        2.1.4 数据挖掘技术方法
    2.2 SAS介绍
    2.3 客户营销响应模型介绍
    2.4 数据挖掘技术在客户营销响应模型上的应用
第三章 客户响应模型数据预处理
    3.1 前期准备
        3.1.1 商业需求
        3.1.2 定义目标
    3.2 数据准备
        3.2.1 数据结构
        3.2.2 数据样本选取
        3.2.3 数据获取过程
    3.3 数据清洗
    3.4 数据转换
    3.5 数据抽样
第四章 基于SAS的客户响应模型设计与评估
    4.1 基于Logistic回归的客户响应模型
        4.1.1 一般线性回归的缺陷
        4.1.2 Logistic回归模型
    4.2 回归模型设计
    4.3 模型表现评估以及评分卡创建
        4.3.1 创建LIFT图
        4.3.2 创建评分卡文件
    4.4 模型实施和监控
        4.4.1 模型实施
        4.4.2 模型监控
第五章 研究结论以及展望
参考文献
致谢

(6)多元统计分析在核勘查数据处理中的应用研究(论文提纲范文)

摘要
Abstract
第1章 引言
    1.1 课题来源及研究意义
    1.2 国内外研究历史及现状
        1.2.1 国内外核勘查数据处理现状
        1.2.2 多元统计分析现状
        1.2.3 多元统计在勘查领域应用现状
    1.3 研究成果及特色
第2章 地质背景
    2.1 金矿工作区地质概况
        2.1.1 主要矿产资源
        2.1.2 地理位置
    2.2 区域成矿地质背景
        2.2.1 构造位置及地层
        2.2.2 地球物理特征
    2.3 矿区地质特征
        2.3.1 构造
        2.3.2 岩浆岩
第3章 数据测量
    3.1 仪器设备与工作条件选择
    3.2 样品采集与测量
    3.3 测量质量控制与测量质量评价
第4章 数据处理
    4.1 数据预处理
    4.2 各元素数据分布
        4.2.1 数据分布检验
        4.2.2 元素等值线图
    4.3 相关分析
        4.3.1 相关系数的特点
        4.3.2 相关系数分析
        4.3.3 Au与其他元素散点图
    4.4 聚类分析
        4.4.1 距离和相似系数
        4.4.2 聚类分析
    4.5 回归分析
        4.5.1 多元回归预测模型的建立
        4.5.2 回归方程和回归系数的显着性检验
        4.5.3 拟合优度
        4.5.4 数据的中心化和标准化
        4.5.5 自变量的选择与逐步回归
        4.5.6 多元逐步回归的实现
    4.6 趋势分析
        4.6.1 趋势分析原理
        4.6.2 趋势分析的实现
结论
致谢
参考文献
攻读学位期间取得学术成果

(7)基于灰色理论与关联规则的中药注射剂不良反应成因研究 ——以双黄连注射剂为例(论文提纲范文)

摘要
ABSTRACT
文献综述
    1 中药注射剂ADR
    2 中药注射剂ADR成因研究的现状分析
        2.1 中药注射剂ADR成因的实验研究
        2.2 中药注射剂ADR成因的综述研究
        2.3 中药注射剂ADR成因的流行病学研究
        2.4 现有中药注射剂ADR成因研究存在的局限
    3 灰色关联分析及其在卫生和医学领域的应用
    4 关联规则挖掘及其在医学领域的应用
前言
    1 研究背景
    2 研究目的
    3 研究意义
    4 研究内容
        4.1 现有中药注射剂ADR成因研究现状分析
        4.2 灰色关联分析及关联规则挖掘在中药注射剂ADR成因研究中的应用探讨
        4.3 实例分析
    5 研究方法
        5.1 文献研究法
        5.2 灰色关联分析法
        5.3 数据挖掘法
        5.4 实例分析法
    6 研究创新点
    7 技术路线
正文
    1 灰色关联分析在中药注射剂ADR成因研究中的应用探讨
        1.1 灰色关联分析理论基础
        1.2 灰色关联分析在中药注射剂ADR成因研究中的应用模式
    2 关联规则挖掘在中药注射剂ADR成因研究中的应用探讨
        2.1 关联规则理论基础
        2.2 关联规则挖掘在中药注射剂ADR成因研究中的应用模式
    3 双黄连注射剂实例分析
        3.1 双黄连注射剂ADR内因分析
        3.2 实例分析资料来源
        3.3 建立双黄连注射剂ADR病例报告数据表及数据预处理
        3.4 双黄连注射剂ADR流行病学信息统计
        3.5 双黄连注射剂临床应用中ADR成因的灰色关联分析
        3.6 双黄连注射剂ADR发生规律的关联规则挖掘
        3.7 结果分析
    4 讨论
        4.1 灰色关联分析与关联规则挖掘应用于中药注射剂ADR成因研究的可行性及有效性讨论
        4.2 双黄连注射剂的ADR成因讨论
    5 总结
        5.1 本课题研究成果
        5.2 本课题研究局限
        5.3 本课题研究前景展望
附录
参考文献
致谢
个人简历

(8)浙江省余杭区竹卵圆蝽预测预报模型的建立(论文提纲范文)

摘要
ABSTRACT
前言
1 文献综述
    1.1 国内外森林病虫害监测现状
        1.1.1 国外森林病虫害监测研究进展
        1.1.2 国内森林病虫害监测研究进展
    1.2 森林病虫害预测预警系统研究
    1.3 森林病虫害预测的方法
        1.3.1 回归分析预测法
        1.3.2 判别分析预测法
        1.3.3 数量化理论预测法
        1.3.4 时间序列预测法
        1.3.5 模糊数学预测法
        1.3.6 神经网络预测法
    1.4 小结
2 竹卵圆蝽及其危害概况
    2.1 研究的背景和意义
        2.1.1 竹卵圆蝽在浙江省危害逐渐严重
        2.1.2 浙江省是竹卵圆蝽危害易发生区域
        2.1.3 预测预报是林业可持续发展的重要内容
        2.1.4 预测预报是林业病虫害可持续控制的发展方向
        2.1.5 开展竹卵圆蝽预测预报模型项目研究的意义
    2.2 竹卵圆蝽的形态特征
    2.3 竹卵圆蝽的生物学特性
        2.3.1 成虫期
        2.3.2 若虫期
    2.4 竹卵圆蝽危害的影响因子
        2.4.1 与温度的关系
        2.4.2 与坡向的关系
        2.4.3 与寄主的关系
        2.4.4 与海拔、经营方式的关系
    2.5 竹卵圆蝽天敌种类
        2.5.1 寄生性天敌
        2.5.2 捕食性天敌
    2.6 竹卵圆蝽的危害状况
    2.7 竹卵圆蝽的防治
        2.7.1 喷雾、涂干防治
        2.7.2 注射防治
        2.7.3 垦复施肥
        2.7.4 合理留竹、采伐
        2.7.5 阻隔法
        2.7.6 人工捕捉等
3 研究区概况及研究内容
    3.1 研究区概况
    3.2 研究的主要内容
        3.2.1 研究的主要范围
        3.2.2 研究小班的选择
        3.2.3 各小班竹卵圆蝽危害情况
        3.2.4 研究范围的有关气象资料
        3.2.5 研究范围内竹卵圆蝽虫口密度资料
4 影响卵圆蝽虫口密度的主导因子分析
    4.1 SAS 软件概述
    4.2 影响竹卵圆蝽虫口密度因子的相关性分析
    4.3 影响竹卵圆蝽虫口密度因子的选择
        4.3.1 多元回归分析
        4.3.2 逐步回归分析
        4.3.3 逐步回归分析的SAS 实现
5 预测模型的建立与检验
    5.1 逐步线性回归方法分析
    5.2 输出结果及说明
    5.3 预测模型的建立与检验
6 结论与讨论
    6.1 结论
    6.2 讨论及下一步工作
参考文献
致谢
个人简介

(9)基于财务指标的中国旅游上市公司的成长性研究(论文提纲范文)

摘要
Abstract
第1章 引言
    1.1 研究背景及问题的提出
        1.1.1 企业成长性理论的不断发展
        1.1.2 旅游业在国民经济中的地位和发展现状
        1.1.3 证券市场的繁荣和旅游上市公司的发展现状
        1.1.4 旅游上市公司成长性评价理论的不成熟和评价方法的盲目性
        1.1.5 旅游上市公司成长性评价是上市公司管理理论研究的新课题
    1.2 研究的目的和意义
        1.2.1 研究的目的
        1.2.2 研究的意义
    1.3 研究的思路和方法
        1.3.1 文献资料法
        1.3.2 深度访谈法
        1.3.3 理论与实践相结合方法
        1.3.4 跨学科研究法
        1.3.5 对比类比法
        1.3.6 因子分析法
        1.3.7 主成分分析法
    1.4 资料来源
        1.4.1 一手资料
        1.4.2 二手资料
    1.5 研究的重点、难点和创新点
        1.5.1 研究的重点
        1.5.2 研究的难点
    1.6 研究的技术路线
第2章 旅游上市公司成长性研究综述
    2.1 相关概念界定
        2.1.1 旅游上市公司的概念
        2.1.2 成长性的概念
        2.1.3 成长性的特征
    2.2 国内外企业成长性评价指标研究综述
        2.2.1 国外企业成长性评价指标研究综述
        2.2.2 国内企业成长性评价指标研究综述
    2.3 国内旅游上市公司的研究综述
第3章 基于企业成长性研究的理论分析
    3.1 企业成长性理论
    3.2 企业核心竞争力理论
    3.3 规模经济理论
    3.4 企业资本结构理论
    3.5 企业多元化经营战略理论
    3.6 绩效管理理论
    3.7 企业财务管理理论
第4章 研究设计
    4.1 研究假设
        4.1.1 提出假设
        4.1.2 假设分析
    4.2 定量分析
        4.2.1 样本选取及数据来源
        4.2.2 数据的预处理
        4.2.3 因子分析
第5章 实证研究
    5.1 成长性数值的计算
    5.2 旅游上市公司的成长性变化分析
        5.2.1 旅游上市公司成长性的横向比较
        5.2.2 旅游上市公司成长性变化的纵向比较
    5.3 世博股份成长性的个案分析
第6章 中国旅游上市公司成长性研究的思考
    6.1 中国旅游上市公司成长性评价方法
    6.2 中国旅游上市公司成长性评价结果
第7章 结语
    7.1 主要结论与研究成果
        7.1.1 采用的评价指标是适宜的
        7.1.2 旅游上市公司成长性的横向对比结果
        7.1.3 旅游上市公司成长性的纵向对比结果
    7.2 研究创新
        7.2.1 评价体系的构建
        7.2.2 评价方法
        7.2.3 评价结果对实践的指导意义
    7.3 研究不足与展望
        7.3.1 研究不足
        7.3.2 研究展望
参考文献
附录
致谢
攻读硕士学位期间研究成果

(10)化学信息学新算法及在化学、生物与食品科学中的应用研究(论文提纲范文)

目录
摘要
ABSTRACT
论文创新之处
第一章 化学信息学算法和定量结构-性质/活性关系综述
    1.1 化学信息学概况
        1.1.1 化学信息学的产生背景
        1.1.2 化学信息学的定义
        1.1.3 化学信息学的结构特点
        1.1.4 化学信息学的研究内容
        1.1.5 化学信息学的发展趋势
        1.1.6 化学信息学部分方法的简介
    1.2 定量构效关系的简介
        1.2.1 定量构效关系的概述
        1.2.2 定量构效关系(QSAR)的研究进展
        1.2.3 QSAR方法的基本步骤
    参考文献
第二章 QSAR方法用于多肽色谱保留行为的预测研究
    2.1 应用RBFNN和PPR方法预测多肽在RPLC中的保留时间
        2.1.1 引言
        2.1.2 理论
        2.1.3 实验部分
        2.1.4 结果与讨论
        2.1.5 结论
    2.2 基于新颖方法对含组氨酸的多肽在固定金属亲和色谱中保留行为的预测
        2.2.1 引言
        2.2.2 数据集
        2.2.3 分子描述符的产生和选择
        2.2.4 最佳多元线性回归,投影寻踪回归和局部懒惰回归算法。
        2.2.5 模型的评价
        2.2.6 结果与讨论
        2.2.7 结论
    参考文献
第三章 QSAR方法在农业食品科学领域的应用
    3.1 基于LS-SVM和PPR方法预测稻瘟病抑制剂的杀菌活性
        3.1.1 引言
        3.1.2 数据集和方法
        3.1.3 结果与讨论
        3.1.4 结论
    3.2 基于PPR的藏红花芳香组分的QSAR研究
        3.2.1 引言
        3.2.2 实验过程
        3.2.3 结果和讨论
        3.2.4 结论
    参考文献
第四章 QSAR方法在生命科学和医药领域的应用
    4.1 应用投影寻踪回归和局部懒惰回归对磷脂膜色谱的药物分离保留指数进行预测
        4.1.1 引言
        4.1.2 算法的理论
        4.1.3 实验部分
        4.1.4 结果与讨论
        4.1.5 结论
    4.2 联合投影寻踪回归和网格搜索方法预测基质金属蛋白酶抑制剂的抑制活性
        4.2.1 引言
        4.2.2 实验部分
        4.2.3 结果与讨论
        4.2.4 结论
    4.3 新颖QSAR方法预测MT3褪黑激素结合位点的亲和性
        4.3.1 引言
        4.3.2 实验部分
        4.3.3 建模方法原理
        4.3.4 结果与讨论
        4.3.5 结论
    参考文献
第五章 QSAR方法在化学感应系统方面的应用研究
    5 基于局部懒惰回归方法对一系列挥发性有机化合物的嗅觉与鼻子三叉神经化学感应系统相对灵敏度的预测
        5.1 引言
        5.2 实验部分
        5.3 结果和讨论
        5.4 结论
    参考文献
附录Ⅰ 在读博士学位期间发表论文目录
致谢

四、慎用逐步判别分析的SAS程序设计(论文参考文献)

  • [1]上海市6~14岁学生力量素质测评体系优化研究[D]. 范洪彬. 华东师范大学, 2017(01)
  • [2]地球化学矿致异常空间分析与定量评价 ——以九瑞铜矿和大湖塘钨矿为例[D]. 龚鹏. 中国地质大学, 2014(11)
  • [3]ν-支持向量分类机在心肌梗塞疾病诊断中的应用[D]. 沈丽静. 华东师范大学, 2014(11)
  • [4]税务稽查选案管理信息系统的设计与实现[D]. 孟英民. 西安电子科技大学, 2012(03)
  • [5]基于SAS的客户营销响应模型设计[D]. 戚俊伟. 华东理工大学, 2012(06)
  • [6]多元统计分析在核勘查数据处理中的应用研究[D]. 江林. 成都理工大学, 2011(04)
  • [7]基于灰色理论与关联规则的中药注射剂不良反应成因研究 ——以双黄连注射剂为例[D]. 张娜. 北京中医药大学, 2010(11)
  • [8]浙江省余杭区竹卵圆蝽预测预报模型的建立[D]. 罗海燕. 浙江林学院, 2009(02)
  • [9]基于财务指标的中国旅游上市公司的成长性研究[D]. 冯小霞. 陕西师范大学, 2009(07)
  • [10]化学信息学新算法及在化学、生物与食品科学中的应用研究[D]. 杜红英. 兰州大学, 2009(11)

标签:;  ;  ;  ;  ;  

谨慎使用逐步判别分析的SAS程序设计
下载Doc文档

猜你喜欢