多元统计分析在数据挖掘中的作用

多元统计分析在数据挖掘中的作用

一、多元统计分析在数据挖掘中的作用(论文文献综述)

倪富陶[1](2021)在《基于深度学习的结构外观病害检测与监测数据挖掘》文中进行了进一步梳理土木基础设施是体现国家综合国力及科学技术发展水平的重要标志,其安全服役关乎国计民生。结构检测评估和结构健康监测是当前桥梁结构管养进行决策的主要依据,不管是结构检测评估还是结构健康监测,都会产生大量的数据,传统的数据分析手段难以对检、监测数据进行高效的分析处理。如何快速的分析海量数据、挖掘数据深层特征以及将分析结果反馈应用到后续桥梁运维管理中,成为土木领域当下研究的前沿热点。基于此研究背景,本文从结构外观检测数据和结构健康监测数据两方面出发,以数据挖掘中的分类问题为重点,利用深度学习技术深入挖掘大量外观检测数据和健康监测数据的内在特征。在依托海量检测数据的研究方面,本文主要研究了基于检测图像的裂缝自动分割方法,分为三个阶段逐步深入。在依托海量健康监测数据的研究方面,本文侧重于研究大数据问题处理框架中的前两个阶段,即数据预处理和数据存储阶段。论文的主要创新点如下:(1)提出了基于深度学习和Zernike正交矩的裂缝分割及宽度测量方法。针对传统方法适用性差的缺点,将深度学习算法和传统的基于数字图像处理的算法结合起来,在深度学习定性分类能力的基础上将图像中裂缝的检测分为“判断有无”、“自动勾画”和“宽度测量”三个层次。采用多个尺度的深度学习缩小裂缝的范围,并在传统方法初步分割出裂缝的基础上,再次利用深度学习筛选初步分割的裂缝,从而大大提高了裂缝分割的精度以及复杂环境下的抗噪性。在宽度测量方面,针对传统的“数像素”方法对于5像素以内细微裂缝测量误差大的缺点,提出了基于Zernike正交矩的细微裂缝宽度测量方法,直接利用裂缝的灰度信息计算裂缝的宽度,提高图像中细微裂缝的宽度测量精度。(2)提出了基于多尺度特征融合网络的像素级裂缝分割方法,实现完全依靠深度学习本身提取特征的裂缝分割。提出框架可以分为特征提取和特征融合两大块,而特征融合又可以分为不同尺度特征简单的像素级融合和不同尺度特征不同维度之间的深层次融合。在特征提取和像素级融合方面,采用自下而上和自上而下两种策略设计了不同的特征融合网络,基于不同裂缝测试集详细分析了高、低阶特征对最终裂缝分割结果的影响。发现低阶特征主要表征裂缝的形态信息,对于裂缝的细节描述更加有效,而高阶特征对于图像中裂缝的语义特征描述更加有效,需要把高低阶特征同时考虑到裂缝分割的框架中。(3)基于对抗深度学习增强的轻量级裂缝检测网络。前两章提出的裂缝分割方法虽然能高精度的分割出裂缝,但是其检测效率并不能够满足自动化检测的实时性要求。因此,本章提出了一种轻量级的裂缝检测框架,并提出了基于对抗深度学习的轻量级网络增强算法。提出框架从两方面对网络进行优化,一方面是深度学习特征提取模块的优化,采取更加轻型、高效的框架;另一方面,针对网络的训练策略提出算法创新,引入了生成对抗距离来衡量相似性,使轻量级网络的输出分布和人工标记的分布相逼近,从而提高轻量级网络的检测效果。最后,将本章提出的算法应用到新华路桥的桥墩裂缝检测中。(4)针对海量监测数据预处理的自动化异常检测需求,提出了基于一维卷积网络的健康监测异常数据识别方法,可以将健康监测系统采集数据直接输入到网络中,利用深度学习挖掘异常数据的本质特征,实现对异常数据的自动识别。随后将提出的方法应用到了江阴大桥吊杆监测数据的异常识别中,与人工检测的结果相对比,发现提出方法可以高精度的识别出健康监测系统采集的异常数据。相比传统的基于数学模型的异常数据识别方法,本文提出方法适用性广泛,可以高精度检测出各种类型的异常数据。相比于基于长短记忆网络的异常识别算法,提出方法不需要人工设定阈值。而相比于基于图像识别的异常检测方法,提出的方法不需要小心调整观测数据的尺度,不需要担心图像中超高维压缩带来的异常信息损失。(5)针对海量监测数据存储的问题,提出了基于卷积自编码网络的长期监测数据压缩方法。提出数据压缩方法可以分为数据压缩网络和数据重建网络两个部分,其中数据压缩网络用于将输入的原始数据压缩到指定的大小,数据数据重建网络用于将压缩后的数据进行还原。本文将提出方法和传统的基于DCT变换的数据压缩方法及压缩感知方法进行对比,发现在较低的压缩率下,本章提出的方法相对传统方法具有更小的重建误差和更高的相关系数。并将提出方法在江阴大桥长期吊杆监测数据下进行验证,发现对于识别为异常的数据,其压缩后重建的精度较低,而对于识别为正常的数据,能够在较低的压缩率下实现高精度的数据重建。

张静驿[2](2020)在《贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用》文中研究指明目的:建立《伤寒论》阳明病篇的中药、方剂、症状的贝叶斯网络模型,结合中医理论知识推理得出《伤寒论》阳明病篇方药及证治的相关规律,为《伤寒论》方证知识的系统研究提供一个新的切入点。方法:本研究首先对《伤寒论》阳明病篇的中药、方剂、症状进行规范化处理,统计中药、方剂、症状的频次、频率,并录入Microsoft Excel软件建立数据库;随后采用SPSS 23.0软件包及R3.4.3软件初步构建贝叶斯网络关系图;再用Netica软件绘制得到贝叶斯网络模型;之后统计贝叶斯网络模型中研究变量的节点度;最后根据图表特征结合中医理论知识分析总结相关规律。结果:(1)方药方面:在《伤寒论》阳明病篇中,仲景使用最多的中药是大黄,使用最多的方剂是承气汤,与其他药物组成药对最多的是甘草和大枣。仲景在阳明病篇中强调阳明实证、阳明变证及阳明热证的治疗,其中用承气汤治疗阳明实证;小柴胡汤、茵陈蒿汤和抵当汤治疗阳明变证;栀子豉汤和猪苓汤治疗阳明热证。仲景亦对表证做了论述,所用方剂为麻黄汤和桂枝汤。(2)证治方面:仲景在阳明病篇中对“发热”做了鉴别,分别指出“发热”相兼“脉浮”为“表热证”、“发热”相兼“便秘”为“里热证”,其中“表热证”用麻黄汤和桂枝汤治疗,“里热证”用承气汤治疗。仲景对“喘”也做了鉴别,指出喘伴恶寒、发热和汗出,用桂枝汤治疗;喘伴潮热、腹胀和便秘,用大承气汤治疗;喘伴发热、汗出和腹胀,用白虎汤治疗。仲景用通利小便的方法治疗发黄,所用方剂为猪苓汤。除此之外,仲景用厚朴治疗谵语、潮热和便秘,栀子治疗身黄、发热和心烦,桂枝治疗恶寒和脉浮,芒硝治疗喘和腹胀,人参治疗潮热;用大承气汤治疗便秘、喘和潮热,栀子豉汤治疗心烦和发热,小承气汤治疗便秘,茵陈蒿汤治疗身黄,小柴胡汤治疗潮热,麻黄汤治疗脉浮,桂枝汤治疗汗出。结论:本研究采用贝叶斯网络和频次、频率统计方法,对《伤寒论》阳明病篇的中药、方剂、症状的知识进行梳理,分析得出方药、证治两方面的规律。研究结果显示:应用贝叶斯网络得到的模型图简洁、清晰、可视化效果好,实现了对《伤寒论》阳明病篇中的方药、证治规律的深入理解,对学习仲景用药和辨证规律有着十分重要的意义,贝叶斯网络是系统研究《伤寒论》的有效方法。

钱晓如[3](2020)在《基于蓝墨云的数据分析在大学生个性化学习模式中的应用研究》文中研究指明随着互联网的发展及相关应用技术行业的普及,为人们解决各种问题带来了全新的思路及能力。例如,相关领域专家已经将这种全新的互联网思维渗透进教育行业,悄然改变着教育者的教学方式、学习者的学习方式。为了解决接口不完善、口径不一致等问题,使得相关数据能够被统一管理的教育平台也应运而生,从前端使用,到后端分析及反馈,形成一个有效闭环,做到了真正为教育行业相关联者提高工作效率。在这个过程中,也给教育者提供了丰富的高质量数据。本研究在对大量文献进行充分调研后,总结前人对该领域所做的研究,并在此基础上提出自己对该领域的一些新的研究思路,使用以数据科学做支撑的挖掘方案最终探索出一种有明显教学优势的个性化学习模式,促使学习者能够积极有效地参与到学习过程中。本研究旨在提供一种剖析数据的角度,基于“蓝墨云”教育平台,挖掘分析出学习者原始学习状态的天然属性,并加以利用最终形成更加高效的个性化教育模式。主要工作集中在以下几个部分:(1)以“蓝墨云”教育平台为依托,针对《教育题材影视片赏析》课程中学习者学习行为数据进行初步基础的数据分析,探索背后可能隐藏的信息;(2)使用统计学领域的特征提取方法,以更加科学的数学理论做支撑,提出个性化学习模式的提取方案;(3)借助《教育题材影视片赏析》课程中学习者真实的学习行为数据,运用数据科学例如统计学原理、机器学习算法等进行个性化学习模式的挖掘和分析;(4)最终提出一种使得学习效果较好的个性化学习模式——基于“蓝墨云”教育平台中视频资源学习时长、非视频资源学习个数、头脑风暴环节中表现较好以及课堂讨论答疑参与次数这四部分有效学习方式的叠加,在真实教学过程中使得学习者取得了较为理想的学习成绩。在这个过程中重点解决特征选择问题,例如:(1)通过对数据的分布以及相关标签的分析,需要使用Min-Max Scaling方法;(2)采用多模型试验,集成所有试验模型的结果进行综合分析,最终定板模型。

刘奕[4](2020)在《5G网络技术对提升4G网络性能的研究》文中研究说明随着互联网的快速发展,越来越多的设备接入到移动网络,新的服务与应用层出不穷,对移动网络的容量、传输速率、延时等提出了更高的要求。5G技术的出现,使得满足这些要求成为了可能。而在5G全面实施之前,提高现有网络的性能及用户感知成为亟需解决的问题。本文从5G应用场景及目标入手,介绍了现网改善网络性能的处理办法,并针对当前5G关键技术 Massive MIMO 技术、MEC 技术、超密集组网、极简载波技术等作用开展探讨,为5G技术对4G 网络质量提升给以了有效参考。

张双[5](2020)在《大数据对新产品开发决策支持关系的研究 ——以华为手机新产品开发为例》文中指出当今是大数据时代,商业环境是快速变化的。在一个高度竞争的环境下,企业需要更优化的新产品开发能力,以便快速响应客户需求。大数据正在改变NPD的过程,越来越多的企业或组织在大力投资大数据能力,以提升利用信息的能力。另一方面,随着大数据分析技术的发展,越来越多的研究结合了大数据分析理论和新产品开发理论,研究方向包括基于大数据的新产品开发决策支持系统(DSS)的构建、基于大数据分析的市场分析等,其中对决策支持系统的研究多集中于计算机科学领域。此外,一些研究更关注大数据为企业新产品开发带来了哪些变化与影响,还有一些研究定性的整理和分析了大数据分析方法对新产品开发决策的支持作用。本文将通过问卷调查,多元统计分析等方法,来实证研究大数据分析方法对新产品开发的决策支持关系。首先,本文通过广泛的文献阅读,基于我国学者对新产品开发决策阶段的划分方式,论证了数据质量管理、数据挖掘、多元统计分析、时间序列分析、知识发现可以支持新产品开发决策,而且不同决策阶段使用的大数据分析方法不同;然后,本文根据理论研究,提出了12个关于大数据分析对不同新产品开发阶段的决策支持关系的假设,并构建了其理论关系模型。接着,本研究以华为手机新产品开发为研究对象,收集了来自华为终端产品线的186份有效调查问卷,并采用SPSS24.0进行了相关分析和多元回归分析,验证了各变量之间的相关关系,以及12个假设的成立情况。此外,本研究根据实证分析的结果,分析了假设成立与不成立的可能原因,并根据结果修正了构建的大数据分析对新产品开发决策的支持关系模型。最后,在实证分析的基础上,结合研究中存在的问题,本文提出了本研究的局限性,并对后续的研究提出了展望和建议。

李蒙[6](2019)在《基于校园大数据的学生行为挖掘方法应用研究》文中指出随着大数据时代的到来,教育信息化取得了快速发展,各个高校的数字化校园建设正在稳步推进并逐渐完善。学校的一卡通系统、无线校园网络、教务考勤系统、学生管理系统等各种应用系统已相继建成,而这些应用系统每天都在产生大量的数据,这些丰富的数据资源为教育大数据挖掘提供了坚定的基础。大数据对高校教育的变革作用不断凸显,在提升学校教育管理质量、教学质量和完善教育成果评价等方面发挥着自己独特的优势。在此背景下,本文以LG高校的学生为研究对象,通过采集数字化校园平台中各种应用的数据,运用K-means算法和Apriori算法进行大数据挖掘处理,来分析大学生校园行为特征与学习效果之间的关系,以便为在校大学生的教育管理与学习能力提高提供经验证据。论文首先从学生的学习习惯、生活习惯、消费习惯三个方面构建了学生的在校行为特征指标。从三个方面分析了学生在校行为的特征,使用聚类分析中的K-means算法对这三个方面的数据进行数据挖掘,得到了五种消费习惯类型、三种生活习惯类型、四种学习习惯类型的学生行为特征分布。根据聚类结果对这些不同类型的学生进行了详细的分析,发现了学生经济能力低的群体问题、学生上网时间过长的问题、图书借阅数量太低等问题,并根据这些问题的特点为老师和学校提供给有针对性的管理建议。然后,利用学生的学业课程成绩和实践创新活动成绩等信息运用主成分分析法构建了学生综合素质指标,并通过Apriori关联规则算法对学生的在校行为特征与学生综合素质进行挖掘,得到学生行为规律与学生综合素质之间的关联关系,分析其中的与研究主题相关的关联规则可以看出,学生越是拥有良好的生活习惯和学习习惯,则学生的综合素质水平越高,反之则亦然。最后,实现了基于Hadoop的学生行为分析系统,能够对学生进行综合画像分析、综合预警分析、精准自助分析,为学生、管理老师和学校相关管理部门提供学生的学习、消费等多方面的在校行为分析,有助于提升学校的管理和决策效率。本文的研究为改善学校的管理工作和提高教学工作质量提供了一定的数据支撑,利用挖掘结果对学生的在校管理政策制定提供了借鉴和参考,并给老师提供学生的个性特点信息,并辅助信息化的教学模式,有利于提高老师的教学成果。也能够为学校制定合理的相关管理政策,推进管理精准化和决策科学化提供参考价值。

张玉娇[7](2019)在《基于循证的中药性效数据挖掘方法评价研究》文中研究指明目的:通过对国内数据挖掘方法在中药性效研究中应用的文献进行收集整理,采用循证方法对中药性效数据挖掘的文献进行统计分析,并将中药性效数据挖掘方法的比较结果直观化和客观化,以期为数据挖掘方法在中医药信息挖掘中的应用提供借鉴和启示。方法:电子检索CNKI(中国知网学术文献总库)、VIP(维普中文科技期刊全文数据库)、WanfangData(中国万方数据文献总库),检索时间范围为建库至2017年9月9日,检索词为主成分分析法、因子分析法、贝叶斯网络等52种数据挖掘方法的不同表述以及中药性效、中药药性、中药功效,检索语言限定为中文,将检索到的文献导入NoteExpress软件中建立文献数据库,对数据挖掘名称进行规范化,并通过数理统计方法分别对纳入文献的基本特征、应用趋势规律、应用内容分布及应用到的数据挖掘软件和基本功能进行归纳总结。根据预先设定好的纳入排除标准对文献进行筛选,再根据设计好的数据提取表格提取基本数据及重要信息,文献筛选和数据提取均由两人独立平行进行,对存在争议的数据则寻求第三方协助判定。并采用Excel 2016和Stata 15.0软件对提取的资料进行分析和系统评价,采用比值比OR(odd ratio,OR)值作为效应指标,对数据挖掘方法在中药寒热药性判别中的应用效果进行评估,并分别使用随机效应模型和固定效应模型进行敏感性分析。通过数理统计方法对数据挖掘方法在单味中药功效预测和中药复方功效预测中的应用效果进行分析,明确研究类型及研究对象,根据设定好的纳入标准和排除标准对文献进行筛选,并根据设计好的数据提取表格提取信息,文献筛选和数据提取均由两人独立平行进行,对存在争议的数据则寻求第三方协助判定。分别对相关文献的数据挖掘方法、建模依据、预测有效率等内容进行统计分析。结果:数据挖掘方法在中药性效挖掘中的应用数量最多的为关联规则、聚类分析、主成分分析等,且从2000年到2018年数据挖掘在中药性效研究领域发布的文献数量呈逐年递增趋势,尤其是2015年之后增长速度尤快,文献质量也不断提升,涉及方面也愈加广泛。中药寒热药性判别方面,经Meta分析,“支持向量机”和“回归判别分析”预测效果比较,总预测准确率为(OR=1.74,95%CI:1.132.68);“支持向量机”和“主成分线性判别分析”比较组合并OR值为1.47>1,95%CI(0.95,2.25),P=0.081>0.05。“支持向量机”和“最小二乘法判别分析”比较组合并OR值为1.15>1,95%CI(0.75,1.77),P=0.512>0.05);“回归判别分析”和“主成分线性判别分析”比较组合并OR值为1..19>1,95%CI(0.77,1.83),P=0.440>0.05;“回归判别分析”和“最小二乘法判别分析”合并OR值为1.51>1,95%CI(0.982.32),P=0.063>0.05;“主成分线性判别分析”和“最小二乘法判别分析”合并OR值为1.27>1,95%CI(0.83,1.95),P=0.275>0.05,剩余两组因异质性较大放弃合成。数据挖掘在功效预测方面常用到的数据挖掘方法有神经网络和贝叶斯网络,目前发现神经网络已被用于单味中药功效预测和复方功效预测中,贝叶斯网络只应用于了单味中药功效预测。功效预测常用的建模依据通常为药理指标、归经、功效、主治、剂量等,目前文献报道中所建的模型预测率均较高。结论:目前已有较多数据挖掘方法投入中药性效研究应用中,预测准确率较高,在该研究领域中适用性较强。已报道的研究主要集中在寒热药性判别方面,支持向量机在寒热药性判别应用中应用结果比较突出,其他统计到的可进行比较的数据挖掘方法在此方面应用效果的比较结果相当,均无明显差异。目前报道的中药功效预测方面的研究相对较少,主要应用的挖掘方法为贝叶斯网络和神经网络,预测准确率均较高;其中神经网络对于单味中药功效预测和中药复方功效预测均适用,成为目前功效预测研究中首要选择的数据挖掘方法。由于此类研究数量不足,无法形成比较,随着证据的增多,研究将呈现出更多更为可靠的比较结果。

郭淑惠[8](2019)在《混合式培训中教师研修成绩的预测与应用研究》文中提出随着我国教育信息化的快速发展,信息技术应用水平的提高,各种教育数据快速增长,面对教育大数据,如何通过对教育数据进行分析,发现潜在的教育信息及教育规律,催生了学习分析技术及在教育领域进行数据挖掘的研究与应用。从目前的研究现状来看,对教育数据挖掘分析的研究正从概念层面走向分析与应用,在学业成绩预测和评价方面已经做了不少研究工作,但仍面临许多挑战。本研究通过构建基于学习行为的学业成绩预测模型,利用数据挖掘技术分析学习行为数据及学习成绩,为进一步进行优化学习过程提供数据支撑。本文应用数据挖掘的思想,以某地区中小学教师国家级培训计划(2016)-示范性网络研修与校本研修整合培训项目中参与培训的学员相关数据为研究对象,采用决策树,规则归纳,K-近邻,人工神经网络,朴素贝叶斯五种分类算法及线性回归算法构建预测模型,期望能为教师研修参与者及相关管理者提供决策支持。主要研究内容主要包括:(1)学业影响因素的选取,学业成绩影响因素的分析可以从多种视角考虑,比如从整个课程实施角度、学习者角度、教师角度等。在本研究中,主要从学习者角度出发,选取参与教师研修人员在教师研修平台上产生的行为数据及最终成绩构建学业成绩预测模型。(2)学习数据的收集及处理,大量的学习行为数据是进行教育数据挖掘和学习分析的基础,在学习过程中,学生使用网络平台过程中已将其学习行为数据记录下来,包括在线学习时长,论坛讨论情况,作业提交情况等。对所收集到的数据集进行转换、清理等一系列数据预处理操作细介绍,最后形成了 1534条规范的数据样本,确定用于成绩预测的学业行为属性,应用于预测模型的构建。(3)教育数据建模与分析,在建模研究中首先使用统计学方法,对数据集因素进行整体分析,其次是利用人工神经网络算法或决策树算法等预测分析算法完成对学业成绩的趋势预测研究。(4)学业成绩预测模型应用,构建了六个成绩预测模型的构建,在对每个算法概述的基础上,对预测模型的生成过程及预测结果进行了具体介绍。在构建的五个预测模型中,准确率最高的是基于决策树构建的预测模型,准确率最低的是基于朴素贝叶斯构建的预测模型。(5)对比五种分类预测模型的准确率及优缺点,综合考虑,选取人工神经网络模型作为预测工具模型,并使用python语言创建了成绩预测工具。研究结论为:通过构建并运行预测模型发现,在网络研修平台所采集的学习行为中,对总成绩影响较大的行为有优秀作业数、工作坊提交资源数与工作坊活动讨论数、合格作业数及课程学习数量,参与研修人员可根据其自身研修情况,对总成绩影响的重要学习行为,调整自己的学习策略以获得更好的研修效果,研修相关管理者及实施者可参考结果来调整研修实施方案,优化评测方式。论文的创新之处是:使用多种数据挖掘预测方法与教师研修中基于学业行为对学业成绩进行预测,发现对于研修最终成绩有重要影响的学习行为因素,可为教师研修项目相关参与者提供一定的决策参考。

丁国勇[9](2019)在《高校学生学业表现数据建模研究 ——基于A大学教育数据的分析》文中进行了进一步梳理高校教育数据挖掘是对高等学校大规模全样本教育数据的挖掘和分析的技术手段,具有能够辅助高校决策能力、管理效率和教学效果提升的高校治理价值。基于教育数据挖掘的技术手段,构建高校学生学业表现的数据模型,挖掘和利用高校教育数据的价值,有助于丰富学生发展理论和完善高校学生管理和学业支持体系。高校学生学业表现的研究具有可靠的实证研究的理论基础。本研究吸收了国内外关于高校学生学业表现的理论框架包括戴维·拉文的学业表现影响因素分析框架、阿斯廷的学生投入理论与I-E-O模型、乔治·库的学生投入理论与大学生成功要素模型,以及NSSE、CCSS、NCSS等调查研究方案的成果,构建出学校环境、社会及人口统计特征、学生个人特征、学生投入等四维度的高校学生学业表现影响因素分析框架。基于这个分析框架,对个案高校学生学业表现进行系统化的数据分析和数据挖掘,以揭示个案高校教育数据系统所存在的问题以及个案高校学生学业表现上所存在的问题。本研究采取个案研究的方法,重点在于揭示个案高校学生学业表现的独特情况和问题,但通过个案的分析,也有助于认识和分析具有普遍意义的高校学生学业表现的共同问题。本研究构建了整合型教育数据系统,采集教学管理信息系统数据以及学生学业表现的关联数据,进行数据的清洗、存储;运用描述性统计方法、方差分析方法分析学生学业表现的特征及差异性;分别从教学管理信息系统数据、整合型教育数据系统中的客观数据、整合型教育数据系统中的全部数据三种数据来源,从社会及人口统计特征、个人特征、学生投入等三个维度,运用多元线性回归、二元逻辑回归等传统统计方法构建回归模型,贝叶斯网络、决策树、人工神经网络、支持向量机等教育数据挖掘方法构建分类模型,并比较各模型有效性,提出高校学生学业表现预测模型的部署模式。研究结果显示,从社会及人口统计特征维度,学生学业表现存在性别差异、地区差异、民族差异。父母教育水平的不同不会带来学生学业表现的差异。从个人特征维度,学生学业表现也存在着科类差异;高考成绩与学生学业表现间存在一定的正相关;人格、学业自我效能、心理状态、体质测试、心理预警状态、学生干部和党员身份与学生学业表现都存在相关性。从学生投入维度,参加学术讲座、志愿服务、社团和利用图书馆资源与学生学业表现之间都存在着显着的正相关。就读体验与学生学业表现存在负相关。学业目标与学生学业表现呈正相关。通过对所构建的回归、分类共27个数据模型的比较发现,基于整合型教育系统中全部数据构建的模型最为有效。多元线性回归模型最高可解释学生学业表现65.4%的变异量;社会及人口统计特征维度变量的解释力约在13%到18%之间,个人特征维度变量的解释力在7%到20%之间,学生投入维度变量的解释力在10%到17%之间。二元逻辑回归模型最高预测正确率为69%。应用贝叶斯网络、决策树、人工神经网络、支持向量机等教育数据挖掘算法建立的12个分类模型,在运行时间、预测正确率、灵敏度等方面都存在差异。相对而言,贝叶斯网络分类模型和支持向量机分类模型的预测有效性要高于决策树分类模型和人工神经网络分类模型,贝叶斯网络分类模型的稳定性要高于支持向量机分类模型。通过自变量精简减少了 10个自变量,且未明显降低模型有效性。

谢莎莎[10](2018)在《基于数据挖掘的工程造价指数研究》文中研究指明面对当今大数据时代的冲击,各种纷繁复杂的建筑工程项目数据信息经过收集、整理、清洗、重组之后具备极大的利用价值,如何结合数据挖掘的方法用好这些宝贵资源,是实现工程造价行业可持续发展、实施信息化管理战略、加速造价服务行业转型的迫切需要。为了适应社会主义市场经济高速发展的需求,建设工程造价管理必须改变完全依靠政府发布的定额计价模式,在遵循政府发布的定额和调价规定的前提下,工程造价的确定需由企业根据市场情况以及自身生产和管理水平确定。本课题应用工程造价和统计学相关理论,在清单计价模式下设计出完整的造价指数测算系统,将数据挖掘理论应用于造价指数管理中,包括造价指数信息的筛选、测算、预测等方法,最后在此研究基础上设计了建筑工程造价指数信息平台。本课题对国内外有关造价指数测算方法及体系设置方面的文献进行了系统整理和分析,以期得到适用于我国信息化建设中建筑工程造价指数系统的建设方法。通过收集近年来典型工程的特征值,调研各城市造价指数的设置情况,建立了一套完整的指数测算系统、筛选系统及预测系统的数学模型。本课题对指数理论、数据挖掘理论、知识管理理论、BP神经网络、遗传算法进行了阐释并讨论了其适用范围和用于本课题的价值。分别针对北美地区及英国的指数体系设置和发布方法进行研究,对国内六个城市或省份地区进行了调研分析,结果表明,各城市指数体系差别较大,主要体现在以下三个方面:第一,发布形式不同。香港、重庆、深圳、成都为定基指数,而江西采取的是环比指数,天津既有定基指数又有环比指数。第二,发布机构不同。香港造价指数体系的设置与发布方式类似英国,由建筑署负责发布政府层次的造价指数,同时利比、威宁谢两大测量师行编制的投标价格指数也发挥着重要的作用,而我国内地工程造价指数主要由各省市地方政府编制并定期发布。第三,编制范围不同,香港造价指数编制成本指数和价格指数,我国内地造价指数编制单项指数和综合指数。本课题通过对国内外建筑工程造价指数测算体系研究,基于当前建筑市场特点,确定对建筑工程造价指数测算体系编制设计以清单计价模式为主。对建筑工程进行分类,提出主要对三大类指数进行编制,分别是建筑工程造价指数、建筑工程费用指数和建筑工程消耗量指数。本课题针对典型工程的样本筛选方法进行了研究。在进行建筑工程造价指数测算时,若将不同类型的工程造价信息杂糅在一起,则会使造价指数失去意义,因而选取典型建筑工程作为测算样本非常重要,在建筑功能、结构形式等进行划分之后再将同类工程汇总。根据建筑工程周期内样本稀少、影响因素众多的特征,在筛选典型工程的过程中,本课题采集了100个建筑工程信息,采取了“专家评选法”、“灰色关联法”、“T检验法”与“决策树法”,首先用“专家评选法”进行样本特征值的初选,选取了有价值的特征值,然后用“灰色关联法”完善“专家评选法”的结论,确定八个特征值,接着用“T检验法”进行筛选,原定的八个特征属性中工程地点、层高、结构类型这三个特征属性对工程造价的影响不显着,因此被剔除,最后引入决策树模型补充T检验法仅能检验因变量而无法检验样本本身的不足。将四种方法相结合,从初选到完善,提高筛选的精度。本课题研究了造价指数的测算模型。测算信息的采集方式主要为人工采集法,选取大量的行业内资深信息员对工程信息进行统计与上报,通过审核的工程信息可进入系统数据。针对造价信息的采集方式、发布方式进行了研究,并针对信息员采集方式设计了完整的信息采集表。从两方面对造价指数进行调整,其一,在典型工程相应的消耗量给定情况下,对典型工程重新组价,可以得到相应的指数和指标;其二,在我国由于建筑材料需要市场采购的范围越来越大,主要建筑材料如钢材、木材、水泥等的价格对工程造价的影响很大,因此,本课题利用调值公式对相应的材料指数进行调整。本课题对建筑工程造价指数的预测进行了研究。由于受建筑工程样本特征值缺失和样本数量较少的影响,在预测未来造价指数时单纯使用BP神经网络具有局限性,会降低预测的准确性和精度,需要结合建筑工程样本特点,对原始BP神经网络进行改进,最佳方法是结合适用于样本数量较少的灰色预测模型。课题以武汉市建筑工程中高层住宅及公寓(含商住楼)项目(12层以上)为例,进行建筑工程造价指数预测的实证分析。案例选取对建筑工程造价影响较大的人工、材料、施工机具费用指数进行造价指数的分析与预测,收集了从2014年第3季度到2016年第4季度各项价格及建筑工程总价指数数据信息。通过计算证明,经过基于遗传算法优化的GA-BP神经网络模型进行建筑工程造价指数的预测精度达97%左右,对建设项目投资决策有着较为关键的参考意义。最后,本课题对建筑工程造价指数平台信息采集系统进行了研究。课题设计了信息采集系统,由平台使用者在采集平台上收集建筑工程核心造价信息,建立地区工程造价信息数据库。通过系统数据清洗、审核、加工服务,最终由地方造价站在发布展示平台按标准要求定期向社会发布建筑工程指标指数,以提升造价管理的效率和服务水平。

二、多元统计分析在数据挖掘中的作用(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、多元统计分析在数据挖掘中的作用(论文提纲范文)

(1)基于深度学习的结构外观病害检测与监测数据挖掘(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 桥梁维护管理现状
        1.1.1 桥梁维护管理现状及意义
        1.1.2 桥梁检测评估
        1.1.3 结构健康监测
    1.2 结构维护管理与大数据技术融合发展的趋势
        1.2.1 大数据背景技术
        1.2.2 融合发展的需求
    1.3 传统数据挖掘方法
        1.3.1 数据挖掘主要解决的四类问题
        1.3.2 数据挖掘经典算法
    1.4 深度学习的发展
        1.4.1 深度学习相关领域学科关系
        1.4.2 深度学习5 种常见网络类型
    1.5 深度学习在土木工程中的应用
        1.5.1 一维数据
        1.5.2 二维数据
        1.5.3 多维数据
    1.6 本文研究目标与研究内容
        1.6.1 研究思路及内容
        1.6.2 论文结构安排及创新点
第2章 基于深度学习和Zernike正交矩的裂缝分割及宽度测量
    2.1 基于数字图像处理的裂缝检测
        2.1.1 传统裂缝分割方法及其局限性
        2.1.2 传统裂缝宽度测量方法及其局限性
    2.2 基于多尺度深度学习的裂缝分割
        2.2.1 整体思路
        2.2.2 GoogLeNet网络结构
        2.2.3 深度残差网络结构
        2.2.4 基于深度学习的裂缝定位及初始分割
        2.2.5 基于深度学习的裂缝精细化分割
    2.3 基于Zernike正交矩的裂缝宽度测量
        2.3.1 正交矩宽度测量原理
        2.3.2 原理误差补偿
        2.3.3 裂缝宽度测量数值计算步骤
    2.4 实验验证
        2.4.1 裂缝定性检测
        2.4.2 裂缝自动勾画
        2.4.3 裂缝宽度测量
    2.5 本章小结
第3章 基于多尺度特征融合网络的像素级裂缝分割
    3.1 多尺度特征融合网络
        3.1.1 特征提取网络及特征可视化
        3.1.2 像素级特征融合
        3.1.3 连续全卷积层
        3.1.4 损失函数
    3.2 两种策略搭建特征融合网络
        3.2.1 自下而上的融合策略
        3.2.2 自上而下的融合策略
    3.3 不同尺度特征影响分析
        3.3.1 搭建数据库
        3.3.2 特征影响直观分析
        3.3.3 训练过程对比分析
    3.4 其他网络参数影响分析
        3.4.1 全卷积层参数影响分析
        3.4.2 特征提取层参数影响分析
    3.5 模型测试结果与讨论
        3.5.1 不同区间测试样本分析
        3.5.2 完整图像裂缝检测
    3.6 本章小结
第4章 基于对抗深度学习增强的轻量级裂缝检测网络
    4.1 轻量级网络优化方法
        4.1.1 生成对抗网络的发展
        4.1.2 基于生成对抗的距离
        4.1.3 轻量化网络结构设计
        4.1.4 对抗分支网络
    4.2 网络训练与对比分析
        4.2.1 考虑模糊的数据集增强
        4.2.2 网络优化策略
        4.2.3 提出方法和传统FCN对比分析
        4.2.4 对抗策略对不同网络影响分析
    4.3 实桥裂缝检测
    4.4 本章小结
第5章 基于一维卷积网络的健康监测异常数据检测
    5.1 健康监测常见异常数据
        5.1.1 数据异常检测的意义
        5.1.2 异常数据类型
    5.2 传统数据异常检测方法及其局限性
        5.2.1 基于单个传感器数据的异常检测
        5.2.2 基于多元统计分析的异常检测
        5.2.3 基于深度学习的异常检测
        5.2.4 传统方法的局限性
    5.3 基于一维卷积网络的数据异常检测方法
        5.3.1 一维卷积网络框架
        5.3.2 损失函数
        5.3.3 Adam优化策略
    5.4 江阴大桥吊杆监测数据异常检测
        5.4.1 数据集准备
        5.4.2 网络训练及参数设置
        5.4.3 基于T-SNE降维的特征分析
        5.4.4 长期监测数据异常识别结果
    5.5 本章小结
第6章 基于卷积自编码网络的长期监测数据压缩
    6.1 传统数据压缩技术
        6.1.1 无损压缩
        6.1.2 有损压缩
    6.2 卷积自编码网络结构
        6.2.1 研究框架
        6.2.2 重建网络
        6.2.3 损失函数
    6.3 江阴大桥吊杆长期监测数据压缩
        6.3.1 数据集准备
        6.3.2 网络训练及参数设置
        6.3.3 压缩率对重建精度影响分析
        6.3.4 与传统数据压缩方法对比
        6.3.5 长期监测数据压缩结果
    6.4 本章小结
第7章 全文总结与展望
    7.1 本文主要成果与创新
    7.2 后续工作展望
参考文献
个人简历、在读期间发表学术论文与研究成果
致谢

(2)贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用(论文提纲范文)

中文摘要
Abstract
前言
1 绪论
    1.1 研究背景
    1.2 研究目的及意义
    1.3 国内外研究现状
        1.3.1 贝叶斯网络技术应用于中医诊断的研究
        1.3.2 贝叶斯网络技术应用于方剂的研究
        1.3.3 贝叶斯网络技术应用于中药的研究
        1.3.4 贝叶斯网络技术应用于中医证候的研究
    1.4 论文的组织结构
2 《伤寒论》的相关知识
    2.1 《伤寒论》一书的介绍
    2.2 《伤寒论》阳明病篇的介绍
3 贝叶斯网络的介绍
    3.1 贝叶斯网络的定义
    3.2 贝叶斯网络的结构
4 研究的材料与方法
    4.1 数据收集
    4.2 数据的整理与规范
        4.2.1 方剂的规范化与频次计数说明
        4.2.2 中药的规范化与频次计数说明
        4.2.3 症状的规范化与频次计数说明
    4.3 质量控制及数据挖掘方法
5 结果
    5.1 中药、方剂频次和贝叶斯网络模型
    5.2 症状频次和贝叶斯网络模型
    5.3 中药与症状间的贝叶斯网络模型
    5.4 方剂与症状间的贝叶斯网络模型
6 讨论
    6.1 方药分布规律
    6.2 症状分布规律
    6.3 中药与症状间的分布规律
    6.4 方剂与症状间的分布规律
    6.5 小结
7 结论与展望
参考文献
综述
    参考文献
致谢
个人简介

(3)基于蓝墨云的数据分析在大学生个性化学习模式中的应用研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 研究现状
        1.2.1 个性化学习研究现状
        1.2.2 教育数据分析研究现状
        1.2.3 研究现状总结
    1.3 研究意义
        1.3.1 理论意义
        1.3.2 实践意义
    1.4 研究内容与研究方法
        1.4.1 研究内容
        1.4.2 研究方法
    1.5 本章小结
第2章 相关理论概念界定
    2.1 个性化学习模式
    2.2 学习行为数据
    2.3 人本主义学习理论
    2.4 多元智力理论
    2.5 相关技术
        2.5.1 数据分析
        2.5.2 回归分析模型
        2.5.3 特征选择技术
        2.5.4 特征选择方法
        2.5.5 基于统计信息的特征选择
        2.5.6 基于机器学习的特征选择
        2.5.7 Xgboost
    2.6 本章小结
第3章 基于蓝墨云的课堂学习行为数据分析
    3.1 蓝墨云功能简述
    3.2 数据分析方法
        3.2.1 探索性数据分析
        3.2.2 定性数据分析
        3.2.3 离线数据分析
        3.2.4 在线数据分析
    3.3 行为数据分析
        3.3.1 行为数据分析步骤
        3.3.2 行为数据分析方法
        3.3.3 基于蓝墨云的学习行为数据分析
    3.4 本章小结
第4章 《教育题材影视片赏析》特征选择数据分析的个性化学习模式探究
    4.1 课程数据特征处理
        4.1.1 全量数据特征处理
        4.1.2 行为数据特征处理
    4.2 课程数据的特征选择和分析
        4.2.1 基于统计信息的特征选择
        4.2.2 基于机器学习的特征选择
    4.3 基于行为数据分析的个性化学习模式应用
    4.4 本章小节
第5章 总结与展望
    5.1 总结
    5.2 不足与展望
参考文献
附录 基于纯粹学习行为数据的特征选择实验代码
攻读学位期间发表的论文和研究成果
致谢

(4)5G网络技术对提升4G网络性能的研究(论文提纲范文)

引言
1 4G网络现处理办法
2 4G网络可应用的5G关键技术
    2.1 Msssive MIMO技术
    2.2 极简载波技术
    2.3 超密集组网
    2.4 MEC技术
3 总结

(5)大数据对新产品开发决策支持关系的研究 ——以华为手机新产品开发为例(论文提纲范文)

摘要
ABSTRACT
缩略语对照表
第一章 绪论
    1.1 研究背景
        1.1.1 大数据时代下的新产品开发
        1.1.2 信息不完全性影响新产品开发决策
        1.1.3 大数据影响新产品开发决策
        1.1.4 从我国企业新产品开发的现实情况看
    1.2 研究目的与意义
        1.2.1 理论意义
        1.2.2 现实意义
    1.3 国内外研究综述
        1.3.1 NPD及其决策点研究
        1.3.2 大数据对NPD决策的支持
        1.3.3 简要评述
    1.4 研究对象、内容与方法
        1.4.1 研究对象
        1.4.2 研究内容
        1.4.3 研究方法
    1.5 研究思路与框图
第二章 相关理论基础
    2.1 大数据相关概念
        2.1.1 大数据的概念
        2.1.2 大数据的特征
        2.1.3 大数据分析方法
        2.1.4 大数据带来的变革
    2.2 新产品开发及决策
        2.2.1 新产品开发
        2.2.2 新产品开发阶段划分
        2.2.3 新产品开发决策
    2.3 大数据分析对新产品开发决策的支持
第三章 大数据对新产品开发决策支持的理论模型
    3.1 研究假设
        3.1.1 概念阶段
        3.1.2 立项阶段
        3.1.3 设计阶段
        3.1.4 样品试制阶段
        3.1.5 市场阶段
    3.2 理论模型
第四章 问卷调查与数据分析
    4.1 变量的操作性定义与衡量
    4.2 数据收集和样本特征
        4.2.1 数据收集
        4.2.2 描述性统计分析
    4.3 信度分析
        4.3.1 大数据分析方法变量信度分析
        4.3.2 新产品开发决策点变量信度分析
    4.4 效度分析
        4.4.1 大数据分析方法效度分析与因子分析
        4.4.2 新产品开发决策效度分析与因子分析
    4.5 相关分析
    4.6 多元回归分析
        4.6.1 概念阶段
        4.6.2 立项阶段
        4.6.3 设计阶段
        4.6.4 试制阶段
        4.6.5 市场阶段
    4.7 假设检验结果汇总
第五章 假设检验结果讨论
    5.1 研究中各要素之间关系的讨论
        5.1.1 大数据分析对概念阶段决策的支持关系
        5.1.2 大数据分析对立项阶段可行性决策的支持关系
        5.1.3 大数据分析对设计阶段决策的支持关系
        5.1.4 大数据分析对试制阶段决策的支持关系
        5.1.5 大数据分析对市场阶段促销决策的支持关系
    5.2 研究结果讨论与模型修正
第六章 研究结论、管理启示与研究展望
    6.1 研究结论
    6.2 管理启示
        6.2.1 大数据时代对新产品开发决策带来深刻影响和变革
        6.2.2 具体的建议
    6.3 研究不足
    6.4 研究展望
附录 大数据对新产品开发决策支持关系研究的调查问卷
参考文献
致谢
作者简介

(6)基于校园大数据的学生行为挖掘方法应用研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 论文研究内容及结构
    1.4 本章小结
第二章 数据挖掘技术理论基础
    2.1 数据挖掘概述
    2.2 数据挖掘过程
    2.3 数据挖掘方法
    2.4 数据挖掘的常用工具
    2.5 本章小结
第三章 学生行为特征指标与综合素质指标构建
    3.1 问题描述
    3.2 数据来源
    3.3 数据集成与预处理
    3.4 学生行为特征指标构建
    3.5 学生综合素质衡量指标的构建
        3.5.1 指标选取
        3.5.2 主成分分析法
        3.5.3 样本选取与数据处理
    3.6 本章小结
第四章 学生行为特征与综合素质的数据挖掘
    4.1 基于K-means的学生行为特征聚类分析
        4.1.1 K-meams算法
        4.1.2 数据选取与数据处理
        4.1.3 基于K-means算法的学生行为聚类分析
    4.2 基于Apriori算法的学生行为与综合素质的关联分析
        4.2.1 Apriori算法
        4.2.2 数据选取与数据处理
        4.2.3 基于Apriori算法的关联分析
    4.3 本章小结
第五章 学生行为分析在综合预警与精准资助工作中的应用
    5.1 建设背景
    5.2 环境搭建
    5.3 数据的选择与预处理
    5.4 学生行为分析系统架构设计与关键技术
    5.5 学生行为分析系统功能结构
    5.6 学生综合画像
    5.7 综合预警分析
    5.8 精准资助分析
    5.9 本章小结
第六章 总结与展望
    6.1 主要工作与结论
        6.1.1 主要工作
        6.1.2 研究结论
    6.2 研究展望
参考文献
致谢
作者简介

(7)基于循证的中药性效数据挖掘方法评价研究(论文提纲范文)

致谢
中文摘要
abstract
注释表
引言
1 中药性效数据挖掘方法与循证科学的概述
    1.1 常用中药性效数据挖掘方法的研究现状
    1.2 常用中药性效数据挖掘方法
        1.2.1 支持向量机
        1.2.2 回归判别分析
        1.2.3 主成分线性判别分析
        1.2.4 偏最小二乘法判别分析
        1.2.5 随机森林模型
        1.2.6 线性判别分析
        1.2.7 人工神经网络
    1.3 中药性效数据挖掘方法的联合应用
        1.3.1 主成分分析与人工神经网络的联用
        1.3.2 粗糙集与支持向量机的联用
        1.3.3 主成分分析与支持向量机的联用
    1.4 循证科学及其应用简介
    1.5 研究目的和意义
2 数据挖掘在中药性效方面应用分布规律研究
    2.1 文献资料
        2.1.1 资料来源
        2.1.2 检索方法
        2.1.3 检索策略的确定
        2.1.4 挖掘方法名称的规范
    2.2 分析方法
    2.3 研究结果
        2.3.1 纳入文献的特征
        2.3.2 应用趋势分析
        2.3.3 应用内容分布
        2.3.4 其他应用分布
    本章小结
3 数据挖掘方法在中药寒热药性判别方面的系统评价
    3.1 文献纳入标准
        3.1.1 研究对象
        3.1.2 研究类型
    3.2 评价的结局指标
    3.3 文献排除标准
    3.4 文献的检索策略
    3.5 系统评价方法
        3.5.1 资料提取
        3.5.2 质量评价
        3.5.3 统计方法
    3.6 软件优化
    3.7 系统评价结果
        3.7.1 文献检索结果
        3.7.2 文献研究特征
        3.7.3 文献质量评价
        3.7.4 数据挖掘方法在中药寒热药性判别方面的Meta分析结果
    3.8 敏感性分析
    本章小结
4 中药功效预测数据挖掘方法的系统评价
    4.1 文献纳入标准
        4.1.1 研究类型
        4.1.2 研究对象
    4.2 文献排除标准
    4.3 评价的结局指标
    4.4 系统评价结果
        4.4.1 单味中药功效预测数据挖掘方法的评价结果分析
        4.4.2 中药复方功效预测数据挖掘方法的评价结果分析
    本章小结
5 讨论与展望
    5.1 讨论
    5.2 结论
    5.3 展望
参考文献
附录:攻读硕士学位期间取得的学术成果
个人简介
答辩委员会名单

(8)混合式培训中教师研修成绩的预测与应用研究(论文提纲范文)

摘要
Abstract
1. 绪论
    1.1 研究背景
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 研究目的及意义
        1.3.1 理论意义
        1.3.2 实践意义
    1.4 研究内容及组织结构
        1.4.1 研究内容
        1.4.2 论文组织结构
    1.5 本章小结
2. 相关研究基础
    2.1 学习分析技术概述
    2.2 教育数据挖掘相关理论
        2.2.1 数据挖掘概述
        2.2.2 教育数据挖掘
        2.2.3 数据挖掘过程
    2.3 分类算法
        2.3.1 决策树
        2.3.2 直接规则归纳算法
        2.3.3 K-近邻算法
        2.3.4 人工神经网络算法
        2.3.5 朴素贝叶斯算法
    2.4 教师研修相关概述
    2.5 本章小结
3. 教师研修中学习行为的数据采集与分析
    3.1 数据采集
    3.2 数据统计分析
        3.2.1 数据分类
        3.2.2 数据描述性统计分析
    3.3 学习行为特征选择
    3.4 学习行为与成绩相关分析
    3.5 本章小结
4. 基于数据挖掘的学业成绩预测模型构建
    4.1 基于决策树算法的学业成绩预测模型构建
        4.1.1 基于决策树的学业成绩预测模型概述
        4.1.2 基于决策树算法学业成绩预测模型构建
        4.1.3 运行决策树模型并分析
    4.2 基于直接规则归纳算法的学业成绩预测模型构建
        4.2.1 基于直接规则归纳算法的学业成绩预测模型概述
        4.2.2 基于直接规则归纳算法的学业成绩预测模型构建
        4.2.3 运行模型及结果分析
    4.3 基于人工神经网络的学业成绩预测模型
        4.3.1 基于人工神经网络算法的学业成绩预测模型概述
        4.3.2 基于人工神经网络算法的学业成绩预测模型构建
        4.3.3 运行模型并分析
    4.4 基于朴素贝叶斯算法的学业成绩预测模型
        4.4.1 基于朴素贝叶斯算法的学业成绩预测模型概述
        4.4.2 基于朴素贝叶斯算法的学业成绩预测模型构建
        4.4.3 运行模型流程及结果分析
    4.5 基于K近邻算法的学业成绩预测模型
        4.5.1 基于K近邻算法的学业成绩预测模型概述
        4.5.2 基于K近邻算法的学业成绩预测模型构建
        4.5.3 运行模型及结果分析
    4.6 基于线性回归算法的学业成绩预测模型构建
        4.6.1 线性回归算法概述
        4.6.2 基于线性回归算法的学业成绩预测模型构建
    4.7 结论与建议
    4.8 本章小结
5 学业成绩预测工具的设计与开发
    5.1 选择学业成绩预测模型
    5.2 成绩预测工具设计
    5.3 成绩预测工具开发
        5.3.1 开发平台
        5.3.2 基于BP算法的人工神经网络python实现
        5.3.3 图形用户界面python实现及程序打包发布
    5.4 本章小结
6 总结与展望
    6.1 论文总结
    6.2 研究不足与展望
参考文献
致谢

(9)高校学生学业表现数据建模研究 ——基于A大学教育数据的分析(论文提纲范文)

摘要
Abstract
绪论
    一、问题提出及研究意义
        (一) 问题提出
        (二) 研究意义
    二、国内外研究现状及趋势
        (一) 关于学生学业表现的研究
        (二) 关于教育数据挖掘的研究
        (三) 关于教学管理信息系统的研究
    三、研究目标与概念界定
        (一) 研究目标
        (二) 概念界定
    四、研究方法与技术路线
        (一) 研究方法
        (二) 技术路线
第一章 高校学生学业表现的理论支撑与现实问题
    第一节 高校学生学业表现的研究模型
        一、戴维·拉文的学业表现影响因素分析框架
        二、亚历山大·阿斯廷的I-E-0模型与学生投入理论
        三、乔治·库的大学生成功要素模型与NSSE调查
        四、清华大学的中国大学生学习与发展调查(CCSS)
        五、厦门大学的国家大学生学习情况调查(NCSS)
    第二节 影响高校学生学业表现的因素分析
        一、社会及人口统计特征对学业表现的影响
        二、学校环境对高校学生学业表现的影响
        三、个人特征对高校学生学业表现的影响
        四、学生投入对学业表现的影响
    第三节 高校学生学业表现的现实问题
        一、高等教育扩张中学生群体的多样化与学业严重分化问题
        二、高校学生的学业投入不足与学业困惑问题
        三、高校对大学生学业的教学和管理支持体系构建的问题
第二章 高校学生学业表现的研究设计
    第一节 高校学生学业表现的影响因素与研究框架
        一、高校学生学业表现的影响因素
        二、高校学生学业表现的研究框架
    第二节 高校学生学业表现的建模流程与数据理解
        一、高校学生学业表现的建模流程
        二、高校学生学业表现的数据理解
    第三节 高校学生学业表现的研究方法与研究工具
        一、高校学生学业表现的研究方法
        二、高校学生学业表现的研究工具
第三章 A大学学生学业表现的数据准备
    第一节 A大学教学管理信息系统中的数据
        一、A大学教学管理信息系统的历史与发展
        二、A大学教学管理信息系统的结构与功能
        三、A大学教学管理信息系统的数据及特征
    第二节 A大学学生学业表现的关联数据
        一、A大学学生学业表现相关管理信息系统数据
        二、A大学学生学业表现问卷调查数据
    第三节 A大学整合型教育数据系统的构建
        一、整合型教育数据系统的概念与结构
        二、整合型教育数据系统的设计与实施
    第四节 A大学学生学业表现的数据采集与处理
        一、A大学学生学业表现的数据采集
        二、A大学学生学业表现的数据处理
第四章 A大学学生学业表现的现状分析
    第一节 A大学学生学业表现的总体特征
        一、A大学学生基本特征分析
        二、A大学学生学业表现的统计特征
        三、A大学学生学业表现的划分
    第二节 A大学学生学业表现的差异分析
        一、基于社会及人口统计特征的学业表现差异分析
        二、基于个人特征的学业表现差异分析
        三、基于学生投入的学业表现差异分析
    第三节 A大学学生学业表现的趋势分析
        一、A大学学生学业表现的总体趋势
        二、A大学不同群体学生学业表现的变化趋势比较
        三、A大学特殊群体的学业表现变化趋势分析
第五章 A大学学生学业表现的数据建模
    第一节 A大学学生学业表现的回归模型
        一、A大学学生学业表现回归模型的数据预处理
        二、A大学学生学业表现的多元线性回归模型
        三、A大学学生学业表现的二元逻辑回归模型
        四、A大学学生学业表现回归模型的有效性比较
    第二节 A大学学生学业表现的分类模型
        一、A大学学生学业表现分类模型的数据预处理
        二、A大学学生学业表现的贝叶斯网络分类模型
        三、A大学学生学业表现的决策树分类模型
        四、A大学学生学业表现的人工神经网络分类模型
        五、A大学学生学业表现的支持向量机分类模型
        六、A大学学生学业表现分类模型的有效性比较
    第三节 A大学学生学业表现数据模型的优化与部署
        一、A大学学生学业表现数据模型的优化
        二、A大学学生学业表现数据模型的部署
第六章 研究结论与研究反思
    第一节 研究讨论
        一、高校学生学业表现的差异性、相关性及变化趋势
        二、高校学生学业表现的数据模型及有效性
    第二节 管理对策
        一、完善高校学生学业支持体系
        二、提升高校教育数据挖掘能力
    第三节 研究的可能创新之处及不足
        一、研究的可能创新之处
        二、研究的不足
参考文献
在读期间研究成果
后记

(10)基于数据挖掘的工程造价指数研究(论文提纲范文)

中文摘要
Abstract
第1章 导论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 工程造价指数方面
        1.2.2 数据挖掘方面
        1.2.3 知识管理方面
        1.2.4 研究现状评述
    1.3 研究思路和研究方法
        1.3.1 研究思路
        1.3.2 研究技术路线
        1.3.3 研究方法
    1.4 拟解决的关键问题和创新点
        1.4.1 研究的关键问题
        1.4.2 论文创新点
第2章 理论综述
    2.1 指数理论分析
        2.1.1 指数的定义
        2.1.2 指数的作用
        2.1.3 统计指数体系及分类
        2.1.4 指数的编制原则和方法
    2.2 建筑工程造价指数的含义及其特性
        2.2.1 建筑工程造价指数的概念
        2.2.2 建筑工程造价指数包含的内容及其特征分析
    2.3 数据挖掘理论
        2.3.1 数据挖掘理论概述
        2.3.2 数据预处理与数据仓库实现
        2.3.3 数据挖掘的类型与方法
        2.3.4 数据挖掘在工程造价指数信息化管理研究中的应用
    2.4 知识管理理论
        2.4.1 知识管理的定义
        2.4.2 知识管理的流程
        2.4.3 知识管理系统
        2.4.4 知识管理理论在工程造价指数信息化管理研究中的应用
    2.5 BP神经网络
        2.5.1 BP神经网络概述
        2.5.2 BP神经网络结构及算法
        2.5.3 BP神经网络的结构设计与参数选取
        2.5.4 BP神经网络的性能分析
    2.6 遗传算法
        2.6.1 遗传算法的基本概述
        2.6.2 遗传算法的基础理论
        2.6.3 遗传算法的特点
第3章 建筑工程造价指数测算体系的建立
    3.1 国内外建筑工程造价指数体系
        3.1.1 国外发展现状
        3.1.2 国内发展现状
    3.2 建筑工程造价指数典型工程及投入品的选择
    3.3 建筑工程造价指数权数及基期的选择
    3.4 建筑工程造价指数编制范围的确定
第4章 典型建筑工程样本信息筛选模型研究
    4.1 样本信息筛选的意义及目标
    4.2 样本信息数据筛选模型选择与建立
        4.2.1 专家评选法
        4.2.2 灰色关联法
        4.2.3 T检验法
        4.2.4 “决策树”模型
        4.2.5 多元线性回归模型
    4.3 样本筛选模型的实证检验
        4.3.1 分类变量标准化
        4.3.2 t检验结果分析
        4.3.3 构建决策树模型
第5章 建筑工程造价指数测算模型研究
    5.1 建筑工程造价指数测算信息的采集
        5.1.1 造价信息采集-发布流程
        5.1.2 工程造价信息采集方式
        5.1.3 建筑工程造价信息采集表设计
        5.1.4 采集表说明
    5.2 建筑工程造价指数的测算方法
        5.2.1 建筑工程造价指数测算基础概述
        5.2.2 建筑工程造价指数测算模型
    5.3 建筑工程造价指数调整
        5.3.1 基于2013 费用定额的造价重组法
        5.3.2 基于典型工程的调值系数法
第6章 建筑工程造价指数预测模型研究
    6.1 造价指数预测的意义
    6.2 造价指数预测内容的确定
    6.3 造价指数预测模型的建立
        6.3.1 造价指数预测模型的选择
        6.3.2 多元线性回归模型预测
        6.3.3 改进神经网络模型预测
第7章 建筑工程造价指数信息平台设计
    7.1 建筑工程造价指数信息平台设计规划
        7.1.1 测算平台建设目标
        7.1.2 测算平台建设原则
    7.2 建筑工程造价指数信息平台各模块功能分析
        7.2.1 录入系统
        7.2.2 发布系统
    7.3 建筑工程造价指数信息平台操作设计
        7.3.1 平台操作组织范围
        7.3.2 数据采集系统流程及主要操作
        7.3.3 加工计算流程及主要操作
        7.3.4 网站发布系统查询流程及主要操作
    7.4 建筑工程造价指数信息平台系统价值
第8章 结论与展望
    8.1 结论
    8.2 展望
致谢
参考文献
附录 A
    A1 博士期间参与的主要科研项目
    A2 博士期间发表的学术论文
附录 B
    附表1 手动录入采集表
    附表2 自动录入采集表
    附表3 发布表
    附表4 工程项目特征表
    附表5 计量单位取定表

四、多元统计分析在数据挖掘中的作用(论文参考文献)

  • [1]基于深度学习的结构外观病害检测与监测数据挖掘[D]. 倪富陶. 东南大学, 2021
  • [2]贝叶斯网络在《伤寒论》阳明病篇方、药、症规律研究中的应用[D]. 张静驿. 山西医科大学, 2020(11)
  • [3]基于蓝墨云的数据分析在大学生个性化学习模式中的应用研究[D]. 钱晓如. 云南师范大学, 2020(11)
  • [4]5G网络技术对提升4G网络性能的研究[J]. 刘奕. 数码世界, 2020(04)
  • [5]大数据对新产品开发决策支持关系的研究 ——以华为手机新产品开发为例[D]. 张双. 西安电子科技大学, 2020(05)
  • [6]基于校园大数据的学生行为挖掘方法应用研究[D]. 李蒙. 西安电子科技大学, 2019(02)
  • [7]基于循证的中药性效数据挖掘方法评价研究[D]. 张玉娇. 江西中医药大学, 2019(02)
  • [8]混合式培训中教师研修成绩的预测与应用研究[D]. 郭淑惠. 华中师范大学, 2019(01)
  • [9]高校学生学业表现数据建模研究 ——基于A大学教育数据的分析[D]. 丁国勇. 南京师范大学, 2019(04)
  • [10]基于数据挖掘的工程造价指数研究[D]. 谢莎莎. 武汉理工大学, 2018(08)

标签:;  ;  ;  ;  ;  

多元统计分析在数据挖掘中的作用
下载Doc文档

猜你喜欢