一、以太网络并行科学计算中通信损耗的定量描述(论文文献综述)
付茜雯[1](2020)在《计算机科技论文摘要的机翻错误类型及译后编辑》文中进行了进一步梳理科研论文在知识传播过程中作用重大,推动国际范围内的知识共享。摘要是科研论文中必不可少的一部分,既是对论文的概括性总结,也是读者发现和探寻相关领域知识的快捷途径。然而,目前英文摘要的机器翻译质量在精确性和专业性方面都不尽人意,需要通过后期编辑和人工校对才能产出高质量的中文翻译文本。本文以计算机科学论文摘要为例,对谷歌机器翻译的300篇计算机英文论文摘要的中文版本进行了翻译错误类型分析并归类,并提出相应的译后编辑策略。首先在赖斯文本类型理论翻译策略指导下,对机器翻译系统生成的译文进行译后编辑,再邀请计算机专业以及翻译专业的专业人士进行确认。之后以DQF-MQM错误类型分类框架为依据,对机器翻译系统生成的译文中的错误进行分类。研究发现,机器翻译的计算机英文论文摘要的中文版本中存在七大类翻译错误,其中不符合中文表达习惯的翻译错误占比最大,其次是术语误译、误译、欠译、漏译、过译以及赘译。本论文研究发现,由于源文本的信息型学术文本特征,长难句、被动语态以及术语翻译是造成机器翻译错误的主要原因。针对源文本的逻辑缜密、语步序固定等特征,本研究针对性地对各类错误类型提出了相应译后编辑策略。建议译者在译后编辑中通过将隐性连接转换为显性连接从而保持源文逻辑性,通过增加主语以及调整语序处理被动语态保持源文的学术精准,通过恰当选取词意处理半技术词汇等。本研究采用定性和定量分析方法,系统归类了计算机科技文本摘要中机器翻译出现的错误,并提出相应译后编辑策略,为该领域的译者提供参考建议,从而提高该领域的机器翻译质量。
胡广超[2](2020)在《容器环境下药物分子动力学模拟与并行虚拟筛选的研究与实现》文中认为借助高性能并行计算的强大算力,基于微观层面上设计药物的分子动力学模拟方法能够产生丰富的蛋白构像,而基于分子对接设计药物的虚拟筛选方式可以筛选出靶向性极强的药物小分子,这两种药物研究手段均能加速新药的研发速度。但长期以来,它们对计算环境要求较高,并且软件依赖众多、部署复杂、不可迁移和在共享计算资源上升级易发生冲突,不仅耗费药物科研工作者大量的时间,而且给计算集群的部署与维护带来沉重的负担。除此以外,分子数据库中的化合物数量众多,长期以来筛选时间较长的问题也急需解决。本文探索了使用以隔离、安全和迁移为性能特征的容器虚拟化方式解决上述问题。首先使用HPL、HPCG和OSU等标准基准程序研究了KVM、Docker和Singularity三种虚拟化方案在CPU处理、存储、磁盘读取和网络带宽方面与物理机的性能损耗差异,然后使用两种典型的高性能计算应用VASP和WRF评估容器在真实算例下的多节点并行计算、GPU计算和跨平台迁移方面的性能。接下来选择上述基准性能实验中性能最佳的容器构建可同时满足三种经典分子动力学模拟的NAMD(CPU与GPU异构计算型)、AMBER(GPU并行版)和GROMACS(多节点并行版)容器环境,并应用到极具医疗研究价值的Ⅱ型糖尿病受体GLP-1R、与癌症相关的BRD9蛋白和起麻醉作用的μ-opioid受体与相应配体的分子动力学模拟研究中;最后在容器环境下研究了编译与预编译版的AutoDock Vina虚拟筛选工具的性能差异,基于性能最优的Vina版本构建和部署了基于MPI多节点并行虚拟筛选药物的容器系统,并研究了它的并行处理性能和完成对靶向肿瘤细胞的MTH1激酶的药物虚拟筛选。本文实验结果显示,通过基准性能评估,Singularity容器在计算峰值、存储、网络与磁盘读取方面的综合性能优于KVM和Docker,能够取得物理机般的计算结果;在真实应用场景下Singularity容器性能完全满足HPC的并行计算环境如MPI、GPU和Infiniband要求,并能够获得与物理机相似的精准结果,迁移性能实验也展现出了Singularity较高的性能稳定性。另外,使用构建的NAMD、AMBER和GROMACS容器计算环境对GLP-1R、BRD9和μ-opioid受体与相应配体的分子动力学模拟结果与物理机非常相似,其性能损耗可忽略不计;同时实验发现在靶向MTH1激酶的药物并行虚拟筛选实验中,编译版的Vina性能最优,并行虚拟筛选容器系统随着节点数的增多可以大幅度减少药物筛选时间,最终筛选出的药物分子可准确对接在MTH1的活性位点上。本文制作的镜像均已上传到镜像资源库中,药物研究者可以自行下载使用。
张心言[3](2018)在《高性能计算云平台测试与资源管理优化技术研究》文中指出IaaS云计算资源按需获取、应用执行环境个性化定制的特点吸引着越来越多的组织机构基于云平台技术构建高性能计算集群。高性能计算云平台弹性资源使用模式虽然提高了系统的资源利用率和灵活性,但虚拟化技术同时也引入了系统开销。一旦云平台构建不合理,高性能计算应用将遭受较大的性能损失。为此,需要深入探究适合高性能计算的云平台构建方案,并对其性能进行全面的测试与验证。此外,资源优化配置是制约高性能计算云平台性能发挥的重要因素。其中,虚拟机放置是资源优化配置的关键。然而,当前缺乏对多核CPU感知的虚拟机放置多目标优化策略的研究。本文围绕着高性能计算云平台的设计构建与性能测试、虚拟机优化放置问题,主要开展了以下的研究工作:首先,深入分析了高性能虚拟化技术和高性能计算云平台的国内外研究现状,论证了高性能计算云模式的可行性。通过对比传统云计算与高性能计算云的异同,阐述了高性能计算云的潜在优势和面临的技术问题;对轻量级虚拟化容器技术Docker和云管理系统OpenStack的特点和组成结构进行了深入分析,提出基于Docker+OpenStack的高性能计算云平台构建方案。其次,基于OpenStack和Docker构建了 NUDTSCICloud高性能计算云平台,并对平台性能进行了测试验证。利用NPB并行基准测试程序和WRF天气预报模式,选取整数和浮点计算、I/O通信、科学计算程序执行效率等性能指标,对真实物理集群和NUDTSCICloud启动的虚拟机集群性能进行了比较,验证了高性能计算云平台的可行性;对测试结果进行了深入分析,论述了虚拟化对科学应用产生的额外性能开销,指出了 NUDTSCICloud高性能计算云平台存在的问题和可能的改进方向。最后,针对传统虚拟机放置算法没有考虑物理服务器具有多核计算能力的问题,提出了一种基于多目标优化的多核CPU感知虚拟机放置算法。不同于传统放置算法仅将CPU作为一维资源考虑,该算法将物理服务器多核CPU抽象为多维向量,针对高性能计算云环境下降低能耗、降低SLA违约率和资源利用均衡等3个优化目标,提出基于蚁群优化的多核CPU感知虚拟机放置算法;CloudSim仿真实验结果表明,提出的算法能在多个互相冲突的优化目标之间进行权衡,获得比传统放置算法更好的Pareto占优解。
尹堂文[4](2018)在《基于飞行安全调和测度及科学计算的人为因素设计与验证》文中研究指明飞行安全性是衡量航空系统先进程度的最重要标准,也是人为因素设计及其适航符合性验证的主要目标。人因意外是导致飞行安全事故的最主要原因之一,而人因意外无法从根源上加以杜绝的根本原因在于对人机工效状态空间的认识不够充分;人机与环境系统及飞行任务诸多方面的不确定性使人机工效状态空间极其庞大、复杂;因此,为了完成在飞行安全、飞机性能、机组绩效等方面的人为因素设计与验证,为了可持续地促进飞行系统的自动化扩展及安全性增强,需要探索一整套科学的解决方案,以获取足够的人机工效状态空间研究数据样本,推进基于人机工效状态空间的人为因素研究,促进计算人因与工效学的发展并推广其应用。人为因素设计与验证问题可以通过面向科学计算的人机与环境复杂系统建模与仿真转化为人机工效状态空间的事实与逻辑问题。对人机与环境复杂系统演变发展的模拟与仿真旨在再现飞行机组、飞机系统、飞行环境、飞行任务等方面的飞行条件、飞行状态、飞行性能的动态演进;演进的结果为人机工效状态空间中的一条高维曲线,也是人机工效状态空间的一个数据研究样本。人机工效状态空间包含交互与评估两个维度的基础信息数据;第一个维度标记飞行系统各层次的构型配置及各动态过程的交互事件;第二个维度标识飞行安全、飞机性能、机组绩效及飞行系统广义评价指标的量化测度。基于人机工效状态空间的人为因素研究包括四个层次的信息算法;第一个层次为基于人机工效大数据的统计建模;第二个层次为基于数据统计模型的因果推断;第三个层次为基于数据统计模型的人因反演;第四个层次为基于数据统计模型的正交实验设计。具有前瞻性的航空人为因素设计与验证能为飞行系统控制及航空系统工程中的协调与决策提供科学依据。本文就上述主题展开了全面、深入的理论与计算研究,具体的工作分为四个部分:首先,我们从方法论的角度探讨基于飞行安全调和测度的人为因素设计与验证解决方案,从方法体系、理论体系、技术体系、工具体系四个方面阐述面向科学计算的人机环智能系统建模与仿真及其在人为因素设计与验证中的作用。在明确了人为因素设计与验证这一科学问题之后,我们探究了飞行系统及人因交互的异构性,探究了科学计算及虚拟工程的适用性,探究了以人为中心的样机设计与制造,探究了多粒度合成飞行域模型、多层次异构域交互、多目标评估的统一表示,探究了人因与工效学问题的研究广度、深度、跨度,并据此提出了通过面向科学计算的人机与环境复杂系统建模与仿真将人为因素设计与验证问题转化为人机工效状态空间的事实与逻辑问题的可行性解决方案。然后,我们从大数据获取的角度探讨基于人机环智能系统建模与仿真的人机工效状态空间研究样本生成方法,从基于任务的人机耦合策略模型、飞行动力学的不变张量模型及基于有限体积法的计算空气动力学、面向飞行任务描述及飞行测试规划的飞行场景、飞行安全的内禀因素及调和测度、飞机性能的无量纲约简、飞行品质及机组绩效的客观评价、航空广义评价指标的变换域测度、全数字快速计算平台的分布式部署八个方面阐述人机环智能系统的复杂人机交互及其再现。在完成任务时,人类通常会期待最好的结果,做好最坏的准备、保证正常的绩效。基于任务的人机耦合策略模型以多特征模式及其结构化实现为独特视角,以解决问题计算序列及其逻辑与算术深度为主要原则,以最优控制、鲁棒控制、自适应决策为主要方法,从复杂性、自适应性、不确定性各层面模拟人类的能力及特征。飞机模型是人机耦合策略模型的操控对象,飞行动力学的不变张量建模及矩阵编码便于飞机模型的计算机仿真,也便于人机与环境复杂系统仿真度与可信度的提高。飞行场景以参数形式表征飞行任务及飞行条件的构型配置;其中,飞行任务的航段组成及衔接描述信息主要面向人机耦合策略模型,飞行条件的数据窗口及数据项规划信息主要面向适航符合性验证。及时察觉并准确评估正在迫近的危害是安全防范的根本。飞行安全性的检测涉及各类飞行事件及评价准则,且难以客观定量分析,检测结果也难以有效利用。我们将安全要素归结为三个内秉因素,并将其集成于统一的调和测度机制,使飞行安全性可借助于概率测度客观定量地加以测评,甚至预测。飞行性能的无量纲约简有助于将各种复杂飞行情况转化为内秉安全因素。通过性能参数的标准化及合理分组,无量纲飞行性能既便于在客观的环境中施加检测,又能准确地反映不同飞行环境及状态下的实际飞行性能。我们尝试在虚拟环境中实现对人-机系统的主观评价,并将其作为飞行品质及机组绩效的客观评价。鉴于飞行品质及机组绩效的评判是一个协同验证、多重决策与反馈控制的过程,我们从协同学习与预测控制的角度,在集成认知框架下的人机耦合策略模型中内嵌评价飞行品质及评估机组绩效的内省能力。人为因素研究涉及诸多抽象概念属性的主观评价。通过类比流体力学中的传输现象及传输属性,我们尝试将广义评价指标的相对概率测度及定量分析推而广之。基于面向服务构架的分布式计算平台在计算复杂性、分布性、并行性、开放性和可扩展性等方面全面支持了人机与环境智能系统建模与仿真,是人为因素设计与验证的科学计算及研究平台。接下来,我们从大数据计算的角度探讨基于人机工效状态空间的前瞻性航空人为因素研究方法,从人机工效大数据分层布局、人机工效大数据统计模型、人机工效大数据因果推断、人机工效大数据人因反演、人机工效正交实验设计五个方面阐述数据驱动及面向问题的人机工效大数据研究方法。混合效应及因果协变模型、Bootstrap参数随机化估计算法、拟合优度框架下的因果关系存在性判断算法、潜在结果框架下的因果效应显着性评估算法、人因反演响应核的最佳统计估计算法、人机工效状态子空间的渐进逼近算法等成果全面推进了基于人机工效状态空间的航空人为因素研究。最后,我们从系统控制与系统工程的角度探讨基于科学计算的航空人为因素设计与验证方法在飞行系统的自动化扩展及安全性增强方面的应用前景,并特别关注飞行安全调和测度在飞行器系统控制中的反馈作用、人为因素设计与验证在航空系统工程中的前馈作用。
于荣欢[5](2011)在《基于PC集群的电磁环境并行计算与可视化方法研究》文中研究指明随着电磁频谱在探测、干扰、通信等武器系统中的广泛使用,以掌控电磁环境为主要内容之一的制信息权已经成为决定战争胜负的关键。如何快速对电磁设备性能进行仿真计算以及对电磁环境的分布、能力进行直观描述已经成为电磁环境领域的一个重要研究方向,其核心是对于电磁辐射问题的数值计算与空间电磁环境的可视化。为解决计算规模问题,目前常用的加速方法包括基于高性能计算机和高性能图形工作站的并行方法、基于GPU通用计算的加速方法和基于PC集群的并行方法,其中基于PC集群的并行方法由于其较低的进入门槛、较高的性价比以及较好的可扩展性,受到众多研究人员的青睐,已逐渐成为当前并行计算与绘制的一个热点方向。当前,对雷达探测能力的描述和对无线通信网络的数据仿真是电磁环境领域研究的两个典型方向。本文针对这两个方向,围绕如何在PC集群上实现电磁环境并行计算与可视化这一问题开展研究,研究内容主要包括电磁环境并行计算、并行等值面提取与绘制、光线投射并行直接体绘制和PC集群环境组合优化等问题。具体而言,本文的主要工作和成果体现在以下几个方面:1)提出了基于三维标量场的电磁环境并行计算方法。首先针对电磁环境的特点,建立了一种基于三维规则标量场的通用电磁环境数据组织形式;并基于此数据组织形式,设计了雷达探测能力分布和通信电磁辐射强度分布的并行计算方法:基于抛物方程的组网雷达联合探测概率并行计算方法和基于ITM模型的通信电磁环境电磁辐射强度分布并行计算方法。2)针对等值面提取与绘制方法与场景内容的关联特点,提出了一种基于Sort-Last模式的并行等值面提取与绘制方法。该方法在任务分配阶段采用基于场景内容的静态任务分配方法;在图像合成阶段设计并实现了一种基于时间统计的自适应动态Direct-Send图像合成算法,算法针对集群节点间存在的性能差异,通过时间统计逐渐调整各节点的负载,以达到图像合成阶段的负载平衡。3)针对光线投射直接体绘制方法面向屏幕空间像素投射计算的特点,提出了一种基于Sort-First模式的并行直接体绘制方法。在并行绘制过程中,设计了一种基于屏幕网格权重计算的任务分配算法,利用投射光线在三维标量场中的穿行距离来进行网格权重的计算,可以实现以较少的负载平衡消耗达到较好的负载平衡效能。4)针对PC集群环境中不同的场景规模所适合的最优集群环境各不相同的特点,提出了一种基于场景复杂度分析的PC集群环境组合优化方法。通过对当前场景时间复杂度进行量化分析,获得当前场景规模的最优集群环境配置。针对节点间性能差异引起的负载不平衡问题,提出了一种基于节点性能测试的负载平衡修正方法。5)在PC集群并行环境中设计并实现了一个并行计算与可视化原型系统-ParaEME。该原型系统集成了本文的各项研究成果,对本文提出的各项成果和算法进行了有效的应用和验证;作为PC集群上的并行计算与绘制的一种有效解决方案,可以为基于PC集群的各种科学计算与可视化提供有效借鉴。
韩林[6](2007)在《基于GPU的光波导器件FDTD并行算法研究》文中研究指明FDTD(Finite-Difference Time-Domain时域有限差分法)是对与时间相关的麦克斯韦方程的直接求解。在电磁场问题的数值计算中具有广泛的应用。是目前射频器件以及光器件的计算机仿真的最有效的方法之一。在光器件的仿真中,由于光波长很短,考虑数值色散的影响,FDTD算法的空间步长一般小于λ/10,导致在进行电大尺寸器件仿真时所需计算网格数目相当庞大。对于光波导仿真,当波长变为微米级时,空间步长就非常短。对于三维光器件的仿真或者大型二维光器件的仿真,需要很大的存储空间和运算能力。对于这种大型的电磁场问题,单台普通PC已经不能满足很多情况下的计算要求。高性能的大型计算机价格又十分昂贵。由于FDTD算法具有天然的可并行运算的优势。将多台廉价的PC机通过网络组成能够协同工作的机群来进行并行FDTD的计算成为一种很好的解决方案。可以满足工业界对大型光器件仿真的要求。因此研究基于PC机群的并行FDTD算法的优化,并为FDTD应用研究一种低成本的并行计算系统确有必要。基于CPU的PC机群在处理光器件的FDTD仿真时,能够满足存储空间的需求,但是运算能力仍然不够强大,这就需要运算能力更加强大的专有硬件来负责运算。现代图形处理器GPU(Graphic Process Units)将数据流并行处理的概念引入硬件结构中,具有高性能的数据并行处理能力。由于图形图像处理相关产业的推动,GPU发展迅速,与CPU相比,价格不高,运算能力却高出几十到几百倍。GPU在大型电磁场FDTD计算中运算速度优势非常明显,本文将在第四章详细介绍并行FDTD在GPU上的实现。论文提出并实现了一种以GPU图形加速卡为核心,并由PC机群通过以太网络连接组成的FDTD的并行计算系统。通过使用最新Linux内核,采用远程网络启动技术,降低了并行处理单元的成本,提高了整个并行系统的可靠性。针对此方案开发了相关的算法和接口软件,克服了并行FDTD计算中的通信瓶颈问题。并从网格划分,CPU缓存(Cache)和流水线结构,网络驱动方面对并行FDTD算法进行优化,使得并行FDTD在进行光子晶体的仿真中达到了很高的加速比。针对本文提出了系统,开发了一整套基于以太网和基于GPU的并行FDTD计算程序包,包括数值算法程序和方便的人机界面程序。并针对一些光波导器件的特性进行了仿真和分析。对二阶FDTD算法进行了并行计算测试和优化,优化后得到了很高的并行加速比。仿真结果同样显示基于GPU的并行FDTD系统具有良好的并行特性,可在光波导器件时域分析方面替代昂贵的大型并行计算机系统。
李康[7](2006)在《光波导器件的高阶FDTD并行仿真分析》文中研究说明时域有限差分法(FDTD)是光波导器件仿真的常用算法。该算法是K.S.Yee在1966年为计算电磁散射问题而提出的。FDTD算法的基本点是将Maxwell方程组的时变的旋度方程用差分形式来表述。FDTD方法具备简洁和高效的特性,可对结构复杂的导体、绝缘介质以及非线性、各向异性物质建模。随着计算机性能的提高和成本下降,已被广泛地应用于计算电磁学的各个领域。很多大型和复杂的问题通过使用FDTD方法得到了解决。 FDTD方法最初是用来解决像射频与微波这样相对较长的波长的电磁问题的,它也可以用于光器件的分析。然而,由于数值色散的影响,FDTD算法的空间步长一般小于λ/10,导致在进行电大尺寸器件仿真时所需计算网格数目相当庞大。对于光波导仿真,当波长变为微米级时,空间步长就非常短。对于三维光器件的仿真或者大型二维光器件的仿真,需要很大的存储空间和计算时间。 使用并行计算技术可以有效地减少FDTD方法的计算时间,在各种复杂FDTD计算中得到了广泛的应用。目前的大型并行计算系统的价格太高,无法满足工业界对于大型光器件仿真的需求。因此为FDTD应用研究一种低成本的并行计算系统确有必要。 减少数值色散误差的另外一个有效的方法是采用高阶FDTD算法。高阶算法具有低的色散特性,在满足同样精度的情况下可以使用比传统FDTD方法更粗的网格单元。对各种高阶FDTD方法色散特性的研究具有重要的意义,目前仍然属于研究的领域。另外,和高阶FDTD相关的边界条件和非连续性分析仍有一些困难。在并行计算的情况下,由于各种高阶FDTD算法数据交换数量急剧增加,其并行处理和传统FDTD有所不同。 本文的目的是研究在并行环境下的高阶FDTD计算的特性,主要在下面几部分: 论文针对FDTD并行计算方法,分析了高阶FDTD方程的数值色散特性并进行了数值仿真。仿真分析表明,对于并行FDTD计算,在各种高阶FDTD算法中,FDTD(2,4)在计算效率和计算精度上具有最佳的结果。
唐渊[8](2004)在《大规模集群系统的性能评价与通信优化研究》文中提出集群系统(LINUX Cluster)是一种新涌现出来的高性能价格比的超级计算的解决方案。与以前高度集成(紧密耦合),全部部件和结构都是专门设计的超级计算机不同,一台集群往往由各种各样的通用的商业化部件所组成,几乎没有或很少有专门设计的硬件,即各个部件之间是所谓的“松散耦合”体系结构。这就必然会引发一些对整个系统性能可靠性和稳定性的担忧。而且,由于其所用的各个标准商业化部件原本并非为高性能的并行计算而量身定造,所以如果只是将它们简单的整合在一起,其效率必然是差强人意。特别是整个系统的通信部分,即所谓的集群网络(Cluster Area Networks),担负着联系各个计算节点的重任,其效率的高低,直接影响到整个系统性能的高低,因此更是关注的焦点。 就大规模科学计算在现代高性能集群系统上的实际应用来说,比如孙家昶老师主持863项目《大规模整体油田的精细油藏数值模拟》(863-306-2D11-03-1),曹建文主持863项目《分布式大规模数值并行理论与算法研究》(863-306-2D01-03-2)以及孙老师主持的973项目《油藏模拟与波动问题及其反问题计算》(G1999032803)等,一致表现出来的是通信时间在大规模并行程序中所占比重越来越大,而且随着使用节点处理器数目的增多,整个应用程序的并行性和可扩展性下降很快,理论峰值的利用率较低。因此,如何从理论到实践上解决好现代高性能集群系统的使用及针对一些关键性的实际应用做好通信上的优化就成了本文中重点想要解决的一个问题。 在历史上,主要从以下2个角度看待集群网络的性能问题: ● 主要考察网络的短消息延迟和长消息传输时的最大带宽。并以这两个指标作为评价网络性能的最重要指标。比如Jack Dongarra使用pingpong考察了大量的高性能计算系统,如,Convex,Cray,IBM,Intel,KSR,MEIKO,nCUBE,NEC,SGI,TMC等;Luecke等考察了一些Linux和NT的集群系统上通信网络的性能,如SGI Origin 2000,IBM SP,Cray-T3E等;Petrini等使用单向和双向的ping考查了Quadrics网络的性能。 ● 从通信模型的角度来考虑高性能网络的性能问题。如1993年UC Berkeley的David Culler首先提出LogP模型来刻画并行机上的通信行为;随后又评估了LogP模型各个参数对Intel Paragon,Meiko CS一2等高性能机器的影响;另外还有其他一些基于LogP模型的扩展。 但随着现代集群网络从硬件到软件上不断的新的发展,如用户级通信,消息流水等,以上2个观点已无法解释在集群系统上运行大规模并行程序的所有现象。因此,迫切需要有新的研究,新的模型,新的解释。 本文的主要工作是:。对于现代高性能集群系统几种主要搭建技术的优缺点进行了量化的 研究;。针对一些大规模科学计算的测试基准程序,如NAs Parallel Benchmarks等, 在国家973项目集群系统一LSSCZ上实测了它们的性能,得到了它们的 变化曲线。将具体的数据与国际上己公布的一些数据和结论等相比 较,总结了一些规律。对如何利用好我国现有的高性能集群系统提出 了一些合理化建议;·针对一种通信优化方法一“通信与通信的重叠”,做了深入的研究。 发现相对高带宽、低延迟的Myrinet 2000对这种优化方法的支持甚至不 如百兆快速以太网。也就是说,对于使用到“通信与通信的重叠”这 种优化技术的大规模并行程序,在M”inet 2000上的运行速度要慢于百 兆快速以太网;或者反过来说,“通信与通信的重叠”在百兆以太网 上是一种好的优化技术,而在M梦inet 2000,Gigabit Ethemet,等高性能 集群网络反而不是。这也提醒我们,对于并行计算程序来说,要比较 准确地预测其通信性能,光考虑底层通信介质的延迟、带宽,甚至现 有的LogP,LogGP模型参数等还是不够的,还必须考虑到程序中所实 际使用的一些通信行为方式(communieation behavior pattem)/通信优化技 术在所运行平台上的支持程度;·由此,提出“热点测试”的观点:根据每个集群网络硬件及通信协议 软件的具体特点或某些热点(hot spot)构造出一些特定测试,以获取该 通信平台对各种并行计算程序通信行为方式/各种常用的通信优化技 术的支持程度;·提出大规模并行程序在集群系统上“性能可移植”的概念:当一个并 行程序从一个平台移植印。rt)到另一个平台上的时候,除了要保证正 确性以外,还必须是通过一定的参数化模型可预测的。对在现代高性 能集群系统上进行大规模科学计算程序的性能预测及其建模作出补 充;·在对国际上一个重要的用户级通信协议GAMMA进行大量测试与分析 的基础上,总结了用户级通信协议的优缺点,给出了一个适用于小规 模集群系统的用户级通信协议框架一,TMachine,;.由于当今超级计算系统TOP 500排名的基准一LINRACK峰值并不能很好 的描述大规模科学计算对通信系统的要求。我们提出大规模科学计 算性能测试与评估的FFT(Fast Fourier Transform)标准,用以刻画超级计 算机/并行机对具有大规模集合通信(eolleetive communieation)的并行应 用程序的负荷承载能力,并结合一套完善的软件包一’,尸尸工万?
李斌[9](2003)在《行波管幅相一致特性研究》文中研究指明行波管是一种高增益的宽带微波/毫米波功率放大器件,广泛用于数据通信、电子对抗、预警飞机、火控雷达、精密制导,在现代军事电子装备中显示出不可取代的重要作用。行波管的研制涉及到电子光学、磁学、阴极电子学、微波电子学、电磁场理论、材料学、机械与热分析诸多学科,工艺过程十分复杂。计算机技术的发展与应用,极大地促进了行波管技术的进步。同时,提高行波管的设计能力,缩短开发周期,减少整管硬件实验,改善行波管性能,固化已有经验,也愈来愈离不开电子计算机,CAD已经成为研制行波管的主要手段。现代电子战、超宽频带高功率相控阵雷达、强力干扰机、微波能武器等的快速发展对高功率微波源提出了更高的要求。宽频带高功率器件成为主要研究对象。由于宽频带和高功率不可克服的矛盾,采用大功率连续波宽带行波管作为阵列单元末级放大器,通过功率合成技术成为获得宽频带高功率微波源的主要手段。在功率合成技术中,幅相一致行波管是核心器件。由于非常高的技术指标要求,使幅相一致行波管的研制和生产都面临很多的困难。其中成品率低是国内幅相一致行波管研制中面临的最严峻问题。成品率低导致无法进行有效的批生产,从而进一步使行波管的一致性难以得到保证。经过广泛的论证,相关领域专家普遍认为CAD技术成为研制幅相一致行波管的主要手段。在实际制管之前,经过高强度的计算机模拟能有效提高设计能力。论文首先系统、全面地综述了微波管CAD技术的最新进展、存在的问题和今后的发展方向。讨论了微波管CAD技术中常用的数值计算方法、介绍了有代表性的大型电磁分析软件、微波管各部件CAD软件、微波管CAD集成环境,对美国的MMACE项目和我国的TWTCAD项目进行了详细的描述。综述了幅相一致行波管国内外发展状况,讨论了目前我国在幅相一致行波管研制和生产中遇到的技术难点及对策。这一章为整个课题的开展指明了方向,奠定了基础。第二章从行波管高频电路出发,详细分析了影响幅相一致行波管色散特性和耦合阻抗的主要因素;开发了可视化计算软件,分析了各重要因素(如夹持杆宽度、螺距、金属翼片高度、螺旋线平均半径、夹持杆介电常数等)对色散特性和耦合阻抗影响的大小;证实了夹持杆材料特性是最重要的影响因素。第三章系统地介绍了粒子模拟方法(PIC);发展了考虑谐波互作用的行波管全三维大信号非线性理论,该理论考虑了周期永磁聚焦和均匀聚焦系统,能有效地退化为基于等效线路模型的Rowe一维、二维、三维非线性理论。基于粒子模拟方法,对三维空间电荷力的计算采用全三维塑性宏粒子模型。对于工作电压考<WP=9>虑了电位下沉效应。第四章探讨了面向对象软件工程方法学在大型科学研究型软件开发中的应用;基于改进的行波管三维非线性理论模型,结合面向对象软件工程方法学、可视化科学计算方法,采用Microsoft Visual C++6.0开发了能动态实时显示行波管内部工作状态和动态显示各技术指标参数的可视化科学计算软件。第五章介绍了幅相一致行波管的一般应用领域;基于改进的行波管三维非线性理论,结合TCP/IP网络并行计算方法、面向对象软件工程方法学、可视化科学计算方法,采用Microsoft Visual C++6.0开发了一个用于分析行波管幅相一致特性的网络计算平台;该平台是一个开放式的框架,经过扩充将来还可以用于研究其他类型微波管(如速调管、耦合腔行波管等)的注波互作用、幅相一致特性分析。
杜振军哈尔滨工程大学计算机系,关健,张锐[10](2001)在《以太网络并行科学计算中通信损耗的定量描述》文中研究表明大型科学计算中常采用并行算法[1,2],负载平衡是并行计算中的一个很重要的方面 13,41。在平衡负载的过程中需要用到通信损耗来描述网络并行计算的速度。该文探讨分析了影响通信损耗的各种因素,提出了一种新的以太网环境中的通信损耗的定量描述方法;阐述了并行科学计算在进行中通信损耗的实际获得过程。实验结果表明,该通信损耗的表示形式在实际应用中是正确可靠的。
二、以太网络并行科学计算中通信损耗的定量描述(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、以太网络并行科学计算中通信损耗的定量描述(论文提纲范文)
(1)计算机科技论文摘要的机翻错误类型及译后编辑(论文提纲范文)
摘要 |
Abstract |
CHAPTER1 INTRODUCTION |
1.1 Research Background and Significance |
1.2 Aims of the Study |
1.3 Organization of the Thesis |
CHAPTER2 LITERATURE REVIEW AND FRAMEWORK |
2.1 Overview on Machine Translation and Post-editing |
2.2 Previous Studies on MT Error Types and Post-Editing Strategies |
2.3 DQF-MQM Error Classification Framework |
2.4 Previous Studies on MT Error Types of Paper Abstracts |
2.5 Text Typology Theory |
2.5.1 Text Typology Theory of Reiss |
2.5.2 Previous Studies on Informative Texts and Translation Principles |
CHAPTER3 METHODOLOGY |
3.1 Source Text and Text Analysis |
3.1.1 Source Text |
3.1.2 Text Analysis |
3.2 Research Method |
3.3 Translation Process |
3.3.1 Translating300 computer science abstracts with MT system |
3.3.2 Post-editing the MT-generated translation based on Text Typology Theory |
3.3.3 Conducting a semi-structured interview for ensuring post-editing quality |
3.3.4 Analyzing and summarizing the errors in300 abstracts |
3.3.5 Preliminary error classifications based on DQF-MQM Framework |
3.3.6 Conducting the2nd semi-structured interview to confirm error classifications |
3.3.7 Quantitative analysis of all MT errors in the300 abstracts |
CHAPTER4 RESULTS AND DISCUSSION |
4.1 Error Types of Machine Translated English Abstracts |
4.1.1 Unidiomatic Translation Errors in MT output |
4.1.2 Terminology Mistranslation Errors in MT Output |
4.1.3 Mistranslation Errors in MT Output |
4.1.4 Under-translation Errors in MT Output |
4.1.5 Omission Translation Errors in MT Output |
4.1.6 Over-translation Errors in MT Output |
4.1.7 Errors of Addition in MT Output |
4.2 Post-editing Strategies for Machine Translated Abstracts |
4.2.1 Post-editing Strategies for Long and Complex Sentences |
4.2.2 Post-editing Strategies for Passive Voice Sentences |
4.2.3 Post-editing Strategies for Technical Terms |
CHAPTER5 CONCLUSION |
5.1 Major Findings |
5.2 Limitations and Suggestions |
References |
Appendix Source Texts and Target Texts of300 Abstracts |
1-20 Abstracts |
21-40 Abstracts |
41-60 Abstracts |
61-80 Abstracts |
81-100 Abstracts |
101-120 Abstracts |
121-140 Abstracts |
141-160 Abstracts |
161-180 Abstracts |
181-200 Abstracts |
201-220 Abstracts |
221-240 Abstracts |
241-260 Abstracts |
261-280 Abstracts |
281-300 Abstracts |
ACKNOWLEDGEMENTS |
(2)容器环境下药物分子动力学模拟与并行虚拟筛选的研究与实现(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.4 本文组织结构 |
第二章 虚拟化技术概述 |
2.1 基于Hypervisor的虚拟机 |
2.2 容器 |
2.2.1 Docker容器 |
2.2.2 Singularity容器 |
2.3 本章小结 |
第三章 容器性能的评估方法与实现 |
3.1 标准基准性能评估 |
3.1.1 存储性能 |
3.1.2 磁盘读取性能 |
3.1.3 CPU性能 |
3.1.3.1 HPL |
3.1.3.2 HPCG |
3.1.4 网络带宽性能 |
3.2 应用基准的性能评估 |
3.2.1 WRF |
3.2.2 VASP |
3.3 容器迁移性能评估 |
3.4 实验结果与分析 |
3.4.1 标准基准 |
3.4.2 应用基准 |
3.4.3 Singularity容器迁移性能 |
3.5 本章小结 |
第四章 容器环境下的药物分子动力学模拟与应用 |
4.1 分子动力学模拟介绍 |
4.2 容器环境下分子动力学模拟环境的构建 |
4.3 实验方法 |
4.3.1 基于容器的靶向Ⅱ型糖尿病受体与配体的分子动力学模拟 |
4.3.2 基于容器的BRD9蛋白与小分子抑制剂的分子动力学模拟 |
4.3.3 基于容器的μ-opioid受体与小分子激活剂的分子动力学模拟 |
4.4 结果与分析 |
4.5 本章小结 |
第五章 容器环境下药物并行虚拟筛选的研究与实现 |
5.1 药物的虚拟筛选介绍 |
5.2 容器环境下并行虚拟筛选环境的实现 |
5.3 实验方法 |
5.4 实验结果与分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(3)高性能计算云平台测试与资源管理优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景 |
1.1.1 高性能计算云平台的起源及发展 |
1.1.2 研究目的及意义 |
1.2 课题相关研究现状 |
1.2.1 高性能计算云平台的适用性分析 |
1.2.2 高性能计算云虚拟集群性能测试相关工作 |
1.2.3 云计算环境下虚拟机放置策略研究 |
1.3 课题简介 |
1.3.1 课题来源 |
1.3.2 课题研究内容及创新点 |
1.4 论文结构 |
第二章 高性能计算云平台相关技术研究 |
2.1 虚拟化技术 |
2.1.1 虚拟化技术的优势 |
2.1.2 主流虚拟化方式分类与对比 |
2.2 云计算与高性能计算云平台管理技术 |
2.2.1 云计算 |
2.2.2 高性能计算云的优势 |
2.2.3 主流云计算平台管理技术 |
2.3 本章小结 |
第三章 NUDT_SCICIoud高性能计算云平台构建与测试 |
3.1 NUDT_SCICloud的设计构建 |
3.1.1 硬件基础配置 |
3.1.2 主要软件组成与平台特性 |
3.1.3 虚拟计算集群的构建与运行环境配置 |
3.2 NPB并行基准测试程序对比测试 |
3.2.1 实验设计 |
3.2.2 测试结果与分析 |
3.3 WRF数值天气预报模式性能测试 |
3.3.1 安装配置 |
3.3.2 测试结果与分析 |
3.4 NUDT_SCICloud资源优化管理的需求 |
3.5 本章小结 |
第四章 基于多目标优化的多核CPU感知虚拟机放置算法 |
4.1 虚拟机放置问题建模 |
4.1.1 基于多维装箱的问题形式化 |
4.1.2 多优化目标与约束条件构建 |
4.2 基于蚁群优化的多核CPU感知虚拟机放置算法 |
4.2.1 蚁群优化算法思想 |
4.2.2 适宜度函数 |
4.2.3 信息素定义 |
4.2.4 状态转移函数 |
4.2.5 最优解集的构建 |
4.3 算法实现与模拟实验分析 |
4.3.1 算法流程 |
4.3.3 CloudSim仿真实验配置 |
4.3.4 实验设计 |
4.3.5 实验结果与分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 未来展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(4)基于飞行安全调和测度及科学计算的人为因素设计与验证(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 科学问题及解决方案 |
1.1.1 科学问题:人为因素设计与验证 |
1.1.2 解决方案:人机工效状态空间 |
1.2 研究现状及研究成果 |
1.3 原始性创新及内容安排 |
1.3.1 原始性创新 |
1.3.2 内容安排 |
第二章 面向科学计算的人机环智能系统建模与仿真 |
2.1 引言 |
2.2 科学计算及虚拟工程 |
2.2.1 传统的样机设计与制造 |
2.2.2 以人为中心的样机设计与制造 |
2.2.3 基于科学计算的人为因素设计与验证方法 |
2.3 计算人因与工效学及异构域交互分析 |
2.3.1 科学计算及交互与评估范式 |
2.3.2 离散事件系统规范与流固耦合分析 |
2.3.3 合成飞行域模型与多目标评估 |
2.4 基于合成飞行域建模及多目标评估的全数字计算平台 |
2.4.1 飞行动力学的不变张量建模及矩阵编码 |
2.4.2 基于有限体积法的计算空气动力学 |
2.5 研究内容及研究层次 |
2.6 本章小结 |
第三章 面向飞行任务描述及飞行测试规划的飞行场景 |
3.1 引言 |
3.2 面向人机耦合策略模型的飞行任务场景 |
3.3 面向适航符合性验证的飞行测试场景 |
3.4 飞行场景的形式与内容 |
3.4.1 飞行场景与最小飞行机组及机组工作量测量 |
3.4.2 飞行场景的涵盖范围及应用环境 |
3.5 飞行场景的开发 |
3.5.1 飞行场景的开发流程 |
3.5.2 基于方法指南的飞行场景开发方法 |
3.5.3 飞行机组与飞机及环境的动态关系 |
3.5.4 基于强化学习的机组操纵序列 |
3.5.5 机组任务与最小飞行机组准则映射关系 |
3.5.6 窗口事件及数据项 |
3.6 飞行场景的应用 |
3.6.1 飞行场景的应用环境 |
3.6.2 飞行场景的组合应用 |
3.7 飞行场景的验证 |
3.7.1 对飞行场景进行验证的四重含义 |
3.7.2 飞行场景单项因素的覆盖性验证方法 |
3.7.3 飞行场景综合因素对飞行机组工作量的有效性验证方法 |
3.7.4 飞行场景综合因素对飞行机组工作量的充分性验证方法 |
3.8 本章小结 |
第四章 基于任务的人机耦合策略模型 |
4.1 引言 |
4.2 人机耦合策略模型的结构化实现 |
4.2.1 基于规则系统的复杂系统建模方法 |
4.2.2 人模型的建模方法概述 |
4.2.3 人机耦合策略模型建模 |
4.3 人机耦合策略模型的自适应决策与鲁棒控制 |
4.3.1 飞行系统的交互、信息、决策与控制 |
4.3.2 人机耦合策略模型的最优控制 |
4.3.3 人机耦合策略模型的鲁棒控制 |
4.3.4 人机耦合策略模型的自适应决策 |
4.3.5 人机耦合策略模型的并行优先级 |
4.3.6 人机耦合策略模型的智能决策与控制 |
4.4 实验及结果 |
4.4.1 实验任务:进近及着陆 |
4.4.2 实验任务:进近、拉飘及着陆 |
4.4.3 基于进近及着陆任务的人机耦合策略模型实例化 |
4.4.4 基于进近、拉飘及着陆任务的人机耦合策略模型实例化 |
4.4.5 实验设置 |
4.4.6 实验结果 |
4.4.7 实验分析 |
4.5 人机耦合策略模型的验证 |
4.6 本章小结 |
第五章 飞行安全的内禀因素及调和测度 |
5.1 引言 |
5.2 内禀安全因素 |
5.2.1 动态演进的飞行安全趋势 |
5.2.2 内秉安全因素的统一机制 |
5.3 调和测度理论 |
5.3.1 调和函数及其属性 |
5.3.2 调和测度的构建 |
5.3.3 边界测度的表示 |
5.3.4 一般域上的调和测度 |
5.3.5 调和测度与极限距离 |
5.4 飞行安全的概率测度 |
5.4.1 安全性趋势量化的通用形式 |
5.4.2 燃油安全的概率测度 |
5.4.3 空间安全的概率测度 |
5.5 飞行安全的张量表示 |
5.6 张量沿系统轨迹的平移 |
5.7 飞行安全的一致性评估 |
5.8 航空广义评价指标的变换域概率测度 |
5.8.1 广义概念属性的概率测度 |
5.8.2 传输属性流 |
5.9 基于多层抽象任务特征的表示发现 |
5.9.1 流形上的抽象调和分析 |
5.9.2 基于微分形式属性密度流的积分内核 |
5.9.3 基于时变演进前向可达集的积分域 |
5.9.4 基于动态流通边界相交测试的积分曲面 |
5.10 沿系统演进曲线的积分泛函 |
5.11 实验及结果 |
5.11.1 实验设置 |
5.11.2 实验结果 |
5.11.3 实验分析 |
5.12 本章小结 |
第六章 飞机性能、飞行品质、机组绩效的客观评价 |
6.1 引言 |
6.2 性能参数的无量纲约简 |
6.2.1 性能表征 |
6.2.2 量纲分析 |
6.2.3 过程性能参数 |
6.3 基于预测控制的协同人因与工效评估模型 |
6.3.1 飞行品质主观等级评定 |
6.3.2 飞行机组工作状态 |
6.3.3 飞行品质与机组绩效的协同验证 |
6.3.4 机组工作状态及其约束的协同观测 |
6.4 本章小结 |
第七章 全数字快速计算平台的分布式部署 |
7.1 引言 |
7.2 基于快速原型构架的计算平台 |
7.3 基于面向服务构架的分布式计算平台 |
7.4 本章小结 |
第八章 基于人机工效状态空间的人为因素研究 |
8.1 引言 |
8.2 人机工效大数据研究样本的产生及布局 |
8.2.1 人机工效状态空间数据样本的产生 |
8.2.2 人机工效状态空间数据样本的布局 |
8.3 人机工效大数据研究样本的处理及分析 |
8.3.1 数据驱动及面向问题的人机工效大数据研究方法 |
8.3.2 人机工效状态空间数据样本的可视化 |
8.3.3 人为因素设计与验证统计推断问题的具体化 |
8.3.4 分层多元纵向数据可变分位混合效应及因果协变模型 |
8.3.5 基于数据统计模型的统计量设计及估计 |
8.4 基于可变分位混合效应及因果协变模型的因果推断 |
8.4.1 因果推断及其上下文 |
8.4.2 因果关系的存在性判断 |
8.4.3 因果效应的显着性评估 |
8.5 基于可变分位混合效应及因果协变模型的人因反演 |
8.5.1 飞行状况的整体变迁及其人因研究 |
8.5.2 人因反演响应核及其人因干预效果表达 |
8.6 基于可变分位混合效应及因果协变模型的人机工效正交实验设计 |
8.6.1 混合水平正交实验设计 |
8.6.2 人机工效状态子空间的渐进逼近 |
8.7 本章小结 |
第九章 飞行系统的自动化扩展及安全性增强 |
9.1 引言 |
9.2 基于协变参数的飞行器系统控制与航空系统工程 |
9.3 基于知识前馈发现及信息反馈融合的自动化扩展与安全性增强 |
9.4 本章小结 |
第十章 全文总结 |
10.1 工作总结及主要贡献 |
10.2 前景及展望 |
参考文献 |
致谢 |
攻读博士学位期间发表的学术论文 |
攻读博士学位期间申请的专利授权 |
攻读博士学位期间获得的计算机软件着作权 |
攻读博士学位期间参与的科研项目 |
攻读博士学位期间获得的奖励 |
(5)基于PC集群的电磁环境并行计算与可视化方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 引言 |
1.1.2 问题的提出 |
1.1.3 论文研究的意义 |
1.2 国内外研究现状 |
1.2.1 电磁环境计算模型 |
1.2.2 电磁环境可视化方法 |
1.2.3 并行计算技术 |
1.2.4 并行绘制技术 |
1.3 本文的出发点及主要工作 |
1.3.1 本文的出发点 |
1.3.2 本文的主要工作 |
1.4 论文的组织 |
第二章 基于三维标量场的电磁环境并行计算方法 |
2.1 引言 |
2.2 电磁环境计算模型 |
2.2.1 雷达电磁环境计算模型 |
2.2.2 通信电磁环境计算模型 |
2.3 电磁环境数据组织形式 |
2.3.1 雷达电磁环境数据特点分析 |
2.3.2 通信电磁环境数据特点分析 |
2.3.3 基于三维标量场的电磁环境统一数据组织形式 |
2.4 电磁环境并行计算方法 |
2.4.1 基于抛物方程的雷达组网联合探测概率并行计算方法 |
2.4.2 基于 ITM 的通信电磁环境并行计算方法 |
2.5 基于 Barrier 的同步控制技术 |
2.6 实验结果与分析 |
2.7 本章小结 |
第三章 三维标量场并行绘制技术 |
3.1 引言 |
3.2 并行绘制基本原理 |
3.3 影响并行绘制算法性能的关键因素 |
3.3.1 并行模式 |
3.3.2 任务分配 |
3.3.3 负载平衡 |
3.3.4 图像合成 |
3.4 并行绘制同步控制技术 |
3.4.1 帧同步控制 |
3.4.2 视点同步控制 |
3.5 三维标量场并行绘制模式分析 |
3.5.1 三维标量场并行绘制特点 |
3.5.2 并行绘制模式分析 |
3.6 实验结果与分析 |
3.7 本章小结 |
第四章 基于 Sort-Last 模式的并行等值面绘制方法 |
4.1 引言 |
4.2 三维标量场等值面可视化方法 |
4.2.1 等值面提取绘制方法基本原理 |
4.2.2 MT 等值面提取绘制方法 |
4.3 Sort-Last 并行绘制模式 |
4.3.1 Sort-Last 并行处理流程 |
4.3.2 Sort-Last 并行绘制模式中的关键问题 |
4.4 基于六面体元的静态负载平衡算法 |
4.4.1 三维标量场的六面体元构建与编号 |
4.4.2 MT 等值面提取的空间计算不均衡性 |
4.4.3 基于六面体元划分的静态任务分配方法 |
4.5 自适应动态 Direct-Send 图像合成算法 |
4.5.1 全深度图像合成 |
4.5.2 已有全深度图像合成算法 |
4.5.3 基于时间统计的自适应 Direct-Send 图像合成算法 |
4.6 同步控制 |
4.7 Sort-Last 模式下的并行等值面绘制框架 |
4.8 实验结果与分析 |
4.9 本章小结 |
第五章 基于 Sort-First 模式的并行直接体绘制方法 |
5.1 引言 |
5.2 光线投射直接体绘制方法 |
5.2.1 直接体绘制方法 |
5.2.2 基于光线投射的直接体绘制方法 |
5.3 Sort-First 并行绘制模式 |
5.3.1 Sort-First 并行处理流程 |
5.3.2 Sort-First 并行绘制模式中的关键问题 |
5.4 基于网格权重的自适应负载平衡算法 |
5.4.1 光线投射直接体绘制算法的图像空间计算不平衡性 |
5.4.2 面向图像空间的负载平衡算法分类 |
5.4.3 基于网格权重的自适应负载平衡算法 |
5.5 同步控制 |
5.6 Sort-First 并行直接体绘制框架 |
5.7 实验结果与分析 |
5.8 本章小结 |
第六章 基于场景复杂度分析的并行计算与绘制组合优化方法 |
6.1 引言 |
6.2 PC 集群系统 |
6.2.1 PC 集群系统概述 |
6.2.2 PC 集群对并行绘制性能的影响因素 |
6.3 电磁环境场景复杂度分析 |
6.3.1 电磁环境计算复杂度分析 |
6.3.2 电磁环境绘制复杂度分析 |
6.4 PC 集群并行性能分析 |
6.4.1 集群节点性能分析 |
6.4.2 集群网络通信性能分析 |
6.5 基于场景复杂度分析的 PC 集群环境组合优化方法 |
6.5.1 PC 集群环境组合优化的必要性 |
6.5.2 基于场景复杂度分析的集群最优节点数选择 |
6.5.3 集群节点最优组合和负载平衡修正 |
6.6 实验结果与分析 |
6.7 本章小结 |
第七章 电磁环境并行计算与可视化原型系统设计与实现 |
7.1 任务背景 |
7.2 系统设计 |
7.2.1 总体设计思路 |
7.2.2 结构设计 |
7.3 系统实现 |
7.3.1 集群环境构建 |
7.3.2 系统流程图 |
7.3.3 集群环境组合优化子系统 |
7.3.4 电磁环境并行计算与绘制子系统 |
7.4 本章小结 |
第八章 总结与展望 |
8.1 本文的主要贡献 |
8.2 进一步工作展望 |
致谢 |
参考文献 |
作者在校期间取得的学术成果 |
附录 A 简写索引表 |
(6)基于GPU的光波导器件FDTD并行算法研究(论文提纲范文)
中文摘要 |
ABSTRACT |
符号说明 |
第一章 引言 |
1.1 光波导的计算机辅助设计方法 |
1.1.1 光束传播法 |
1.1.2 时域有限差分法 |
1.2 论文的研究内容及意义 |
1.3 本论文的主要工作及贡献 |
第二章 时域有限差分法 |
2.1 FDTD基本算法 |
2.2 吸收边界条件的处理 |
2.2.1 Berenger PML |
2.3 稳定性分析 |
2.4 激励源 |
2.4.1 激励源的类型 |
2.4.2 激励源的设置 |
2.5 本章小结 |
第三章 并行FDTD计算技术 |
3.1 对并行FDTD计算的需求 |
3.2 并行计算技术简介 |
3.2.1 并行计算的概念 |
3.2.2 并行计算机的种类 |
3.3 并行FDTD计算机系统 |
3.3.1 基于大型并行计算机的FDTD并行计算 |
3.3.2 基于专用硬件的FDTD并行计算机系统 |
3.3.3 基于GPU(图形处理器)并行计算机系统 |
3.3.4 采用PC构成的并行FDTD计算系统 |
3.4 并行FDTD实现步骤 |
3.4.1 并行FDTD方法的区域分解及负载平衡 |
3.4.2 并行FDTD计算中的边界数据交换 |
3.5 并行FDTD运算中并行计算单元之间的通信 |
3.5.1 并行FDTD计算系统的数据通信 |
3.6 并行FDTD优化 |
3.6.1 利用CPU缓存技术优化算法 |
3.6.2 利用CPU流水线技术优化算法 |
3.6.3 优化网卡驱动和网络参数 |
3.7 本章小结 |
第四章 基于GPU的并行FDTD计算技术 |
4.1 GPU介绍 |
4.1.1 GPU中的可编程处理单元 |
4.2 使用GPU做FDTD计算 |
4.2.1 GPU上的通用计算 |
4.2.2 GPU上的实现FDTD算法 |
4.3 本章小结 |
第五章 并行FDTD计算系统设计及仿真实例 |
5.1 硬件系统设计 |
5.1.1 并行计算单元为基于PC主板的结构的单元 |
5.1.2 专用的大容量千兆位网络通信 |
5.2 软件系统设计 |
5.2.1 操作系统的选择 |
5.2.2 并行计算单元的远程启动 |
5.2.3 人机界面、控制程序 |
5.3 并行FDTD的边界数据的传递、数据压缩 |
5.3.1 边界数据的传递 |
5.3.2 数据压缩 |
5.4 以太网并行FDTD二维仿真实例 |
5.4.1 并行仿真结构 |
5.4.2 以太网并行计算效率分析 |
5.5 GPU并行FDTD二维仿真实例 |
5.6 本章小结 |
第六章 总结 |
6.1 本文的主要研究工作和结果 |
6.2 本研究课题可以进一步研究的内容 |
参考文献 |
致谢 |
学位论文评阅及答辩情况表 |
(7)光波导器件的高阶FDTD并行仿真分析(论文提纲范文)
目录 |
中文摘要 |
ABSTRACT |
第一章 引言 |
1.1 光波导的计算机辅助设计方法 |
1.1.1 光束传播法 |
1.1.2 时域有限差分法 |
1.2 论文的研究内容及意义 |
1.3 本论文的主要工作及贡献 |
第二章 时域有限差分法 |
2.1 FDTD基本算法 |
2.2 吸收边界条件的处理 |
2.2.1 Mur吸收边界条件 |
2.2.2 Berenger PML |
2.2.3 各向异性 PML |
2.3 稳定性分析 |
2.4 数值色散分析 |
2.5 激励源 |
2.5.1 激励源的类型 |
2.5.2 激励源的设置 |
2.6 本章小结 |
第三章 高阶时域有限差分法 |
3.1 高阶 FDTD算法的提出 |
3.2 利用中心差分法求解微分技术 |
3.3 高阶 FDTD基本算法 |
3.4 高阶 FDTD法的 PML吸收边界条件 |
3.5 镜像原理在 PML吸收边界的应用 |
3.6 高阶 FDTD法的稳定性分析 |
3.7 高阶 FDTD方法的数值色散分析 |
3.7.1 高阶 FDTD方法的数值色散方程 |
3.7.2 高阶 FDTD方法的数值色散分析 |
3.8 数值仿真实例 |
3.9 本章小结 |
第四章 并行 FDTD计算技术 |
4.1 对并行 FDTD计算的需求 |
4.2 并行计算技术简介 |
4.2.1 并行计算的概念 |
4.2.2 并行计算机的种类 |
4.2.3 并行算法和并行编程 |
4.3 并行 FDTD计算机系统 |
4.3.1 基于大型并行计算机的FDTD并行计算 |
4.3.2 基于专用硬件的FDTD并行计算机系统 |
4.3.3 采用 PC构成的并行 FDTD计算系统 |
4.4 并行 FDTD实现步骤 |
4.4.1 并行 FDTD方法的区域分解及负载平衡 |
4.4.2 并行 FDTD计算中的边界数据交换 |
4.5 并行 FDTD运算中并行计算单元之间的通信 |
4.5.1 物理接口 |
4.5.2 并行 FDTD计算系统的数据通信 |
4.6 并行 FDTD方法对计算机存储资源的估算 |
4.6.1 二维目标空间对计算单元的内存需求 |
4.6.2 三维目标空间对计算单元的内存需求 |
4.6.3 高阶 FDTD算法的内存需求 |
4.6.4 主机的内存需求 |
4.7 本章小结 |
第五章 并行 FDTD计算系统设计及仿真实例 |
5.1 硬件系统设计 |
5.1.1 并行计算单元为基于 PC主板的结构的单元 |
5.1.2 专用的大容量千兆位网络通信 |
5.2 软件系统设计 |
5.2.1 操作系统的选择 |
5.2.2 并行计算单元的远程启动 |
5.2.3 人机界面、控制程序 |
5.3 并行 FDTD的边界数据的传递、数据压缩 |
5.4 二维仿真实例 |
5.4.1 仿真结构 |
5.4.2 并行计算效率分析 |
5.4 三维仿真实例 |
5.5 本章小结 |
第六章 总结 |
6.1 本文的主要研究工作和结果 |
6.2 本研究课题可以进一步研究的内容 |
参考文献 |
致谢 |
攻读博士学位期间发表的论文 |
学位论文评阅及答辩情况表 |
(8)大规模集群系统的性能评价与通信优化研究(论文提纲范文)
第一章 绪论 |
1.1 集群系统简介 |
1.2 现阶段几种主要的集群网络简介 |
1.3 高性能集群网络评测简介 |
1.3.1 常用的并行通信模型及性能评测因子简介 |
1.3.2 常用的性能测试程序简介 |
1.3.3 常用的通信优化方法简介 |
1.4 大规模科学计算性能测试与评估-LINPACK标准 |
1.5 针对实际应用的大规模并行软件性能评估模型概述 |
1.5.1 ScaLAPACK的性能预测模型 |
1.6 大规模科学计算性能测试与评估-FFT标准 |
1.6.1 Turkey-Cooley算法 |
1.6.2 并行FFT |
1.6.3 FFT性能分析 |
1.6.4 FFT的软件实现 |
1.6.5 与本文相关工作 |
1.7 本文的主要工作 |
第二章 硬件因素对Beowulf Linux集群系统通信性能影响的研究 |
2.1 常用的并行通信模型简介 |
2.2 实验用系统的配置情况 |
2.3 Beowulf Linux集群系统上的MPI基本行为分析 |
2.4 节点计算部分对通信性能的影响 |
2.5 网络部分对通信性能的影响 |
2.5.1 百兆快速以太网.versus.Myrinet |
2.5.2 单网卡.versus.双网卡 |
2.6 结论和建议 |
2.7 小结 |
第三章 大规模科学计算的性能测试与评估 |
3.1 引言 |
3.2 并行测试程序PARKBENCH |
3.3 并行测试程序NPB(NAS Parallel Benchmarks) |
3.3.1 NPB简介 |
3.3.2 NPB测试方法论 |
3.3.3 NPB 2.4 Class D的构建原则 |
3.3.4 测试环境-LSSC2 |
3.3.5 Block-Tridiagonal-BT |
3.3.6 Conjugate Gradient-CG |
3.3.7 Embarrassingly Parallel-EP |
3.3.8 Fast Fourier Transform-FT |
3.3.9 Lower-Upper Symmetric Gauss-Seidel-LU |
3.3.10 Integer Sort-IS |
3.3.11 Multigrid-MG |
3.3.12 Scalar-Pentadiagonal-SP |
3.4 并行测试程序NPB在大规模科学计算研究机群系统LSSC2上运行情况总结 |
3.4.1 单节点性能小结 |
3.4.2 总体性能小结 |
3.5 NAS Parallel Benchmarks 2.4的残差检验和附表 |
第四章 对集群网络通信性能的热点测试 |
4.1 引言 |
4.2 Myrinet 2000上的热点测试 |
4.2.1 Myrinet 2000上的发送/接收过程 |
4.2.2 一个热点,三种策略 |
4.2.3 2个热点测试程序 |
4.3 测试平台 |
4.4 简单的乒乓测试结果 |
4.5 测试程序Pstab A和Pstab B的运行结果及分析 |
4.5.1 从应用程序角度进行分析 |
4.5.2 从通信协议角度看Myrinet 2000上的发送/接收指令 |
4.6 三种策略对LogP模型参数影响 |
4.7 三种策略对NAS Parallel Benchmarks的影响 |
4.8 在其他一些集群网络(cLANs)上的测试结果 |
4.9 TH-MyVIA-另一种构筑在Myrinet2000上的通信协议 |
4.10 结论和展望 |
第五章 LINUX集群系统上的用户级通信 |
5.1 简介 |
5.2 已有的用户级通信协议及其分析 |
5.2.1 用户级通信协议GAMMA的性能测试及其优缺点分析 |
5.2.2 GAMMA的性能测试 |
5.3 集群环境通信协议所需作的工作 |
5.4 一个适用于小规模集群系统的用户级通信协议框架-‘TMachine’的分层,实现与策略 |
5.5 下一步的工作 |
第六章 并行FFT算法的通信问题研究 |
6.1 FFT并行算法简介 |
6.1.1 并行FFT的数据分配方案 |
6.1.2 并行FFT算法的通信行为调度 |
6.1.3 影响并行FFT算法性能的一些主要因素 |
6.2 一种对并行FFT算法内存体冲突进行改善的技术 |
6.2.1 传统的FFT算法 |
6.3 对旋转因子矩阵进行压缩的技术 |
6.4 并行FFT算法的性能衡量指标 |
6.5 一个典型的并行FFT算法-HFFT算法实例分析 |
6.6 未来可以做的工作 |
第七章 总结和展望 |
7.1 第2章 |
7.2 第3章 |
7.3 第4章 |
7.4 第5章 |
7.5 第6章 |
参考文献 |
攻读学位期间发表和接受的论文 |
致谢 |
作者简历 |
(9)行波管幅相一致特性研究(论文提纲范文)
中文摘要 |
英文摘要 |
第一章 绪论 |
1.1 微波管CAD技术进展 |
1.1.1 数值计算方法及相关软件 |
1.1.2 微波管模拟计算与CAD |
1.1.3 微波管CAD集成环境 |
1.1.4 欧洲各国的微波管CAD状况 |
1.2 幅相一致行波管进展 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.2.3 技术难点与对策 |
1.3 本论文的背景、主要工作和创新 |
第二章 幅相一致行波管高频电路模拟 |
2.1 理论建模与分析 |
2.1.1 色散方程 |
2.1.2 轴向互作用耦合阻抗 |
2.2 模拟结果讨论 |
2.3 结论 |
第三章 幅相一致行波管三维非线性理论 |
3.1 粒子模拟方法(Particle In Cell) |
3.1.1 宏粒子模型 |
3.1.2 有限尺寸粒子模型 |
3.1.3 静电模型 |
3.1.4 电磁模型 |
3.2 行波管三维大信号非线性理论 |
3.2.1 互作用模型 |
3.2.2 归一化变量和运动坐标系 |
3.2.3 径向耦合函数 |
3.2.4 电路方程 |
3.2.5 聚焦磁场 |
3.2.6 运动方程 |
3.3 行波管三维空间电荷力计算 |
3.4 行波管三维大信号工作方程组 |
3.4.1 工作方程组 |
3.4.2 电位下沉效应 |
3.4.3 初始条件 |
3.4.4 增益、效率和电流的计算 |
第四章 幅相一致行波管可视化科学计算 |
4.1 软件工程学 |
4.1.1 软件工程方法学进展 |
4.1.2 面向对象方法 |
4.1.3 对象模型技术 |
4.1.4 面向对象分析、设计和实现 |
4.2 微波管CAD中软件工程学应用 |
4.2.1 MMACE&TWTCAD |
4.2.2 TWTCAD系统分析、设计和实现 |
4.3 可视化科学计算 |
4.3.1 科学计算可视化理论模型 |
4.3.2 科学计算可视化系统框架 |
4.4 行波管三维互作用可视化科学计算 |
4.4.1 数值结果 |
4.4.2 谐波的影响 |
4.4.3 空间电荷力的影响 |
4.4.4 小结 |
第五章 幅相一致行波管网络并行计算 |
5.1 幅相一致行波管概述 |
5.2 网络并行计算 |
5.2.1 并行计算机分类 |
5.2.2 工作站群集 |
5.2.3 基于TCP/IP的网络并行计算 |
5.3 幅相一致行波管网络并行计算 |
5.3.1 系统软硬件环境 |
5.3.2 TCP/IP与Windows Socket |
5.3.3 幅相一致特性分析 |
5.4 小结 |
第六章 结束语 |
参考文献 |
致谢 |
发表和录用的学术论文 |
四、以太网络并行科学计算中通信损耗的定量描述(论文参考文献)
- [1]计算机科技论文摘要的机翻错误类型及译后编辑[D]. 付茜雯. 大连理工大学, 2020(06)
- [2]容器环境下药物分子动力学模拟与并行虚拟筛选的研究与实现[D]. 胡广超. 兰州大学, 2020(01)
- [3]高性能计算云平台测试与资源管理优化技术研究[D]. 张心言. 国防科技大学, 2018(01)
- [4]基于飞行安全调和测度及科学计算的人为因素设计与验证[D]. 尹堂文. 上海交通大学, 2018(01)
- [5]基于PC集群的电磁环境并行计算与可视化方法研究[D]. 于荣欢. 国防科学技术大学, 2011(04)
- [6]基于GPU的光波导器件FDTD并行算法研究[D]. 韩林. 山东大学, 2007(03)
- [7]光波导器件的高阶FDTD并行仿真分析[D]. 李康. 山东大学, 2006(05)
- [8]大规模集群系统的性能评价与通信优化研究[D]. 唐渊. 中国科学院研究生院(软件研究所), 2004(04)
- [9]行波管幅相一致特性研究[D]. 李斌. 电子科技大学, 2003(02)
- [10]以太网络并行科学计算中通信损耗的定量描述[J]. 杜振军哈尔滨工程大学计算机系,关健,张锐. 计算机工程与应用, 2001(01)