大规模并行计算机系统通讯问题研究

大规模并行计算机系统通讯问题研究

肖利民[1]1996年在《大规模并行计算机系统通讯问题研究》文中进行了进一步梳理并行处理是计算机研究领域中的一个热门课题。基于消息传递的大规模并行计算机系统逐渐成为超高性能计算机市场上的主流产品,它的性能在很大程度上取决于其内部处理机之间的通讯效率。 足够小的通讯软件开销以及实现计算和通讯在时间上的重叠是提高大规模并行计算机系统内部处理机间通讯效率的关键。传统通讯机制中的上下文切换、复杂的缓冲区管理以及慢速的内存数据拷贝,往往会造成过大的软件开销,不利于计算和通讯的重叠。因此有必要分析这些开销的来源并采取措施去尽量消除它们的影响。Active Message通讯机制充分利用了通讯硬件的异步特性,可以大大地减少消息发送和接收的软件开销,较好地挖掘出通讯硬件的潜能。 本文讨论了在曙光-1000大规模并行计算机系统上实施Active Message通讯机制的策略,设计和实现了基于Active Message机制的通讯软件和基于Active Message通讯软件的NX函数调用子集,并对曙光-1000的底层通讯(包括互连网络的传输延时和处理机读写网络通讯接口FIFO的时间开销)、Active Message通讯软件以及基于Active Message的NX函数调用进行了性能评价。 性能评价的结果表明,曙光-1000互连网络的延时较小,处理机读写FIFO的时间是硬件通讯开销的主要部分,Cache对降低通讯开销的作用明显;Active Message通讯软件有着很小的消息发送和接收软件开销,可以大幅度地提高通讯的性能,对于短消息,通讯开销可以降低一个数量级;并且以Active Message为基础实现的高层通讯软件在提高通讯性

李琼[2]2009年在《面向高性能计算的可扩展I/O体系结构研究与实现》文中研究表明数值模拟计算是进行科学研究和探索的主要技术手段之一,其对计算机的计算和数据处理能力提出了巨大的、不断增长的需求,推动着并行计算机系统的发展。高性能计算已进入PetaFlops时代,与此同时,数据存储也进入Petabyte(千万亿字节)时代,对I/O性能、可扩展性、可靠性、可用性和易管理性提出了严峻挑战。大规模并行计算机系统的I/O效能已经成为阻碍系统获得高效能的重要瓶颈。这主要表现在两个方面,一是I/O设备速度、I/O体系结构等因素的制约,使系统I/O性能和计算性能严重不匹配;二是系统规模的扩展导致I/O设备高故障率和数据恢复时间的增长,使I/O系统的可用性问题日益突出。为了缓解I/O瓶颈问题,可以从应用程序、可扩展算法、编译器和语言、运行时库、操作系统和体系结构六方面展开研究。其中,I/O体系结构是所有技术途径的关键支撑。针对高性能计算I/O需求与挑战,结合高效能并行计算机系统的研制任务,论文首先研究了I/O体系结构,从体系结构上保证并行I/O的性能及可扩展性。其次,在实现机制上,研究了涵盖I/O的存储一致性模型及实现技术、智能I/O控制、电磁混合存储加速和事务型存储管理等技术,达到提高并行I/O性能和系统可用性的目的。论文的主要研究工作和创新点如下:1. I/O受限的并行加速比模型针对并行计算机系统的可扩展性问题,研究了I/O负载对并行计算机系统可扩展性的影响,提出了I/O受限的并行加速比性能模型,以此为基础对三类常见的I/O体系结构的可扩展性进行了分析;最后用性能模型指导I/O体系结构设计,设计了一种面向高性能计算的可扩展并行I/O系统结构,提出了提高系统可扩展性的几种策略。2.涵盖I/O的广义域存储一致性模型及协议实现技术针对支持全局DMA操作的共享存储系统存储一致性问题,从I/O与存储体系结构一体化设计理念出发,定义了涵盖I/O的广义程序概念,研究了广义存储一致性,建立了广义顺序一致性模型、广义释放一致性模型和广义域一致性模型,基于广义域一致性模型设计并实现了Cache-Memory-I/O数据一致性协议,在大规模CC-NUMA系统上实现了支持全局并发DMA的全局共享I/O系统。实测结果表明,该系统I/O吞吐能力和扩展能力强,实测并行I/O带宽高达20.2GB/s,并行I/O带宽随着进程个数良好扩展。3.基于强化学习的智能I/O调度算法RL-scheduler针对实际应用中磁盘阵列的I/O服务效率问题,将机器学习领域中的强化学习技术引入RAID控制器中,提出了基于强化学习的智能I/O调度算法RL-scheduler,利用Q-学习策略实现了面向并行应用的自治调度策略。RL-scheduler综合考虑了调度的公平性、磁盘寻道时间和MPI应用的I/O访问效率,并提出多Q-表交叉组织方法提高Q-表的更新效率。实验结果表明,RL-scheduler缩短了并行应用的平均I/O等待时间,提高了大规模并行计算机系统的实用I/O带宽,增强了系统的可扩展性。4.支持事务语义的电磁混合存储管理算法针对高性能计算对I/O性能和可用性的双重需求与挑战,在存储设备一级将事务型存储管理和电磁混合存储加速技术有机结合,研究支持事务语义的电磁混合存储技术,提出了基于令牌的并行事务冲突处理协议和自适应动态逻辑分区管理算法。模拟结果表明,支持事务语义的电磁混合存储系统能够有效利用事务访问规律提高固态盘缓存命中率,隐藏版本管理、冲突检测等开销,获得I/O性能和可用性的双重改善。

卢宇彤[3]2009年在《面向高效能计算的大规模资源管理技术研究与实现》文中研究表明高性能计算发展到今天,已经从单一地追求高性能转向致力于实现系统的高效能,提高系统的实际性能、可编程性、可移植性和健壮性,降低系统的开发、运行以及维护成本。然而,由于百千万亿次以上高性能计算机系统具有规模庞大、结构复杂和组成异构多样等特点,为了实现高效能目标,系统必须解决实际应用的持续性能难以提升、管理效率低、可靠性差、能源消耗巨大等多个挑战性问题。这些问题对高效能计算机系统的大规模资源管理系统在性能、功能和可扩展性等多个方面提出了很高的要求,大规模资源管理技术成为高效能计算机系统实现的一个重大挑战性技术问题。论文以我们自行研制的可扩展共享存储(S2MP:Scalable Shared Memory Processing)体系结构的高性能计算机系统上的大规模资源管理系统实现为基础,以面向高效能大规模并行计算机系统的高效资源管理技术为主要研究内容,在资源管理模型、资源管理系统的可扩展技术、综合优化的调度机制、用户作业自动恢复的容错管理方法以及系统能耗管理技术等方面展开研究,本文主要工作和贡献如下:1、提出了大规模并行计算机系统的深度资源信息模型DRIM,克服了传统资源管理系统所关注的资源对象粒度过粗和资源描述能力不足的问题,针对高效能计算系统的特点建立了实体模型、功能模型和应用模型,更加全面、准确地描述了计算资源、通信资源、存储资源、多模式应用等各方面的特征,并将资源对象之间的关系模型化,使得管理策略更有效,管理功能可扩展性更好,为大规模并行系统高效的作业调度与资源分配提供了有力支撑。2、设计了动态层次式级联资源管理结构,提出了基于自组织方式的级联服务动态创建方法,优化了资源管理系统的通信协议,设计了轻载的传输协议来减少大规模资源管理开销,采用硬件通讯机制实现高效的控制消息传递,通过全局操作与综合优化实现大规模作业的快速加载,解决了资源管理系统的规模可扩展问题。采用基于构件的系统实现结构支持资源管理的功能扩展。在由2048个多核处理器构成的S2MP体系结构的系统上进行了资源管理系统的实现和测试,测试结果表明系统具有良好的可扩展性。3、提出了基于综合优先级的调度策略,综合考虑系统的作业属性、资源属性和服务属性中的多个因素,提升了调度机制的灵活性和有效性;设计了可变深度的回填调度策略MC-Backfill,实现了根据队列实际状态对Backfill的深度和频度的动态调整,较好地协调了系统的公平性目标和高吞吐率目标的实现。系统测试表明,MC-Backfill策略可以在用户对作业执行时间估计不准确的情况下较好地减少作业平均等待时间,提高系统吞吐率。4、建立了一种高性能计算系统的故障分布模型,提出了基于Checkpoint/Restart的作业容错执行时间模型;设计了面向可靠性的检查点周期选择算法和最优结点集合选择方法,增强了系统中作业运行的可靠性;实现了基于Checkpoint机制的作业自动容错,避免了系统运行过程中的人工干预,降低了系统的平均故障恢复时间,提高了系统的可用性。5、结合系统级和应用级的能耗管理技术,从资源管理系统的角度研究了全系统能耗管理,设计了能耗约束条件下的资源分配方法进行系统级的结点能耗管理;提出了基于负反馈的两级能耗管理模型进行应用级的能耗管理,基于访存带宽和I/O带宽的利用率,采用线性控制和模糊控制相结合的方法动态调整并行应用线程和进程数目,适时将空闲处理器核关闭以节约系统能耗。并给出了对能耗控制管理有效性的测试和分析。

苗乾坤[4]2010年在《面向共享存储系统的计算模型及性能优化》文中研究说明长期以来,大规模计算的应用需求推动并行计算技术不断发展,并行计算机的峰值计算能力稳步提高。当前,基于共享存储的片上多核处理器搭建集群系统,成为并行体系结构的发展趋势,并行计算已经进入了千万亿次并行计算机的时代。但是,并行计算机的实际应用水平不高,应用程序实测性能远低于系统的峰值性能。因此,充分发挥并行计算机的计算能力,加速应用程序的执行速度,逐渐成为并行计算领域中亟需解决的一个关键问题。未来,共享存储系统是搭建大规模并行处理系统的基本单元。围绕提高并行计算机的实际应用效率,缩小实际应用性能与机器峰值性能之间的差异,本文以共享存储系统为目标平台,研究并行计算模型以及程序性能优化关键技术,主要研究工作分为两部分:一是研究分层的并行计算模型,为并行算法设计和并行程序执行提供理论基础和分析方法,其中重点研究片上多核系统的程序执行模型;二是研究共享存储系统上的程序性能优化技术,以提高并行应用程序的实际性能,同时为程序执行模型提供思路和借鉴。本文针对计算模型和优化技术的研究,可以有效地提高并行应用的性能,充分发挥并行计算机的计算能力,具有重要的学术价值和广泛的应用前景。具体而言,本文的主要研究成果、贡献和创新点可概括为以下几点:(1)提出分层的并行计算模型随着并行机体系结构的快速发展变化,传统单一的并行计算模型变得越来越复杂,难以使用。本文对并行计算模型分层研究,把并行计算模型分为并行算法设计模型、并行程序设计模型和并行程序执行模型三个层次,分别给出了各层模型的特点及研究内容。(2)优化共享存储系统上消息传递的通信性能MPI是一种流行的并行编程接口,同时支持分布存储并行机和共享存储并行机。针对MPI在共享存储上的驱动程序通信性能不高,本文提出一种共享存储系统上MPI消息传递优化方法,利用共享内存系统上进程间通讯机制和自旋等待同步策略,实现了进程间直接数据复制,减少了消息传递延迟,提高了共享存储系统上点对点和集合通信性能,优化了实际应用程序的通信性能。(3)优化共享存储系统上典型应用程序的性能本文研究两个典型的并行应用,分别在两种共享存储系统上的优化方法。一个是在对称多处理机上,基于MPI的生物信息领域的应用Mfold的并行优化;另一个是在片上多核系统上,基于OpenMP的信息检索领域的应用CBIR的并行优化。针对应用和系统特点,设计了高效的并行算法,挖掘共享存储系统的多级并行度,有效优化了应用的指令级并行性、数据级并行性和线程级并行性,加速了应用程序在共享存储系统上的速度,为这一类平台上开发高效应用程序提供了借鉴。(4)提出面向片上多核系统的定量程序执行模型结合对共享存储系统上应用程序性能优化的研究,本文提出面向片上多核系统的定量程序执行模型CRAM(h)。CRAM(h)模型考虑了指令执行行为、层次存储访问行为及并行处理行为,抽取关键性能参数,对程序执行时间进行建模。实验表明,模型评估的程序执行时间与实际程序运行时间基本一致。

宋振龙[5]2014年在《面向超级计算的大规模并行存储系统关键技术研究》文中研究表明近几年来,超级计算技术在科学研究和国民经济建设中扮演越来越重要的角色,应用领域也更加广阔。当前,超级计算和数据存储正迈向E级时代,超级计算机系统计算能力迅速提升,数据规模急剧增大,存储与计算的矛盾日益突出,对超级计算机系统数据处理能力提出巨大挑战。本文主要针对超级计算机大规模存储系统中存在的问题,结合天河超级计算机并行存储系统的研制任务,围绕如何利用新型存储介质提升存储系统的I/O效能,开展新型存储体系结构、元数据服务系统的优化、闪存存储介质及存储阵列的性能优化、系统功耗优化等关键技术的研究,以提升大规模并行存储系统对海量数据的存储能力和处理能力。论文的主要研究工作和创新点如下:1.针对当前的对并行存储系统的优化缺乏量化策略,通过分析理想的并行存储系统模型,研究并行存储中的行为方法,给出了并行存储系统的带宽和延迟的行为模型。根据存储的数学模型和优化策略对并行存储系统体系结构进行了优化,提出了一种新型可定义存储架构。实验表明该架构在可扩展,可升级以及可配置优化方面具有更好的特性。2.针对传统元数据管理技术存在的瓶颈问题,本文根据分区并行、集中管理的设计思路,提出了基于闪存存储阵列和大SMP节点服务平台的元数据分域处理技术,实现了支持高并发的基于固态存储阵列的元数据服务器。实验表明,该技术显著提高了元数据服务的I/O吞吐率和可扩展性,并行存储系统的文件创建和查询速度提升了大约5倍。3.针对大规模并行存储数据带宽高,延迟低的要求,根据程序的局部性原理,采用预测策略重新设计了新的FTL映射策略,该策略有效降低了FTL转换带来的延迟,提升了闪存的读写速率。同时优化算法通过减少地址映射信息未命中而引起的固态盘内额外读写操作,可以有效提高固态盘的整体读写性能,并延长固态盘的使用寿命。4.针对闪存构建RAID以后带来的寿命急剧减少的问题,本文提出了一种基于缓存的可重构RAID策略。一方面,利用失效数据继续在介质中存在的特点,保护有效数据,从而避免了校验码的频繁更新问题,延长了闪存的寿命;另一方面,利用缓冲区写和闪存读可并发的特性,提升了RAID的带宽,降低了I/O访问的延迟;此外,利用缓冲区的替换策略可以将具有同一读写特性的数据汇聚到相近的位置,显著加速了垃圾回收的过程。实验证明相比传统的RAID策略,该策略可以大幅减少垃圾回收和擦除的次数,显著提升闪存介质的使用寿命。5.针对未来基于非易失存储介质的计算存储相融合的系统架构。本文根据大规模非易失存储的计算存储系统的功耗模型,提出了基于通信类的模拟退火算法,利用作业的通信特性对进程进行分类,构建一个次优的初始任务图,根据初始任务图和约束通过模拟退火算法找到局部最优解,采用模拟退火算法实现快速的作业调度策略。实验表明,此种策略较传统任务分配策略时间更短,节能效果更好。

荣莹[6]2005年在《基于MPI和Linux的集群系统的构建和应用》文中指出本文介绍基于MPI和Linux的集群系统的构建和应用。 随着计算机应用的日趋复杂,对计算机系统超过当前可能提供的计算速度的需求总是不断增长。如何满足科学计算的要求,快速而有效地提高计算速度成为计算机科学迫切需要解决的问题之一。解决这一问题最为快速而且有效的方法是将多台计算机连接起来构成集群并行计算系统,使它们能够协同求解同一问题。 本文在系统研究集群并行计算系统结构、应用类型,以及应用需求的基础上,构建了一个小型的基于MPI和Linux的集群系统。并且在该集群系统上成功实现了GeoFEM软件的移植。 本文主要取得以下成果: (1) 以最小成本建立了基于MPI的COW型的PC集群并行系统。本系统利用实验室现有的PC机和局域网资源,在Linux、MPICH等免费软件平台上构建而成,以最小成本实现了高性能并行计算机;为GeoFEM系统的移植实现提供了必需的硬件基础。 (2) 构建的集群并行计算系统具有良好的灵活性和可扩展性。系统通过NFS、NIS、RSH服务器的配置实现了集群并行系统的网络服务。系统内所有运算节点均可通过对这些服务器的配置,随时按用户使用要求进行增减,集群系统节点管理简便;为系统运算能力升级打下了良好的基础。 (3) 硬件资源达到最大利用率。本集群并行系统所有节点机在不进行并行计算时,均可单独作为个人用户计算机使用,灵活性强。 (4) 在已构建的集群系统上成功实现了GeoFEM的安装、调试和运行。通过对MPI、C、C++、FORTRAN90编译器等GeoFEM使用环境的分析,配合对GeoFEM软件系统的安装参数含义的理解,摸索出了适合本集群并行系统的GeoFEM安装参数。

张耀程[7]2008年在《通用并行离散事件仿真环境及相关技术研究》文中研究说明仿真技术作为推动科学发展和社会进步的三大科学研究手段之一,其发展一直与计算技术的发展紧密结合。许多具有挑战性的研究与应用,如复杂战场环境的作战仿真,大规模通信网络与大规模集成电路的设计与验证,空中及道路交通管理,决策支持系统等,对模型精度、计算速度及计算资源的需求远远超过了普通串行计算机所能提供的计算能力,这些问题的解决有赖于并行计算机及并行离散事件仿真(PDES)技术的应用。在PDES技术研究领域中,并行仿真支撑环境的研究具有至关重要的地位,论文围绕建立通用高性能并行离散事件仿真环境的关键技术展开研究,结合并行离散事件仿真支撑环境KD-PARSE (KD-PARallel Simulation Environment),重点讨论了能够适应多种并行计算硬件平台的PDES系统模型、PDES中的时间同步算法、事件管理机制与事件回退算法、及PDES中的模型互操作机制等问题。论文首先从并行仿真所使用的并行计算平台入手,分析了各种并行硬件环境所适用的计算模型,并据此将PDES系统分为同步、异步、共享内存、及消息传递四种模型。在此基础之上,提出了一种适用于MIMD并行计算平台、基于消息传递模式的异步PDES系统模型,该模型可以运行在分布、共享、及混合内存体系结构的并行计算环境中,仿真模型之间统一以消息传递方式进行事件调度,由底层通信软件负责消息在共享内存和分布内存环境中的路由。基于该模型,论文介绍了并行离散事件仿真环境KD-PARSE,包括它的模型表示方法,以及基于该环境建立的并行离散事件仿真系统的体系结构,并重点介绍了KD-PARSE如何实现在共享、分布及混合内存环境中的消息传递操作和同步操作。接下来,论文对PDES中的时间同步算法进行了研究,在介绍时间同步算法相关概念的基础上对文献中已经大量报道的各类同步算法进行了归纳,按照同步算法中若干关键参量的取值将其分为保守同步、乐观同步、容错同步及有限乐观同步四大类算法。论文重点介绍和分析了将乐观同步和积极同步相结合的Breathing Time Warp同步算法,并在集群环境中通过PHOLD实验验证了该算法相对于单独的保守、乐观或积极同步算法的优越性。针对BTW算法静态控制事件处理乐观程度的缺陷,论文提出了一种BTW改进算法SafeBTW,该算法将事件之间的调度关系分为安全因果关系和不安全因果关系,并据此限制事件处理过程中乐观风险的传播范围,经PHOLD实验证明SafeBTW算法在整体仿真计算乐观性增加的情况下可以有效减少因二次回退而引入的计算开销,提高整体仿真计算效率,同时随节点数的增长显示出较强的可扩展性。结合KD-PARSE中的事件管理服务模块的具体实现,论文介绍了PDES中能够支持乐观处理方式的事件模型和事件队列结构。论文分析了KD-PARSE中事件与仿真对象之间的关系,并重点介绍了KD-PARSE中基于增量式状态保存法、反消息法、及懒惰回退法的事件回退算法以及KD-PARSE自动回退框架的设计与实现。接下来,论文介绍了KD-PARSE中的事件队列设计以及节点的事件管理服务框架,最后介绍了PDES中的事件状态管理过程并给出了KD-PARSE中的事件管理服务开销实验结果。最后,论文介绍了KD-PARSE中基于实体模型和事件处理机制的互操作框架。该互操作框架包括数据分发框架和交互处理框架两部分,允许仿真实体按照HLA中定义的模型互操作方法进行实体状态数据的公布定购操作和交互操作,并提供基于实体属性和定购兴趣表达式的数据分发管理(DDM)服务。针对类似集群计算机这样的分布内存计算环境,KD-PARSE对其数据分发框架进行了优化,优化后的DDM服务性能与未优化的设计方案相比,可以显著提高在这类计算环境中的计算性能及可扩展性。

毛永捷[8]1997年在《基于消息传递的机群机间通讯系统》文中研究说明并行处理与并行计算机是当今计算机科学研究的热点之一,并行计算机以其卓越的性能日益受到世人的瞩目。其中,基于消息传递的并行计算机逐渐成为了超级计算机发展的主流,它包括两种机型:大规模并行处理机和机群。本文以基于消息传递的机群系统为原型,给出了机群机间通讯系统的性能评价模型,并详细地介绍了该系统的实现方案。 随着半导体工艺的日新月异,处理器越来越快,并行计算机的性能提高越来越依赖于相对较慢的通讯系统功能和效率的改善。一方面,通讯系统带宽和延时性能的提高,能直接加快消息传递的过程,使解题速度加快;另一方面,实现计算与通讯在时间上的重叠,能从宏观上隐藏通讯开销,从而使延时大大减小。通讯系统设计的好坏,直接关系到并行计算机的解题速度和解题规模。 本文讨论了机群机间通讯系统的数据链路构成,将其大致分为两种链路模型:单链路缓冲机制和基于Wormhole机制的二维Mesh网络。文中详细分析了它们的带宽、延时性能与数据流量和数据缓冲区的关系,给出了机群机间通讯系统的性能评价模型。 根据这样的性能评价模型,当数据流量比较小、Mesh网络负载比较轻时,机群机间通讯系统的延时与通讯距离近似无关;在数据流量比较大、Mesh网络负载比较重时,随着网络负载率的升高系统延时迅速增大。在稳定的数据流量下,系统带宽取决于最小的子链路带宽;在数据流量不稳定或网络出现阻塞时,缓冲机制将适时地发挥作用。同时,在考虑信道噪声的情况下,一定间隔的数据缓冲区将有可能使误码率降低。 机群机间通讯系统的关键设备—PMI的实现,是本文进

田俊刚[9]2004年在《高性能集群系统分析、设计与应用》文中进行了进一步梳理高性能集群是一组相互独立的服务器通过高速网络连接构成的高性能计算系统。相对于其它高性能计算机,它的优点是可扩展性好,具有高可用性和很高的性价比。 本文通过对高性能集群技术的分析和对集群互连网络的测试比较,选用SCI可扩展一致性接口技术设计了一个高性能集群,并实现了气象并行计算在高性能集群上的应用。 全文由四部分构成:高性能集群技术、高速互连网络的分析、高性能集群的设计和高性能集群在气象数值预报计算中的应用。 论文首先阐述了高性能计算机的需求和发展现状,研究了高性能集群的体系结构和软、硬件组成,然后详细分析了对集群性能起重要作用的几种高速互连网络的结构和组成,并通过测试对它们的性能指标做了比较。在此基础上,根据气象预报计算的具体需求,采用16节点和SCI网络,设计了高性能集群。同时对该集群网络(SCI)的可用性进行了深入的分析。最后为验证集群的性能,实现了气象数值预报中短期中尺度模式MM5、通用气候模式CCM3和区域气候模式RegCM3在该集群上的调试计算。 综上所述,本文完成了一个高性能集群的详细设计。同时在集群互连技术的分析比较中提供了大量有用的数据,为今后进一步设计大规模的集群奠定了基础。

陈龙鑫[10]2013年在《基于MPI的几种确定性算法的并行设计》文中认为近年来,软硬件技术的快速发展,使得计算机技术得到了越来越广泛的应用,新一代计算机在性能上较之以往有了长足进步。随着计算机使用范围的不断扩大,需要使用计算机来解决的问题规模也逐渐增大。面对现代诸多科研应用领域中具有挑战性的大规模计算课题对计算资源的需求,人们对高性能计算有了更加迫切的需求。并行计算是高性能计算研究领域中的热点问题之一,是计算数学与新一代计算机科学相结合的成果,它为大规模科学计算提供了理论基础与支持工具。作为如今流行的基于消息传递的并行编程环境,MPI(Message Passing Interface)即消息传递接口,以其功能强大、移植性好、高效等优点成为了目前最重要的并行编程工具被广泛应用于并行计算中。本文首先介绍了高性能计算与并行计算的发展情况,阐述了并行算法的基本理论。而后对MPI进行了简要说明,并介绍了C语言环境下MPI库的基本调用方法。在此基础上,研究讨论了运用MPI对三种确定性算法进行并行化设计。对于贪心算法中求单源最短路径的Dijkstra算法,通过实验测试给出算法执行时间以及加速比以分析算法性能:对于k-means算法,通过对实验数据的具体计算分析完成算法相应功能;对于禁忌搜索算法,在进行并行化设计的同时对其进行适当改进,通过实验对比串行算法与并行算法数据并予以分析得出结论。

参考文献:

[1]. 大规模并行计算机系统通讯问题研究[D]. 肖利民. 中国科学院研究生院(计算技术研究所). 1996

[2]. 面向高性能计算的可扩展I/O体系结构研究与实现[D]. 李琼. 国防科学技术大学. 2009

[3]. 面向高效能计算的大规模资源管理技术研究与实现[D]. 卢宇彤. 国防科学技术大学. 2009

[4]. 面向共享存储系统的计算模型及性能优化[D]. 苗乾坤. 中国科学技术大学. 2010

[5]. 面向超级计算的大规模并行存储系统关键技术研究[D]. 宋振龙. 国防科学技术大学. 2014

[6]. 基于MPI和Linux的集群系统的构建和应用[D]. 荣莹. 成都理工大学. 2005

[7]. 通用并行离散事件仿真环境及相关技术研究[D]. 张耀程. 国防科学技术大学. 2008

[8]. 基于消息传递的机群机间通讯系统[D]. 毛永捷. 中国科学院研究生院(计算技术研究所). 1997

[9]. 高性能集群系统分析、设计与应用[D]. 田俊刚. 西北工业大学. 2004

[10]. 基于MPI的几种确定性算法的并行设计[D]. 陈龙鑫. 天津师范大学. 2013

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

大规模并行计算机系统通讯问题研究
下载Doc文档

猜你喜欢