软件DSM中的数据行为分析及系统性能优化

软件DSM中的数据行为分析及系统性能优化

谢向辉[1]1999年在《软件DSM中的数据行为分析及系统性能优化》文中指出软件DSM系统以其易构造性和易编程性成为高性能计算技术的研究热点之一。由于过高的远程访问代价软件DSM系统的性能受到极大的制约。本论文重点研究了软件DSM中的共享数据行为,并从存储一致性协议、访存算法、应用程序特征等方面研究了优化软件DSM系统性能的技术,论文的主要工作有六个方面: ① 对共享变量的描述、共享数据的表示、存放、基本活动方式、以及一般访问过程进行了描述,提出了数据空间的访问冗余度的概念。并对假共享、存储粒度与程序的并行性和通信代价之间的关系进行了系统分析。 ② 分析了用于软件DSM系统研究的典型应用程序的特征,认为软件DSM对应用程序的适应是有限度的。具有粗粒度的远程访问和规则的访问方式的应用比较适合软件DSM的环境,细粒度以及大量不规则的远程访问会使软件DSM极不适应。 ③ 以同步操作为尺度,以通信开销为基础,描述了软件DSM系统中各种主要的时间和空间开销,给出了开销分析的方法和部分定量分析结果,并结合具体的一致性协议和应用,给出了时间开销的估算方法。 ④ 对国外最新软件DSM系统(CVM)进行了深入的研究。在分析消化了三万多行源程序的基础上,建立了运行于工作站群环境下的试验平台,为各种方法的验证铺垫了基础。 ⑤ 在对应用程序的多写形式分析的基础上提出了有限多写方法(LMW),并在基于工作站群的环境下实现了多种原型实验环境。LMW方法在DSM层面融合了单写和多写,使LRC和RC协议在程序运行过程中动态转换,简化了多写的实现。LMW方法对于适应于软件DSM系统的应用是有效的,在通信带宽较高的情形下可以很好地改善系统性能。 ⑥ 提出了数据预送(Pre-sending)的技术,并分别在HP和SUN两种工作站群的环境下实现了实验原型。数据预送是由数据拥有者将数据放置到可能的使用者的存储空间中的技术。实验表明对于访问较为规则的应用大数据块的预送是有效的,远程访问次数大幅减少,应用性能得到改善。但对于访问极为不规则的应用,大数据块预送反而会使系统性能下降。

陈小文[2]2011年在《同构众核处理器的片上存储管理与同步机制研究》文中研究指明随着集成电路技术的迅猛发展和应用需求的强力推动,片上系统逐渐由基于总线的单核或少量多核结构发展到基于片上网络的大量多核(众核)结构。由于每个处理器核和路由器完全相同,同构众核处理器具有非常好的规整性和可扩展性,易于挖掘多个处理器核协同并行工作的潜力。同构众核处理器在带来强大并行计算能力的同时,也对体系结构的设计提出了新的挑战。其中如何提供有效的存储管理和高效的同步机制以便能充分挖掘同构众核处理器的并行性能,已经成为同构众核体系结构设计领域的重要课题。本文首先分析了同构众核处理器的结构特征和并行程序行为,构建了同构众核处理器平台和性能评价模型。然后,从“片上可编程存储管理技术”和“高效双通道硬件同步机制”两大方面对同构众核处理器的存储和同步问题进行了深入细致的研究。本文对提出的“面向分布式共享存储的数据管理引擎”、“混合式分布式共享存储空间的静态和动态划分技术”、“基于动态缓冲分配的双通道快速信号灯同步机制”和“基于协同通信的双通道快速栅栏同步机制”从统计硬件开销、建立性能评价函数以及开展综合激励实验和应用程序实验等多个方面进行了详细的性能评测。本文的主要工作与创新点体现在以下几个方面:1)通过引入等效串行报文和等效串行通信的概念建立了量化的网络通信模型,进而建立了在均匀和热量两种网络流量下的同构众核处理器性能评价模型,并得出在结构设计和程序开发上如何权衡“核间并行—网络通信”性能矛盾体的建议,指导后续研究工作的开展。2)为了增强同构众核处理器的适用范围,采用微代码方法[1]设计并实现了数据管理引擎,用于片上分布式共享存储管理。数据管理引擎允许使用者通过微代码编程方式根据不同的应用实现各种不同的功能。在结构上,采用双协处理器设计,并发处理来自本地节点和通过片上网络来自远程节点的请求。在编程上,提出了基于命令触发的微代码执行机制,开发了微代码函数库和微代码编程流程。结合微代码编程流程,本文通过微代码实现了分布式共享存储功能。实验结果表明,随着网络规模的扩大,数据管理引擎引入的延迟开销与网络通信开销相比非常小。本文提出的微代码解决方案的延迟开销控制合理,延迟效率接近纯硬件解决方案,同时具有与纯软件解决方案相同的灵活性。3)为了降低虚地址向实地址转换的开销对系统性能的影响,提出了一种混合式的分布式共享存储空间,并开发了该空间的静态和动态划分技术。在混合式分布式共享存储空间中,本地存储器划分为私有和共享两部分,并且采用物理和逻辑两种寻址模式。这样设计的理念是:对共享数据采用全局寻址的虚地址访问,同时对私有数据采用快速寻址的实地址访问。在静态划分技术下,混合式分布式共享存储空间的构成在系统设计时确定,在系统运行时不会发生任何改变。在动态划分技术下,混合式分布式共享存储空间的私有区域和共享区域可在系统运行时根据并行程序中数据的属性进行动态调整。实验结果表明,与传统分布式共享存储空间相比,混合式分布式共享存储空间具有性能优势。在我们的实验中,性能的提升比例最高为37.89%,最低为3.68%。4)为了降低信号灯同步串行化对系统性能的影响,从消除头阻塞和提高缓冲利用率角度出发,提出了一种基于动态缓冲分配的双通道快速信号灯同步机制。每个节点包含一个基于动态缓冲分配的双通道快速信号灯同步模块。该模块提供了一组同步锁变量,全局寻址和对所有节点可见。该模块并发响应来自本地节点和通过片上网络来自远程节点的同步请求,并动态分配缓冲资源,在逻辑上形成多个与同步变量一一对应的虚拟缓冲,目的是消除头阻塞和提高缓冲利用率。实验结果显示,与旋转锁相比,该同步机制性能较优,为同构众核处理器提供了一个高效快速的信号灯同步解决方案。5)为了降低栅栏同步串行化对系统性能的影响,从优化网络通信开销角度出发,提出了一种基于协同通信的双通道快速栅栏同步机制。在该方法下,栅栏同步报文以广播的方式在片上网络中快速传输并且在传输过程中通过不断合并消除栅栏获取同步间的网络竞争。在路由器中设计了协同通信模块,用于支持栅栏同步报文的协同通信。在协同通信过程中,路由器彼此协同工作,共同完成一次快速高效的栅栏同步。实验结果表明,在协同通信方法下,all-to-all算法由性能最差变为性能最佳的栅栏同步算法,具有非常好的可扩展性。

陈晓江[3]2010年在《分布式系统软件体系结构建模与开发方法研究》文中指出随着计算机网络技术的发展,开放、分布、异构的分布式系统由于在资源共享、高可用性、并行处理等方面巨大优势,成为当前计算机应用系统的主流,其系统规模的不断扩大,演化和维护要求的不断提高,以及其特有的分布性、异构性和自治性等成为长期困扰和制约开发的主要困难。大量研究和软件开发实践表明,引入软件体系结构作为指导分布式系统开发与构件组装的蓝图,是控制软件复杂性、提高软件质量、支持软件开发、演化、复用和维护的重要手段,是解决分布式系统开发困境,成功构造分布式系统现实、有效的途径。因此,如何通过软件体系结构提升分布式系统开发的质量和效率,保证系统维护和演化空间,是分布式系统开发中的关键,也是本文研究的核心内容。一个可行的思路是通过形式化方法保证对分布式系统体系结构严格的抽象和验证,通过使其具有动态性而满足对于环境和需求变化的适应,最后通过有效的手段保证其从分布式系统软件设计初期贯穿到软件实现阶段,在整个软件生命周期有效的控制开发与演化。基于以上思路,在分析当前分布式系统开发方法与支持手段不足和问题的基础上,本文针对软件体系结构和分布式系统交互风格的形式化描述、体系结构求精与映射、演化与重构以及体系结构驱动下的分布式系统开发方法等进行了研究,并用实际的案例进行了说明。具体的研究成果和主要贡献有:(1)提出了一个适合分布式系统的体系结构抽象模型DSAM,给出了其形式化模型,以此为基础,设计实现了一个基于属性文法的软件体系结构描述语言Dis_ADL和基于CCs的分布式构件交互风格描述语言Discid。Dis_ADL支持对分布式系统进行规约、分析、验证、求精,通过对软件体系结构形式化描述和图形描述双重支持,提供了易用性和语义严格的统一,也具有适应环境和需求变化的动态配置能力;Discid针对分布式系统交互协议复杂,构件交互设计困难的问题,提出了一个可视化交互设计的解决方案,可以很好的对分布式系统交互中同步、并发、死锁等动态特性进行直观描述、严密分析和性质验证,极大的方便了分布式系统中最为关键的交互风格的设计。(2)提出了体系结构求精的指导原则,并设计了一套从软件体系结构描述Dis_ADL到软件实现层面通用设计模型UML的映射规则,把求精验证后体系结构元素映射到可编码设计元素,缩小设计和实现间的距离,使软件体系结构的理论研究指导软件开发实践的作用更为突出。(3)提出一种在模糊聚类分析基础之上进行软件体系结构重构,进而通过将设计结构矩阵相关理论和包模式识别技术相结合对重构的体系结构进行分析的方法,不但可以发现和定位违背设计实现,解决了开发过程中软件体系结构设计和软件实现的一致性丢失问题,使真实系统与体系结构保持一致,而且可以使其与软件实现更好同步演化,使软件体系结构在整个分布式软件生命周期中发挥其指导作用。(4)提出了体系结构驱动的分布式系统开发方法ADiSC,建立了分布式系统开发的生命周期模型,在分布式系统整个生命周期中引入体系结构支撑。通过将软件体系结构自项向下的指导和自底向上基于构件组装的软件开发方法相结合实现对系统的构造;通过软件体系结构不断求精、映射,使得需求向设计、实现平缓转化,体系结构设计向面向对象设计的自动转化,极大缩小了从系统高层设计到软件实现之间的距离;通过体系结构重构分析保证真实系统与软件体系结构在开发与演化过程中的一致性,使得软件体系结构可以贯穿并有效指导整个分布式系统的开发维护过程。ADiSC方法使得分布式系统开发既具有严格的理论基础,又具有规范的工程原则。(5)在此基础之上,设计并实现了一个可视化支持分布式软件体系结构构造、规约、分析、求精、重构的设计建模环境ADisDTool,极大减轻了分布式系统设计人员的认知难度,保证开发质量,极大地提高了系统的设计效率。同时,在本文中我们也给出了应用案例进行分析,展示了相关主要方法有效性。

郑仁亮[4]2009年在《OFDM超宽带射频收发器设计关键问题及单芯片实现》文中研究说明近几年在短距离无线通信领域,超宽带(Ultra-wideband,UWB)技术作为一种新型无线传输技术,在10米距离内能获得480Mb/s甚至更高的数据传输率,吸引了广泛关注和重视,被认为是未来短距离无线通信重要发展方向之一。本论文主要研究多载波正交频分复用(MultiBand OFDM,MB-OFDM)超宽带前三个频带(3.1-4.8GHz)的超宽带射频收发器系统设计中存在的主要问题,并对其中关键电路设计进行了研究,最终使用CMOS工艺实现收发器单芯片集成与测试。首先,从系统角度,结合MB-OFDM UWB技术特点,设计了基于直接变频方式的射频收发器架构。针对系统中的偶次谐波失真、正交(In-Phase/Quartuture,I/Q)失配、直流失配及载波泄漏分别提出了解决方案。通过系统设计,完成了接收器各个电路模块具体设计指标的优化与分配,从而指导电路的设计与实现,以满足系统的要求。如何保证射频信号在带内保持性能一致的调制发射与接收解调是电路设计的难点。因而在发射器电路设计中,通过上变频调制器(Modulator)与可编程增益放大器(PGA)的谐振点不同来调谐增益在带内的平坦度。由于发射器的载波泄漏会对线性度造成影响,论文提出了使用7位电流型DAC来校正上调制器的输出直流失调来提高载波抑制。另外使用了电阻负反馈的线性化跨导和电流镜技术解决了低电压下高线性度的问题。在接收器前端,提出了一种输入共源管电流复用与栅极电感相结合的电阻负反馈方式的低噪声放大器(Low Noise Amplifier,LNA)。在一定增益与噪声性能要求下,该LNA降低了功耗和芯片面积;同时栅极电感能够拓展高频增益带宽,并且能进一步优化输入匹配;在与压焊脚(PAD)上附加的静电泄放电路(ESD)和键合线电感(Bonding Inductor)协同设计的基础上完成了LNA与混频器的级联设计。考虑了射频系统集成中包括版图布局、电路模块隔离等关键问题,使用Jazz 0.18umRF CMOS工艺完成了收发器电路的单芯片集成。收发器测试芯片结果基本满足系统性能要求,验证了从系统设计到电路实现的设计思想。是国内首次对OFDM UWB射频收发器系统的单芯片集成。

徐敏[5]2006年在《基于UML和Petri网技术的负荷管理系统》文中研究表明电力负荷管理系统是运用通信技术、计算机技术、自动控制等技术对电力负荷进行监控、管理的综合管理信息系统。在电力短缺问题越来越严重的今天,研究电力负荷管理系统有利于实现供需资源的协同优化整合。 文章深入研究了负荷管理系统的建模技术。在对结构化方法、面向数据结构方法以及面向对象方法比较之后,采用面向对象方法的UML(Unified Modeling Language)进行系统建模。但是UML不能很好的描述系统的动态特性,而Petri网能充分描述系统的并发性、异步性、非确定性和并行性等,可以很好的建立系统的动态模型,因此文章探讨复合建模的思路,尝试使用面向对象的UML和Petri网技术相结合的方法对负荷管理系统进行建模。 文章首先用面向对象的UML对负荷管理系统做静态建模分析,建立了负荷管理系统的用例图、类图、构件图和部署图,然后采用Petri网技术对负荷管理系统做动态建模,建立负荷管理系统的工作流模型,并进行了正确性验证和冲突性分析。最后根据系统的功能需求和所建的模型开发了负荷管理系统软件。 实践证明,应用面向对象的UML和Petri网技术相结合的方法是建立信息系统模型的有效方法。

黄丽[6]2010年在《温度分层型水蓄冷槽的模拟及理论研究》文中进行了进一步梳理蓄能技术可以削峰填谷、缓解用电高峰期电力不足,使发电设施在夜间低谷期的潜力得以充分利用发挥。水蓄冷技术作为一种低投入、高效的蓄能方式得到了越来越多的关注。本文结合实际工程,论述了利用消防水池做蓄冷水槽进行温度分层型水蓄冷空调系统的设计方法,并与原有常规空调系统比较其节能性。探讨了散流器的设计原理依据及布置原则,设计模拟模型,并利用CFD软件建立蓄冷水槽的模拟模型,模拟研究蓄冷水槽的性能:蓄(释)冷过程中水槽出口水温随时间变化情况以及蓄(释)冷进行时蓄冷水槽内温度分布变化情况。理论分析了影响冷量释放系数FOM的主要因素是不同温度水之间在界面的混合与热传导损失。计算分析减小斜温层厚度可以提高FOM,通过CFD模拟得出斜温层厚度随散流器孔口出流速度降低而减小。利用CFD软件建立八角形和径向圆盘形散流器模拟模型,发现在设计参数一样的情况下,八角形比径向圆盘型孔口出流速度均匀。模拟比较不同参数的八角形散流器的孔口出流均匀程度,并用理论计算分析验证模拟的正确性。

参考文献:

[1]. 软件DSM中的数据行为分析及系统性能优化[D]. 谢向辉. 中国科学院研究生院(计算技术研究所). 1999

[2]. 同构众核处理器的片上存储管理与同步机制研究[D]. 陈小文. 国防科学技术大学. 2011

[3]. 分布式系统软件体系结构建模与开发方法研究[D]. 陈晓江. 西北大学. 2010

[4]. OFDM超宽带射频收发器设计关键问题及单芯片实现[D]. 郑仁亮. 复旦大学. 2009

[5]. 基于UML和Petri网技术的负荷管理系统[D]. 徐敏. 河海大学. 2006

[6]. 温度分层型水蓄冷槽的模拟及理论研究[D]. 黄丽. 武汉科技大学. 2010

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

软件DSM中的数据行为分析及系统性能优化
下载Doc文档

猜你喜欢