系统资源高可用性和应用性能保证的研究及实现

系统资源高可用性和应用性能保证的研究及实现

李春颖[1]2003年在《系统资源高可用性和应用性能保证的研究及实现》文中研究表明随着软件业的高速发展,高可用性(High Availability, HA)越来越受到人们的重视。高可用性这是关键系统最重要的要求之一。它要求网络系统有失败(或异常)恢复的功能,能从网络系统上断开不能响应服务的节点及链路,而把服务转向备份的服务及链路;而当失败的服务及链路重新恢复的时候,它们就成了热备份系统。所以,网络系统要具备冗余的网络设备(服务器及链路等)系统以及失败(或异常)恢复管理设备。 高可用性的实现需要在硬件、系统软件、中间件、应用软件上的整体考虑,以保证系统在任一环节失效的情况下,都能进行及时恢复,要求系统恢复时间极短,并且在系统恢复后保证数据的一致性。 本文首先介绍了通用高可用系统的策略,通过对系统硬件、操作系统、网络、数据库软件、应用软件运行方式的研究,提出了叁主机模式高可用系统,实现监控业务系统中所有关键资源的解决方案。 然后,本文着重论述了如何在发生各种不可预料的故障、破坏性事故或灾难情况时,能够继续提供计算机服务,确保业务系统的7x24小时不间断运行。在研究基础上,本文提出了一个系统资源高可用性和应用性能保证的原型,并就此进行了实验。 本文最后总结了工作尚存的不足,并指出了其发展的方向、应用前景和它所面临的挑战。

侯洪涛[2]2015年在《面向全球导航卫星系统的多层可用性分析方法研究》文中研究指明全球导航卫星系统(Global Navigation Satellite System,GNSS)作为人类社会的重大时空基础设施,有如人脑的导航功能一样,影响着人类活动的方方面面。随着各类导航应用的精度、时间和使用环境要求越来越高,高可用性已经成为GNSS设计和建设时关注的重要指标之一,同时全球四大GNSS的逐步建成,导航可用性分析已经成为各大系统相互兼容定位避免风险的关键手段。开展面向GNSS全系统可用性分析研究,一方面能够评价现有GNSS满足导航用户需求的能力,促进其改进和优化,另一方面能够牵引在建GNSS的总体设计和约束各分系统的工程建设。论文围绕如何基于导航系统底层部件可靠性进行GNSS全系统可用性分析问题开展了深入研究,系统的提出了面向GNSS全系统可用性概念体系,突破了一些关键分析技术,比较好的解决了GNSS全系统可用性多层映射分析的相关理论、方法和技术问题。论文的主要工作及创新成果如下:(1)面向GNSS全系统可用性分析,提出了一种基于误差传递过程的可用性多层映射分析方法框架。通过分析底层部件可靠性向顶层服务可用性映射分析的困难,研究了GNSS系统基本工作过程,提出了面向GNSS信息信号工作过程的导航可用性层次概念体系,首次把GNSS可用性分为系统可用性、链路可用性和服务可用性叁大类自底向上、依次递进的层次关系,系统、全面的描述了GNSS的各类可用性指标。基于此概念体系和GNSS用户等效距离误差(User Equivalent Range Error,UERE)在信息信号工作过程中的影响传递,提出了面向GNSS的可用性多层映射分析方法框架。本框架把导航可用性分为导航系统资源层、链路功能层和用户服务层叁层,给出了各层可用性之间的映射影响关系模型,并通过定义各层可用性分析模型,构建了底层部件可靠性和大系统服务可用性之间的一体化影响关系。(2)针对GNSS单星可用性分析,建立了基于连续时间Markov链(Continuous-Time Markov Chain,CTMC)和半马尔科夫过程(Semi-Markov Process,SMP)的单星可用性分析模型。针对导航卫星中关键载荷寿命周期和维修时间服从指数分布的部件对单星导航任务功能的可用性分析,基于CTMC建模的相关假设,研究了导航卫星CTMC瞬时可用性分析的过程,建立了基于CTMC的导航卫星可用性的通用分析模型,并用单部件卫星的可用性计算方法进行了验证。针对不严格服从指数分布的载荷的可用性分析,研究建立了基于SMP的导航卫星降阶分析模型,不是一般性的给出了基于SMP的导航卫星可用性求解方法。同时,利用单星可用性的通用分析模型,构建了标准化的卫星属性权重指标,建立了面向能力测度的导航星座可用性分析模型。(3)为了建立系统可用性和服务可用性之间的关系,提出了一种面向数据龄期(Age of Data,AOD)影响的导航链路可用性映射技术方法。基于导航系统的求解原理和导航系统故障影响因素分析,研究了UERE的主要影响因素。从导航地面网络的角度,建立了包含导航信息完整性、准确性、时效性的导航信息可用性关键指标计算模型,据此提出了基于AOD的导航信息可用性计算模型,量化了信息可用性和AOD之间的映射关系。从信号覆盖性和健康性指标研究了导航信号可用性,建立了AOD与用户测距误差(User Range Error,URE)之间的线性影响关系模型,从而建立了基于AOD的UERE误差预测模型,并用GALILEO数据验证了此模型的合理性。(4)针对顶层服务可用性,建立了基于导航加权精度(Weighted Dilution of Precision,WDOP)求解的服务可用性分析模型。在分析均匀星座导航精度衰减因子DOP求解算法的基础上,研究了面向区域增强星座的加权DOP算法。针对精度仿真分析的时空有效性,研究得出了区域格网精度在[5o,9o]范围、时间分辨率在60秒的取舍原则,建立了面向区域增强星座的WDOP精度可用性计算模型。在详细研究导航系统完好性指标及其影响故障模式的基础上,分析了面向多GNSS系统的RAIM完好性算法,给出了区域加权多GNSS系统中的多颗故障星故障判断和识别的算法过程,建立了基于RAIM的多GNSS系统的完好性可用性分析模型。最后详细研究了包含精度连续性和完好性连续性的GNSS连续性的计算模型,并建立了基于WDOP的区域增强星座的连续性可用性分析模型。(5)在上述方法框架和可用性分析模型的基础上,基于仿真模型可移植性规范(Simulation Model Portability Standard 2.0,SMP2.0),建立了仿真分析模型框架,开发了面向可用性分析的导航领域模型体系,设计和实现了GNSS系统可用性分析仿真原型系统。最后以某区域增强导航星座的卫星备份策略分析为例,应用所提可用性分析模型以及此原型系统进行了仿真,给出了基于可用性分析的初步备份策略,验证了方法的可行性。

黄伟[3]2005年在《机群系统容错中间件技术研究》文中进行了进一步梳理在高性能计算机的研究当中,如何保证系统的可用性和应用的可靠性一直就是需要首要考虑的问题之一。机群以其高性价比和高可扩展性已经成为构造高性能计算机一种主要的方法,而节点间松散耦合的结构也使得机群系统更易于保证系统的可用性。随着机群系统规模的逐渐增大,也带来许多了新的问题,如更加频繁的组件失效,软件体系结构的扩展性等问题。这些新的问题对如何保证系统的可用性带来了更多的挑战。机群容错中间件技术将机群、容错和中间件技术结合在一起,是一种在机群系统软件层实现的能够同时保证系统可用性和应用可靠性的方法。 本文结合曙光4000A系统的机群操作系统Phoenix高可用核心的设计与实现,对机群容错中间件的关键技术进行了探索,重点研究了:1)在大规模情况下,适用于机群系统的容错中间件的框架与体系结构;2)在容错中间件技术中,适合于大规模机群的容错实现机制;3)在采用容错中间件情况下,对机群系统可用性和应用可靠性的评价。本文取得的研究成果如下: 1.在提出和分析机群系统规模变大给系统可用性所带米的新的挑战后,提出了一个用于大规模机群系统的容错中间件框架DCFT-Kernel。这个框架采用了分区管理的思想及“平等式”与“结构式”结合的体系结构,较当前的机群高可用软件有效地解决了大规模系统所带来的系统扩展性、软件体系结构扩展性、和容错机制扩展性等问题。DCFT-Kernel框架由组服务、故障管理服务、配置服务、事件服务和用户接口组成,能够提供完备的错误侦测、错误修复、错误通知功能。 2.在分析了将容错技术应用到机群系统在理论上需要解决的问题后,提出了一种用于实现机群容错中间件核心容错机制的关键技术——组服务技术。机群容错中间件的工作基础是自身的高可靠,组服务技术通过采用组结构和成员关系协议,能够保证机群容错中间什自身在运行时严格的一致性和高可靠性。在组服务基础上,提出的机群容错机制充分考虑了机群系统和并行应用的特点,提供了层次化的故障侦测和处理方法,能够对大部分的系统故障和应用故障进行有效的处理。 3.在曙光4000A系统上实现了一个实际运行的机群容错中间件系统DCFTM。DCFTM位于机群操作系统的核心,为机群操作系统的各种服务部件提供高可用支持,同时也可以直接向上层应用程序提供编程接口,保障应用程序的容错运行。通过对DCFTM实际运行的性能分析表明:1)DCFTM能够保证机群操作系统中各类服务的高可用运行,在故障处理时可以提供很高的响应时间,能够及时的发现和修复各种故障,并通知这些事件。2)DCFTM只占据很少的系统开销,只要将心跳间隔时

刘东君[4]2010年在《服务器集群系统请求调度与高可用性研究》文中研究说明随着多媒体技术和计算机网络的迅猛发展,对服务器的请求也大量增加。这迫切需要高性能、高可用性和高性价比的Web服务器系统。服务器集群技术正是目前解决服务器超载和提供高性能服务器的一种有效手段。服务器集群就是由多台计算机通过高速网络连接而成的系统,集群系统性价比高,并且有良好的扩展性和容错性等,因此获得了广泛的应用。本文在介绍了服务器集群系统的概念、分类、数据共享方式和各种服务器集群的特点后,对集群系统负载均衡和高可用性问题进行了研究。首先将负载均衡与Web Qos控制结合,在已有的启发式算法上进行改进和优化,提出了新的基于Qos控制的负载均衡启发式算法。接着本文建立基于目标规划的异构服务器集群系统请求调度模型,对请求按其自身性质进行分类,再将服务器本身的性能作为约束条件,并把请求丢失率最小和不同能力的服务器处理不同数目的请求作为目标,从而建立目标规划模型,通过模型求解来解决请求调度问题。仿真结果验证了模型算法的有效性,模型算法既能让服务器处理能力得到较好发挥,又满足了请求响应时间的要求,使整个服务器集群的处理能力得到较大提高。本文对主/从和主/主双机热备份系统提出了高可用性服务器集群系统状态管理模型,然后又建立了基于Markov过程的双机热备服务器集群系统可用性模型,得到由单台服务器的可用性推算双机热备服务器集群系统可用性的量化关系。最后用仿真实验验证了模型的有效性。

刘安丰[5]2005年在《基于QoS的分布式Web服务结构模型及其关键技术研究》文中研究指明Web服务占据了当前网络70%以上的通信流量,并呈明显上升的趋势,在下一代互联网中Web服务普遍被认为代表了网格的发展方向。如何建立合理的Web服务结构模型,并实现有效QoS(Quality of Service)控制的机制与策略,从而满足不断增长的客户需求,为用户提供有效的Web服务,并为不同用户提供区分服务和性能保证,这是当今Web服务发展所面临的巨大挑战,也是实现下一代网络不可缺少的关键技术。 本文针对基于局域网的Web服务集群和网格Web服务二个研究对象,深入研究了Web服务的结构模型、Web QoS控制的策略和算法。针对Web服务集群,首先提出了一种基于QoS-aware的Web集群区分服务模型,然后在此基础上针对系统负载均衡、区分服务、克服自相似访问业务对QoS的影响、高可用性等几个方面的QoS控制指标提出了一系列解决策略与算法。采取的策略是:先进行某一方面的QoS优化,然后逐步在随后提出的解决方案中综合前面提出的QoS指标一起优化,最后,达到使系统总体回报率最大化的同时,使各项QoS指标得到优化。针对网格Web服务还没有较完善的结构模型,提出了一种多级多层的Web服务结构模型,并对其进行了改进使其具有从协议低层支持负载均衡。总结来说,本文的主要研究工作如下: (1)提出了一种Web集群区分服务结构模型,它较好地解决了以往在Web集群系统中前后台区分服务分离的不足。在此基础上,将基于事务的区分服务接纳控制策略运用到此模型。理论分析与实验结果表明:在系统过载时能有效保证系统的稳定性,高优先级任务得到较好的服务,比基于会话的接纳控制效果要好。 (2)提出了一种结合网络自相似访问特征的接纳控制算法,它综合考虑了请求访问特征以及负载情况等多方面的因素自适应调整,综合优化Web集群系统中多维调度目标,实验结果证明了算法的有效性,它既能适应网络自相似访问特征,又可支持多维QoS的调度优化。 (3)提出了一种资源优化的QoS控制算法,针对不同的服务有不同的资源需求,提出了一种既能使系统负载均衡又能充分利用系统资源的启发式算法。实验证明,该启发式算法能显着地降低资源优化分配中的计算复杂度,使其能满足实时调度的需要。在此基础上,进一步提出了一种资源优化的双最小均衡区分服务调度算法,该算法综合了多维QoS目标优化以及区分服务。在与其它调度策略如分离式调度算法的对比结果显示:双最小均衡调

何涛[6]2007年在《高可用性虚拟化管理操作环境的研究与开发》文中指出随着计算机系统越来越庞大,越来越复杂,系统的可用性和管理受到了空前的挑战。由于历史原因,大型企业或机构的计算环境往往是分散、孤立、异构的,缺乏资源的统一管理和动态配置,每个应用环境都需按预计最大负载来构建,彼此之间仅有较低的或根本没有资源共享。这是导致系统可用性不高的重要原因。 面对这些传统IT技术与架构所带来的问题,本文对高可用系统进行了研究,通过虚拟化技术,将基础设施从物理变成虚拟的,IT设施变成了一个虚拟资源池。在此基础上,探讨并设计了一个资源自主计算模型,构建一个“整合”、“开放”、“自主”和“虚拟”的计算资源管理系统,实现了计算机系统的高可用性和自我管理性。根据以上目标,作者参与设计并实现了具有虚拟化管理的高可用性的虚拟操作环境系统。作者研发的工作主要体现在以下几个方面: 1.资源管理框架的设计:为了对计算资源进行统一管理,虚拟操作环境利用WBEM(Web-Based Enterprise Management)标准,设计并实现了一个开放性的管理框架,该框架具有良好的整合性和管理的灵活性。 2.自主计算模型的设计:为了系统能够实现自我配置、自我修复、自我优化和自我保护四个自主计算的特征,设计和实现了一个自主计算模型,进而提高了系统的可用性也降低了系统的管理难度。 3.资源虚拟化的设计:把企业中所有的各种资源整合成一个虚拟资源池。利用逻辑分区技术使可分区服务器和存储设备等资源能够根据业务需要进行动态的配置。同时引入自主计算技术实现系统一定程度上的自我管理。

严金瑶[7]2013年在《基于虚拟化技术的云计算框架设计研究》文中研究表明云计算是一种基于互联网的IT服务新模式,通过网络可以动态地将可伸缩的虚拟化IT资源以服务的形式按需提供给用户。目前,云计算产业被认为是继大型计算机﹑个人计算机﹑互联网之后的又一次IT产业革命。因此,如何构建出更加高效、稳定、灵活的云计算平台已成为热门研究课题。本文借助于OpenStack开源云计算平台,作为IaaS资源的通用前端,通过服务器虚拟化技术,给出了一种安全和高效的云计算平台框架。该平台建立在服务器组合而成的计算机集群之上,实现了对外按需提供基础设施即服务的功能。本文针对系统的负载均衡问题,运用虚拟化环境下的动态迁移技术,给出了一种系统物理设备的实时检测策略,能够快速实施虚拟机迁移或对其进行快速恢复,保障了系统所提供服务的可用性和连续性。同时设计了新的能耗管理方案,对系统的能耗进行动态管理,有效地支撑了整个系统的负载均衡机制。测试实验结果表明,本文给出的设计方案能高效地提供基础设施服务,在不影响性能的前提下,本文设计方案可以节能将近30%,起到了提高资源利用率和降低了云计算平台能耗的作用。

杨宇[8]2017年在《面向应用性能管理的流式计算框架的研究与实现》文中提出随着互联网信息化程度的不断深入,作为IT技术的一个主要分支,应用性能管理(APM: Application Performance Management)系统帮助企业保障并提升了其业务的关键应用的可用性、可靠性及性能。应用性能管理系统所采集处理的数据以“流”的方式进入处理系统,这些数据需要实时地进行复杂的并行化的计算。因此,如何构建低延迟、高吞吐且持续可靠运行的数据流式计算系统是当前应用性能管理中研究与应用的热点,也是一个具有挑战性的课题。然而,目前市场中的通用流式计算框架并未考虑应用性能管理的特殊需求,不支持数据处理模块的热插拔,且其计算传输开销大、系统资源利用率低等特点对应用性能管理并不友好。本课题深入分析了应用性能管理系统对数据的流式处理需求,研究并设计了一套支持动态调整处理任务的流式计算框架,并对框架中的任务调度算法做了深入的研究与优化,在保证任务调度合理性的同时,保障了系统的高可用性与负载均衡。本文首先介绍了面向应用性能管理的流式计算框架的研究背景与意义,并根据应用性能管理系统的数据挖掘分析处理需求,提出了面向应用性能管理的流计算框架功能需求。然后给出了该框架的核心功能设计、接口设计与详细交互流程设计。最后对面向应用性能管理的流式计算框架进行详细设计,给出主要类的定义说明,并完成了代码实现与测试。在论文结尾,对本文相关工作进行了总结并提出了未来的研究方向。

管赋胜[9]2009年在《高可用性源代码自动评判系统设计研究》文中指出源代码自动评判系统是智能信息处理技术的具体应用,系统可以自动完成编译、运行用户提交的源代码,并将用户程序消耗的系统时间、空间资源信息及时反馈给用户,便于用户检验自己设计的数据结构和算法的优劣。它通过浏览器的方式提交用户针对特定问题设计的源代码,然后进行自动评判,立即反馈信息,给计算机专业数据结构、算法等课程的教学和学习带来极大的方便。本文在研究了当前流行的源代码自动评判系统后,针对源代码自动评判系统受时间地点限制、并发处理能力差、可伸缩性差等问题,完成改进的设计方案:高可用性源代码自动评判系统,并在Linux环境下用Java开发实现。系统遵循软件工程设计规范,针对提高系统可用性作了设计,并进行了性能测试和优化设计,同时该系统部署方式也为其它高可用性系统的设计提供了一个参考,具有一定的实践价值。本文首先介绍了软件工程在指导本系统设计、开发实现的概况,采用工程的概念、原理、思想、技术和方法来设计开发本系统,并强调了软件结构分析及设计技术。选择了成熟的架构模式,作为系统开发框架。结合UML建模给出了本系统关键业务的时序图和协作图以及整个系统架构设计的包图。其次,从系统实施环境及开发工具介绍开始,重点分析了Java多线程编程和Linux系统编程在核心评判模块上的应用,并结合源代码分析了具体技术的实现。考虑系统运行时的安全问题,给出了适当的解决方法。在实现了基本评判任务基础上研究了评判服务器和后台数据库管理系统高可用性实现的部署方案。最后,研究了动态web应用性能测试技术,根据测试结果对系统高可用性实现进行了分析,并结合分析结果提出系统优化方案。

高峰[10]2005年在《实现智能管理的高可用性虚拟操作环境的研究与开发》文中研究表明随着计算机系统越来越庞大,越来越复杂,系统的可用性和管理受到了空前的挑战。由于历史原因,大型企业或机构的计算环境往往是分散、孤立、异构的,缺乏资源的统一管理和动态配置。这是导致系统可用性不高的重要原因。 本文首先对高可用系统进行了研究,然后分析了大型企业或机构的计算环境的特点,在此基础上,探讨了建立一个“整合”、“开放”、“自主”和“虚拟”的计算资源管理系统,来实现计算机系统的高可用性和易管理性。根据上述目标,作者参与设计和实现了一个具有智能管理特征的高可用性虚拟操作环境系统。作者参与的研究和开发工作主要包括以下叁个方面: 1.为了统一计算资源的管理,利用了WBEM(Web-Based Enterprise Management)标准为虚拟操作环境系统建立一个开放性的管理框架,并采用Java技术实现了该框架。该框架同时具有良好的整合性和开放性。 2.根据自主计算思想,在虚拟操作环境系统中设计和实现了自我配置、自我修复、自我优化和自我保护四个自主计算的特征,使计算机系统具有智能的自我管理能力,不仅提高了系统的可用性也降低了系统的管理难度。 3.对分区技术作了探讨,并利用分区技术在一定程度上实现了计算环境中的虚拟化,使可分区服务器和存储设备等资源能够根据业务需要进行动态的配置,提高了系统的可用性。 在论文的结尾,对虚拟操作环境系统的研究和开发作了简单的总结和评价。

参考文献:

[1]. 系统资源高可用性和应用性能保证的研究及实现[D]. 李春颖. 河海大学. 2003

[2]. 面向全球导航卫星系统的多层可用性分析方法研究[D]. 侯洪涛. 国防科学技术大学. 2015

[3]. 机群系统容错中间件技术研究[D]. 黄伟. 中国科学院研究生院(计算技术研究所). 2005

[4]. 服务器集群系统请求调度与高可用性研究[D]. 刘东君. 中国科学技术大学. 2010

[5]. 基于QoS的分布式Web服务结构模型及其关键技术研究[D]. 刘安丰. 中南大学. 2005

[6]. 高可用性虚拟化管理操作环境的研究与开发[D]. 何涛. 西北工业大学. 2007

[7]. 基于虚拟化技术的云计算框架设计研究[D]. 严金瑶. 南京邮电大学. 2013

[8]. 面向应用性能管理的流式计算框架的研究与实现[D]. 杨宇. 北京邮电大学. 2017

[9]. 高可用性源代码自动评判系统设计研究[D]. 管赋胜. 苏州大学. 2009

[10]. 实现智能管理的高可用性虚拟操作环境的研究与开发[D]. 高峰. 西北工业大学. 2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

系统资源高可用性和应用性能保证的研究及实现
下载Doc文档

猜你喜欢