实时容错嵌入式小卫星操作系统设计的研究

实时容错嵌入式小卫星操作系统设计的研究

孙栓[1]2008年在《微小卫星星载微内核实时操作系统设计及系统容错技术研究》文中认为小卫星有重量轻、体积小、功耗低等优点,它工作在无人干预的低温、高辐射的空间环境中,其星务系统需要满足集成度高、寿命长、可靠性高和抗干扰能力强等要求。本文的主要工作是研究如何设计高可靠、高容错的嵌入实时卫星操作系统,并在相关的软件工程领域进行必要的探索。在比较了多种操作系统结构模型的基础上,本文首先研究了采用微内核结构的小卫星操作系统结构设计思想。采用微内核结构能够大大简化系统内核内部以及系统内核与应用之间的接口,明显地降低模块之间调用的复杂性,从结构上保证了系统的高可靠性,并且具有易于扩展等优点。接下来本文讨论了操作系统内部任务结构和任务调度策略的设计。在分析时间驱动和事件驱动的优点和缺陷的基础上,研究了基于消息和定时任务处理的时间、事件混合驱动的抢占式卫星操作系统设计思想。这种思想综合了时间驱动和事件驱动的好处,既不会在负荷突然升高时造成失控,也不会降低关键任务的响应时间。其后,在分析容错实时系统面临的主要问题基础上,本论文对容错实时调度算法进行了深入地研究,提出了一种较通用的容错实时调度算法LP-FT,它可调度多种类型的任务,适用范围广泛。本文在理论上证明了该算法的正确性,给出了可调度条件,进行了算法分析,并基于实时操作系统VxWorks,设计其容错调度模块,实现了LP-FT容错实时调度算法,最后对容错调度模块进行了测试。结果表明,其时间和空间开销能够满足实时系统的要求。最后,本文着重分析了小卫星在空间环境中运行时的各类故障问题,针对小卫星数据存储提出了编码容错技术,并在ModelSim模拟平台上对编码容错技术方案进行了设计和验证。

李涛[2]2000年在《实时容错嵌入式小卫星操作系统设计的研究》文中认为本文的主要工作是研究如何设计高可靠、高容错、可重组、软实时的分布 式的嵌入卫星操作系统,并在相关的软件工程领域进行必要的探索。 本文首先研究了小卫星操作系统的机构设计,在比较了大量的操作系统结 构模型的基础上,本文提出了采用微内核结构的小卫星操作系统结构设计思想。 采用微内核结构能够大大简化系统内核内部以及系统内核与应用之间的接口, 明显地降低模块之间调用的复杂性,从结构上保证了系统的高可靠性,并且具 有易于扩展等优点。 在完成了小卫星操作系统的结构设计后,本文开始了操作系统内部进程结 构和进程调度策略的设计,在研究了时间驱动和事件驱动的优点和缺陷之后, 本文提出了基于消息和定时任务处理的时间、事件混合驱动的抢占式卫星操作 系统设计思想。这种思想综合了时间驱动和事件驱动的好处,既不会在负荷突 然升高时造成失控,也不会降低关键任务的响应时间。另外,将一般消息和定 时任务消息在系统内部区分开来,既大大降低了系统调度时的CPU占用时间, 又降低了内部程序的复杂性,同时也充分适应了时间事件混合驱动的驱动方式, 并且进一步提高了系统内核的灵活性和可扩展性(后面的分布式通信设计中就 使用到了这一灵活性)。注入管理机制的引入为系统可靠性的提高打开了另外一 扇大门,它的引入使得系统能够在星上进程出现故障时,更新该进程,实现进 程的重组,或者在卫星的运行过程中,为卫星星载计算机系统增添新的功能。 由于小卫星操作系统是一个容错操作系统,本文用专门的章节讨论了小卫 星操作系统的容错设计,并提出了一种新的基于改进的级联相关构造学习算法 的星载软件故障易发模块的识别方法,这种方法简单、高效,与其它一些可能 方法如感知器法和高斯法相比具有收敛更快、结果更优等优点。能够在卫星软 件开发周期的早期阶段发现故障易发模块,这对于合理地分配软件开发人员, 降低软件开发成本,尽可能避免在软件开发的晚期不断返工具有较高的实用价 值。 目前小卫星采用双机系统,在未来充分降低成本之后可以采用灵活性更高 的工作方式,为此,本文研究分布式的星载软件系统。在单机星载软件系统的 基础上,利用系统微内核结构提供的灵活性,在内核消息管理中对应用程序透 明地加入分布式功能,利用因果定序和逻辑定序进行事件定序,并且提出了一 种新的分布式互斥与同步方法,该方法简便、易行,通过向各站点的互斥与同 步服务进程发送消息来实现,其应用范围并不仅限于星载计算机系统,可以被 任何一个分布式系统参考和采用。 多机分布式系统必然要求系统具有合理的任务分配功能,对于卫星来说, 任务基本上都是准静态确定的,一般不会动态地随机生成一个新任务,所以本 【 文最后研究了对通用操作系统几乎没什么意义但是对于卫星操作系统却有很大 实用价值的静态任务分配算法,提出了一种新的基于Hopfleld神经网络的静态 任务分配算法,对实际的应用结果表明该算法是一个快速、较优的实用算法。 另外,考虑到系统出现故障后可能出现的任务迁移问题,研究了卫星多机系统 故障任务迁移机制。该机制确保了一台单机发生故障时,系统能够在另一台单 机上迅速向后恢复到一个符合一致性要求的状态。

黄影[3]2006年在《星载COTS计算机的体系结构设计及其抗SEU研究》文中提出空间环境中存在着大量的带电粒子,星载计算机硬件系统的电子器件会受到电磁场的辐射和重粒子的冲击,从而导致SEU(Single-Event Upsets,单粒子翻转)效应。SEU使得星载计算机中的数据可能出现小概率错误,这种错误若不及时进行纠正将会影响计算机系统的运行和关键数据的正确性。一个自然的解决办法是进行屏蔽和加固,但是,屏蔽材料的厚度受到卫星体积和重量的制约,屏蔽的作用有限,且辐射加固的器件价格昂贵,难以供货,性能不高。而COTS(Commercial-Off-The-Shelf,商用现货)器件具有成本低、性能高的优势,且不受国外进口的限制。引入COTS技术是星载计算机发展的趋势。本文根据国外研制星载计算机的经验和先进技术,结合国内实际情况,设计出一种基于COTS的高性能、高可靠性、低成本的具有抗SEU功能的星载计算机体系结构。本系统的硬件部分以ARM9处理器为核心,具备多种接口,软件部分以裁减后的linux操作系统为平台。本文从器件选型开始,完成了星载COTS计算机的体系结构设计,原型系统的测试验证与实现,并实现了裁减后linux操作系统的移植。在此基础上对系统的进一步改进做了初步探讨,为以后应用于航天工程打下了坚实的基础。但是,COTS器件本身并不具备抗SEU能力,如何提高COTS系统的可靠性,以适应恶劣的空间辐射环境,是一个具有挑战性的课题。针对星载计算机的空间SEU效应,本文实现了星载COTS计算机体系结构的抗SEU容错设计,研究了基于COTS器件(如SRAM型FPGA)的具有多级容错机制的抗SEU加固技术,增强了星载COTS计算机的可靠性。系统级采用了基于FPGA(Field Programmable Gate Array,现场可编程门阵列)的双机容错系统技术,提高了星载计算机宏观上的可靠性;模块级针对存储器器件的TMR(Triple Module Redundancy,三模冗余)容错技术,也提高了SRAM和FLASH的抗SEU能力;芯片级采用了片内FPGA抗SEU容错设计,片外通过实现FPGA自加载电路的重配置功能,进一步提高了系统的抗SEU能力。本文的设计和验证等研究工作都是建立在星载计算机原型系统实现的基础之上的。本课题的研究成果若进一步完善,可直接应用于星载计算机和空间机动信息平台中,在降低研制成本、提高在轨数据处理能力方面,对推动中国空间科学技术和国防事业的发展有重大的意义。

王平[4]2004年在《嵌入式计算机控制系统容错策略研究》文中提出计算机控制技术已广泛应用于宇航、航空、各种工程设计和科学研究、各种过程控制和管理、国防、军事以至日常生活领域。由于计算机的广泛应用,其可靠性成为一个非常突出的问题,许多应用场合都要求计算机能长期稳定、安全、可靠地运行。计算机控制系统的容错设计主要是指针对故障的专门设计方法,它主要包括故障的检测和诊断、硬件的可靠性设计、软件的可靠性设计、硬件不可恢复或无冗余备份条件下的控制系统降级运行等。本文主要以空间飞行的星载计算机控制系统为研究对象,围绕提高控制系统的可靠性在传感器数据采集、计算机软件和硬件以及容错设计的验证等方面主要可能采取的措施开展工作。 传感器正确采集输出数据是控制系统正常工作的基础。传感器故障数据的产生主要有两个方面:一是受各种干扰输出不正确的数据,一是传感器自身发生故障不能获得正确数据。为了检测出传感器的故障,本文使用了数值计算方法进行传感器输出数据的预测,并根据预测结果与实际传感器输出结果的比较得到传感器的故障概率。由于传感器输出数据发生跃变的情况在空间环境是时常出现的,因此传感器的故障概率并不能指出传感器确实发生了故障,要准确判断传感器是否确实发生故障,需要采用多源数据融合的方法。DS证据理论提供了这种融合的判断方法,使得我们可以根据信息融合的结果判断传感器是否确实发生故障,但DS证据理论在实际应用中有时并不能完全符合实际结果,为此,在分析了DS证据理论存在的缺陷后,本文提出了改进的RDS证据理论,该理论的主要改进是对DS组合证据方法增加了相关系数和可靠性加权系数,在去除了证据之间的相关性并增加了证据的可靠性系数后,RDS证据能正确地对多源数据进行融合,从而获得正确输出结果。 软件的容错设计是实现计算机控制系统高可靠性的一个重要方面,为了实现软件的容错,避免干扰造成影响,可以使用故障检测、故障恢复、破坏估计、故障隔离、继续服务等技术,利用指令冗余、软件陷阱、软件看门狗等方法来使发生故障的系统恢复正常运行。由于在程序设计过程中可能人为地引入各种错误,因此卫星星载软件要求能实现重组,本文就此问题提出一种基于组件的运行中嵌入式软件的重组方法,在使用组件化、模块化技术的基础上,利用恢复块、多版本以及软件注入等技术实现软件的重组。由于目前星载计算机控制系统在空间环境面临的主要问题是辐射造成的单粒子事件和的影响,因此,本文提出一种软件实现容硬件错的设计方法。该方法基于数据复制来完成,在程序产生新数据的各个运行阶段,都对源数据和输出数据进行复制比较,在进行多次等价运算的基础上,利用结果数据一致性比较的方法来得出运算结果。为了解决运算结果数据一致性比较的问题,本文还提出了动态模糊聚类的数据一致性比较方法,以得到正确的输出结果。 容错设计的正确与否需要通过容错验证来完成,本文在卫星电源控制系统的容错设计验证中采用了软硬件故障注入的验证方法,通过建立电源系统的故障分析树,分析其故障模式,使用硬件模拟器和软件仿真器产生故障,以验证电源控制系统的软硬件容错设计是否正确。本文最后概要介绍了作者所参与的创新一号小卫星计算机系统的软硬件设计及测试和在轨运行情况。 本文的主要贡献有下面几个方面:一是提出利用数值方法进行传感器检测值的预计,并以此为基础得到了传感器的故障概率;二是对信息融合的重要理论—D卿rnps权沈.Sh副比r理论进行了重要的改进,提出了可靠的DS理论(RDs),并用实例证明了RDS理论应用于实际中的正确性;三是提出了软件容错和嵌入式软件重组的流程和方法:四是利用数据复制的方法实现了软件的容硬件错能力,该方法结合软件EDAC可以实现商业器件在星载计算机上的可靠应用:五是提出了动态模糊聚类的数据一致性校验方法,以实现对多个输出的正确性的判断。

陈琳琦[5]2006年在《基于嵌入式操作系统的微小卫星环境监测及数据管理研究》文中研究指明微小卫星是当前航天的热门研究领域,掌握微小卫星技术是世界各国综合国力的象征之一。微小卫星本身不复杂,研究把各种新技术应用于微小卫星是其中的应用热点,而总线数据传输和管理是其中相当关键的一部分。小卫星要能实现自主工作需要稳定可靠的数据处理系统,因此实现星载机稳定的数据传输和管理是本课题的研究重点。本项目硬件部分以Intel80386EX作为中央处理器,各部件数据传输方式采用CAN总线,冗余控制作为数据采集的一部分使得总线管理系统做相应的裁决。而相应的软件控制部分则依托在嵌入式领域应用广泛的实时多任务操作系统VxWorks,它具有高度可剪裁的微内核结构、高效的多任务调度、灵活的任务间通信手段、快速灵活的I/O系统、确定的微秒级中断延迟时间等优点。利用性能优异的Intel80386EX配以业界高可靠的实时嵌入式操作系统VxWorks,以保证微小卫星在所处的空间恶劣环境下能完成正常稳定的传输任务。文中首先对微小卫星的数据管理系统进行初步探讨和研究,然后详细论述了基于仿真机下对VxWorks相关移植,并重点研究了VxWorks下的相应CAN总线的原理和驱动相关问题,探讨了基于嵌入式系统的数据综合管理系统及软硬件交叉调试技术。最后主要利用串口和网口结合主机进行任务模块程序的编写和功能模块调试,这些工作对最终进行微小卫星航天应用打下一定的基础。

臧佳[6]2012年在《基于MPSoC的空间光学CCD遥感相机控制系统研究》文中研究说明传统的微处理器被设计成固定的、单个的和可重用的模块,但是,在二十世纪九十年代随着专用集成电路ASIC和片上系统SOC制造技术的发展,多核技术逐渐应用到嵌入式的高端领域。以FPGA为载体的MPSoC(MultiprocessorSystems-on-Chip)成为目前嵌入式多核技术的发展趋势,它能够针对嵌入式的需求进行多核的定制化开发,FPGA的重复可编程性保证了系统的灵活性。本文以空间CCD相机控制系统为例,针对目前航天电子学系统传统的自底向上的设计方法中存在的一些设计成本高,周期长,硬件实现正经受着高速高带宽发展趋势的挑战等问题,采用了一种MPSOC的解决方案。在研究了MPSoC体系结构和设计方法的基础上,提出了一种基于EDK平台的异构MPSoC系统。基于平台的设计方法是自上而下和自底向上设计方法的综合,因此在设计过程中将自上而下的系统建模和基于平台库的IP复用技术紧密结合,将系统功能模块尽可能采用平台资源实现,加快了设计进程。在系统设计的早期采用UML语言对系统进行了功能需求分析,建立了系统的静态功能模型和动态功能模型,在此基础上完成了系统软硬件协同划分;建立了EDK平台的资源模型和结构模型,实现了系统功能模型向平台模型的映射。在系统软硬件协同设计阶段,首先完成了系统设计空间探索,在处理器架构上采用了一主两辅的异构多核结构,通过分析功能模块间的依赖关系,实现了并行任务的划分及映射,将不同类型任务分配到不同类型核上执行,将任务间的数据传递映射到通信体系结构上,提高了任务级并行处理能力。然后给出了硬件平台的设计过程,将硬件功能模块采用平台库里的IP或用户IP实现,通过CoreConnect总线连接到处理器。在软件实现方面,采用了主从编程模式,为主核移植操作系统Vxworks实现多个任务的调度,通过核间通信的方式控制辅核上程序的运行,给出了多核程序交互的过程,并针对辅核Microblaze_0处理器上进行的像移速度计算采取了容错措施,提高了关键计算型任务的可靠性。为了对这种新的基于MPSoC的相机控制系统进行测试和分析,采用Xilinx公司的XUPV2P开发板和2个自主研制的扩展板作为平台对系统进行了验证,测试了多核间的通信,给出了资源评估和各处理器子系统的性能分析。实验表明,本文设计的MPSoC可以较好的实现相机控制系统的功能需求,具备较高的集成度和灵活性,并克服了传统DSP+FPGA设计方法中数据传输速度容易受接口和总线带宽的限制及信号间容易串扰的弊端。

冯力刚[7]2005年在《CCIPS的分布实时容错一体化研究》文中认为分布式航天器系统(简称DSS)由多颗微小卫星组成,通过微小卫星的相互协作来完成预定的科研、军事任务。分布式航天器协同控制信息处理子系统(简称CCIPS)运行于分布式航天器系统中,该子系统要满足DSS 姿态控制、位置控制、通信管理等协同控制及数据处理的要求。本文重点对CCIPS 的分布实时容错一体化进行了研究,提出了相关的设计方案,并对此方案进行了实现。本文首先对普通系统中所采用的容错技术和实时容错技术进行了研究。容错技术常采用冗余的方式:硬件冗余、软件冗余、时间冗余和信息冗余。而实时容错的研究可以从两个方面入手:一种是调度算法,另外一种是容错结构。从调度算法入手就提出了容错实时调度算法,从容错结构入手就提出了软件容错库概念。在对容错和实时容错研究的基础上,本文对CCIPS 中所采用的实时容错进行了设计和实现。首先,在CCIPS 容错设计时引入了“免疫”和“自愈”的概念,系统中每一个节点都相当于一个自治的个体,对自身出现的故障具有一定的“免疫”和“自愈”能力。其次,提出了把单节点的容错与系统节点间容错相结合的思想,以此来设计CCIPS 的实时容错。在节点内部采用软件的方法、软件和硬件相结合及硬件备份的方法,对节点上运行的任务和通信接口进行容错处理。而且,充分利用分布式系统的特点,实现了节点级的容错。系统的每个节点都相当于一个自治的个体,能通过对系统其他节点的信息收集,对系统出现的失效情况进行判断,并使用负载平衡的思想来采取相应的容错措施。最后,本文还对CCIPS 系统采取的实时容错措施进行了相关测试,结果证明该系统在节点任务异常、节点通信接口出现故障和节点失效的情况下,能够按要求完成预定的实时任务。

底素然[8]2012年在《面向星载数据管理系统的SpaceWire应用模型的仿真研究》文中研究表明随着空间任务的日益多样化,卫星电子系统内部的结构越来越复杂,而且出现了越来越多的高速仪器设备或子系统,使得航天器内部的数据交换量以及交换速率猛增,给将各种仪器设备或子系统连接起来的星载总线在通信速率、通信可靠性、数据安全性及使用灵活性等方面提出了更高的要求。国内航天器上广泛采用的RS-422/485、MIL-STD-1553、CAN等低速总线已无法满足未来航天在轨数据系统的发展要求,迫切需要发展一种适于空间环境使用、高速、可靠、可扩展、低功耗的新型数据总线以满足空间数据网络的需求。世界各国都十分重视星载数据总线的采用和总线技术的发展。为满足航天在轨数据系统的高速传送需求,ESA于2003年提出了SpaceWire总线,它是一种高速的、点对点、全双工的串行总线标准,可通过路由开关形成大型通信网络。SpaceWire采用统一的数据接口简化和规范各种设备之间的互连,数据通信速率为2-400Mbps,国外已实现抗辐照的数据传输速率为200Mbps的SpaceWire系统。目前,NASA、JAXA、ROSCOSMOS等国际航天机构都参与到SpaceWire总线标准发展与修订工作中,并在各自的航天任务中开展SpaceWire总线技术的应用工作,而且已有许多航天任务成功应用了或正在应用SpaceWire总线技术。本文在分析了国内外空间数据系统需求与发展趋势以及SpaceWire,总线技术在航天任务中应用趋势的基础上,通过7个嵌入式通信节点板和3个SpaceWire路由器搭建了一个SpaceWire星载数据网络的半物理仿真演示与测试环境。根据航天任务的数据业务需求及传输类型,设计了仿真测试数据模型及通信模型,并对部分星载仿真节点在应用层及驱动层的软件进行了设计与实现。最后,在上述的数据模型及通信模型的基础上,对SpaceWire总线仿真系统的数据传输时延、误码率和带宽等重要指标进行测试与分析,并根据测试结果对未来SpaceWire,总线技术在综合电子系统中的应用模型提出了建议。本文的主要创新点在于,围绕SpaceWire,总线仿真系统的性能测试,从实际工程应用角度出发,在SpaceWire,总线的应用体系结构、路由连接方式、冗余容错处理、Qos保障机制和管理模式等方面,开展了SpaceWire,总线应用模型的仿真工作。特别地,在所建立的半物理仿真平台中,利用SpaceWire,总线与SpaceWire路由交换机将卫星管理单元和各有效载荷连接起来,形成完整的内部网络,实现了有效载荷数据与卫星服务数据的统一管理,突破了传统卫星平台只能对卫星勤务数据进行统一管理的格局,对SpaceWire总线在卫星综合电子系统中的应用具有一定的指导意义。另外,在该仿真系统平台中,探索并实现了SpaceWire接口的冗余容错管理机制,为在轨数据系统实施自主管理和冗余容错管理奠定了技术基础。

张国强[9]2006年在《星载并行处理计算机系统容错技术研究》文中研究指明小卫星以其研制周期短、发射方式灵活、成本低、风险小等众多优势,已经成为航天领域研究的热点。并行容错星载计算机系统PFT-OBCS(Parallel Fault-Tolerance On-Board Computer System)是一个基于COTS技术实现的四CPU并行星载计算机系统。该系统以RTEMS和SPARC V8架构的处理器为软硬件平台,具有基于消息传递的并行计算、状态监控与自主切换、数据交换与分发、软件重注入、在轨功能重构等功能。本文对PFT-OBCS中的关键技术进行了研究,详细分析了PFT-OBCS容错结构和RTEMS操作系统源代码。在此基础上,制定了容错策略并对硬件提出了容错支持要求,重点实现了一些有特色、实用性强的容错技术,如软件重注入、从结点重启等等。同时,结合系统容错结构和策略,使用组合模型与马尔可夫模型对PFT-OBCS进行可靠性建模分析,指出了影响系统可靠性的关键部件。然后,对容错模块的功能和系统性能进行了测试。最后,通过对PFT-OBCS开发过程中的一些问题的总结与分析,提出了下一步工作的展望。

参考文献:

[1]. 微小卫星星载微内核实时操作系统设计及系统容错技术研究[D]. 孙栓. 南京航空航天大学. 2008

[2]. 实时容错嵌入式小卫星操作系统设计的研究[D]. 李涛. 中国科学院上海冶金研究所. 2000

[3]. 星载COTS计算机的体系结构设计及其抗SEU研究[D]. 黄影. 国防科学技术大学. 2006

[4]. 嵌入式计算机控制系统容错策略研究[D]. 王平. 中国科学院研究生院(上海微系统与信息技术研究所). 2004

[5]. 基于嵌入式操作系统的微小卫星环境监测及数据管理研究[D]. 陈琳琦. 南京航空航天大学. 2006

[6]. 基于MPSoC的空间光学CCD遥感相机控制系统研究[D]. 臧佳. 中国科学院研究生院(长春光学精密机械与物理研究所). 2012

[7]. CCIPS的分布实时容错一体化研究[D]. 冯力刚. 长沙理工大学. 2005

[8]. 面向星载数据管理系统的SpaceWire应用模型的仿真研究[D]. 底素然. 首都师范大学. 2012

[9]. 星载并行处理计算机系统容错技术研究[D]. 张国强. 国防科学技术大学. 2006

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

实时容错嵌入式小卫星操作系统设计的研究
下载Doc文档

猜你喜欢