高性能VIM向量协处理器体系结构研究与实现

高性能VIM向量协处理器体系结构研究与实现

王绍刚[1]2004年在《高性能VIM向量协处理器体系结构研究与实现》文中研究说明PIM(Processor-In-Memory)是一门新兴的技术,它为解决计算机系统的存储瓶颈问题带来新的思路,正越来越受到业界的重视并且已经产生了巨大的效益。向量(Vector)是科学计算领域十分有效的模型,但由于其实现代价相对较高,因而通常只被大型计算机系统采用。PIM技术与向量技术相结合,产生了VIM(Vector-In-Memory)体系结构。基于VIM体系结构的向量微处理器可为科学计算、多媒体处理等领域提供性能高、功耗低、性价比高的解决方案。 VIM体系结构下向量协处理器体系结构与传统的向量处理器有所不同。传统的顺序执行(In-Order)体系结构不能充分利用PIM技术提供的高存储带宽,并且实现相对复杂,系统造价高,因而迫切需要研究基于VIM体系结构新的向量协处理器体系结构。 本文研究了基于PIM技术的向量微处理器相关关键技术。在对已提出的顺序、分离及乱序执行等体系分析比较的基础上,提出了VIM向量协处理器的体系结构并实现了基于VIM体系结构的向量微处理器KD-VIM-1。KD-VIM-1向量处理器对已有的分离体系结构做了改进,引入了分布式寄存器的概念,降低了造价,有效支持了短向量类型的指令。存储系统是向量微处理器的重要部分,本文对VIM体系结构下存储系统做了相关的研究,并根据基于PIM技术存储器特点,改进了Roger提出的DRAM访问调度算法,在存控中引入了动态调度的机制,有效提高了存储系统的带宽。在以上关键技术研究的基础上,本文还研究了VIM体系结构下向量协处理器的实现技术,包括标量指令集的扩展方式,多端口寄存器文件的实现,向量执行单元的流水线设计等。 最后,根据以上的研究结果,本文采用硬件描述语言VHDL实现了KD-VIM-1向量微处理器,完成在Altera Stratix系列FPGA芯片上的综合,并在ProcSuperStar开发板上对KD-VIM一1处理器进行了系统级的验证。

张绪冰[2]2004年在《基于高性能VIM体系结构的嵌入式存储系统的研究与实现》文中研究指明处理器和存储之间的性能差距日趋严重,将处理器和存储器集成到单一芯片的PIM技术为解决存储性能瓶颈问题提供了新的途径。相对于当前超标量和超长指令字处理器的局限性而言,向量处理器从开发数据级并行方面提供更高的性能。VLSI技术和半导体工艺的飞速发展,使向量处理所需的大量硬件可以集成在一块芯片内。把PIM技术和向量技术有机结合的高性能VIM体系结构,能够充分利用嵌入式DRAM所带来的高带宽,更好地发挥向量处理的优势,具有较高的性价比,是针对存储性能瓶颈的良好解决方案。 课题在研究PIM技术与向量处理技术的基础上,对VIM体系结构进行了研究,验证实现了存储器内置向量处理器——KD-VIM-1。本文对基于高性能VIM体系结构的嵌入式存储系统进行了深入研究,在分析目前国内外已有的嵌入式存储系统体系结构的基础上,提出了KD-VIM-1系统的嵌入式存储系统体系结构。研究了几种交叉开关模型和相关调度算法,分析了VIM体系结构的访存特征,提出并实现了KD-VIM-1存储交叉开关。同时对低位交叉编址技术、扭斜交叉编址技术进行了探讨,设计了适合于KD-VIM-1的嵌入式存储系统的编址方式。 最后,本文采用硬件描述语言VHDL实现了KD-VIM-1的嵌入式存储系统,进行了功能模拟,采用Altera Stratix FPGA完成了综合,并在ProSuperStar开发板上对KD-VIM-1的嵌入式存储系统进行了验证。

鲍捷[3]2014年在《基于嵌入式Linux的网络视频监控系统的研究与设计》文中认为随着大数据和云计算时代的到来,互联网的越发成熟并广泛的普及于人们生活的方方面面。视频监控作为对未来平安城市、智慧城市的重要支撑手段,也越发显得尤为重要。本课题研究并设计一种基于嵌入式Linux的网络视频监控系统,整个系统采用B/S架构,即:以叁星公司的S3C2440作为视频监控的核心处理器,通用计算机作为监控显示和控制终端,利用客户端浏览器直接访问服务器,最终在PC机上显示监控画面。首先在开发板搭建嵌入式Linux系统平台,依次移植U-Boot引导程序、Linux内核的移植和定制、创建根文件系统,并在此基础上进行网络视频监控系统的设计。网络视频监控系统由五大模块组成,分别是视频采集模块、视频压缩模块、视频传输模块、Web服务器模块以及客户端模块。视频采集模块利用Linux提供的V4L2应用程序接口进行视频数据的采集;然后经过H.264视频压缩模块进行视频数据的压缩;接着利用流媒体传输协议传输视频数据;客户端可以请求Web服务器,Web服务器接收请求后,将视频数据反馈给客户端。网络监控系统设计完成之后,又对叁种移动目标跟踪算法做了相关研究。MeanShift算法的跟踪窗口不能根据跟踪目标大小自适应的调整;CamShift算法虽然能自动调节跟踪窗口大小来准确跟踪目标,但是如果目标颜色和背景颜色相近或是移动目标被完全遮挡,将导致丢跟踪失败;基于Kalman滤波改进的CamShift目标跟踪算法,通过时间更新和测量更新预测下一帧移动目标可能的位置,很好的解决颜色相似或是移动目标被完全遮挡的情况,能够在较复杂的环境下准确跟踪目标。

邴笑然[4]2016年在《基于模型化开发的嵌入式平台移动目标检测系统实现》文中指出近年来视频移动目标检测算法已趋于成熟,在军事、安全、交通、航空航天等各个领域得到了广泛的应用。随着视频监控系统的需求增多,以及近年来嵌入式技术的不断发展,人们对于视频与图像处理系统的小型化、低功耗、清晰度与稳定性等方面有了新的要求。本研究采用罗技高清720P USB接入摄像头C270做为视频采集端,搭载3.0.15内核版本嵌入式Linux操作系统与四核Cortex A9高扩展性的i.MX6 Quad ARM做为硬件处理平台。i.MX6不仅小巧、功耗低,有着优秀的图像处理表现,且支持NEON操作,能够高质量地提升系统视频、图像处理的性能。以往传统基于ARM的图像处理开发方式,设计者既要研究视频图像算法,还要有较高水平的软件编程能力来将其实现,同时,针对特定处理器要熟练掌握内部寄存器的操作方法。这些都需要研究人员有跨专业跨领域的能力。专注研究算法的研究人员代码能力往往不是强项,而代码能力优秀的计算机专业人员对于视频图像处理算法往往不能很好的把握。这些情况给研究人员带来很大困扰,使得视频图像处理系统开发难度增加,延长了产品开发周期,带来经济效益的损失。为解决上述问题,本文提出了基于MATLAB/Simulink进行模型化软件开发的设计流程,流程使用Simulink图像处理模块库平台,采用帧差法、背景差法、光流场等算法进行模型搭建,应用MATLAB/Simulink/RTW工具箱,在Linux系统环境下生成嵌入式C语言算法代码、编译、移植并运行于ARM平台,这样,对开发人员代码能力的要求降到最低,可以大大缩短系统的开发周期。同时本文将嵌入式Web服务器boa移植于嵌入式设备,设计视频监控静态页面,并编写相应的视频图像CGI反馈程序做为用户网页动态请求,实现了移动目标检测视频图像处理结果的远程实时查看。综上,嵌入式与半实物仿真平台为视频图像处理研究人员提供了开发与算法的验证平台,并为基于ARM平台的算法设计与实现提供了新的方法和思路。

刘文良[5]2007年在《基于空间矢量调制的矩阵变换器研究与实现》文中认为矩阵变换器作为交-交功率变换器,具有输入输出波形为正弦、输入功率因数可控、能量再生、无需大容量储能元件等众多理想特性,受到了国内外电力电子行业的广泛关注。目前,矩阵变换器还停留在理论研究和实验阶段,本课题的研究目的在于设计、实现基于DSP的矩阵变换器空间矢量控制实验系统,以期推进矩阵变换器作为下一代新型功率变换装置的发展进程。本文首先从矩阵变换器的拓扑结构出发,对矩阵变换器的工作原理和调制原理进行了理论推导与分析,总结出基于空间矢量调制策略的开关组合函数。采用计算机仿真方法建立矩阵变换器控制系统仿真模型,对系统的控制原理、输入与输出性能以及输入滤波器参数对系统性能的影响进行了大量仿真研究,并对滤波引起的输入电流相移问题进行补偿。在对双向功率开关实现、安全换流、输入滤波器设计以及保护电路设计等关键技术问题进行深入研究基础上,提出了一种可靠性高、易于软硬件实现的矩阵变换器控制系统设计方案。采用高性能32位DSP芯片TMS320F2812作为主控制器,以Altera公司Cyclone系列FPGA芯片为协处理器,成功实现空间矢量调制、开关函数合成、四步半软换流等控制策略到实际系统的算法移植。构建整体矩阵变换器实验系统,对矩阵变换器的输入、输出特性进行实验测试,获得了较为理想的试验结果,实现了对输入功率因数的调节控制,从实验方面验证了系统设计方案的可行性。

胡英多[6]2009年在《基于S3C2440的嵌入式Linux的应用》文中认为随着计算机技术逐渐渗透到各类电子产品当中,一种实用、高效的计算机系统——嵌入式系统不断展现出它独特的魅力。嵌入式计算机系统专门服务于特定需求,一般要求低成本、低耗费、轻型、高性能、高可靠性。嵌入式系统日益广泛的应用让人们看到这项技术所蕴含的巨大市场潜力。ARM是目前使用最广泛的嵌入式微处理器,具有低功耗、高处理速度、低成本的特点,采用ARM芯片研制的嵌入式产品很多。ARM Linux嵌入式系统正被广泛的应用于消费类电子、工业控制、航空航天、汽车电子、医疗器械等领域。本文研究的嵌入式Linux以ARM9的S3C2440微控制器作为硬件平台。S3C2440主频达到400MHz,并且有硬件MMU(内存管理单元),非常适合嵌入式Linux运行。本论文研究如何在已有的硬件基础上构建一个完整的Linux嵌入式软件系统,并且在其上开发应用程序。论文首先研究了如何建立Linux嵌入式交叉开发环境,然后研究了U-Boot系统引导程序的移植方法,同时深入分析了U-Boot源代码的结构,增加了U-Boot的启动方式。然后裁剪和移植了Linux 2.6内核,建立了系统运行需要的根文件系统。之后研究了Linux设备驱动程序开发技术,并为了配合Qtopia图形用户界面,编写了液晶屏Frame Buffer驱动和触摸屏Input子系统驱动程序。之后编写了基于QTopia的图形界面mp3播放软件,播放器用到的主要技术点有:C/C++编程、Qt/E GUI、多线程及同步、Socket网络通信。播放器达到了如下目标:具有和常见mp3播放器同等的功能,可以播放本地mp3文件和Http服务器上的mp3文件;具有较好的编码风格,比较合理的类和模块组织结构;软件经过测试运行稳定。最后本文对研究进行了总结和提出了进一步的工作方向。总之本文研究了嵌入式Linux开发的全过程。

参考文献:

[1]. 高性能VIM向量协处理器体系结构研究与实现[D]. 王绍刚. 国防科学技术大学. 2004

[2]. 基于高性能VIM体系结构的嵌入式存储系统的研究与实现[D]. 张绪冰. 国防科学技术大学. 2004

[3]. 基于嵌入式Linux的网络视频监控系统的研究与设计[D]. 鲍捷. 中国矿业大学. 2014

[4]. 基于模型化开发的嵌入式平台移动目标检测系统实现[D]. 邴笑然. 北京理工大学. 2016

[5]. 基于空间矢量调制的矩阵变换器研究与实现[D]. 刘文良. 天津大学. 2007

[6]. 基于S3C2440的嵌入式Linux的应用[D]. 胡英多. 电子科技大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

高性能VIM向量协处理器体系结构研究与实现
下载Doc文档

猜你喜欢