自适应视频运动估计搜索算法及其在视频会议中的应用

自适应视频运动估计搜索算法及其在视频会议中的应用

白波[1]2004年在《自适应视频运动估计搜索算法及其在视频会议中的应用》文中提出随着计算机网络技术和计算机通信技术的迅猛发展,使对网络上提供高质量的视频/音频等多媒体服务的需求越来越大。VOD、视频电话、远程教育、视频会议等,将成为人们生活中不可缺少的一部分。实时视频传输由于其独特的应用环境,使得传统的编码方法不再适用。如何提高在低带宽下的视频压缩性能和压缩效率,是当前视频编码研发的热点。同时也是多媒体网络应用软件实用化所必需解决的问题。正在制定的MPEG—4标准不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的存取性。运动估计与运动补偿技术为 MPEG-4的关键技术之一。由于运动估计非常耗时,因此对编码的实时性影响很大。研究使用快速的运动估计算法对提高视频的编码效率和编码质量有重要意义。 本文以视频会议系统为应用背景,重点研究了MPEG-4的运动估计搜索算法,在分析视频图像时空域相关性和已有的运动估计算法的基础上提出了自适应运动估计搜索算法。算法以时空相邻块的运动矢量预测搜索起点和运动类型,自适应的选用搜索模式和终止准则,实现视频图像的快速高效运动估计。试验测试结果表明,该算法在编码速度和质量上都有明显优势。 本文并将使用自适应运动搜索算法的MPEG-4应用于视频会议系统,设计与实现了视频会议系统软件,很好地实现了视频会议系统的视频编码和较为完善的视频会议系统功能。

魏振宇[2]2005年在《H.264快速算法研究及其在高速DSP平台上的实现》文中进行了进一步梳理从视频电话,视频会议到 DVD,数字电视,机顶盒,数字视频在我们的周围无处不在,深深的丰富了我们的生活。针对数字视频的不同应用领域,国际组织提出了一系列视频压缩国际标准。正是由于众多视频标准的发展使数字视频得到广泛的应用。同样,数字视频应用领域的扩大,也为视频压缩技术提出了更高的要求,推动了视频压缩标准的发展。H.264/AVC 是目前由 ISO MPEG 和 ITU-T VCEG 联合提出的最新一代视频压缩国际标准,和以往视频编码标准相比,H.264 采用了很多特殊的技术以降低码率,提高性能,例如:1/4 精度的亚象素运动矢量搜索、多帧预测、7 种模式的块匹配、以及帧内预测、整数 DCT 变换、CABAC 或 CAVLC 的熵编码技术等等。这些技术的使用,使得 H.264 具有低码率,高质量的性能。但是这些技术的使用也大大增加了编码器的复杂度,使得运算量大大增加,远远不能满足实时编解码的要求。如何对 H.264 的算法进行优化,使其满足实际工程需要成为近1~2 年来研究热点。通过对算法的研究,作者发现运动估计,亚象素搜索以及模式选择部分耗费了编码器运算量的 70%~80%,对其进行优化改进很有必要。在充分利用图像相邻宏块间具有较强空域相关性的基础上,本文提出了基于预测和早停止技术的快速运动估计算法和亚象素搜索算法,以及基于模式预测和自适应阈值的快速模式选择算法,显着的提高了编码器的运行效率,并较好的保持了图像的质量,对视频压缩码率也没有明显影响。随着数字信号处理器(DSP)的快速发展,为实现便携式的数字视频通讯终端提供了可能。TI(Texas Instruments)公司推出的 C64 系列 DSP 具有高主频,并行处理能力高的特点,是目前处理能力最高的数字信号处理器之一。将 H.264 的算法实现在以 C64 DSP 为核心处理器的系统中,具有较强的工程意义和市场价值。本文将 H.264 的编码器实现在 Ti C6416DSP 的仿真开发平台 NVDK 中,通过系统级优化,算法级优化,指令级优化等手段,充分利用 DSP 的并行处理能力和丰富的媒体处理指令,最终达到了实时编码的效果。

杨晓琴[3]2011年在《H.264快速运动估计算法及其在CUDA上的实现》文中认为ISO/IEC和ITU-T联合制定的新一代视频压缩标准H.264可以获得很高的编码效率,但却大大增加了编码复杂度,对视频编码的实时性带来了很大的挑战。在高实时应用系统中,必须对该标准进行相应的改进。改进的方法可以从两个方面考虑,一方面通过对编码算法的改进,降低编码时间,提高编码速度,另一方面采用相关协处理设备与CPU协同编码,从而提高系统实时性。运动估计是H.264编码标准的核心技术之一,编码时间占很大比例。本文总结了几种经典的运动估计算法,并在此基础上了提出了一种高效的快速运动估计算法----改进的UMHEX算法。该算法采用了提前终止阈值,改进的搜索模板和基于混合模板的搜索技术。通过实验表明,改进的算法与全搜索算法和UMHEX算法相比,在保持信噪比和码率几乎不变的情况下,编码时间明显降低了。图形处理器GPU具有强大的浮点计算能力和并行处理能力,能够很好地协同CPU完成视频编解码。在解码器中,将去方块滤波放入GPU中进行并行计算,其余部分仍在CPU中计算,从而提出了CPU+GPU的并行解码器结构。本文充分利用了GPU的并行计算能力,使得去方块滤波的计算时间大大缩短。实验表明,这种并行架构与传统的算法相比,能够有效地进行编码加速。不管是对算法本身的改进或是通过协处理器进行并行处理,都能够有效地提高编码速度,改进系统的实时性,从而使得H.264视频编码标准能够很好地应用到实际场合中。

李协[4]2015年在《侦率帧问技术及其在低码率信道中的应用研究》文中研究表明目前视频传输已是网络应用中的重要组成部分,并且其在互联网的地位也越来越重要。视频数据由于数据量大的特点,需要经过压缩,才能满足传输的要求。虽然视频压缩技术发展迅速,并且能提供较高的压缩比,但在一些带宽严重受限的应用中(移动网络视频会议),仍亟需高效的低码率视频编码技术。降低输入视频的时间分辨率和空间分辨率可以明显降低视频编码器输出码率,有利于在低码率信道中传输,但视频质量将会受到严重影响。一种解决策略是在编码端降低帧率,然后在解码端通过帧率上转换恢复正常帧率。针对低码率信道视频传输,本文提出了一种基于区域划分的帧率上转换技术以及一种基于二次率失真模型的自适应降帧算法,分别应用在解码端和编码端。本文首先介绍了帧率上转换技术的基础理论以及视频编码中常用的运动估计算法,然后提出了一种改进的帧率上变换方案。该方案基于场景切换检测结果自适应选择采用帧率内插和帧率外推技术提升帧率。本文在现有的镜头切换检测算法基础上,针对帧率内插的应用,提出一种使用基于像素点比较和Sobel边缘比较的组合检测方法,此方法效果好且计算复杂度低。本文的创新点主要在帧率内插部分。针对现有基于双向运动估计的帧率内插方案不能很好处理运动物体边缘的问题,本文提出了一种基于运动区域划分的自适应运动补偿策略,它在双向运动估计的基础上,对运动物体的复杂和简单区域分别采用AOBMC和VS-BMC进行运动补偿。仿真结果表明该策略能较好解决了已有方案由于运动物体边缘运动矢量估计不准确导致的运动模糊问题。本文最后通过分析研究视频编码中的码率控制技术,针对视频在低码率信道传输的应用环境,提出了一种使用二次率失真模型进行自适应降帧的策略,最后通过实验验证在低码率信道应用中,通过降帧和内插的方法能比直接增加量化步长的得到的视频要好,因此本文的方法可以在低码率信道中对视频质量有要求的应用中使用,具有一定参考价值。

魏建云[5]2010年在《AVS视频编码器的模块算法优化及其在DSP上的实现》文中研究说明AVS是我国具备自主知识产权的第二代信源编码标准。该标准的提出既改变了第一代信源编码技术落后的局面,也解决了AVC专利许可问题死结。与当前流行的国际标准MPEG-4和H.264/AVC相比,有性能高、计算复杂度低、专利费用低等优点。但目前AVS编解码芯片与软件还不成熟,其产业化的实现还有很长的路要走。因此,对AVS编码器的研究具有极为重要的意义。为此,本文在研究多媒体技术的发展现状以及目前各种视频压缩技术的基础上,对AVS编码器中的亚像素运动估计和帧间模式选择模块进行了研究,并提出了快速算法,提高了编码速度。然后将编码器和快速算法移植到了DM642平台上,为AVS的实时编码和应用打下了基础。论文的主要工作包括:1.对亚像素运动估计进行研究,并提出了两个有效的快速搜索算法。为了获得较好的图像质量和高的编码效率,AVS采用了1/4像素精度的运动估计技术。但标准中采用的亚像素全搜索算法的计算量在运动估计中占了非常大的比重,因此减少亚像素的搜索时间尤为重要。由于视频序列具有中心偏置特性和较强的时空相关性,所以本课题从这两个方面来研究减少亚像素搜索的耗时,提出了两种快速算法。一种算法考虑中心偏置特性,根据整像素最优点和次优点的方位关系来预测亚像素运动矢量的方向,使亚像素的待搜索点数由16个降低到4~8个。该算法实现简单,编码效果较好,适合在硬件和实时系统中应用。另一算法利用时空相关性,用宏块的空间和时间上的相邻块的运动矢量来预测当前宏块的运动矢量,降低搜索时间。该算法能使编码器的编码时间节省21%~36%,编码效果稍好于上方法,但实现较复杂。在具体的视频应用中,可以根据不同需求,选择一种合适的快速算法使用。2.在统计基础上,提出了一种基于预测和阈值判决的帧间模式选择快速算法。标准中对4种帧间模式和Skip.帧内等6种模式都进行了搜索。每种帧间模式下都进行运动估计,而对全部的搜索模式都要进行率失真计算,这样的搜索策略是非常耗时的。经统计发现,当前块的最佳编码模式与其时间和空间上相邻块的最佳编码模式相同的概率非常大,因此可以用相邻块的最佳编码模式来预测当前块最可能的编码模式,从而减少搜索的模式,节省编码时间。实验证明,对于不同的视频序列,该算法在保证图像质量和比特率几乎不变的情况下,编码总时间节省了23%~59%。3.把AVS编码器及本课题提出的快速算法移植到嵌入式DM642平台上,并实现两个视频获取方法和数据回传。一是基于UDP/IP协议的网络传输,DM642对接收到的视频序列进行编码。二是DM642对摄像头捕获的视频信息进行编码,即针对监控系统的编码。编码后的码流经网络传输由上位机程序进行存储。这为AVS在嵌入式半台上的实时编码打下了很好的基础。

郭海丰[6]2005年在《基于H.264的视频压缩技术及其在网络视频监控系统中的应用研究》文中研究表明随着信息技术的发展,对静止图像和视频序列图像的压缩编码技术的应用越来越广泛,图像压缩技术已经成为电视广播、视频监控和多媒体娱乐等中最重要的一部分。由ITU-T VCEG和ISO/IEC MPEG联合组成的JVT开发的H.264/MPEG 14496-10 AVC(文中后面将统一称其为H.264)是最新一代的视频压缩标准,也是目前图像通信领域研究的热点。本文对H.264标准进行了系统深入的分析,并对新标准的性能进行了仿真实验;对最耗时模块之一的块匹配运动估计快速搜索算法进行了改进;采用TCP/IP协议在局域网上开发了基于H.264标准的网络视频监控系统的实验演示平台;文章最后给出了一个网络视频监控系统的应用实例。 论文的主要内容如下: 第一章 综述了课题的研究背景、视频压缩的意义、目的以及压缩的可行性,分析了目前国内外在该领域的研究现状,阐述了本论文所研究的网络视频监控系统的一些关键技术。最后,提出了论文的主要研究内容,并给出了论文的总体框架。 第二章 对H.264标准进行了系统深入的分析,总结出了H.264标准区别于以往标准的新技术,利用H.264标准的测试模型对其进行了仿真实验。 第叁章 对最耗时模块之一块匹配运动估计的现有各种搜索算法进行了深入分析,在此基础之上提出了一种改进的快速运动估计搜索算法,并对新算法的有效性进行了仿真实验验证。 第四章 对网络传输中误码产生原因以及其对网络视频传输的影响进行了简要的分析;在分析常用的一些抗误码技术的基础上,深入分析了最新一代的视频压缩标准H.264应用在网络传输抗误码中的一些最新技术;对新标准的抗误码性能进行了仿真实验。 第五章 分析了H.264编解码的原理,对网络视频监控的软件进行了详细设计,并在此基础上,采用TCP/IP协议在局域网上开发了基于H.264标准的二层网络视频监控演示平台。 第六章 在前述内容的基础上,给出了一个叁层网络视频监控系统的应用实例。 第七章 对全文进行了总结,并对未来的发展提出了展望。

佚名[7]2010年在《自动化技术、计算机技术》文中进行了进一步梳理TP112010051942输出耦合的复杂网络自适应牵制同步/樊春霞,蒋国平(南京邮电大学自动化学院)//应用科学学报.―2010,28(2).―203~208.针对输出耦合复杂网络的同步控制,提出一种自适应牵制控制方法以实现复杂网络同步。不同于现有同步控制方法,该方法利用节点输出变量构造同步控制器,只需控制网络中的部分节点就可根据同步误差自适应

王翠[8]2008年在《AVS视频编码标准的帧间预测算法的研究及其在DSP上的实现》文中进行了进一步梳理快速编码算法是改善通信系统视频压缩效果的关键技术,我国具有自主知识产权的新一代视频编码标准AVS(音视频编解码技术标准,AudioVideo coding Standard)在高清数字视频及网络多媒体应用方面表现出良好的性能和较低的复杂度。本文改进了AVS算法帧间预测部分,提高了搜索效率。在DSP嵌入式系统中对AVS算法进行了芯片级的优化,使之更加适合于实际工程中的应用。实时实现AVS编码器的硬件平台选取本实验室自主设计的基于DM6446(达芬奇)芯片的实验板,硬件仿真结果表明,优化后的代码与原来的C代码相比,帧率提高了25倍左右。根据实时性和提高编码质量的要求,本文以实际应用为背景对AVS算法标准中的相关部分进行了深入研究,主要完成3个方面的工作:首先在广泛阅读国内外大量文献的基础上提出了改进帧间预测中最耗时的整像素搜索算法的方案。实验结果表明,与原有的搜索算法相比该方案可以在图像质量基本不降低的前提下,搜索点数约为原来的20%,提高算法的运行速度。其次介绍了AVS算法标准在PC机上实时实现的过程。由于目前业界仅有测试版本的AVS代码,远没能达到实际应用的要求,因此课题组通过分析和优化代码结构,自行设计研发出运行在PC机上能够实时编码的AVS代码(QCIF 20fps)。最后开展了在DSP环境下优化AVS代码的研究工作。采取了诸如合理分配存储空间,优化数据结构,提高Cache命中率以及有效利用DMA资源等多种优化手段来提高TMS320DM6446极其有限的内存资源的使用效率,最终使代码执行效率大大提高。本文通过上述方法,使AVS程序能够很好的在TMS320DM6446上运行,且帧率达到13 fps,这对于在DSP上进一步开发视频压缩算法有着重要的意义,有利于AVS算法在DSP上的实时实现。

高利娜[9]2010年在《网络视频监控系统高效编码技术的研究》文中指出计算机技术、信息技术、互联网技术以及计算机视觉技术的快速发展为视频监控技术提供了良好的技术支持平台,从最初的模拟视频监控到今天的数字网络视频监控,可以看出视频监控技术正日趋成熟。对于今天的网络视频监控来说,它可以让人们不受时间空间的限制在任何IP主机上来监视监控场景的变化。但是,网络视频监控系统在其研发过程中仍有较大困难亟待克服,因为网络的带宽是有限制的,而摄像机所捕获的视频流数据则是庞大的,若是把这么庞大的数据传输到网络上就好比一个庞大的货车在一个极窄的道路上行驶一样,不但影响视频数据正确的传输,更影响其传输的速度,这对于网络视频监控的实时性来说更是不可能达到的。所以,为了达到较快较少地传输视频码流且不影响接收端的画面质量,人们对视频序列做了大量的分析研究,利用各种技术尽可能的压缩视频数据,其中,最主要的压缩技术就是利用帧内数据的相关性及帧间数据的相关性压缩视频数据,即帧内预测与帧间预测。由于网络视频监控系统可以应用在不同的网络上,而这些网络也可以使用不同的网络协议,所以,为了在不同的网络上尽最大可能的压缩视频数据,本文根据H.264/AVC可移植的特性及其较高的压缩比等优点,展开对视频数据压缩编码技术的研究。为了以较少的码流传输视频数据而又不影响人眼对监控视频的感观,首先对当前存在的运动目标检测技术进行了分析研究,列出了在静态场景下运动目标检测的叁种方法,即光流法、相邻帧差法和背景差分法,并对这叁种方法进行了比较,最后选取背景差分法来检测视频流中的运动目标,针对背景差分法只能检测静态场景的不足,本文中阐明了一种在动态场景下对运动目标进行高效准确检测的技术——快速自适应背景更新法。为了进一步研究运动目标检测技术基本原理,本文结合H.264/AVC视频编码的框架,分析了运动估计与运动补偿技术。在此基础上,对基于块匹配法的运动估计作了详细的研究,针对块匹配法中绝对误差和(SAD, Sum of Absolute Difference)匹配准则对监控场景光线变化存在误判的情况,列出了一种新的绝对误差和匹配准则(N_SAD, New Sum of Absolute Difference)。最后,本文在vc++6.0环境下,利用Intel提供的开源计算机视觉库(OpenCV, Open Source Computer Vision Library)实现对视频监控场景运动目标的检测。

参考文献:

[1]. 自适应视频运动估计搜索算法及其在视频会议中的应用[D]. 白波. 重庆大学. 2004

[2]. H.264快速算法研究及其在高速DSP平台上的实现[D]. 魏振宇. 清华大学. 2005

[3]. H.264快速运动估计算法及其在CUDA上的实现[D]. 杨晓琴. 南京大学. 2011

[4]. 侦率帧问技术及其在低码率信道中的应用研究[D]. 李协. 电子科技大学. 2015

[5]. AVS视频编码器的模块算法优化及其在DSP上的实现[D]. 魏建云. 山东大学. 2010

[6]. 基于H.264的视频压缩技术及其在网络视频监控系统中的应用研究[D]. 郭海丰. 浙江大学. 2005

[7]. 自动化技术、计算机技术[J]. 佚名. 中国无线电电子学文摘. 2010

[8]. AVS视频编码标准的帧间预测算法的研究及其在DSP上的实现[D]. 王翠. 太原理工大学. 2008

[9]. 网络视频监控系统高效编码技术的研究[D]. 高利娜. 武汉理工大学. 2010

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

自适应视频运动估计搜索算法及其在视频会议中的应用
下载Doc文档

猜你喜欢