采用小波变换视频压缩的研究与应用

采用小波变换视频压缩的研究与应用

安丹丹[1]2007年在《基于小波变换的视频压缩算法研究》文中研究指明随着Internet网络、无线通信技术以及交互式多媒体技术的迅速发展,视频压缩技术成为当今视频通信的研究重点。在最近的二十多年中,小波理论得到了迅速的发展,成功地在许多领域得到应用。在图像压缩领域,基于小波变换的JPEG2000已经成为当今主流的图像压缩标准。在视频压缩领域,基于小波的压缩算法不断出现,并且表现出其优异的性能和良好的发展前景。本文以此为背景,提出基于小波变换的视频压缩算法研究,首先对小波变换理论进行了较为深入的阐述,包括多分辨率分析理论、图像小波分解过程的推导等,对图像分解中小波基的选择问题进行了讨论,从而确定了课题的实施方案,即在本文设计的视频压缩算法中采用双正交小波基D9/7。其次,研究了基于小波变换的静止图像压缩算法EZW、SPIHT和一种改进的EZW算法,这些算法是视频压缩编码算法中的关键部分。在软件平台上进行了算法验证、分析和对比,结果显示,应用改进的EZW算法对图象进行压缩,重构图像的PSNR值较高。论文第叁部分研究了基于小波变换的视频压缩算法和多分辨率运动补偿算法,对运动补偿算法进行了适当改进。最后,设计了一个基于小波变换、小波域运动补偿和改进的EZW算法的视频压缩方案,进行了软件设计并对其运行结果进行了数据分析。经与H.263视频压缩标准对比,说明本文提出的算法在中高码率下性能优异,在低码率下也达到了H.263标准。

周建威[2]2003年在《采用小波变换视频压缩的研究与应用》文中提出随着多媒体技术的应用和发展,国家信息化与广播电视的数字化、网络化进一步推进,数字化后的视频和音频信息具有数据海量性,它给信息的存储和传输造成较大的新的困难。在多媒体技术发展过程中,人们一直在探索和研究既没有方块效应又能适用图象自身特点的具有通用性的编解码方式。当前,典型的方式有JPEG和MPEG,在MPEG家族中已从MPEG-1,-2发展到MPEG-4,MPEG-7和MPEG-21。 本文首先分析了目前采用的多媒体数据压缩格式的现状及主要特点,同时对专业级的电视信号及如何实现数字化作了简单的描述与分析。为在湖南广电集团局域网实现电视节目的实时传送和回放,采用发展前景十分广阔的小波理论,引入离散小波变换实现视频图像压缩。小波分析理论是近几年国际上掀起热潮的一个前沿领域,它被认为是傅里叶分析方法的突破性进展。采用小波分析的小波变换编码被认为具有上述优点和发展潜力的编码方法。 文章从建立离散小波变换数学模型出发,提出了视音数据处理总体结构,并与相关公司进行认真探讨与研究,同时与采用MPEG-2压缩方式进行截图比较与数据分析,并在实际运行中与广播级视频信号进行比较。开发了应用于广播电视系统的视频压缩技术,设计了用户界面。该系统实际运行表明,所用模型基本合理,用户界面友好,操作简单,满足目前应用的要求,提高了审查电视节目的效率,具有较好的实际应用前景。

徐冬冬[3]2016年在《高分辨率空间CMOS相机视频实时压缩技术研究》文中研究表明由于空间相机在视频分辨率以及帧频等指标要求的不断提高,导致CMOS输出的视频数据量急剧增加。现有的压缩算法运算过程十分复杂,而且主要停留在软件仿真阶段,硬件实现困难且效果较差。为了有效缓解星上存储器以及信道传输的压力,研制出压缩性能好、数据处理快的实时视频压缩系统迫在眉睫。论文以参与的工程项目“空间CMOS相机技术”项目为背景,对全色和多谱段CMOS相机视频压缩技术分别进行了研究。现将本文的主要研究内容和成果概括如下:1、根据项目需求以及CMOS视频的特点,探讨小型CMOS相机及高分辨率CMOS相机ASIC的ADV212压缩技术。提出利用Custom-specific工作模式为各种格式的视频提供接口,并通过FPGA内部的块RAM以及DDR3 SDRAM的乒乓操作对数据进行缓存,显着地提高了工作效率;之后,为了适用于不同应用场合,本文方法实现了码流的存储后传输以及直接传输之间的切换,并通过纠错编码极大的提升了闪存的纠错能力;最后,为了验证方法的可行性,本文基于压缩板以及解压板进行了实验验证。结果表明,压缩系统可实现实时稳定的工作,通过软件设置,系统可以实现极高的压缩比,压缩比80:1时,平均峰值信噪比(PSNR)高于28 dB,压缩比150:1时,平均PSNR高于26 dB,解决了在大数据量下,压缩系统硬件实现困难以及实时传输困难等问题。2、结合离散小波变换(Discrete Wavelet Transform, DWT)与Karhunen-Loeve变换(KLT)提出一种空间多光谱视频压缩算法。通过两种变换的有效结合可以将图像的能量集中到少数系数上,更好地达到压缩效果。本文首先将多光谱图像的每个谱段进行快速2维离散5/3小波变换,消除多光谱图像的大部分空间冗余。然后对所有谱段产生的小波系数进行改进KL变换,来消除光谱冗余和残存的空间冗余。最后对所得系数进行熵编码,得到压缩码流。实验结果表明,在0.25-2bit/pixel (b/p)范围内,平均PSNR达到41dB,与其他多光谱图像压缩算法相比,极大的提高了系统PSNR,提升了多光谱图像压缩算法的性能;同时提出了硬件实现策略,验证了本文理论的正确性以及算法的可行性,为空间多光谱图像压缩系统实现提供了参考。3、图像进行KLT和一级DWT后,不同谱段的系数之间以及同一谱段的高频子带之间仍然存在很大的相关性,其平均值大于0.9,提高小波变换级数后此值会相应的降低,但效果不是十分理想;基于DWT和Tucker分解的压缩算法将图像作为张量,这样能完整的表示高维数据并保持其本征结构,较好的去除图像的空间冗余和光谱冗余,但稀疏表示不足,达不到更高的压缩比。本算法的提出可以很好的克服以上两种方法的不足,在保证较高压缩性能的同时,有效地保护了光谱信息。首先将多光谱图像的所有谱段进行KLT,消除多光谱图像的光谱冗余。然后将变换后的每个谱段进行2维离散9/7小波变换,消除多光谱图像的空间冗余。其次,将变换后的每个小波子带都看作非负张量,对其进行Tucker分解(Tucker Decomposition, TD),并用阻尼高斯-牛顿算法(damped Gauss-Newton, dGN)求出最优解,进一步消除光谱冗余和空间残余冗余。最后,将得到的模式矩阵和核心张量进行熵编码。在压缩比4:1-32:1范围内,平均PSNR高于43dB,与其他多光谱图像压缩算法相比,极大的提高了系统PSNR,提升了多光谱图像压缩算法的性能。4、采用MT9V032型CMOS数字图像传感器设计了一款完整的小型化、低功耗相机。基于初级像差理论设计了焦距为12.95 mm,F数为5的光学系统,该系统体积小、结构紧凑,在空间频率83 lp/mm处,各视场调制传递函数(MTF)均优于0.5;电子学系统以FPGA作为时序控制平台,控制CMOS输出数字视频信号,数字视频信号通过差分芯片以低压差分信号(LVDS)格式输出到图像采集卡,最后在计算机上成像。实验结果表明,本文设计的相机像质良好、功耗低、移植性强、可靠性高,时钟为26.6 MHz时,帧频为60帧/秒,并可通过调节内部寄存器的值实现多种模式,特别适用于对相机体积以及成像质量要求较高的场合。5、根据高分辨率空间CMOS相机视频压缩系统指标,设计了用于大、中型视频压缩系统的基于KAC-06040的CMOS相机系统。设计的焦距为1175mm,F数为6.71的光学系统,该系统体积小、结构紧凑,在空间频率106.41 lp/mm处,各视场MTF均优于0.446(有遮拦),能量集中度11um以内的能量集中度均优于80%;电子学系统以FPGA作为时序控制平台,控制CMOS输出数字视频信号,数字视频信号通过Camera Link传输线以Medium模式输出到图像采集卡,最后在计算机上成像。实验结果表明,本文设计的相机像质良好、功耗低、移植性强、可靠性高,满足项目需求。

陈琪[4]2006年在《H.264视频编码标准在视频会议中的研究与应用》文中认为近年来,随着通讯、计算机、微电子技术的迅速发展,视频压缩解码技术与传输技术日臻完善和成熟,实现视频通信传输终因成本的逐步降低而成为可能。因此,视频会议系统这一新兴技术,由于其可以为处于两点或多点间的与会者提供音频和视频等多种信号,节省大量费用,提高工作效率而迅速发展,并有望成为下一代网络(NGN)的主要业务。本文以“即时通讯系统”的课题为背景,在研究视频编码算法的基础之上,介绍了视频编码发展的历程,并比较了当今主流视频编码的特点,分析各自的优缺点。由于编码效率高以及视频质量优越的特性,将H.264这一当前最热门的视频编码标准作为重点研究分析的对象。论文介绍了基于Internet的软件视频会议系统。采用软件视频会议的方式,地理上分散的用户可以共聚一处。通过图形、声音等多种方式进行信息交流,支持人们远距离进行实时信息交流与共享、开展协同工作,这样既达到了召开会议的目的,又提高了工作效率。论文详细论述了视频压缩编码的原理、基本算法以及各个视频编码的特性,特别介绍了目前最新的视频编码标准H.264。H.264由于其采用的分层设计、帧内预测编码、整数DCT变换以及高精度、多模式的运动估计等先进技术,使得H.264编解码高效,压缩率高,并且抗丢包性能和抗误码性能超出了以往的H.26x系列和MPEG系列视频编码。本文分别对这些技术进行了详细的分析。由于H.264运算量较大,导致编码速度较低,无法达到视频会议对于帧率的要求。为改进H.264的编码速度,论文用一定的篇幅提出了一种基于宏块模式选择的快速算法,用于加快运动估计的过程,并在实验中得到了验证。最后,文章针对H.264应用前景进行了展望。

王镇道[5]2008年在《视频压缩的运动估计与小波方法研究》文中研究说明图像是人类获取信息的主要途径,而图像压缩在数字图像的处理、存储和传输中起着十分重要的作用。运动估计和运动补偿是消除视频信号时间冗余的主要方法,是视频压缩编码的关键技术。本文在空间域运动估计方法、小波域运动估计方法,以及小波变换在图像压缩中的应用等方面进行了研究和探讨。主要工作与贡献如下:(1)提出了一种空间域物体运动特征自适应的运动估计算法,主要包括搜索起点预测模型和自适应搜索方法两部分。基于物体的整体性和运动的连续性,搜索起点预测模型随相邻块运动相关性的变化调整模型参数,预测结果更加接近最佳运动矢量。根据绝对误差和的梯度和物体的运动特征,自适应搜索调整模板的大小和形状,从而加快搜索速度。实验结果表明,该算法在峰值信噪比(PSNR)和搜索速度以及重建图像的主观质量方面优于其它快速运动估计对比算法。(2)提出了一种小波域的初始运动矢量预测方法和交叉搜索运动估计方法。初始运动矢量预测方法利用小波变换的多分辨率特性,以及块的时间和空间关联性,并结合低频子带全搜索方法,在运算复杂度增加极小的情况下,得到更准确的初始运动矢量。根据小波子带系数的特点,在低频子带平移后,交叉搜索沿水平和垂直方向进行,通过调整交叉搜索中心,逐步逼近最优的运动矢量。运动估计按小波变换级数进行,在每个分辨率层次,搜索范围局限于参考帧对应变换级数下的4个平移子带,得到的是当前分辨率下的最优运动矢量,保证了解码图像是已接收数据下的最佳图像。仿真结果验证了初始矢量预测和交叉搜索方法的有效性。(3)通过分析运动补偿时间滤波(MCTF)更新算法对重构图像PSNR的影响,研究了一种内容自适应的MCTF反向运动补偿算法。根据简单量化独立信源编码的平均绝对误差和计算方法,分析了更新步骤缺省时编码端高、低频子带的能量增益系数的变化,并得出更新步骤是否缺省时,因能量归一化所导致的解码端奇、偶数帧之间的PSNR变化。基于预测和更新步骤的运动矢量互为反向的原则,提出了一种反向运动补偿矢量的获取方法。仿真实验表明该方法可以改善重构图像的PSNR。根据小波变换的子带系数特性,建立了图像平坦区域的估算模型;根据运动估计后的高频子带能量,建立了运动估计准确程度的估算模型,从而实现了具有内容自适应特性的MCTF反向运动补偿算法,减小了ghosting伪影,克服了由于运动估计的不准确以及更新步骤可能导致的低频子带反向补偿误差。仿真实验证明了该方法的有效性。(4)设计了一种高效低功耗的二维小波变换器VLSI结构,提出了采用该小波变换器的视频压缩系统方案和系统优化方法。二维小波变换器采用基于提升算法的可分离二维变换结构,对行、列小波处理器的数据调度方法进行了优化。采用Z形扫描方法,用少量暂存器缓冲列滤波结果,实现了行、列处理器并行工作,提高了数据处理速度和硬件利用率。通过优化列处理器的数据调度,处理每个点只需读取或存储一次数据,将存储器访问带宽降低了50%,从而用单口RAM替代了双口RAM,大大减少了存储器所占芯片面积和功耗。整个设计进行了FPGA验证,并采用HJTC 0.18μm工艺库完成了综合与版图设计,设计的芯片通过了流片验证。(5)针对氧化铝熟料烧结回转窑生产过程,提出了一个视频压缩系统设计方案。该系统包括多媒体专用DSP、二维离散小波变换器、摄像头以及网络传输等部分。通过回转窑火焰图像的压缩进行了仿真实验,实现了黑把子图像在不同空间分辨率、时间分辨率和不同PSNR条件下的压缩与重构,完成了在极低码率下黑把子的准确识别,说明了该系统可有效应用于回转窑火焰图像的压缩。

胡宏军[6]2005年在《基于小波变换的视频压缩研究》文中认为随着计算机网络的普及和发展,很多信息可以通过网络实现共享。形色兼具的视频信息在网络传输的信息中所占据的比例也越来越高。但由于视频信息本身十分庞大,限制了其在网络中的传播速度。于是视频信息的压缩成为视频传输的一个重要环节,视频图像压缩技术也成为多媒体技术发展的关键和核心技术。总之图像视频压缩最终目的是以尽可能低的压缩比来得到更好的图像和视频来满足人的视觉系统、网络带宽以及各种不同类型的用户。 本文将小波变换理论运用到视频压缩上,小波视频压缩的进展有赖于小波图像压缩的研究和信号维数的提高,视频压缩的应用背景与图像压缩的应用背景有很大的不同。由于视频应用实时性的原因,视频压缩算法要对压缩算法的复杂度和压缩效率作综合考虑。故本文以静止图像的小波压缩技术作为研究基础,主要对嵌入式零树小波压缩算法(EZW)进行了仿真并分析它的优缺点,据此提出了改进的零树小波压缩算法,将它与分层树集划分编码算法(SPIHT)进行了比较。此外,分析了编解码的抗干扰措施。着重分析了整数小波变换以及将其应用于EZW算法(Wavelet-Difference-Reduction algorithm,WDR)为基础,提出将基于“提升”算法的基数小WDR),改进了其不足,并进行了仿真。进一步将其运用到视频小波压缩上,构成了叁维小波变换和3D-SPIHT算法。 最后对小波变换进行视频压缩技术研究与探讨是一个新的课题,密切关注视频压缩技术的发展方向,特别是基于小波变换的视频压缩。不久的将来会实现多网融合和多种终端融合的格局。

赵纯[7]2008年在《数字视频采集压缩系统实现》文中进行了进一步梳理随着人类社会迈入信息化时代,图像和视频作为信息载体被广泛应用。而数字视频比模拟视频具有多种明显的优点,它的发展推动了多媒体、视频通信和数字电视等产业的飞速发展。基于数字视频重要的研究意义及其数据量巨大带来的传输瓶颈问题,本课题要求实现数字视频的采集和压缩。视频采集是数字视频采集压缩系统的基础,是系统的硬件部分。以CMOS图像传感器OV7660作为视频采集芯片,以CY7C68013作为CPU控制和USB2.0接口芯片。OV7660采集的视频数据按设定的输出频率,在CY7C68013的控制下,通过USB2.0接口传输到计算机,由视频处理软件还原成原始图像显示。硬件结构合理,体积小,使用方便。系统的软件部分主要完成视频采集,显示和压缩等功能。包括系统固件程序,USB2.0接口与计算机通信的应用程序和视频采集压缩应用程序部分。固件程序采用Keil C编写,控制硬件来完成USB2.0接口的通信任务。USB2.0接口与计算机通信的应用程序采用Visual C++ 6.0编写,将图像传感器的原始图像数据传输到上位机,完成两者间的通讯。视频压缩应用程序实现了对静态图像和数字视频的压缩。其中,静态图像压缩实现了对抓取的单帧图片进行基于小波变换的EZW及基于DCT变换的JPEG压缩。数字视频压缩以两种方式实现,一种是将原始视频数据保存为文件后进行压缩,采用的是H.263,本系统改进的H.263和MPEG-2压缩算法,均能在保证视频质量的情况下达到较理想的压缩比;一种是在对实时采集数据实时显示的基础上实现基于H.263和MPEG-2的实时压缩,通过实验表明其实时效果有待改进,为今后实现高实时性的采集压缩系统奠定了坚实的基础。

陈高[8]2016年在《基于分数阶全变差的视频图像压缩感知重构算法研究》文中研究指明作为一种新兴的信号表征与压缩采样理论,压缩感知理论能在低采样率的情况下准确地重构出原始信号。鉴于其具有采样和压缩同时以低速率进行的特点,近年来吸引了一大批相关领域学者的关注和研究。重构算法是压缩感知理论中十分重要的一个环节,重构质量的好坏直接关系着其在实际中的应用。设计低计算复杂度以及高重构质量的压缩感知重构算法以精确重构出信号特别是大尺度视频图像信号,一直是研究的热点。本文正是在这一背景下,以视频图像信号为研究对象,通过对压缩感知稀疏表示以及重构算法深入广泛的研究,针对基于全变差稀疏模型重构的视频图像容易丢失纹理细节等问题,将分数阶全变差模型引入到视频图像压缩感知重构,并在此基础上设计重构算法,主要贡献及创新工作如下:1、针对基于全变差模型的图像压缩感知重构存在丢失纹理和细节信息等问题,提出了一种基于优化最小算法的分数阶全变差二维压缩感知图像重构算法。该算法将压缩感知理论中的一维随机观测扩展为双向二维随机观测并建立了二维压缩感知图像重构框架。此外将分数阶差分技术引入到全变差图像稀疏表示中,设计了基于分数阶全变差的图像稀疏重构模型。在此基础上利用优化最小化思想,将该稀疏重构模型转化为一系列简单的迭代优化问题进行求解。实验结果表明:与现有的基于全变差模型的压缩感知稀疏图像重构算法相比,该算法具有更低的计算复杂度,更高的峰值信噪比和结构相似度以及更好的视觉效果。2、为了得到更加稀疏化的图像表示方法,提出了一种基于多特征图像稀疏表示的二维压缩感知图像重构算法。该算法利用联合稀疏表示的思想,结合图像在对偶离散小波变换域的稀疏性及分数阶全变差模型,设计出了一种基于多方向对偶离散小波变换与分数阶全变差相结合的图像压缩感知稀疏重构模型并提出了一种梯度投影算法对该模型进行求解。在标准测试图像上的实验结果证明了所提出的算法的有效性,并且具有比现有的主流算法更高的重建精度。3、针对视频克罗内克压缩感知重构算法计算复杂度高的问题,提出了一种基于分数阶全变差的视频克罗内克压缩感知重构算法。该算法将分数阶全变差模型进行扩展,通过克罗内克积运算构造了一种基于分数阶全变差的视频克罗内克压缩感知稀疏重构模型并设计了一种交替方向法来求解该稀疏模型。在该模型中,视频信号无需进行列向量化处理,因此大大降低了重构的计算复杂度和存储空间。此外通过引入分数阶全变差稀疏表示,重构视频的质量也得到了提高。在标准测试视频上的实验结果表明:与克罗内克压缩感知以及现有的一些主流视频压缩感知重构算法相比,提出的算法具有更低的计算复杂度,同时具有更高的峰值信噪比以及更好的视觉效果和纹理保持能力。4、为了提高视频张量压缩感知的重构质量并降低计算复杂度,提出了一种基于分数阶全变差的视频张量压缩感知重构算法。该算法将分数阶全变差模型推广到张量,建立了一种联合分数阶全变差与张量稀疏表示的视频压缩感知稀疏重构模型,同时充分利用张量的数学性质,设计了一种张量光滑l0算法求解该模型。实验结果表明:与现有的基于张量的视频压缩感知重构算法相比,所提出的分数阶全变差张量视频压缩感知重构模型能够较大幅度地提高重构视频的主客观质量并具有较低的计算复杂度。

刘闯[9]2005年在《基于小波的网络视频实时压缩的服务端流控与客户端缓冲技术研究》文中研究指明随着计算机技术、Internet网和多媒体技术的飞速发展,流媒体技术的应用越来越普及,因此研究基于该技术的网络视频应用就显得很有意义,为了使客户端能够实时收到高质量的视频图像,网络视频直播系统需要具备自适应带宽、强实时性、高稳定性等特性。由于目前的Internet不能为直播视频流传输提供可靠的QoS保证,网络视频直播面临着延迟大、丢包、传输抖动等问题。另外,随着网络用户的急剧增多,Internet常常因为拥塞而导致大量数据包丢失,为了弥补传输网络的缺陷,对直播视频流进行服务端流控和客户端缓冲显得尤为重要。 本文首先介绍了小波视频压缩和流媒体技术,接着,在小波实时压缩视频基础上,针对目前服务端流控算法在保证视频实时性方面还存在实时性差、动态跟随性差、速率调节波动大、延迟大等问题,提出了基于小波实时压缩视频的自适应流控算法,该算法在NS上仿真效果较好。实验表明:该算法是有效的,而且是TCP友好的,能够保持网络带宽的高使用率。然后,为了解决目前客户端缓冲策略在保证客户端视频播放实时性上还存在动态适应性差、延迟大等缺点,对客户端缓冲进行了改进,给出了改进后的客户端自适应缓冲策略。实验表明:该策略延迟小、实时性强、动态适应性好,能够有效地协调客户端视频播放的实时性和缓冲延迟之间的矛盾,提高视频直播的整体性能。实验同时也验证了提出的算法和改进的策略的正确性和可行性。

刘云霞[10]2012年在《基于有限脊波变换和压缩感知理论的智能交通监控系统技术研究》文中进行了进一步梳理随着汽车交通系统发展的日趋成熟,以计算机视觉方法采集交通信息、提供智能辅助决策、进行相关信息存储和管理为目的的智能交通监控系统越来越受到人们的重视。交通信息的获取无疑是交通监控系统的首要任务,相对于地感线圈等传统的检测以及监控手段,基于视觉的交通信息监控系统能够更直观地提供视觉信息,从而提供更全面更快速的交通信息。然而,由于实际应用中存在光照、遮挡及环境复杂多变等因素的影响,基于视觉手段获取的交通图像质量参差不齐,对后续进行的基于图像的交通信息理解提出了很高的要求。如何根据交通图像及视频的特点,寻求高效的图像表示算法、交通标志及车牌字符识别算法以及高效的压缩存储算法等关键问题,至今未有满意的解决。本论文基于新兴的有限脊波变换以及压缩感知理论进行算法研究,并从实际的工程应用出发,针对交通图像去噪、车牌字符识别以及交通视频压缩等关键问题进行应用研究。一直以来,以寻求数字图像稀疏表示为目的的高效表示及分析方法都是信号处理领域的研究热点。在数字图像的特征表示方面,来源于数学分析、计算机视觉、统计分析以及模式识别等多个领域的多尺度几何分析理论是近年来的研究热点,包括脊波变换(Ridgelet Transform)、曲波变换(Curvelet Transform)、轮廓波变换(Contourlet Transform)、Bandelet变换和Wedgelet变换等多种方法。多尺度几何分析方法克服了传统小波变换只对水平、竖直和对角线叁个方向敏感,对图像中几何结构的描述能力有限的缺陷,可以提供对图像不同尺度、不同方向的多分辨率表示。其中,脊波变换立足于图像中线奇异性的有效表示,利用Radon变换将线奇异性映射为点奇异性,然后使用小波变换来对点奇异性进行处理。鉴于道路、车牌、交通标志中大量存在的线特征,定义在离散域的有限脊波变换因其优越的线奇异特征表示能力,成为本文研究工作的基础。有限脊波变换域良好的系数集中特性为有效地区分图像内容与随机噪声提供了可能,同时基于有限脊波变换系数的特征提取算子也有望在交通字符识别中给出满意的分类效果。在数字图像的分析方法方面,近年来发展起来的基于新型采样理论的压缩感知方法日益获得广泛关注。压缩感知方法利用信号固有的稀疏特性将传统的基于奈奎斯特采样定理的采样过程转化为根据信号特征设计观测矩阵、进而最小化l1范数的优化过程,旨在通过构造超完备数据字典的方法寻求信号的最稀疏表示。研究人员利用大量训练样本构建远大于特征维数的数据字典,以待分类样本在该数据字典下表示系数的稀疏性为指标,将压缩感知理论应用到人脸识别中去。基于压缩感知理论的分类器,放宽了对特征提取的严苛要求,并且成功的解决了存在遮挡干扰下的人脸分类问题。本文以此为基础,探讨压缩感知分类器在车牌字符识别问题中的应用。另外,通过对实际获取的大量交通监控视频的分析和统计表明,交通监控图像具有视频背景固定、视频帧内区域间存在高度自相似性的特点。本论文以减少帧内空间冗余性为出发点,以交通监控视频帧内各块为单位,将视频压缩中面向减少时间冗余性的帧间运动估计以及运动补偿方法应用于帧内以块为单位的视频压缩。本论文的主要工作如下:(1)有限脊波变换算法改进及相应的基础研究在分析二维可分离小波在高维信号描述的不足的基础上,从连续脊波变换的基本理论作为切入点,介绍其基本思路及与其他变换的关系。对有限脊波变换的基本理论进行介绍,具体地,介绍有限Radon变换及有限Radon域变换方案的选择原则。在此基础上,对本文作者前期提出的基于能量的自适应有限脊波变换方案及其按列阈值的选择方法在图像去噪中的应用等进行了详细的介绍,并对目前基于有限脊波变换为特征的图像分类方法进行了总结,作为本文后续研究工作的基础。(2)基于有限脊波变换的交通图像去噪在对交通图像特性进行分析的基础上,将作者前期提出的基于能量的有限脊波变换及按列阈值算法应用到交通标志图像的去噪中;结合大量实验讨论了有限脊波变换域不同变换方案及阈值策略的去噪性能。同时针对交通图像长宽比不固定、且通常相差较远的特点,提出一种基于有限脊波变换的重迭分块去噪算法,具有运算量小且易于实时实现的优点;最后在交通标志图像数据库上的去噪实验结果验证了该算法的有效性。(3)基于有限脊波变换特征和压缩感知技术的车牌字符识别算法研究本文提出利用有限脊波变换进行特征描述并基于压缩感知技术进行车牌字符识别。具体地,本文提出利用按列首尾相接的有限脊波变换系数作为特征,并考察其在平移、噪声、遮挡等干扰因素下的特征鲁棒性。利用训练样本构建脊波字典,通过压缩感知方法解l1范数最小化问题对测试样本在脊波数据字典下展开系数的稀疏性给出分类结果。在车牌字符图像库上的仿真结果表明,所提算法具有很好的抗噪声以及抗遮挡能力。(4)基于块匹配的交通监控视频压缩本文从分析交通监控视频的场景固定、帧内相似性较强的特点出发,提出以利用静止图像中以块为单位的空间冗余信息为出发点,提出了一种基于块匹配的图像压缩算法,将传统的应用于视频压缩中的运动估计和运动补偿方法应用于静止图像以及视频的压缩中。在自然图像、可分级视频编码以及交通监控视频的大量压缩实验中均取得了压缩性能的提高,改善了编码效率。并且提出的块匹配模块可以灵活性地推广到任意编码器中。

参考文献:

[1]. 基于小波变换的视频压缩算法研究[D]. 安丹丹. 河北工业大学. 2007

[2]. 采用小波变换视频压缩的研究与应用[D]. 周建威. 湖南大学. 2003

[3]. 高分辨率空间CMOS相机视频实时压缩技术研究[D]. 徐冬冬. 中国科学院研究生院(长春光学精密机械与物理研究所). 2016

[4]. H.264视频编码标准在视频会议中的研究与应用[D]. 陈琪. 华中科技大学. 2006

[5]. 视频压缩的运动估计与小波方法研究[D]. 王镇道. 湖南大学. 2008

[6]. 基于小波变换的视频压缩研究[D]. 胡宏军. 湖南大学. 2005

[7]. 数字视频采集压缩系统实现[D]. 赵纯. 中北大学. 2008

[8]. 基于分数阶全变差的视频图像压缩感知重构算法研究[D]. 陈高. 西南交通大学. 2016

[9]. 基于小波的网络视频实时压缩的服务端流控与客户端缓冲技术研究[D]. 刘闯. 国防科学技术大学. 2005

[10]. 基于有限脊波变换和压缩感知理论的智能交通监控系统技术研究[D]. 刘云霞. 山东大学. 2012

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

采用小波变换视频压缩的研究与应用
下载Doc文档

猜你喜欢