数字视频压缩理论与技术研究

数字视频压缩理论与技术研究

赵海武[1]2002年在《数字视频压缩理论与技术研究》文中指出数字视频压缩编码技术是各种数字视频应用的关键技术。在过去的几十年之中,数字视频压缩编码技术取得了很大的进步,有力地促进了可视电话/电视会议、数字电视、VCD/DVD等应用的发展。特别是国际标准化组织(ISO)与国际电工委员会(IEC)联合制定的MPEG系列标准,产生了很大的影响。本文首先对数字视频压缩编码技术的发展状况做了研究,对各种压缩技术的分类以及视频编码的最新进展做了论述并提出了若干独到的见解。 MPEG-4标准采用的基于对象的视频编码方法代表了数字视频编码技术的发展方向。MPEG-4中的视频对象可以是视频中的物体或者背景,因此视频对象有叁类信息需要编码:运动,纹理和形状。本文对视频对象的形状编码方法作了深入的研究。提出了一个用于二值图像的变换——Zh变换,并在此变换的基础上设计了一个完整的视频对象形状编码方案。 类似于DCT和WT等变换,zh变换可以把图像数据从空间域变换到另一个类似于频率域的域,使变换后的数据从粗到精地描述了视频对象地形状。这对后面的编码非常重要。另外,zh变换的计算也是非常简单的。 本文提出的基于zh变换的视频对象形状编码方法,仍然使用二值位图来表示视频对象的形状,但是克服了传统的基于位图方法编码数据流不可分级的缺点。本文方法输出的编码数据流可以根据码流分级的要求灵活的分为一个基本层和若干增强层。更重要的是,本文方法在编码效率上比MPEG-4现有的形状编码方法也有很大提高。Zh变换后的数据被重新组织成二值位图,仍然用基于上下文的算术编码方法编码。经过Zh变换,算术编码器可以利用已经编码的数据更准确的预测下一位要编码的数据,因此算术编码器的效率得到了提高。 在本文的最后,还讨论了算法实现中的一些具体问题,尝试了对算法的各种改进措施。

王华[2]2004年在《高品质数字视频光纤传输技术研究》文中研究说明随着科技的发展和人们生活水平的提高,视频传输系统被广泛应用于工业临控、交通管理、广播电视、银行、商场等多个领域。针对不同的应用场合,设计高质量的视频传输系统是当前视频传输技术研究的关键。 本文将数字化技术和光纤传输技术相结合,研制了非压缩多路数字视频光纤传输系统。该系统基于时分复用技术、采用串行数字视频传输方式,可在一根光纤中同时传输10路视频信号。系统在总体设计时、将一次复用方案和二次复用方案相比较,确定采用二次复用的总体设计方法;系统的各部分硬件具体实现时,采用CPLD+ASIC的实现方法,PCB采用四层板的制板结构,同时高速串行数据接口采用PECL差分交流耦合的连接方式,使系统具有高集成度、可靠性及灵活性的特点。实验证明,该系统工作稳定、实时传输效果好,是远程视频监控系统及安防系统的实用方案。 由于非压缩多路数字视频光纤传输系统的数据传输速率高达千兆比特,这对于要求低码率传输的应用场合很不利。因此本文在非压缩多路数字视频光纤传输系统的研制基础上,对视频压缩算法进行了初步研究,并初步确定了基于压缩算法的多路数字视频光纤传输系统的结构框图和工作方案。

叶红军[3]2007年在《基于FPGA的数字视频光纤传输系统的设计》文中提出随着计算机技术和通信技术的迅速发展,数字视频在信息社会中发挥着越来越重要的作用,视频传输系统已经被广泛应用于交通管理、工业监控、广播电视、银行、商场等多个领域。同时,FPGA单片规模的不断扩大,在FPGA芯片内部实现复杂的数字信号处理系统也成为现实,因此采用FPGA实现视频压缩和传输已成为一种最佳选择。本文将视频压缩技术和光纤传输技术相结合,设计了一种基于无损压缩算法的多路数字视频光纤传输系统,系统利用时分复用和无损压缩技术,采用串行数字视频传输的方式,可在一根光纤中同时传输8路以上视频信号。系统在总体设计时,确定了基于FPGA的设计方案,采用ADI公司的AD9280和AD9708芯片实现A/D转换和D/A转换,在FPGA里实现系统的时分复用/解复用、视频数据压缩/解压缩和线路码编解码,利用光收发一体模块实现电光转换和光电转换。视频压缩采用LZW无损压缩算法,用Verilog语言设计了压缩模块和解压缩模块,利用Xilinx公司的IP核生成工具Core Generator生成FIFO来缓存压缩/解压缩单元的输入输出数据,光纤线路码采用CIMT码,设计了编解码模块,解码过程中,利用数字锁相环来实现发射与接收的帧同步,在ISE8.2和Modelsim仿真环境下对FPGA模块进行了功能仿真和时序仿真,并在Spartan-3E开发板和视频扩展板上完成了系统的硬件调试与验证工作,实验证明,系统工作稳定,图像清晰,实时传输效果好,可用于交通、安防、工业监控等多个领域。本文将视频压缩和线路码编解码在FPGA里实现,利用FPGA的并行处理优势,大大提高了系统的处理速度,使系统具有集成度高、灵活性强、调试方便、抗干扰能力强、易于升级等特点。

李宇[4]2011年在《基于音频嵌入视频的立体音视频同步方法研究》文中提出随着计算机技术和网络技术,特别是宽带通信技术、Internet技术以及数据压缩技术的显着提高,多媒体通信技术取得了迅速的发展。多媒体应用已经深入到我们生活的各个方面,人们在信息交流过程中,越来越多地使用多媒体信息作为交流的手段。现代视频技术正在向“数字化”、“高清化”和“立体化”方向发展。立体视频能够使用户获得叁维场景的立体感知,具有广阔的应用领域,如立体电视、立体会议、远程教育、航空导航、远程医疗诊断等等。支持立体视频应用的一项关键技术就是立体音视频同步技术。随着数字电视系统的不断发展,针对不同的应用领域,一系列的数字视频编码标准相继制定并不断得到完善,ISO/IEC与ITU-T组成的联合视频组(JVT)制定了最新的视频编码标准—H.264。H.264继承了以往视频编码标准的优点,采用了很多新技术,使其编码性能优于其他标准。与先前的标准相比较,H.264具有更高的压缩比和更好的信道适应性,因此基于H.264标准实现立体视频编码更有可能突破立体视频在存储和传输上的难关。基于H.264标准,在单视点编码的基础上搭建了运动补偿预测和视差补偿预测相结合的立体视频编码平台。根据基于H.264标准的立体视频编码平台的特点,本文提出了基于音频嵌入视频的立体音视频同步方法。算法的基本构想就是将立体音频压缩码流嵌入到基于H.264标准的立体视频编码系统中,确保在传输、存储、接收端解码以及播放过程中立体音视频“始终同步”。本文提出的立体音视频同步方法遵循叁个设计原则:(1)音频优先;(2)尽量减小对视频图像质量造成的影响;(3)控制嵌入开销。在本文中,我们没有利用MPEG-2标准中的时间戳技术,而是提出了一种基于音频嵌入视频的立体音视频混合信号同步压缩编码方法。在发送端,把立体音频数据当作隐藏信息嵌入到立体视频的变换系数中,然后对嵌入了立体音频数据的立体视频在基于H.264标准的立体视频编码平台上进行压缩编码。在传输过程中,只传送隐藏了立体音频信号的立体视频信号。在接收端,根据嵌入规则从解码后的立体视频中提取立体音频数据,再分别重构立体视频和立体音频。这样就实现了立体音视频同步到达接收端的目的,最终能够实现立体音视频的同步播放。立体音频数据隐藏于立体视频中进行同步编码,因此在不使用时间标签、节省传输资源的情况下实现了立体音视频的同步传输,并克服了网络传输过程中的延迟、抖动、网络拥塞等问题带来的影响。仿真实验是在VC++ 6.0的平台上对本文提出的基于音频嵌入视频的立体音视频同步方法进行验证。选取叁种不同格式的双目立体视频序列作为测试序列,对实验结果加以分析。将在解码端提取的立体音频数据与在编码端嵌入的立体音频数据进行对比,发现两者完全相同,表明本文提出的嵌入与提取方法能够保证立体音频数据无失真地嵌入和提取。从Y分量PSNR对比图中可以看出,本文提出的两种嵌入方案对立体视频图像质量的影响都很小,Y分量PSNR下降幅度的平均值都远小于0.1 dB。主观方面将单独编码的第30帧解码图像与同步编码的第30帧解码图像进行对比,无论是Y分量图像对比还是YUV图像对比,人眼都很难发现两者的区别。在嵌入开销方面,采用两种嵌入方案的嵌入开销都很小,远小于MPEG-2标准中3%的信道开销,在低开销的情况下实现了立体音视频的同步传输。实验结果表明,本文提出的基于音频嵌入视频的立体音视频同步方法能够通过立体音视频同步编码的方式实现立体音视频的同步传输,进而实现同步播放,而且对立体视频图像质量的影响较小,嵌入带来的开销也很小,达到了预期的研究目的。

王静波[5]2008年在《基于H.264的加密算法的研究与实现》文中研究说明在当今这个信息爆炸的年代,计算机网络和多媒体技术得到了飞速的发展,图形、图像、音频和视频等多媒体信息也得到了更加广泛的应用。人们在享受它们带来的便利的同时也在使用中不断提出更高的要求。随着剽窃、窃取信息,非法盗版等行为的日益严重和社会对信息安全性重视的程度不断增高,视频信息的加密技术逐渐成为人们关注的焦点和急需研究的问题。本文根据视频压缩标准H.264的原理和特点,提出了一种混沌的视频加密算法。该算法利用混沌函数产生加密序列,首先对DCT变换、量化后的矩阵块做空间置乱和数值扩散,然后对熵编码后的二进制序列作进一步的加密处理,从而达到加密目的。本文所有算法均在H.264参考软件JM12.4上加以实现。通过分析和观察实验结果表明,上述算法达到了理想的加密效果。本文主要工作是:1.对数字图像的过程和原理进行了总结。2.对视频压缩编码的发展和现状进行了概括,对视频编码标准H.264进行了研究。3.对密码学知识进行了介绍,并对常见的密码算法和密码攻击方法进行了说明。4.对近年来出现的视频加密算法作了研究和性能分析。5.引入混沌系统中的Logistic映射和Baker映射,利用不同的混沌映射起到不同的加密效果,提出了一种新的叁级加密算法。

杨付正[6]2005年在《数字视频客观质量评估方法研究》文中认为数字视频质量评估在视频压缩、处理以及视频通信领域中起着十分重要的作用。本文深入研究了数字视频的客观质量评估方法,提出了几种新的数字视频客观质量评估方法,以及一种基于水印技术的视频误码掩盖方法,并结合人的视觉特性提出了一种适用于梯度—门限边缘检测算子的改进方法。 主要研究成果为: 1.结合人类视觉的亮度掩盖和空间复杂度掩盖效应,首先提出了一种简单的无参考方块效应测度;根据人眼对运动物体的跟踪特性,以及人眼视角的范围和聚焦的能力,提出了方块效应群的概念,确定了新的方块效应空间联合机制,进而给出了一个与人眼视觉特性较为一致的方块效应测度。 2.在分析方块效应的形成原因的基础上,提出了一种在编码端降低方块效应的方法。该方法通过调整编码端DCT系数的量化,平滑相邻块边界处的量化误差,从而达到降低方块效应的目的。 3.提出了一种适用于自然场景压缩恢复视频的无参考质量评估方法。该方法根据视频的时间相关性以及人眼对物体运动的视觉感知特性,利用序列中具有较高空间复杂度的平动物体在相邻图像对应区域中的变化评价视频的质量。 4.基于脆弱性水印的特点,提出了一种部分参考数字视频质量评估方法。在视频序列中隐性嵌入所需的水印信息,在解码端提取可能受到损伤的水印,并与原始水印比较,根据恢复水印的损伤程度评估恢复视频的质量。 5.利用数字水印传递额外信息的能力,提出了一种有效的视频误码掩盖方法。在压缩视频码流中隐藏额外的运动矢量信息,通过比较从水印提取的运动矢量与视频解码得到的运动矢量进行误码检测,并对恢复视频中的错误块进行时域误码掩盖。 6.提出一种新的全参考视频质量评估方法,该方法根据失真图像与参考图像梯度的相关系数来描述图像的内容失真,结合图像的亮度失真来评价视频序列中各图像的质量。 7.结合人的视觉特性,提出对图像的梯度进行亮度和空间复杂度掩盖的思想,在此基础上提出了提高梯度—门限边缘检测算子性能的改进算法。图像梯度方向的确定易受噪声的影响,容易导致错误的空间复杂度掩盖区域。本文提出了准确确定空间复杂度掩盖区域的方法,提高了边缘检测算法的性能。

张铭铭[7]2009年在《视频监控系统中图像增强技术的研究》文中研究说明随着网络、通信、图像处理和微电子等技术的快速发展和人们物质生活水平的提高,视频监控以其直观、方便和内容丰富等特点,日益受到人们重视。但是,由于网络视频处理技术和智能视频分析技术尚未完全发展成熟,目前普遍应用于视频监控系统中的视频处理技术主要是视频数据的压缩、传输和存储。监视视频图像质量的好坏,将直接影响监控系统的效果。因此如何将视频图像增强方法运用于视频监控系统,使它们在数字视频监控系统中得到快速、有效的应用,是值得我们研究的课题。由于视频监控系统采集到的图像常常存在对比度较差,边缘模糊,噪声较大等缺陷,给我们正常使用数字视频带来了很多的负面影响。因此研究视频增强处理是一项很有意义的工作。本文研究了数字视频监控系统的压缩编码技术,重点从视频降噪和对比度增强两方面研究压缩后视频图像的增强处理。论文主要工作有:介绍了视频监控系统和视频编解码技术,通过比较H.26X和MPEG标准,特别是目前研究热点的MPEG-4和H.264编码标准,得出H.264标准更适合数字视频监控系统。因此本文采用H.264进行视频图像的压缩,并且概述了H.264的关键技术及其应用。采用H.264对监控系统采集到的视频进行压缩处理,量化是压缩过程唯一带来损失的模块,提出利用RBF神经网络对量化参数进行预测,有效的改善视频的质量。在视频对比度增强方面,针对视频监控图像对比度低的特点,研究并实现了提高视频对比度的方法,包括直方图修正法、加权平均法以及基于小波变换的反锐化掩模法的对比度增强方法。在视频降噪方面,研究了帧内和帧间两种降噪方法。帧内降噪方面,研究了现有的几种降噪方法,如邻域平均法、维纳滤波、高斯滤波、Butterworth滤波等方法,并对这些方法进行了实验。帧间降噪方面,主要研究了时域平均滤波法和自适应递归滤波法。针对视频图像具有很强的时间和空间相关性的特点,提出了将帧内滤波和帧间滤波相结合的方法进行视频增强。通过理论分析和实验,验证了本文中采用的算法的有效性,具有一定的实用价值。借助DirectShow平台完成了仿真界面的设计,将各种算法集成到仿真界面中,并用该界面对各种增强算法进行了仿真。最后,对本论文所完成的工作进行了总结,指出了进一步的研究方向。

高敏[8]2016年在《视频图像压缩中熵编码技术研究》文中进行了进一步梳理在视频压缩标准中,熵编码模块在信源符号的压缩和码流的组织过程有着不可替代的作用。熵编码模块首先利用上下文建模技术来挖掘信源符号之间的统计冗余;然后使用熵编码引擎(算术编码技术或者变长编码技术)来去除统计冗余,进而产生紧凑的二进制码流,以供存储和传输。熵编码模块通常利用已经编码的符号来估计待编码符号的概率分布,从而能够高效地去除信源符号之间的冗余信息。然而,这种编码依赖关系却不利于熵编码模块的并行处理,降低了吞吐率。因此,如何平衡熵编码模块的编码效率和数据吞吐率已经成为衡量熵编码技术优劣的重要性能指标。随着高画质视频的逐步普及,未来的视频压缩标准将要处理数据量更加庞大的视频,因此继续提高熵编码模块的压缩效率仍然具有很重要的意义。为了克服外界条件的限制,在目前最新的多媒体应用中,压缩感知技术正在被应用于采集数字图像/视频。当采用压缩感知技术对图像/视频进行采集时,得到的测量值(通常用测量值表示利用压缩感知采样得到的样本信息)和传统的图像/视频采集方法得到的像素值在本质上是不同的。测量值通常是利用随机高斯矩阵对原始信号进行投影操作而得到的,每个测量值都包含了原始信号的全局信息,并且各个测量值之间是相互独立的。所以,传统的图像/视频压缩标准技术不再适用于测量值的压缩。如何充分挖掘测量值的统计特性为其设计一个高效的熵编码器是测量值压缩中的一个新的挑战问题。所以,在这种研究背景下,本文对H.264/AVC,HEVC和AVS2等视频压缩标准中的熵编码模块进行优化,来提高熵编码模块的压缩效率和数据吞吐率;另外,本文也为压缩感知中测量值的压缩设计了一个高效的熵编码器,来把测量值转化为紧凑的二进制码流,实现真正的数据压缩。因此,本文的研究工作主要包括以下四个部分:第一,在H.264/AVC的上下文自适应二进制算术编码器(CABAC)的设计过程中,由于没有充分地考虑吞吐率这一指标,使得熵编码模块已经成为整个解码器的主要瓶颈之一。为了提高H.264/AVC中CABAC的吞吐率,本文首先根据预测残差的DCT系数的统计特性,提出了一个层次依赖上下文模型HDCM(Hierarchical Dependency Context Model)。在HDCM中,DCT系数块中的非零系数的个数和DCT系数的频域位置被用作为上下文,来挖掘DCT系数之间的统计冗余。然后,本文提出了一个基于层次依赖上下文模型的二进制算术编码器hdcmbac来编码h.264/avc中的预测残差的dct系数。为了高效地描述dct系数块,并且降低语法元素之间的上下文依赖关系,hdcmbac重新设计了用于描述dct系数块的语法元素。这些语法元素包括,dct系数块中非零系数的个数n,用于指示每个位置上的dct系数是否为非零系数的语法元素significant_flag和用于指示每个非零dct系数的幅值的语法元素coeff_abs_level_minus1。实验结果表明,与h.264/avc中的cabac相比,hdcmbac可以取得相似的编码效率,并且最大限度地降低了dct系数之间的上下文依赖关系。第二,为了继续提高视频编码标准中熵编码模块的编码效率和为下一代视频编码标准的制定做技术储备,本文以hevc为基础,提出了一个内存消耗小并且编码效率高的熵编码方案,该方案包括变换系数的增强上下文建模方法和低内存消耗的二进制算术编码引擎。在变换系数的增强上下文建模方法中,本文采用当前变换系数的局部模板内非零变换系数的个数和当前变换系数的位置信息作为significant_coeff_flag(用于指示当前的变换系数是否为非零系数的语法元素)的上下文;为了减少significant_coeff_flag的上下文模型的个数,变换系数块被分割为不同的区域,并且相同区域使用相同的上下文模型集合。在编码coeff_abs_greater1_flag(用于指示当前的非零变换系数的绝对值是否大于1的语法元素)时,本文采用当前变换系数的局部模板内绝对值等于1和绝对值大于1的变换系数的个数作为其上下文;为了利用亮度分量中变换系数与其位置之间的相关性,变换系数的位置信息也被用作coeff_abs_greater1_flag的上下文。在编码语法元素coeff_abs_greater2_flag(用于指示当前的非零变换系数的绝对值是否大于2的语法元素)时,本文采用当前变换系数的局部模板内绝对值大于2和绝对值大于1的变换系数的个数作为该语法元素的上下文。在低内存消耗的二进制算术编码引擎中,本文采用多参数的概率估计模型估计二进制符号的概率;在编码区间的分割过程中,本文提出了一个低位宽的乘法操作来代替传统的查表操作。如此设计之后,低内存消耗的二进制算术编码引擎在概率估计过程和编码区间分割过程中均不再需要大量的存储空间。实验结果表明,与hevc中原始的熵编码方案相比,本文提出的熵编码方案具有更高的编码效率。第叁,在第二代中国国家视频压缩标准avs2中,熵编码模块中存在着很强的顺序依赖关系,这些顺序依赖关系严重地制约着avs2编解码器的吞吐率。这些顺序依赖关系主要来源于算术编码引擎的归一化过程和bypassbin(概率等于0.5的二进制符号)的编码过程以及变换系数的上下文建模过程。因此,本文从上述叁个方面对AVS2的熵编码模块进行优化设计。具体来讲,本文首先提出了一种快速的,与标准兼容的算术编码引擎归一化方法。该方法简化了算术编码引擎的执行流程,减少调用归一化过程的次数。其次,本文提出了一个快速的bypass bin的编解码过程,使得bypass bin的编解码过程仅仅需要移位和加法操作即可完成,极大地降低了bypass bin的编解码复杂度。最后,本文改进了AVS2中变换系数的编码过程,降低变换系数之间的上下文依赖关系。实验结果表明,上述叁个技术大幅度地提高AVS2中熵编码模块的吞吐率,同时性能损失也比较小。第四,在图像的压缩感知采样中,为了提高测量值的压缩性能,差分脉冲预测(DPCM:Differential Pulse-Code Modulation)和均匀标量量化(SQ:uniform Scalar Quantization)被联合应用于测量值的压缩中。尽管如此,若想真正地实现测量值的压缩,即把测量值转化为紧凑的二进制码流,熵编码模块是一个必不可少的模块。为此,本文基于图像的差分脉冲预测和标量量化框架(DPCM-plus-SQ),为测量值的量化索引提出了一个高效的熵编码方案。在该熵编码方案中,本文分析了测量值的量化索引的统计特性,并且根据这些统计特性设计了相应地语法元素来描述测量值的量化索引。具体来说,本文首先使用语法元素significant_map来指示当前测量值的量化索引是否为非零;然后,对于非零的量化索引,使用语法元素abs_coeff_level_minus1和sign_flag来分别指示它的幅值和符号。为了挖掘这些语法元素的局部统计特性,本文采用自适应的算术编码引擎来编码这些语法元素,以期望去除它们的统计冗余从而产生紧凑的码流。实验结果表明,与测量值量化索引的0阶信息熵和H.264/AVC中CABAC的变换系数编码方法相比,本文提出的熵编码方案能够进一步提高测量值的编码效率。

徐冬冬[9]2016年在《高分辨率空间CMOS相机视频实时压缩技术研究》文中指出由于空间相机在视频分辨率以及帧频等指标要求的不断提高,导致CMOS输出的视频数据量急剧增加。现有的压缩算法运算过程十分复杂,而且主要停留在软件仿真阶段,硬件实现困难且效果较差。为了有效缓解星上存储器以及信道传输的压力,研制出压缩性能好、数据处理快的实时视频压缩系统迫在眉睫。论文以参与的工程项目“空间CMOS相机技术”项目为背景,对全色和多谱段CMOS相机视频压缩技术分别进行了研究。现将本文的主要研究内容和成果概括如下:1、根据项目需求以及CMOS视频的特点,探讨小型CMOS相机及高分辨率CMOS相机ASIC的ADV212压缩技术。提出利用Custom-specific工作模式为各种格式的视频提供接口,并通过FPGA内部的块RAM以及DDR3 SDRAM的乒乓操作对数据进行缓存,显着地提高了工作效率;之后,为了适用于不同应用场合,本文方法实现了码流的存储后传输以及直接传输之间的切换,并通过纠错编码极大的提升了闪存的纠错能力;最后,为了验证方法的可行性,本文基于压缩板以及解压板进行了实验验证。结果表明,压缩系统可实现实时稳定的工作,通过软件设置,系统可以实现极高的压缩比,压缩比80:1时,平均峰值信噪比(PSNR)高于28 dB,压缩比150:1时,平均PSNR高于26 dB,解决了在大数据量下,压缩系统硬件实现困难以及实时传输困难等问题。2、结合离散小波变换(Discrete Wavelet Transform, DWT)与Karhunen-Loeve变换(KLT)提出一种空间多光谱视频压缩算法。通过两种变换的有效结合可以将图像的能量集中到少数系数上,更好地达到压缩效果。本文首先将多光谱图像的每个谱段进行快速2维离散5/3小波变换,消除多光谱图像的大部分空间冗余。然后对所有谱段产生的小波系数进行改进KL变换,来消除光谱冗余和残存的空间冗余。最后对所得系数进行熵编码,得到压缩码流。实验结果表明,在0.25-2bit/pixel (b/p)范围内,平均PSNR达到41dB,与其他多光谱图像压缩算法相比,极大的提高了系统PSNR,提升了多光谱图像压缩算法的性能;同时提出了硬件实现策略,验证了本文理论的正确性以及算法的可行性,为空间多光谱图像压缩系统实现提供了参考。3、图像进行KLT和一级DWT后,不同谱段的系数之间以及同一谱段的高频子带之间仍然存在很大的相关性,其平均值大于0.9,提高小波变换级数后此值会相应的降低,但效果不是十分理想;基于DWT和Tucker分解的压缩算法将图像作为张量,这样能完整的表示高维数据并保持其本征结构,较好的去除图像的空间冗余和光谱冗余,但稀疏表示不足,达不到更高的压缩比。本算法的提出可以很好的克服以上两种方法的不足,在保证较高压缩性能的同时,有效地保护了光谱信息。首先将多光谱图像的所有谱段进行KLT,消除多光谱图像的光谱冗余。然后将变换后的每个谱段进行2维离散9/7小波变换,消除多光谱图像的空间冗余。其次,将变换后的每个小波子带都看作非负张量,对其进行Tucker分解(Tucker Decomposition, TD),并用阻尼高斯-牛顿算法(damped Gauss-Newton, dGN)求出最优解,进一步消除光谱冗余和空间残余冗余。最后,将得到的模式矩阵和核心张量进行熵编码。在压缩比4:1-32:1范围内,平均PSNR高于43dB,与其他多光谱图像压缩算法相比,极大的提高了系统PSNR,提升了多光谱图像压缩算法的性能。4、采用MT9V032型CMOS数字图像传感器设计了一款完整的小型化、低功耗相机。基于初级像差理论设计了焦距为12.95 mm,F数为5的光学系统,该系统体积小、结构紧凑,在空间频率83 lp/mm处,各视场调制传递函数(MTF)均优于0.5;电子学系统以FPGA作为时序控制平台,控制CMOS输出数字视频信号,数字视频信号通过差分芯片以低压差分信号(LVDS)格式输出到图像采集卡,最后在计算机上成像。实验结果表明,本文设计的相机像质良好、功耗低、移植性强、可靠性高,时钟为26.6 MHz时,帧频为60帧/秒,并可通过调节内部寄存器的值实现多种模式,特别适用于对相机体积以及成像质量要求较高的场合。5、根据高分辨率空间CMOS相机视频压缩系统指标,设计了用于大、中型视频压缩系统的基于KAC-06040的CMOS相机系统。设计的焦距为1175mm,F数为6.71的光学系统,该系统体积小、结构紧凑,在空间频率106.41 lp/mm处,各视场MTF均优于0.446(有遮拦),能量集中度11um以内的能量集中度均优于80%;电子学系统以FPGA作为时序控制平台,控制CMOS输出数字视频信号,数字视频信号通过Camera Link传输线以Medium模式输出到图像采集卡,最后在计算机上成像。实验结果表明,本文设计的相机像质良好、功耗低、移植性强、可靠性高,满足项目需求。

张玥瑒[10]2007年在《矢量量化在视频压缩中的应用研究》文中提出数字视频是多媒体信息的核心和最具挑战性的研究领域之一。数字视频信号的信息海量性是数字视频发展的巨大挑战,要解决这个问题单靠网络带宽和硬件技术的发展不是远远不够的,数据压缩是有效的解决办法。视频压缩使人们能够更有效地利用传输带宽和存储资源。虽然存储和传输的容量不断提高,但是在可以预见的未来,压缩编码仍然是多媒体研究和应用的核心问题之一。矢量量化(Vector Quantization,VQ)是一种有效的有损压缩技术,它的突出优点是码率-失真性能高而且解码算法简单,因此它己经成为图像压缩编码的重要技术之一。矢量量化的理论基础是香农的速率失真理论,其基本原理是用码书中与输入矢量最匹配的码字的索引代替输入矢量进行传输和存储,而解码时只需简单的查表操作。随着矢量量化技术的逐渐成熟,基于矢量量化器的视频压缩算法越来越成为学者们研究的热点。与传统算法的相比,基于矢量量化器的视频压缩算法具有理论背景清晰、编码性能高等优点。本文重点探讨了矢量量化技术的原理、概念、关键技术和研究现状,研究了矢量量化器在视频压缩编码中的设计方法和理论,提出了一种基于预测矢量量化的视频压缩方案,并对提出的算法进行了仿真实验。论文主要的研究工作体现在以下的几个方面:本文系统地介绍了矢量量化技术和视频压缩技术的发展现状并重点介绍了基于矢量量化的数字视频压缩技术的研究现状,旨在了解现有矢量量化算法、数字视频压缩算法的发展进程,为本文矢量量化与视频压缩两者结合的算法提供思路。本文介绍了当今主要视频压缩国际标准,特别是深入研究了ITU-H.264标准的框架和运动预测补偿算法。H.264的整个框架与以前的标准差别不大,H.264标准采用成熟的技术积极地改进了每个功能单元的技术,因此H.264标准取得了最高的编码效率,当然H.264的复杂度也是最高的,总的来说H.264仍然是一种基于变换的视频压缩标准。因此,本文针对H.264复杂度高的缺点和矢量量化器具有的理论清晰、结构简单、编码复杂度低和比特率-失真性能高的优点,将二者结合提出了一种新的基于矢量量化的视频压缩方案:基于预测矢量量化的视频压缩方案。它借鉴了H.264标准的编码方法并结合了矢量量化技术,使用最大值最小化部分失真竞争学习算法得到公有码书,从而保证所有的视频序列经过压缩之后只需传输码字索引。为了减少矢量量化编码的复杂度,本文采用平均距离排序部分搜索算法实现了码矢量快速搜索,该方法使用输入矢量的平均值极大地降低了穷尽搜索的计算量而不损失其性能。仿真实验表明,本方案计算复杂度较低、编码效率较高、比特率-失真性能高,适用于实时性较强的场合或运算能力有限的手持移动设备之上。

参考文献:

[1]. 数字视频压缩理论与技术研究[D]. 赵海武. 南京理工大学. 2002

[2]. 高品质数字视频光纤传输技术研究[D]. 王华. 中国科学院研究生院(西安光学精密机械研究所). 2004

[3]. 基于FPGA的数字视频光纤传输系统的设计[D]. 叶红军. 大连理工大学. 2007

[4]. 基于音频嵌入视频的立体音视频同步方法研究[D]. 李宇. 吉林大学. 2011

[5]. 基于H.264的加密算法的研究与实现[D]. 王静波. 吉林大学. 2008

[6]. 数字视频客观质量评估方法研究[D]. 杨付正. 西安电子科技大学. 2005

[7]. 视频监控系统中图像增强技术的研究[D]. 张铭铭. 济南大学. 2009

[8]. 视频图像压缩中熵编码技术研究[D]. 高敏. 哈尔滨工业大学. 2016

[9]. 高分辨率空间CMOS相机视频实时压缩技术研究[D]. 徐冬冬. 中国科学院研究生院(长春光学精密机械与物理研究所). 2016

[10]. 矢量量化在视频压缩中的应用研究[D]. 张玥瑒. 哈尔滨工业大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

数字视频压缩理论与技术研究
下载Doc文档

猜你喜欢