高采样率音频信号的参数编解码方案设计与实现

高采样率音频信号的参数编解码方案设计与实现

夏田[1]2004年在《高采样率音频信号的参数编解码方案设计与实现》文中认为在数字调幅广播、移动通信和多媒体检索等需要低码率音频编码的应用领域,参数音频编码正在成为传统音频编码方法的必要补充。参数音频编码的核心问题是对音源模型的研究。论文对近二十年来参数音频编码及其音源模型的发展作了大体上的回顾,对其中具有代表性的音源模型进行了介绍。现有的大部分音源模型主要是针对中低采样率(如32KHz、22KHz、16KHz,甚至8KHz)音频信号的,这样做固然可以大幅降低码率,但是由于音频带宽的不足使得编码合成音质受到了比较严重的影响。论文针对目前一部分参数音频编码音源模型在高采样率下出现的各种问题进行改进,提出一种面向44.1KHz/48KHz高采样率音频信号的参数音频编码系统,使用了可以有效兼顾码率与音质的多分辨率正弦模型和多分辨率ERB噪声模型。同时融合多种参数音频编码方案的优点,在编码器结构上进行了调整,将只对某类信号有较好编码效果的模块,如谐波结构分析模块、双变换短时成分检测与双变换短时模块等,作为选项纳入到编码器中,由使用者在编码时根据不同源声文件的不同特点,来决定是否使用和如何使用,而这些灵活的设置都可以通过码流中预先定义好的几个标示比特位来告知解码器,对解码器本身的构成与复杂度并没有直接的影响。采取如上改进措施以后,论文所实现的参数音频编解码系统在不使用熵编码的情况下,可在24Kbps/ch的码率下实现对44.1KHz/48KHz 采样音频信号的参数音频编码。按照ITU-R BS.1534标准进行的非正式主观测试表明,论文实现的编解码系统主观音质良好。

蒋学鑫[2]2007年在《MP3实时编解码系统的研究与开发》文中研究说明近几年来,在网络流媒体、移动设备、数字广播等领域,数字音频信号处理得到了广泛的应用。为了解决数字音频信号存储和传输的瓶颈问题,数据压缩成为当代数字音频处理中的一个十分重要的研究课题。在众多的压缩标准中,MP3压缩格式以其优越的性能以及品质与算法复杂度的极佳折衷,使之成为当前PC、网络、PDA上最为流行的音频格式。由于MP3应用的普遍性,因此对MP3的课题研究十分广泛。本论文主要侧重于实际工程应用,研究背景基于一款用于手机平台的音频播放和录音的专用ASIC芯片,该芯片的核心是一个16位定点DSP,此硬件平台上,实现MP3的编码与解码。如今MP3技术已经非常成熟,现阶段各大商家最为关心的并不是如何实现MP3,而是如何能在低成本低功耗的平台上实现MP3,这就意味着对原始MP3标准在实现过程中的优化是当前的一个热点问题,这也是进行本课题研究的现实意义之所在。本论文共分为五个章节。第一章首先概述了课题背景和实现平台;第二章先概述了当前音频压缩的发展方向,然后详述了MP3压缩标准;第叁章介绍了MP3在DSP上实现和算法优化;第四章讲述了整个手机平台的开发系统和MP3的性能测试;最后一章作了总结和展望。论文中提出的MP3算法的优化方案,对于现实应用,有着普遍的借鉴和参考意义。本文的成果,可直接集成在目前市场上流行的中低端多媒体手机中,具有广泛的实用价值。

燕栋[3]2015年在《DRM通信系统的设计》文中研究说明短波高速网桥调制解调器是根据客户要求,针对目前远洋短波通信带宽小,传输速率缓慢所提出的一种解决方案。论文进行了该系统的设计实现。该系统基于数字无线调制(DRM)广播系统通信体制,采用成熟的正交频分复用调制解调和删除卷积码技术,与目前采用的远洋短波通信技术相比具有传输速率高、抗衰落、抗多径能力强等特点。论文描述了DRM广播系统的发展、基本结构、传输模式和方案。从硬件角度提出了叁种技术方案和一种加解密电路方案,并分析了叁种硬件方案的优势和劣势。从软件角度进行了各个功能模块的算法分析,描述了嵌入式系统软件构架和可编程逻辑单元软件构架,对部分功能结构单元和算法进行了重点分析。本文实现了短波高速网桥调制解调器中的信号处理模块,完成信号收发所需的基带信号和数字中频信号处理。信号处理模块基于DRM通信体制,实现了信源编码、主业务信道复用、能量扩散(短伪随机序列加扰)、卷积编码、信道交织、调制和上变频等功能;在接收信道对应实现了下变频,解调,判决,解交织、信道解码、解扰、解复用和信源解码等反向功能。

刘鑫[4]2011年在《宽带音频的非线性频带展宽技术》文中研究指明本文在深入研究传统音频频带扩展技术的基础上,分析了超宽带音频信号的高低频相关性,首先,根据低频谱包络和感知音色特征,研究了高频子带能量的估计方法;其次,基于非线性动力学中的相空间重构和最近邻匹配的方法,研究了高频频谱细节的非线性预测方法,最后,在实际编码器上实现了由宽带到超宽带音频信号的盲目频带扩展。在高频子带能量估计方面,本文引入了高斯混合模型,并用其拟合高低频特征的联合概率密度,在最小均方误差准则的基础上构建了一套基于高斯混合模型的高频子带能量估计算法,保证了在平稳特征数据下高频子带能量估计的准确性。在此基础上,将隐马尔科夫模型引入到音频频带扩展算法中,并基于最小均方误差准则构建了一套基于隐马尔科夫模型的高频子带能量估计算法,进一步改善了重建音频的感知质量,有效地解决了扩展后高频子带能量的时域突变问题,提高了在复杂特征数据条件下重建音频频谱能量的平滑性。在频谱细节恢复方面,本文利用相空间重构技术验证了音频信号在频域内的非线性特征,并利用低频相轨迹的局部演变规律,提出了基于最近邻匹配的高频频谱细节非线性扩展方法。在实际编码器应用方面,本文组合隐马尔科夫模型和非线性预测技术,构建了一套完整的“盲目式”宽带向超宽带音频信号的非线性频带扩展算法,并将其应用到24kb/s速率下的G.722.1宽带音频编码器中,主观和客观质量评价表明,频带扩展后的G.722.1编码器质量与同码率下的G.722.1C超宽带编码器相当。

唐骏[5]2007年在《低延迟高质量音频编码算法研究》文中提出一般认为,高效的感知音频编码与以实时通信为目的的低延迟编码是两个不同的研究和应用领域。一方面,感知音频编码在较宽的频带范围内,能够以极低的码率提供主观音质极好的音频,但编解码延迟较大,不适合交互式的实时通信的应用;另一方面,语音编码能够满足实时通信延迟的要求,但对于非语音信号,其编码性能较差。因此,研究同时具有高质量和低延迟的音频编码技术非常必要。本文提出了一种新的低延迟高质量音频编码算LDX,主要面向交互式的实时通信。为了降低编解码算法延迟,LDX并未完全沿袭传统的感知音频编码的技术路线,而是采用了相对较短、长度固定的变换窗,从而大幅度地降低了算法延迟。同时,为了在高压缩比下获得高质量的音频,LDX对现有的心理声学模型和立体声编码算法作了改进,运用FFT和MDCT相结合的心理声学分析方法,不仅降低了算法复杂度,同时也提高了心理声学分析的精确度;LDX运用正方形极坐标映射的声道耦合算法,相对于传统的M/S立体声编码算法,具有更高的编码效率;针对变换的音频编码中预回声现象,LDX提出了一种时域拆分——频域合成的、基于组合心理声学模型的预回声处理新算法,能有效地抑制预回声,从而保证了音频质量。因此,LDX具有以下性能特性:在相同编码比特率下,音质要远好于ITU-T G.722.1c和MP3;算法延迟低,16kHz、32kHz和48kHz采样率下最小算法延迟分别为16ms、8ms和5.33ms,能够满足交互式的实时通信;支持较大范围的编码比特率和采样率;中等算法复杂度。总之,LDX算法的提出弥补了传统音频编码算法和语音编码算法的不足,它不仅具有较低的编解码算法延迟,而且在编码效率、音质和算法复杂度等方面,可以与时下的其它高级感知音频编码算法相媲美。

何敏[6]2007年在《基于软件无线电的水情遥测信息接收及处理关键技术研究》文中认为数据接收、解调及解码纠错是水情遥测系统数据处理的关键,传统的水情遥测系统中,由电台接收射频信号并完成二次下变频及鉴频解调,输出的音频信号通过专用的调制解调器完成解调,这种方法的最大缺点就是缺乏灵活性,同时解调可靠性也不高。根据软件无线电技术理论,尽可能早的将接收到的模拟信号数字化,最大程度地通过软件来实现电台及调制解调器的各种功能可大幅度提高系统解调性能及可靠性,基于上述想法,本文在软件无线电技术的基础上,采用LabVIEW作为软件开发平台,同时结合相关硬件实现了水情遥测系统中信号的采集、软件解调等处理过程,以达到提高系统可靠性的目的。文中首先分析了现行水情信息接收及处理存在的不足,提出了基于软件无线电的信息接收及处理的思想,比较了基于传统超短波电台、新型中频数字化电台以及NI的PⅪ—5600射频信号分析仪的软件无线电实现方法的优劣,最终,出于成本以及系统要求的考虑选择了传统电台的实现方法。然后分别论述了信号的采集、解调、解码纠错。信号的采集通过计算机声卡来完成,这样在满足系统采集要求的情况下还节约了成本。解调部分给出了两种不同的实现法,可以根据具体系统要求选择相应程序;此外还分析了不同信噪比条件下的误码率情况。解码部分包含了信道解码和信源解码两部分,完成了BCH解码,从而还原了测站实际水情信息。从实验结果看,这样一个利用软件来完成采集及信号处理的系统是可行的,有效的。

齐希[7]2013年在《基于DM642的MPEG-4AAC编解码器的实现与优化》文中指出MPEG-4高级音频编码(Advanced Audio Codec)简称MPEG-4AAC,是国际标准组织为声音数据设计的一种音频文件压缩格式。MPEG-4AAC作为MPEG-4音频编码标准的核心,它代表着当今最先进和最有效的数字音频编码技术。MPEG-4AAC支持高采样率和多声道,具有高压缩比,能够在低码率情况下重建高品质的音质,这些特点使它非常适用于网络多媒体、音视频会议、移动通讯、家庭影院和在线广播等领域。MPEG-4AAC算法的复杂度较高,要想在嵌入式平台上实现MPEG-4AAC实时编解码,这不仅需要处理器具有快速的运算能力,而且要求处理器的内存容量足够大。TMS320DM642定点DSP具有运行速度快、存储器容量大、功耗低和应用范围广的特点,因此,系统选择了TMS320DM642作为硬件平台的基础。然而,本文研究的重点是如何在TMS320DM642平台上实时高效地完成MPEG-4AAC编解码。首先,文中介绍了MPEG-4AAC的基本原理和模块组成,分析了每个模块的计算复杂度,重点对MPEG-4AAC算法中滤波器组、心理声学模型、量化编码和反量化解码这些计算复杂度高的模块进行了优化。其中,滤波器组模块采用了MDCT、IMDCT快速算法,心理声学模型采用了CMDCT替换FFT变换的方法,针对量化编码和反量化解码模块的非线性运算部分,提出了查表法和线形插值组合的优化方法。其次,为了进一步提高MPEG-4AAC算法在TMS320DM642平台上的执行效率,文中结合TMS320DM642处理器的硬件结构和并行指令处理特点提出了若干优化方法,如使用内联函数、软件流水,线性汇编改写,Cache优化策略,双乒乓缓存和EDMA传输优化方法。最后,给出了优化后的MPEG-4AAC在TMS320DM642平台上编解码的实验结果。针对MPEG-4AAC编解码后的音频质量进行了主观和客观性能分析,并对编解码速度进行了实时性分析。实验结果表明:优化后的MPEG-4AAC能够获得高质量的音频效果,并能满足实时编解码的要求。

徐志军[8]2006年在《无损音频编码(MPEG-4 ALS)的原理分析与仿真》文中研究说明无损音频压缩逐渐成为数字音频压缩领域的一个研究热点,很多研究机构和公司都提出了一些无损音频压缩算法。MPEG-4 ALS(MPEG- 4 Standard for Lossless Audio Coding)由于在压缩效率、复杂度、灵活性等方面都有不错的表现,受到了越来越多的关注。通过对MPEG- 4 ALS编码器的分析研究,本文给出了两种较易实现的改进:一种是应用了基于随机存取功能的逐阶预测;一种是对预测系数量化的改进。接着,用详实的测试数据、图表对逐阶预测相对不预测的情况下的优势进行论证。最后将MPEG-4 ALS与AudioPak的性能进行了纵向比较,从预测阶数、预测误差的信息熵、频谱、帧平均值、帧最大值、帧最小值、方差等角度进行了分析。实验表明,MPEG- 4 ALS有着不错的压缩性能。本文在探讨分帧、预测器、熵编码等设计技术的基础上,阐述了如何利用MATLAB设计、仿真和分析无损音频编码器,同时完整地实现了音频信号的编解码,并取得大量的实验数据,为研究分析无损编解码器的性能提供了可靠保证。

张丽娜[9]2013年在《基于DSP TMS320C6727的AC-3音频编码算法的研究及实现》文中提出数字音频编码技术是数字多媒体技术的重要组成部分,现在有多种数字音频编码标准,其中杜比AC-3(Dolby Digital AC-3)标准的音频编码技术广泛地应用于DVD和ATSC(美国数字电视国家标准)中。该技术具有可以传输多个通道而占用空间却很少的特点,因此可以在保证音质的前提下实现较低的码率。而我国正处于数字电视产业化推进的关键时期,相信高效而又经济的AC-3数字音频编码系统会有不错的应用前景。目前,设计以DSP为主要音频处理平台的软件编码器非常符合市场的需求。TMS320C6727这款DSP是TI公司为了音频处理而专门推出的一款高性能浮点芯片。它有着丰富的外设接口、充裕的存储空间和较高的时钟频率,完全可以满足音频编码实时性的要求。本文研究了AC-3音频编码的算法,对其中的暂稳态判决模块进行了深入的研究以及基于DSP C6727的算法移植和优化。通过分析几种音频编码标准中对预回声现象的处理算法,指出在时域上进行暂态信号判决的重要性。对AC-3标准中暂稳态判决模块进行分析,针对过度短窗切换、漏检现象和只采用简单峰值比较检测提出了改进算法:充分利用声音在时域上的后掩蔽效应和基于人耳听觉特性的暂态信号判决方法。经过实验验证,该算法提高了暂态信号检测的准确性同时避免了短窗的过度切换。最后将改进的AC-3音频编码算法移植到了DSP上,并针对C6727平台自身的特点进行了优化,实现了在300MHz频率下的实时音频编码。最后论述了基于C6727音频编码的系统,给出了系统设计的整体方案和DSP的局部接口定义。目前该系统已经在市场上出售。

黄昊[10]2008年在《音频信息隐藏关键技术的研究》文中指出数字化与网络化带给了社会和生活深刻的变化和影响,数字媒体的认证与保护日益迫切。因此数字信息隐藏技术引起了广泛的关注和研究,其中抗压缩编码的音频水印具有很高的实用价值。本文的工作主要致力于应用于音频感知编码的信息隐藏算法的设计,力图从理论到实践探索出一种适用于主流感知编码的音频信息隐藏方法。以此为目标本文主要工作及创新点如下:1.通过实验探讨了扩频调制中相关检测准确率降低的根本原因——短时音频信号样点不吻合高斯正态分布模型假设。针对这一问题提出了一种新的自适应的扩频调制方法,应用到音频水印中去。通过调整嵌入强度消除了嵌入域样点与扩频序列相关性的影响,同时通过检测期望的嵌入帧筛选策略来对不可感知性进行优化。2.基于听觉感知特性,提出了新的基于梅尔倒谱系数方差和与连续子帧相关和的感知敏感成分划分法。利用此方法提出一种通过对语音信号进行非均匀压扩来提升时长规整的感知质量的新方法和一种新的针对感知敏感成分的音频信息隐藏的同步攻击方法。3.探讨了隐藏信息与载体信号的相关性对音频感知质量的影响。利用嵌入的非相关提出了一种新的针对直接扩频隐写方式的音频隐写分析方法,根据原始嵌入与检测嵌入引起失真的区别,采用音频失真测度作为特征向量对支持向量机进行训练分类,检测中不需要对原始音频进行估计。4.从感知编码原理出发,提出了抗感知编码水印设计的关键在于要适应于载体感知特性的观点。在音频信号感知规律与时频结构的分析基础上,全面探索了感知编码对隐藏信息的影响。最终提出了一种新的鲁棒音频水印算法。采用载体信号划分的同步机制,利用低频能量的鲁棒性,对相邻子帧的低频能量比进行量化调制来嵌入水印。并对其进行了同步攻击与stirmark攻击测试。

参考文献:

[1]. 高采样率音频信号的参数编解码方案设计与实现[D]. 夏田. 清华大学. 2004

[2]. MP3实时编解码系统的研究与开发[D]. 蒋学鑫. 电子科技大学. 2007

[3]. DRM通信系统的设计[D]. 燕栋. 天津大学. 2015

[4]. 宽带音频的非线性频带展宽技术[D]. 刘鑫. 北京工业大学. 2011

[5]. 低延迟高质量音频编码算法研究[D]. 唐骏. 西安电子科技大学. 2007

[6]. 基于软件无线电的水情遥测信息接收及处理关键技术研究[D]. 何敏. 河海大学. 2007

[7]. 基于DM642的MPEG-4AAC编解码器的实现与优化[D]. 齐希. 中南民族大学. 2013

[8]. 无损音频编码(MPEG-4 ALS)的原理分析与仿真[D]. 徐志军. 东南大学. 2006

[9]. 基于DSP TMS320C6727的AC-3音频编码算法的研究及实现[D]. 张丽娜. 天津大学. 2013

[10]. 音频信息隐藏关键技术的研究[D]. 黄昊. 中国科学技术大学. 2008

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

高采样率音频信号的参数编解码方案设计与实现
下载Doc文档

猜你喜欢