AMR声码器的研究和开发

AMR声码器的研究和开发

罗之丹[1]2002年在《AMR声码器的研究和开发》文中研究指明由于语音通信领域对高质量语音需求日益增加,语音编码技术也在近年来得到了飞速发展。AMR声码器是3GPP所提出的第叁代移动通信语音编码标准,它实现语音的多种低速率编码和解码,支持静音抑制和舒适噪音生成,在MSC中发挥网关的作用,保证了基于ATM的第叁代移动通信网与现有的网络资源PSTN/ISDN的互通性。由此,AMR声码器的研究和开发具有很大的实用价值。 本文首先研究了AMR声码器的算法,AMR声码器主要由多速率语音编码器、源控速率方案和错误消除机制叁大部分组成。基于TI公司生产的DSPTMSC6000对其进行实现,结果表明语音质量达到了ITU的规定的标准,并严格通过了测试序列。 本文还介绍了基音检测常用的一些方法,并把AMR算法中基音检测模块提取出来,做了一定的研究。并且提出了一种简单高效的基音检测方法,采用时域自相关法和基音周期动态平滑相结合,消除大部分的半频和倍频的误判,取得了良好的效果。

赵路[2]2002年在《第叁代移动通信AMR声码器的研究与开发》文中提出AMR语音编解码标准是3GPP提出的第叁代移动通信系统W-CDMA的语音编解码标准。本文主要对AMR语音编解码算法进行了分析和研究。在此基础上,描述了一种较为先进的大型DSP系统程序开发策略,并以此为指导思想,以美国TI公司C6000DSP开发平台开发出了整个AMR解码器单元的系统程序。论文对AMR解码器的误码隐藏处理单元进行了重点分析,针对原有算法合成语音自然度不好的缺点,论文研究了将谱外推法应用到AMR算法中外推出声道模型反射系数参数进行误码消除处理。最后,文章分析了现有移动通信中的回波抵消算法,针对不同的算法和算法中的不同参数,研究了它们在工程应用中的计算量,并进行了回波抵消效果的的仿真。

岳子琪[3]2002年在《3G中语音端点检测算法及其实现研究》文中提出语音端点检测可以减少实时系统中的大量计算,使该系统仅处理语音输入,不至于在静音段白白浪费计算量和存储量,有利于在资源较为紧张的DSP系统上实现。本文首先对WCDMA的语音编码标准—AMR声码器中的语音端点检测算法进行了分析,重点探讨了算法的特点及其理论依据,其思想具有普遍意义,可以在信源压缩编码及其它需要高精度语音端点检测的应用场合中采用,具有较大的研究价值。然后,本文进一步提出改进的语音端点检测算法,仿真数据表明性能有较大提高,且在项目中得以实际运用,测试性能良好。本项目实现了基于TMS320C6203的灵活高效多通道AMR声码器,仿真和录放验证的结果与3GPP提供的结果满足比特级精确要求。实时处理的非正式主观测试表明,合成语音质量优于GSM的RPE-LTP的语音质量,达到长途语音质量,完全可以实际应用,为第叁代移动通信中声码器设备的研制奠定了良好的软件和硬件基础。

盖晓东[4]2010年在《基于Tilera多核平台的AMR声码器实现》文中研究表明自适应多速率(AMR,Adaptive Multi Rate)语音编码是由第叁代伙伴计划制定的用于第叁代移动通信WCDMA系统中的语音编码标准。AMR语音编码是一种变速率语音编码,它采用代数码本激励线性预测算法,支持八种语音编码速率,可自适应地选择信道模式和编码模式,在移动通信领域应用十分广泛。AMR声码器算法复杂度很大,为了提高语音通信的实时性,就需要选择高性能的硬件器件来实现并对其进行优化以提高运行效率。所以对AMR算法关键技术的改进及其硬件实现平台的研究,具有重要的理论研究价值和实际应用前景。目前多核处理器芯片以及以多核处理器为核心的高性能应用系统迅猛发展。Tilera公司推出的Tilera多核处理器能够实现高速、并行的通信与数据处理,在数字信号处理,流处理,网络安全方面有着独特的并发处理能力,当然也能提高语音同时的实时性。本文首先对AMR编解码器的原理及其采用的关键技术进行了研究,分析了Tilera多核处理器的架构、功能以及多核开发环境MDE的使用,其次根据TilePro64多核处理器的架构特点,将AMR声码器移植到TilePro64多核平台上加以实现并简单优化。最后,应用ITU标准语音序列对优化后的AMR算法性能进行了测试,并给出了测试结果。数据结果表明,在TilePro64平台上实现的AMR声码器运行效率得到了较大提高。

李宋琛[5]2002年在《第叁代移动通信中的AMR声码器研究》文中认为语音业务一直是移动通信中的主要业务之一,其中最关键的技术就是语音信号的编码与解码。由于无线通信中始终存在着频率资源不足的问题,低速率语音编码成为现代语音技术研究的主要方向。目前4.8kbps~16kbps的编码算法通常都采用CELP算法。 随着第叁代无线移动通信技术的发展与成熟,下一代语音编码技术标准也基本定型。3G AMR声码器采用目前在4K以上速率中应用比较成熟的ACELP技术,并使用活动语音探测和舒适噪声等控制方式提高编码器的主观听觉性能和频带的利用率。为了适应未来第叁代无线通信的需要,AMR可以在多种工作模式之间切换,速率从4.75kbps到12.2kbps共8种,因而能够适用在各种不同的用途中。AMR声码器采用了广泛使用的ACELP技术。经过长期实践验证,ACELP算法具有编码效率高,算法复杂度低和工作稳定等主要特点。许多新一代的语音编码标准方案中都采用了该算法,例如国际电联的G.723,G.729等。该声码器在未来的移动通信话音中占有重要地位,是第叁代语音通信的核心,同时在其它应用领域,如IP电话等也有参考价值。 AMR声码器除了使用ACELP算法以外,还大量使用了其它控制手段。这些手段包括活动语音探测,舒适噪声,速率切换,多带滤波等等。活动语音探测的概念能够降低语音数据的实际传输速率,舒适噪声能够弥补一定情况下语音自然度下降的问题。这些工程技术与算法构成了声码器的核心。 本文第二章详细介绍了ACELP语音编码的基本原理。第叁章主要讨论AMR声码中的各种控制机制。第四章着重讨论了AMR声码器的变速率工作部分。最后给出了对该声码器模型的计算机软件仿真结果及性能分析。

韩心梓[6]2016年在《移动通信端到端语音加密传输技术研究》文中提出近年来,随着移动通信业务的普及,手机等移动终端设备已逐渐渗透到人们生活的方方面面。然而,公众在享受移动语音业务带来的方便快捷的同时,也面临着语音通话中不可忽视的安全问题,语音通话内容被窃听便是最常见的安全问题之一。而如今,随着公众安全意识的提升,移动终端的通话安全已成为了信息安全领域的一项研究热点。对移动通信网的整体改造、重新设计和对移动终端的改造等方法,都常见于各类移动通信保密方案中。其中,针对移动终端的端到端语音加密方式具有易于实现、成本较小等优点,尤为得到关注。本文正是将端到端语音加密以及传输作为研究方向,进行了理论研究和方案设计与实验。本文首先研究了移动通信中的各类声码器标准,以及移动语音传输中的VAD检测技术,初步了解了移动语音网络的传输特性,从而确立了加密语音需要满足的特点,为端到端语音加密传输完成了需求分析。其次,提出了一种基于修改语音频谱形态的加密方案,并在该方案中研究了语音的多项短时特征参数,设计了基于语音短时特征参数的音节分割方法,用以辅助加密。统计和研究了语音信号的频谱形态与分布特征,设计了语音频谱形态的修改方法,并进行了仿真实验,验证该方法具有一定的加密效果,且密文语音可在移动语音通道中有效传输。本文还研究了语音压缩编码算法和流加密算法,提出了一种对压缩语音数据做流加密并利用OFDM调制进行传输的方案。在对使用GSM全速率声码器的传输信道进行研究和测试后,进行了相应的OFDM符号结构和参数设计,使密文信号能在该信道中更加稳定有效地传输。在对提出的方案进行仿真实验后,比较了不同调制方式下的解调误码率结果,并以QPSK方式生成的传输信号为对象,分析了其在GSM增强型全速率声码器信道中的解调误码情况,提出了针对信号频率的修改方法。此外还在AMR声码器信道中测试了解调误码率随编码速率变化的情况。

张伟伟[7]2014年在《通信系统中语音质量评价的研究》文中进行了进一步梳理随着通信技术的飞速发展,现代通信系统提供了广泛的语音服务,语音通信已经成为生活中不可或缺的交流方式。为了提供更好的语音通信服务,需要对通信网络和语音编解码技术进行性能评价。评判语音通信系统性能优劣的指标是多方面的,其中最重要的一个标志是系统输出语音的质量。由于语音质量直接地影响着用户的体验,因此如何准确有效的评价语音质量成为一个重要的课题。语音质量评价的方法,主要分为主观评价方法和客观评价方法。主观评价方法可以得到较准确的结果,但是,由于其费时和费力,因此不适用于对实时通信系统的评价。客观评价是以计算机信息处理为核心来判别语音的质量,它不受测试条件的限制,也不受测试人员主观因素的影响。所以,客观评价技术成为大家研究的热点。本文主要研究了基于QoE的语音质量客观评价方法。对ITU-T.P.862标准的PESQ算法进行了详细研究,并对其进行了改进。为了更有效的评价语音质量,提出了一种新的感知语音质量评价方法也就是NPESQ算法。然后,搭建了一个VoIP语音通信的实验平台,在此平台上采用NPESQ算法来评价VoIP通信的语音质量。最后,提出了基于多元回归算法的语音质量评价模型。本论文的主要成果分为以下几个方面:第一,对感知语音质量评价算法(PESQ)进行了深入研究,并对其进行了改进。PESQ算法是ITU提出的一种语音质量客观评价算法,并形成ITU-T P.862标准。它是目前比较主流的语音质量评价算法。然而,PESQ算法是在英语环境下提出的,在不同的语言环境下,PESQ算法的评价效果是有差异的。目前,没有专门针对中文环境下PESQ评价语音编解码器性能的研究。本文研究了PESQ算法对语音编解码器的评价性能。所选择的语音编解码器,是3G通信中常用的叁类变速率编解码器,包括增强型可变速率编解码器(EVRC), EVRC-B和自适应多速率语音编解码器(AMR)。经过实验测试得出在中文环境下PESQ对EVRC和EVRC-B进行评价时,存在局限性,不能得出准确的评价结果。为了提高PESQ算法对EVRC和EVRC-B评价的准确度,对PESQ提出了改进。仿真结果表明,经过改进后,其评价准确度得到了提高。改进的PESQ算法可以更好的评价语音业务。第二,为了更准确的评价通信系统的语音质量,本文提出了一种新型感知语音质量评价模型(NPESQ)。NPESQ模型是基于ERB频率尺度和Moore响度变换的客观评价方法。本文给出了NPESQ模型的实现过程,并通过实验测试,给出了NPESQ模型评价出的语音质量的得分。语音质量客观评价方法的性能指标有叁个,分别为准确性、相关性和一致性。本文通过大量的实验测试数据验证了NPESQ算法的这叁个性能。实验结果证明了,NPESQ算法可以得到比PESQ更准确的评价结果,并且NPESQ测得的结果和主观MOS结果具有更高相关性和一致性。第叁,搭建了一个新的VoIP实验分析平台,并采用新提出的NPESQ算法来评价受不同因素影响时VoIP通信的语音质量。本文搭建的VoIP实验平台和其他研究者的平台有两点不同:第一点是选择最新的网络仿真软件WANem来实现对真实的网络环境的再现。第二点为了保证实验更真实有效,需要进行多次反复的实验。如果用手动的运行几百次乃至几万次的过程不太合适,太费时费力。所以,我们编写了脚本来实现批处理。在同样的网络参数下,用批处理来自动进行多次的实验,再对所得的结果进行统计分析,这样保证了实验结果的准确性。然后,采用新型感知语音质量评价模型来评价VoIP通信的语音质量,通过实验评价出了不同因素影响下语音质量的得分。第四,针对VoIP通信中语音质量的评价,提出了基于多元回归算法的语音质量评价模型。多元回归分析是确定一个因变量和多个变化因素之间相互关系的一种统计分析方法。创建一个合理的语音质量评价模型的本质就是寻找各个影响因子和语音MOS值之间的关系。这样的关系可以通过回归分析的数理统计方法,用数学模型表达出来。在VoIP系统中,传输网络性能参数对感知语音质量(QoE)起着基础性的影响作用。我们采用多元回归分析的方法,建立了网络性能参数和语音质量之间的映射模型。以网络通信中的丢包,时延和包错排序为参数,通过实验数据分析,提出了新的多元回归算法的语音质量评价模型。利用该多元回归模型,将给定的网络性能参数带入函数模型中,可以直接得到语音质量的得分,从而更快捷的实现语音质量评价。

肖累累[8]2013年在《语音质量客观评价方法的研究》文中指出本课题的目的是研究最新的语音质量客观评价算法的表现。在通信系统中,语音的质量对于评估系统的表现是一个主要的因素。为了达到评估语音质量的目的,开发有效的语音质量评估算法是必须的。感知的语音质量客观评估算法是最有用和最便捷的方法。其中,语音质量的感知评估算法(PESQ算法)是近些年来最为流行的方法,而感知客观语音质量评估算法(POLQA算法)则是被设计用于克服之前提出的诸如PESQ等算法中存在的缺陷的最新算法。本篇论文将要讨论评估通信系统和网路中的语音质量的这两个最新的ITU标准PESQ算法和POLQA算法。本文首先研究并实现了PESQ算法,并对其进行了简单的性能分析。接下来,本文研究了POLQA算法,它是一个技术升级,能够覆盖最新的语音编码和网络传输技术,对于3G,4G/LTE和VoIP网络有了更高的准确度。然后,通过仿真实验将POLQA算法和PESQ算法作了对比。从实验数据的结论来看,可以得出如下结论:POLQA算法相较于PESQ算法有更好的表现,并且即将替代PESQ算法。为了提高PESQ算法在中文环境下的性能,本文提出了一种改进PESQ算法的新模型,它用ERB-尺度替换了Bark-尺度。最后,在VoIP系统中,本文通过将改进的PESQ算法应用于EVRC、EVRC-B、AMR叁种不同声码器来验证其性能。实验结果表明,在中文环境下,改进的PESQ算法新模型较之于原PESQ算法具有更好的准确性。

孔庆峰, 邱玲, 朱近康[9]2003年在《WCDMA中AMR声码界的编码速率选择》文中研究说明文章分析了WCDMA第叁代移动通信系统中使用的AMR声码器的8种速率的性能参数,根据这些参数对8种速率进行了分类,并在此基础上从载干比(C/I)的角度给出了AMR声码器在实际应用中进行速率选择所需的参数及其系统结构。

周晓海[10]2009年在《自适应低速率语音编解码研究与实现》文中研究表明语音通信目前仍是移动通信网所承载的主要业务,数字化后的语音占用的带宽比较宽,而移动通信网受网络容量限制,对分配给每个用户的信道带宽有所限制,因此,必须对数字化后的语音进行压缩编码后才能传输。数字化后的语音,相邻样点之间具有很强的相关性,因此对于实现语音压缩编码具有可行性。语音压缩编码方式可以分为基于参数的压缩编码方式和基于波形的压缩编码方式。基于参数的编码方式具有编码速率低、合成质量好、优良的抗噪声性能等优点,成为当前大部分语音压缩编码标准广泛采用的编码方式。随着移动通信用户的增加,必须对通信网络容量和用户需求做合理的折中处理,因此可变速率的语音压缩编码成为移动通信网承载的语音通信广泛采用的编码方式。自适应多速率语音编码(AMR:Adaptive Multi-Rate)是ITU提出的用于第叁代移动通信网的语音编码标准,基于CELP编码方式,可提供高质量的重建语音。它可根据信源和信道的变化灵活调整语音编码模式、编码速率,使信道的利用效率和移动通信网络容量实现最优,代表了语音压缩编码技术的一个发展方向。实现自适应多速率语音编码的关键技术包括话音激活检测技术(VAD)、信源与信道的速率自适应控制技术(RDA)、差错隐藏技术(ECU)以及舒适噪声生成技术(CAN)等。本文第一章首先介绍了语音编码的相关基础知识和国内外发展现状,第二章介绍了语音编码器的基础知识和基于参数编码方式的线性预测压缩编码技术,并给出了一种改进的端点检测算法。从第叁章开始,系统地介绍了自适应多速率语音编码(AMR:Adaptive Multi-Rate)的组成、语音编解码器算法、AMR的关键技术等,并对AMR编码器算法中的背景噪声预测部分进行了改进。第四张至第六章分别介绍了在TMS320VC5402 DSP芯片上实现AMR算法的相关软硬件设计,并给出硬件实验结果和软件实验结果。

参考文献:

[1]. AMR声码器的研究和开发[D]. 罗之丹. 西北工业大学. 2002

[2]. 第叁代移动通信AMR声码器的研究与开发[D]. 赵路. 西安电子科技大学. 2002

[3]. 3G中语音端点检测算法及其实现研究[D]. 岳子琪. 西安电子科技大学. 2002

[4]. 基于Tilera多核平台的AMR声码器实现[D]. 盖晓东. 大连理工大学. 2010

[5]. 第叁代移动通信中的AMR声码器研究[D]. 李宋琛. 电子科技大学. 2002

[6]. 移动通信端到端语音加密传输技术研究[D]. 韩心梓. 东南大学. 2016

[7]. 通信系统中语音质量评价的研究[D]. 张伟伟. 北京邮电大学. 2014

[8]. 语音质量客观评价方法的研究[D]. 肖累累. 北京邮电大学. 2013

[9]. WCDMA中AMR声码界的编码速率选择[J]. 孔庆峰, 邱玲, 朱近康. 无线电工程. 2003

[10]. 自适应低速率语音编解码研究与实现[D]. 周晓海. 西安建筑科技大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

AMR声码器的研究和开发
下载Doc文档

猜你喜欢