3G中语音端点检测算法及其实现研究

3G中语音端点检测算法及其实现研究

岳子琪[1]2002年在《3G中语音端点检测算法及其实现研究》文中进行了进一步梳理语音端点检测可以减少实时系统中的大量计算,使该系统仅处理语音输入,不至于在静音段白白浪费计算量和存储量,有利于在资源较为紧张的DSP系统上实现。本文首先对WCDMA的语音编码标准—AMR声码器中的语音端点检测算法进行了分析,重点探讨了算法的特点及其理论依据,其思想具有普遍意义,可以在信源压缩编码及其它需要高精度语音端点检测的应用场合中采用,具有较大的研究价值。然后,本文进一步提出改进的语音端点检测算法,仿真数据表明性能有较大提高,且在项目中得以实际运用,测试性能良好。本项目实现了基于TMS320C6203的灵活高效多通道AMR声码器,仿真和录放验证的结果与3GPP提供的结果满足比特级精确要求。实时处理的非正式主观测试表明,合成语音质量优于GSM的RPE-LTP的语音质量,达到长途语音质量,完全可以实际应用,为第叁代移动通信中声码器设备的研制奠定了良好的软件和硬件基础。

张希岩[2]2015年在《噪声环境下的时域语音激活检测研究》文中进行了进一步梳理随着科学技术的不断发展,语音已经突破原来人与人之间通话的范畴,如今已经应用到越来越多的领域中,语音的广泛应用不断促使语音相关技术的发展。由于噪声存在的绝对性,语音系统的准确度和效率往往受到严重影响。因此,语音信号处理中与噪声有关的技术是一项至关重要的研究课题,语音激活检测就是其中一项关键技术。语音激活检测的目的是检测出信号是话音还是噪声。语音激活检测是一项语音前端处理技术,语音系统根据判决结果再选择不同方法进一步处理信号,所以语音系统对信号进行处理之前先进行话音检测不但能够减少噪声干扰,还能够提高系统的鲁棒性。语音激活检测技术在国内外都得到了大量的研究,并取得了一定的成果,目前已经是语音识别、语音通信等系统的必要技术。语音激活检测方法主要包括时域和频域两大类。时域方法主要包括基于能量、过零率、平均幅度等方法,频域方法主要有基于倒谱、谱熵、分形、小波变换等方法。本文在介绍语音信号处理的基础上,首先介绍了语音激活检测的原理,随后又对常见的几种时域和频域中的语音激活检测方法进行了介绍,主要包括基本原理、实现流程、仿真实验、统计特性等,并对各方法的优缺点进行了分析。鉴于方法特点和实际需求,本文对时域中“过零率+能量”双门限联合语音激活检测方法进行了重点研究,虽然实验结果表明这种“取长避短”的联合方法能够提高检测的性能,但通过信号仿真波形可以看出这种方法仍然具有“帧间干扰”、“拖尾”等缺点。因此,本文随后在能量和过零率的检测原理、判决准则等方面进行了深入探究,尤其是经过理论推导和方案论证提出了一种过零率修正模型,最终得到一种新的时域双门限语音激活检测方法,实验证明:新的方法有效地解决了常用时域检测方法存在的问题。本文还对多种噪声环境下各语音激活检测方法进行了正确率统计实验,通过对比不同方法统计结果,进一步知晓了独立与联合方法、常用与改进方法、时域与频域方法间检测正确率的差异,由此更深入了解了各方法的特点。除此之外,本文还从语音端点检测和英文语音激活检测的方面进行了实验,从功能扩展的角度剖析了检测方法的性能;本文还对语音激活检测方法的应用场景——硬件平台进行了介绍,并说明了硬件平台的实验方法。本文在最后对课题研究进行了总结,概括出一些收获与结论,同时指出了目前存在的一些问题,并由此对未来语音激活检测的研究和发展进行了展望。

佚名[3]2006年在《通信》文中研究说明TN912006010862CVAAS自适应动态电源管理策略/卜爱国,胡晨,刘昊,李杰(东南大学国家专用集成电路系统工程技术研究中心)//应用科学学报.―2005,23(3).―269~273.在嵌入式和便携式系统的低功耗设计中,动态电源管理(dynam

王秋杰[4]2011年在《TD-SCDMA网络测试软件中语音识别模块的设计与实现》文中研究表明TD-SCDMA是由中国提出的第叁代移动通信(3G)国际标准,于2000年被国际电信联盟(ITU)正式采纳,成为全球认可的第叁代移动通信国际标准之一。在政府和运营商的大力支持下TD-SCDMA的网络建设工作正在如火如荼地展开。随着网络建设进度的发展,对无线网络所提供的业务质量进行评估显得尤为重要。而从用户感知角度对业务质量进行衡量将成为业务质量评估的一个发展趋势。音频播放时延是衡量3G可视电话业务以及语音业务质量的重要用户体验指标,对衡量无线网络以及业务质量有着举足轻重的作用。如何获取音频播放时延已经成为3G可视电话业务以及语音业务质量评估中一个亟待解决的问题。在此背景下,本文将语音识别技术引入到TD-SCDMA网络质量测试中,解决了3G网络业务质量评估中音频播放时延的获取问题。本文以"TD-SCDMA网络测试软件中语音识别模块的设计与实现”为课题,做了以下工作:1)给出了当前无线业务质量评估的需求分析。2)介绍了语音识别系统的结构以及语音识别的相关基本原理3)分析比较了目前的语音识别系统中的方法,并提出了改进方案。4)针对TD-SCDMA网络测试软件的现状,设计并实现了语音识别模块。5)论文的总结和展望。

佚名[5]2006年在《通信》文中指出TN912006030666基于特征点的整数小波目标跟踪方法的研究/王丽荣,申铉国,王延杰(吉林大学通信工程学院)//光学技术.―2005,31(3).―401~404.基于提升方法的整数小波变换的诸多优点,以Harr整数小波变换为例,提出了动态目标跟踪

佚名[6]2003年在《通信》文中研究表明TN91 2003020974电信业务特性集成的时序着色Petri网模型/陆以勤,韦岗,贺前华(华南理工大学)“华南理工大学学报.一2002,30(l)一27一33提出了一个电信系统业务特性集成的建模和检验方法.根据这个方法,现有的系统和新的业务特性分别

刘明飞[7]2016年在《智能家居中语音增强和分离的研究与应用》文中进行了进一步梳理智能家居这个词语,出现在我们生活中频率越来越高。在智能家居的模块中,通过人们的语音信号控制室内的家电是比较常见的一类智能方式,所以智能家居模块对语音信号的处理要求较为苛刻。本论文主要针对智能家居中的语音信号处理进行研究,通过处理接收到的语音信号,使得智能家居模块能得到一个清晰干净的声音。语音信号处理一直备受人们的关注,近几年来人们在语音信号处理的各个领域取得了较好的研究与应用。在本论文中,我们针对语音信号的降噪声,语音信号分离、语音信号端点检测等方向做了研究与实现。语音信号的降噪声可以提高语音信号的信噪比,提高语音信号的可识别度,传统的语音信号降噪声使用单个麦克风,在本论文中我们主要研究麦克风阵列降噪声,包括固定波束降噪声和自适应波束降噪声算法的研究与实现。在多人讲话的环境中,语音信号分离技术可以得到较好的应用,使得智能家居模块得到可识别的语音信号,在本论文中,我们提出了不同于传统的盲源信号分离算法,我们使用常见的一些算法用于语音信号的分离,称之为半盲源信号分离。语音信号的端点检测可以用于激活智能家居模块,有效减少待机功耗。同时本论文将各个算法在硬件上都有实现,我们采用TI 64位的DSP6747,和6个麦克风组成麦克风阵列。本论文的创新点有以下几点:1、与传统的麦克风阵列相比较,本论文将远场与近场在前期做判断,算法会针对不同的情况做出不同的反应。2、将传统的最小均方误差算法用于半盲源信号分离。3、将最小二乘法用于半盲源信号分离。4、将半盲源信号分离算法与传统的固定波束算法结合用于语音信号分离。5、将语音端点检测算法用于智能家居模块,减少待机功耗。6、通过EDMA提高了自适应降噪声算法的实时性。同时,本论文针对各个算法都介绍其原理,而且针对各个算法在实际环境中的应用做了实验并收集了数据,并且从实验和数据中可以验证算法的优越性。从实际的实验中,我们可以发现,本论文中提出的以上创新点在实际中都有较好的应用。

马伟荣[8]2009年在《基于HMM模型的连接词语音识别的抗噪研究》文中进行了进一步梳理语音识别经过半个世纪的发展,其理论研究已经取得了一定的成果,在实验室环境中取得了极高的识别率,并且已经从实验室走向实用。然而离人们所期望的语音识别能力跟人一样的目标还相去甚远。语音识别在实用化的过程中仍存在如环境等诸多制约因素,还需要在各个层次进行有针对性的研究,使语音识别能够真正实用化。本文以提高加性噪声干扰下语音识别系统的识别率为目的,全面研究语音识别理论基础,重点研究预处理和特征提取阶段的抗噪声的技术,并采用渐进的方式实现了基于HMM模型的汉语孤立词和连接词的语音识别系统。深入研究语音增强处理和端点检测技术,从语音非线性特征——复杂性测度出发,提出一种具有抗噪能力的端点检测的方法,实验证明该方法在低信噪比下能准确检测出语音的端点。对抗噪特征提取技术进行深入分析,给出了一种新的动态模型补偿方法,实验证明该特征具更好的鲁棒性。对HMM模型在实现过程中出现的问题,如多训练集问题、模型初值选择、数据下溢等给出了解决方法。将提出的方法具体应用系统中,实验表明,系统具有良好的噪声鲁棒性。本文对语音识别系统各部分进行深入研究和实践,并作出了探索性的工作,取得了一定成效,为从事这方面研究奠定了基础。

周晓海[9]2009年在《自适应低速率语音编解码研究与实现》文中研究指明语音通信目前仍是移动通信网所承载的主要业务,数字化后的语音占用的带宽比较宽,而移动通信网受网络容量限制,对分配给每个用户的信道带宽有所限制,因此,必须对数字化后的语音进行压缩编码后才能传输。数字化后的语音,相邻样点之间具有很强的相关性,因此对于实现语音压缩编码具有可行性。语音压缩编码方式可以分为基于参数的压缩编码方式和基于波形的压缩编码方式。基于参数的编码方式具有编码速率低、合成质量好、优良的抗噪声性能等优点,成为当前大部分语音压缩编码标准广泛采用的编码方式。随着移动通信用户的增加,必须对通信网络容量和用户需求做合理的折中处理,因此可变速率的语音压缩编码成为移动通信网承载的语音通信广泛采用的编码方式。自适应多速率语音编码(AMR:Adaptive Multi-Rate)是ITU提出的用于第叁代移动通信网的语音编码标准,基于CELP编码方式,可提供高质量的重建语音。它可根据信源和信道的变化灵活调整语音编码模式、编码速率,使信道的利用效率和移动通信网络容量实现最优,代表了语音压缩编码技术的一个发展方向。实现自适应多速率语音编码的关键技术包括话音激活检测技术(VAD)、信源与信道的速率自适应控制技术(RDA)、差错隐藏技术(ECU)以及舒适噪声生成技术(CAN)等。本文第一章首先介绍了语音编码的相关基础知识和国内外发展现状,第二章介绍了语音编码器的基础知识和基于参数编码方式的线性预测压缩编码技术,并给出了一种改进的端点检测算法。从第叁章开始,系统地介绍了自适应多速率语音编码(AMR:Adaptive Multi-Rate)的组成、语音编解码器算法、AMR的关键技术等,并对AMR编码器算法中的背景噪声预测部分进行了改进。第四张至第六章分别介绍了在TMS320VC5402 DSP芯片上实现AMR算法的相关软硬件设计,并给出硬件实验结果和软件实验结果。

参考文献:

[1]. 3G中语音端点检测算法及其实现研究[D]. 岳子琪. 西安电子科技大学. 2002

[2]. 噪声环境下的时域语音激活检测研究[D]. 张希岩. 西安电子科技大学. 2015

[3]. 通信[J]. 佚名. 中国无线电电子学文摘. 2006

[4]. TD-SCDMA网络测试软件中语音识别模块的设计与实现[D]. 王秋杰. 北京邮电大学. 2011

[5]. 通信[J]. 佚名. 中国无线电电子学文摘. 2006

[6]. 通信[J]. 佚名. 中国无线电电子学文摘. 2003

[7]. 智能家居中语音增强和分离的研究与应用[D]. 刘明飞. 兰州大学. 2016

[8]. 基于HMM模型的连接词语音识别的抗噪研究[D]. 马伟荣. 西北大学. 2009

[9]. 自适应低速率语音编解码研究与实现[D]. 周晓海. 西安建筑科技大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  

3G中语音端点检测算法及其实现研究
下载Doc文档

猜你喜欢