基于隐马尔可夫算法的上海城市路名语音识别方法研究

基于隐马尔可夫算法的上海城市路名语音识别方法研究

陆晔[1]2002年在《基于隐马尔可夫算法的上海城市路名语音识别方法研究》文中研究说明随着现代计算机技术和语音技术的发展,用语音和计算机交流已经成了现代科技发展的一个标志,语音识别和语音合成也因此成为现代计算机技术研究迫切需要发展的一个方向。 语音识别技术关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音信号本身的特点造成了语音识别的困难,这些特点包括多变性、动态性、瞬时性和连续性等。计算机对语音识别的过程和人对语音的识别过程基本上一致。目前主流的语音识别技术是基于统计模式识别的基本理论。 本文以最终实现一个基于HMM模型的城市道路名语音识别系统为目的,详细介绍了作者在实现高识别率的语音识别算法中的思想以及改进。论文论述了特征矢量的获取,HMM的原理和Baum_Welch算法的实现方法。并在此基础上采用了Viterbi算法,Segmental K-means算法,减少了运算复杂度,提高识别速度,使之能够满足实时性的要求。同时针对语音识别系统中识别率不高的问题,采用基音频率分析的方法分别建造男女声识别模型。并建造了基于城市道路名称(整词)的HMM和基于中文音素的HMM两种模型。论文的最后给出了这两种模型识别性能的比较结果和分析。

林立[2]2008年在《基于语音识别技术的中文语音路名查询系统的实现和语言模型的研究》文中研究表明语音是人类进行交流的一种基本且十分便捷的工具。在科技高速发展的时代,用数字化的技术进行语音信号的转换、存储、传送、识别和合成已成为有广阔应用前景的研究领域。语音识别是其中一个重要的分支,它是指机器通过学习实现从语音信号到文字符号的理解过程,是一种十分重要的人机交互方式。中文语音路名查询系统的研究与实现,建立在语音识别的理论基础上,以HTK工具包为软件核心。HTK(HMM Toolkit)是英国剑桥大学开发的一个用于创建和处理隐马尔可夫模型的实验工具包。由于其在语音识别方面处于相对领先地位,且源代码公开便于系统开发调试,所以是进行语音识别研究的一个理想平台。本文介绍了语音识别相关理论的研究和HTK语音识别系统处理流程,提出了基于语音识别技术的中文语音路名查询系统的设计和实现,可实现用户实时中文语音输入路名的情况下,系统将识别结果以汉字方式显示在屏幕上,也可进行WAV语音存储文件的识别和测试。本系统小巧快速,具有较高的识别率。在此基础上进一步延伸,可拓展出诸多应用于电话拨号系统、信息网络查询、家庭服务、声控智能玩具等相关领域的产品。由于语言模型在语音识别过程中起到的重要作用,论文最后介绍了语音识别领域中语言模型相关的理论分析和实验比较结果,使本文的内容覆盖了语音识别系统的主要构造组成。

参考文献:

[1]. 基于隐马尔可夫算法的上海城市路名语音识别方法研究[D]. 陆晔. 华东师范大学. 2002

[2]. 基于语音识别技术的中文语音路名查询系统的实现和语言模型的研究[D]. 林立. 上海交通大学. 2008

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于隐马尔可夫算法的上海城市路名语音识别方法研究
下载Doc文档

猜你喜欢