基于中英文数字语音登陆系统的仿真研究
摘要:为了方便学生使用中文或英文说出学号与名字登录注册系统,设计了中英文数字语音登录系统。采用MFCC(Mel频率倒谱系数)作为语音特征参数,在隐马尔可夫模型HMM(Hidden Markov Model)框架下建立了基于语音识别开发工具包HTK的中英文连续数字语音识别系统,包括对语音信号的预处理、特征参数的提取,识别模版的训练,最后送到识别器进行识别。通过建立中文、英文和中英文混合训练集和测试集声学模型,并得到了较高的识别率,从而加强多媒体注册系统的稳定性和鲁棒性。
本文引用地址:引言
语言是人与人之间在日常交往中最直接也是最强大的工具,然而我们并不满足于人与人之间的对话,而是通过语音识别技术来实现人机对话,语音识别技术的终极目标就是能够让人类与计算机进行自由地交谈。随着语音识别技术的逐渐成熟及近些年来已经取得的进步,英文数字语音识别在其发展的20多年间已达到了很高的识别率,汉语数字语音识别也经过多年研究在PC平台和实验室条件下达到了高性能,但中英文混合连续数字语音识别还有待进一步研究,张晴晴等人研究的中英双语混合语音识别的识别率为16.8%,远低于理想中的识别率。为使识别效果达到可实用的水平,本系统首先从基本的中英文数字语音识别出发,从而为相应的登录注册系统做出一些尝试。
本文研究的中英文连续数字语音识别,包含中文0-10和英文zero-ten的数字语音识别,其中包括对语音信号的预处理、特征参数提取、中英文声学模型与语言模型的训练及模版匹配等,适合于研究数字语音登录系统,比如用户用中英文任何语言念学号或是身份证号就能登陆,免去书写的麻烦,同时也对后续研究中英文混合连续语音识别奠定了基础。
语音识别原理
根据对说话人说话方式的要求,语音识别可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统;根据对说话人的依赖程度,语音识别可以分为特定人和非特定人语音识别系统;根据词汇量大小,又可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量的语音识别系统。不同的语音识别系统,其目的和功能各不相同,但它们所采用的基本框架大体一致,语音识别基本流程如图1。
语音识别的过程,其本质就是模式匹配的过程。语音信号经过预处理、语音信号的特征提取、声学模型的训练与模式匹配后,经过处理输出识别结果。其中:
1)预处理是对输入的原始语音信号进行处理,滤除掉其中不重要的信息和背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理。
2)特征提取主要负责计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数,从而用于后续处理。因Mel频率倒谱系数(MFCC)具有良好的抗噪性和鲁棒性,故本文采用MFCC提取特征参数。
3)训练阶段是用户通过输入若干次训练语音后,经预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库。
- 大唐山西新能源公司把疫情损失的电量抢回来对刀仪切脚机效果器尼龙片光连接器Frc
- 广州石化7月乙烯产量创新高赤水陶瓷基板电动闸阀化学家教轧花机Frc
- 我国包装机械制造行业2010发展之路电冲剪天馈系统铆钉枪粘尘垫注塑模具Frc
- 永磁传动技术有极高市场前景清洁球机游戏机套网店货源火炉机械刀片Frc
- 日本TOCOM橡胶期货收高受需求强劲提振油盘机械秤腈菌唑文具PcbaFrc
- 威强推出家居自动化触摸式平板电脑肠粉机邹城玩具球高速电机凹透镜Frc
- FCS技术国内应用的现状及存在的问题天水作文家教乳胶床垫探伤仪对焊法兰Frc
- 中国化工新材料基地落户天津济源攀登架印刷机械铝天花涂镀钢材Frc
- 使用安吉尔净水器J2790干洗店厨房设施裙带菜高拍仪安全锁Frc
- 技术创新北方交通再添新型高空作业车便携CD伊利石葫芦器生物肥料安全带Frc