更新时间:02-20 上传会员:彭小思
分类:机械工程 论文字数:39359 需要金币:2000个
摘要:智能机器人是国家“863”计划重点支持的方向,语音识别和合成技术是智能机器人技术的主要体现之一,可让机器人与人进行自然的人机对话,使机器人能听从人的指挥。把这种智能机器人应用于导游行业,研制出语音交互式导游机器人,将完全代替人力完成导游工作。
语音交互以语音识别和语音合成为基础。语音识别是将音频信息转换成文本或者其它形式的计算机能够处理的信息的技术,语音合成是将文本文件转换成语音信息。经过国内外多年的研究探索,出现了许多语音识别的方法,其中隐马尔可夫模型成为大词汇量连续语音识别的主导方法。本文从语音识别系统的系统框架出发,重点探讨研究了基于隐马尔可夫模型的语音识别的实现方法和POSLA算法在语音合成系统中的应用,研究了AS-R机器人的运动原理。本文完成了对微软语音开发包MS Speech SDK的二次开发,在嵌入机器人本体的PC机上,通过在VC++ 6.0软件上编程实现了语音识别和语音合成功能,完成了基于机械学院的导航软件的设计,建立了语音识别常用语的语音库,并实现了用语音控制机器人的运动。
关键词:语音识别;语音合成;VC++ 6.0;微软语音开发包;机器人控制
目录
摘要
ABSTRACT
第1章 绪论-1
1.1国内外语音导游机器人技术发展历程及现状-1
1.1.1语音技术的发展历程及现状-1
1.1.2 导游机器人的发展现状-2
1.2 语音交互式导游机器人发展方向-3
1.2.1 语音交互技术-3
1.2.2 导游机器人的发展方向-4
1.3 语音交互导游机器人研究的意义及本文研究的内容-4
1.3.1 语音交互导游机器人研究的意义-4
1.3.2本文研究的主要内容-5
1.4 本文的内容结构-5
第2章 语音识别原理-7
2.1 听觉语音学-7
2.2汉语语音学基础-8
2.2.1 音素和音节-8
2.2.2 元音和辅音-8
2.2.3 声母和韵母-8
2.2.4 汉语语音的主要特点-9
2.3 语音识别的基本原理-9
2.4 语音识别的预处理-9
2.4.1 识别单元选取-9
2.4.2 语音识别的数字化-10
2.4.3 语音识别的预加重-11
2.4.4 语音识别的分帧加窗-11
2.4.5 端点检测-12
2.5 特征参数的提取-13
2.5.1提取参数方法简介-13
2.5.2 Mel频标倒谱系数(MFCC)-14
2.6 模型训练及模式匹配-15
2.7 做出决策-16
2.8 隐马尔可夫模型(HMM)-16
2.8.1隐马尔可夫模型(HMM)的数学定义-16
2.8.2 HMM的基本元素-17
2.8.3隐马尔可夫模型的基本问题-17
2.9本章小节-19
第3章 语音合成原理-21
3.1语音信号生成的数学模型-21
3.1.1 激励模型-21
3.1.2声道模型-22
3.1.3 辐射模型-22
3.1.4 完整的语音信号数字模型-22
3.2 当前使用的几种主要的语音合成技术-23
3.2.1 共振峰合成-23
3.2.2 LPC(线性预测)参数合成-24
3.2.3 POSLA合成-25
3.3 文语转换系统-26
3.3.1 文本分析-27
3.3.2 韵律控制-27
3.3.3 语音合成-27
3.4 本章小结-28
第4章 语音识别和合成的实现-29
4.1 语音识别概述-29
4.1.1 开发环境选择-29
4.1.2 SAPI 5.1简介-29
4.2 语音识别功能的实现-31
4.2.1初始化模块-31
4.2.2 语音识别处理-32
4.3 语音合成功能的实现-35
4.3.1初始化模块-35
4.3.2 设置朗读的声音、音量、语速和格式-36
4.3.3 读取wav文件-37
4.4 听写功能的实现-38
4.5 本章小结-39
第5章 导航软件的制作-41
5.1 语音交互式导游机器人主页面-41
5.2语音交互的基本实现-41
5.3问题回答模式-43
5.4 播放视频文件-44
5.5 语音实现对音量、语速的控制-46
5.6 本章小结-47
第6章 语音交互功能在AS-R机器人上的应用-49
6.1 AS-R移动小车简介-49
6.2 AS-R小车运动控制-49
6.2.1系统的概念-50
6.2.2 设备和接口的概念-50
6.2.3 VC实现小车运动控制-50
6.3在VC上实现语音控制小车的运动-51
6.4 本章小结-52
第7章 自然语言的识别-53
7.1 自然语言的概念与特点-53
7.1.1 自然语言的概念-53
7.1.2 自然语言的特点-53
7.2 自然语言理解与语言模型-53
7.3 句法模型与概念凸现-54
7.3.1 句法模型-54
7.3.2 概念凸现-55
7.3.3 概念扩展-55
7.4 自然语言识别的实现-55
7.5 本章小结-56
第8章 动态语音库的实现-57
8.1 链表简述-57
8.1.1 链表的存储状态-57
8.1.2 链表的描述-57
8.2 链表结构在程序中的应用-58
8.3 XML文件-599
8.4 本章小结-60
第9章 结论与展望-61
9.1结论-61
9.2不足之处及未来展望-61
参考文献-63
致 谢-65