图书介绍

语音处理及人机交互技术【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

张毅，刘想德，罗元等编著
出版社：北京：科学出版社
ISBN：9787030303240
出版时间：2016
标注页数：200页
文件大小：26MB
文件页数：214页
主题词：自然语言处理－研究；人-机系统－研究

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：746b73a811829bd5e07389e424cc24ff

下载说明

语音处理及人机交互技术PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章绪论1

1.1 语音信号技术的历史1

1.2 语音信号技术应用及新方向3

1.2.1 语音信号的识别3

1.2.2 语音信号的合成4

1.2.3 语音信号的编码4

参考文献5

第2章语音信号的声学基础7

2.1 语音信号的产生7

2.1.1 语音发音器官7

2.1.2 语音声学特征10

2.1.3 语音信号的时域及频域表示11

2.1.4 汉语语音分类13

2.1.5 汉语语音韵律特性16

2.2 语音信号的感知16

2.2.1 人的听觉系统17

2.2.2 人耳的听觉特性19

2.2.3 人耳听觉的掩蔽效应20

2.3 语音信号生成的数学模型26

2.3.1 激励模型26

2.3.2 声道模型28

2.3.3 辐射模型30

2.3.4 语音信号的数学模型31

2.4 语音产生的非线性模型33

2.4.1 调频-调幅模型的基本原理33

2.4.2 Teager能量算子34

2.4.3 能量分离算法34

2.4.4 调频-调幅模型的应用36

参考文献36

第3章语音信号的分析38

3.1 语音信号预处理步骤38

3.1.1 采样与量化38

3.1.2 预加重39

3.1.3 分帧与加窗40

3.1.4 端点检测42

3.2 语音信号的时域分析43

3.2.1 短时能量分析44

3.2.2 短时平均过零率44

3.2.3 短时自相关函数和短时平均幅度差函数45

3.3 语音信号的频域分析47

3.3.1 滤波器组方法47

3.3.2 傅里叶频谱分析48

3.3.3 线性预测倒谱系数49

3.3.4 Mel频率倒谱系数51

3.4 语音信号的倒谱分析53

3.4.1 同态信号处理的基本原理54

3.4.2 复倒谱和倒谱56

3.5 语音信号的小波分析57

参考文献58

第4章语音增强60

4.1 语音信号与语音增强60

4.1.1 语音特性60

4.1.2 人耳感知特性61

4.1.3 噪声特性61

4.1.4 语音增强的信号模型63

4.2 谱减法语音增强64

4.2.1 基本原理65

4.2.2 基本谱减法的改进66

4.3 维纳滤波法语音增强67

4.4 卡尔曼滤波法语音增强68

4.5 最小均方误差法的语音增强71

4.6 语音增强的一些新发展73

参考文献75

第5章模式识别算法及应用77

5.1 矢量量化的基本原理77

5.2 矢量量化的失真测度78

5.2.1 欧氏距离测度79

5.2.2 线性预测失真测度80

5.2.3 识别失真测度81

5.3 人工神经网络的基本原理81

5.4 人工神经网络的基本构成83

5.4.1 人工神经元模型83

5.4.2 神经网络有向图表示85

5.4.3 神经网络结构及工作方式86

5.5 基本神经网络模型及算法87

5.5.1 单层感知器87

5.5.2 多层感知器90

5.5.3 径向基函数神经网络模型92

5.5.4 循环神经网络93

5.5.5 支持向量机95

参考文献98

第6章语音信号的识别99

6.1 语音识别概述99

6.2 孤立词语音识别100

6.3 连续词语音识别102

6.4 说话人识别103

6.4.1 说话人识别概述103

6.4.2 说话人识别特征选取103

6.4.3 说话人识别系统的结构107

6.4.4 说话人识别中的识别方法108

6.4.5 说话人识别中需进一步研究的问题109

6.5 语音信号预处理110

6.6 语音信号识别特征提取111

6.7 语音信号识别方法113

6.8 隐马尔可夫模型基本原理及在语音识别中的应用114

6.8.1 马尔可夫链114

6.8.2 隐马尔可夫模型的定义115

6.8.3 隐马尔可夫模型的三个问题115

6.8.4 隐马尔可夫模型在语音识别中的应用118

6.9 动态时间规整算法120

参考文献122

第7章语音信号的合成123

7.1 概述123

7.2 语音合成的基本方法124

7.2.1 以单词为基础的合成方法124

7.2.2 以音节为基础的合成方法125

7.2.3 以音素为基础的合成方法126

7.3 共振峰合成法127

7.4 线性预测合成法129

7.5 语音合成专用硬件介绍132

7.6 PSOLA算法合成语音134

7.7 文语转换系统136

参考文献138

第8章语音信号定位与分离技术140

8.1 声源定位技术140

8.1.1 基于麦克风阵列的定位方法140

8.1.2 基于人耳听觉机理的声源定位143

8.2 语音分离技术149

8.2.1 计算听觉场景分析149

8.2.2 计算听觉场景分析的语音分离模型154

8.2.3 独立分量分析155

8.3 声源定位与语音分离实现方法167

参考文献169

第9章基于听觉机制的语音识别171

9.1 人耳的听觉机制171

9.1.1 人耳听觉中枢的物理结构171

9.1.2 人耳听觉中枢的听觉机理172

9.2 人耳听觉系统的基本模型172

9.2.1 人耳听觉系统的外周听觉模型173

9.2.2 人耳听觉系统的内毛细胞模型177

9.2.3 人耳听觉系统的重合神经元模型181

9.3 多声源环境下人耳语音定位模型183

9.3.1 双耳线索183

9.3.2 耳廓效应184

9.3.3 双耳时间差模型185

9.3.4 多声源环境下声源定位系统的设计185

9.4 多声源环境下人耳语音分离模型188

9.4.1 语音信号分离的反演模型188

9.4.2 语音信号分离系统的设计189

9.5 基于听觉机制的语音识别系统190

参考文献191

第10章基于语音的人机交互及应用193

10.1 人机交互的研究及发展193

10.1.1 人机交互概述193

10.1.2 人机交互的研究内容194

10.1.3 人机交互的发展历程195

10.2 语音人机交互及其应用196

10.2.1 语音人机交互概述196

10.2.2 语音人机交互与智能轮椅196

10.2.3 语音人机交互与智能电视197

10.2.4 语音人机交互的其他应用198

参考文献199