語音信号處理

語音信号處理

趙力著圖書(2009年版)
《語音信号處理》,是機械工業出版社出版的圖書,作者趙力。介紹了語音信号處理的基礎、原理、方法和應用,以及該學科領域近年來取得的一些新的研究成果和技術。
  • 中文名:語音信号處理
  • 外文名:
  • 别名:
  • 作者:趙力
  • 價格:36.00元
  • 語種:簡體中文
  • ISBN:9787111271901
  • 出版社:機械工業出版社
  • 開本:16開
  • 出版時間:2009年6月
  • 裝幀:平裝

内容簡介

《語音信号處理(第2版)》介紹了語音信号處理的基礎、原理、方法和應用,以及該學科領域近年來取得的一些新的研究成果和技術。全書共分14章,包括緒論、語音信号處理基礎知識、語音信号分析、矢量量化技術、隐馬爾可夫模型、神經網絡在語音信号處理中的應用、語音編碼、語音合成、語音識别、說話人識别與語種辨識、語音轉換與語音隐藏、語音信号中的情感信息處理、耳語音信号處理、語音增強等内容。《語音信号處理(第2版)》可作為高等院校教材或教學參考用書,也可供從事語音信号處理等領域的工程技術人員參考。

圖書目錄

第1章 緒論

第2章 語音信号處理基礎知識

2.1 語音和語言

2.2 漢語語音學

2.2.1 漢語語音的特點

2.2.2 漢語的拼音方法

2.2.3 漢語音節的一般結構

2.2.4 漢語聲母的結構

2.2.5 漢語韻母的結構

2.2.6 聲母和韻母的相互作用—音征互載

2.2.7 漢語的聲調

2.3 語音生成系統和語音感知系統

2.3.1 語音發音系統

2.3.2 語音聽覺系統

2.4 語音信号生成的數學模型

2.4.1 激勵模型

2.4.2 聲道模型

2.4.3 輻射模型

2.4.4 語音信号的數學模型

2.5 語音信号的特性分析

2.5.1 語音信号的時域波形和頻譜特性

2.5.2 語音信号的語譜圖

2.5.3 語音信号的統計特性

2.6 思考與複習題

第3章 語音信号分析

3.1 概述

3.2 語音信号的數字化和預處理

3.2.1 預濾波、采樣、A/D轉換

3.2.2 預處理

3.3 語音信号的時域分析

3.3.1 短時能量及短時平均幅度分析

3.3.2 短時過零率分析

3.3.3 短時相關分析

3.3.4 短時平均幅度差函數

3.4 語音信号的頻域分析

3.4.1 利用短時傅裡葉變換求語音的短時譜

3.4.2 語音的短時譜的臨界帶特征矢量

3.5 語音信号的倒譜分析

3.5.1 同态信号處理的基本原理

3.5.2 複倒譜和倒譜

3.5.3 語音信号倒譜分析實例

3.6 語音信号的線性預測分析

3.6.1 線性預測分析的基本原理

3.6.2 線性預測方程組的求解

3.6.3 LPC譜估計和LPC複倒譜

3.6.4 線譜對分析

3.7 語音信号的小波分析

3.7.1 傅裡葉變換

3.7.2 短時傅裡葉變換

3.7.3 連續小波變換

3.7.4 離散小波變換

3.7.5 小波變換的幾個實例

3.8 基音周期估計

3.8.1 自相關法

3.8.2 平均幅度差函數法

3.8.3 并行處理法

3.8.4 倒譜法

3.8.5 簡化逆濾波法

3.8.6 小波變換法

3.8.7 基音檢測的後處理

3.9 共振峰估計

3.9.1 帶通濾波器組法

3.9.2 倒譜法

3.9.3 LPC法

3.10 思考與複習題

第4章 矢量量化技術

4.1 概述

4.2 矢量量化的基本原理

4.3 矢量量化的失真測度

4.3.1 歐氏距離測度

4.3.2 線性預測失真測度

4.3.3 識别失真測度

4.4 矢量量化器的最佳碼本設計

4.4.1 LBG算法

4.4.2 初始碼本的生成

4.5 矢量量化技術的優化設計

4.6 思考與複習題

第5章 隐馬爾可夫模型

5.1 隐馬爾可夫模型的引入

5.2 隐馬爾可夫模型的定義

5.2.1 離散Markov過

5.2.2 隐Markov模型

5.2.3 HMM的基本元素

5.3 隐馬爾可夫模型的基本算法

5.3.1 前向-後向算法

5.3.2 維特比算法

5.3.3 Baum-Welch算法

5.4 隐馬爾可夫模型的各種結構類型

5.4.1 按照HMM的狀态轉移概率矩陣(A參數)分類

5.4.2 按照HMM的輸出概率分布(B參數)分類

5.4.3 其他一些特殊的:HMM的形式

5.5 隐馬爾可夫模型的一些實際問題

5.5.1 下溢問題

5.5.2 參數的初始化問題

5.5.3 提高HMM描述語音動态特性的能力

5.5.4 直接利用狀态持續時間分布概率的HMM系統

5.6 思考與複習題

第6章 人工神經網絡初步

6.1 人工神經網絡簡介

6.2 人工神經網絡的構成

6.2.1 神經元

6.2.2 神經元的學習算法

6.2.3 網絡拓撲

6.2.4 網絡的學習算法

6.3 幾種用于模式識别的神經網絡模型及其主要算法

6.3.1 單層感知器

6.3.2雙層感知器

6.3.3 多層感知器

6.3.4 徑向基函數神經網絡的分類特性

6.3.5 自組織特征映射模型

6.3.6 時延神經網絡

6.3.7 循環神經網絡

6.3.8 支持向量機

6.4 用神經網絡進行模式識别的典型做法

6.4.1 多輸出型

6.4.2 單輸出型

6.5 思考與複習題

第7章 語音編碼

7.1 概述

7.2 語音信号壓縮編碼的原理和壓縮系統評價

7.2.1 語音壓縮的基本原理

7.2.2 語音編碼的關鍵技術

7.2.3 語音壓縮系統的性能指标和評測方法

7.3 語音信号的波形編碼

7.3.1 脈沖編碼調制

7.3.2 自适應預測編碼

7.3.3 自适應增量調制和自适應差分脈沖編碼調制

7.3.4 子帶編碼

7.3.5 自适應變換編碼

7.4 語音信号的參數編碼

7.4.1 線性預測聲碼器

7.4.21P-10編碼器

7.5 語音信号的混合編碼

7.6 現代通信中的語音信号編碼方法

7.6.1 EVRC算法基本原理

7.6.2 EVRC算法概述

7.7 思考與複習題

第8章 語音合成

8.1 概述

8.2 共振峰合成法

8.3 線性預測合成法

8.4 語音合成專用硬件簡介

8.5 PSOLA算法合成語音

8.6 文語轉換系統

8.7 思考與複習題

第9章 語音識别

9.1 概述

9.2 語音識别原理和識别系統的組成

9.2.1 預處理和參數分析

9.2.2 語音識别

9.2.3 語音識别系統的基本數據庫

9.3 動态時間規整

9.4 孤立字(詞)識别系統

9.4.1 基于MQDF的漢語塞音語音識别系統

9.4.2 基于概率尺度DP識别方法的孤立字(詞)識别系統

9.5 連續語音識别系統

9.6 連續語音識别系統的性能評測

9.6.1 連續語音識别系統的評測方法以及系統複雜性和識别能力的測度

9.6.2 綜合評估連續語音識别系統時需要考慮的其他因素

9.7 思考與複習題

第10章 說話人識别與語種辨識

10.1 概述

10.2 說話人識别方法和系統結構

10.2.1 預處理

10.2.2 說話人識别特征的選取

10.2.3 特征參量評價方法

10.2.4模式匹配方法

10.2.5 說話人識别中判别方法和阈值的選擇

10.2.6 說話人識别系統的評價

10.3 應用DTW的說話人确認系統

10.4 應用VQ的說話人識别系統

10.5 應用HMM的說話人識别系統

10.5.1 基于HMM的與文本有關的說話人識别

10.5.2 基于HMM的與文本無關的說話人識别

10.5.3 基于HMM的指定文本型說話人識别

10.5.4 說話人識别HMM的學習方法

10.5.5 魯棒的HMM說話人識别技術

10.6 應用GMM的說話人識别系統

10.6.1 GMM模型的基本概念

10.6.2 GMM模型的參數估計

10.6.3 訓練數據不充分的問題

10.6.4 GMM模型的識别問題

10.7 說話人識别中尚需進一步探索的研究課題

10.8 語種辨識的原理和應用

10.8.1 語種辨識的基本原理和方法

10.8.2 語種辨識的應用領域

10.9 思考與複習題

第11章 語音轉換與語音隐藏

11.1 語音轉換的原理和應用

11.2 常用語音轉換的方法

11.2.1 頻譜特征參數轉換

11.2.2 基音周期轉換

11.2.3 韻律信息轉換

11.3 語音分析模型和語音庫的選擇

11.3.1 語音分析模型

11.3.2 語音庫的設計

11.4 應用CMM的語音轉換

11.5 語音轉換的研究方向

11.6 語音信息隐藏的原理及應用

11.7 語音信息隐藏的常用方法

11.8 語音信息隐藏系統的評價标準

11.9 語音信息隐藏需要研究和解決的問題

11.10 思考與複習題

第12章 語音信号中的情感信息處理

12.1 概述

12.2 語音信号中的情感分類和情感特征分析

12.2.1 情感的分類

12.2.2情感特征分析

12.3 語音情感識别方法

12.3.1 主元分析法

12.3.2 神經網絡方法

12.3.3 混合高斯模型法

12.4 情感語音的合成

12.5 今後的研究方向

12.6 思考與複習題

第13章 耳語音信号處理

13.1 耳語音的聲學特征分析

13.1.1 音長

13.1.2 音高

13.1.3 聲調

13.1.4共振峰頻率

13.1.5 耳語音美爾頻率倒譜特征參數分析

13.2耳語音增強

13.3 耳語音轉換正常音

13.4耳語音識别

13.4.1 孤立字(詞)的耳語音識别

13.4.2 耳語音的說話人識别

13.5 耳語音的研究方向

13.6 思考與複習題

第14章 語音增強

14.1 概述

14.2 語音特性、人耳感知特性及噪聲特性

14.2.1 語音特性

14.2.2入耳感知特性

14.2.3 噪聲特性

14.3 濾波法語音增強技術

14.3.1 陷波器法

14.3.2 自适應濾波器

14.4 利用相關特性的語音增強技術

14.4.1 自相關處理抗噪法語音增強技術

14.4.2 利用複數幀段主分量特征的降噪方法

14.5 非線性處理法語音增強技術

14.5.1 中心削波法

14.5.2 同态濾波法

14.6 減譜法語音增強技術

14.6.1 基本原理

14.6.2 基本減譜法的改進

14.7 利用Weiner濾波法的語音增強技術

14.7.1 基本原理

14.7.2 Weiner濾波的改進形式

14.8 思考與複習題

附錄A 語音信号LPC美爾倒譜系數(LPCMCC)分析程序

附錄B 利用HMM的孤立字(詞)語音識别程序

附錄C 漢英名詞術語對照”

參考文獻

上一篇:學會提問

下一篇:做事先做人

相關詞條

相關搜索

其它詞條