基于gabor波的水声语音基音提取算法研究
基于gabor波的水声语音基音提取算法研究[20191212175218]
摘 要
语音信号的基音周期是描述激励源的重要特征参数之一,无论是语音分析与合成、语音压缩编码,还是语音识别等,准确可靠地检测语音信号的基音周期都至关重要,将直接影响到整个系统的性能。但是影响基音周期提取的因素很多,准确提取基音周期比较困难。
论文首先对语音信号处理作简单的介绍,对基音周期的检测提取的重要性进行说明,然后对语音信号在时域和频域两个方面进行分析讲解。论文重点是基音提取小波算法研究,为了体现小波算法的优点,本文先进行了自相关法和短时平均幅度差函数法的简单介绍。两种方法可以实现基音的检测,但是会出现错误,例如出现“半频”和“倍频”。而且存在噪声时,两种方法对基音检测的精确度就更差了,难以实现基音周期的准确检测和提取。
论文重点介绍的是基于gabor波的语音基音提取算法研究。该算法共三个步骤:基音周期的粗定位,基音周期的轨迹平滑和基音周期的精定位。该方法能较为准确的对基音周期进行检测提取,精度高,连续性好,在噪声存在的情况下也能很好的实现语音基音的检测提取,具有良好的抗噪性能。
查看完整论文请+Q: 351916072
关键字:语音基音提取,自相关函数,平均幅度差函数,小波变换法
目 录
摘 要 I
ABSTRACT II
第1章 绪论 1
1.1引言 1
1.1.1 语音信号处理的认识 1
1.1.2 语音信号的基音周期 2
1.2 语音的基音检测 2
1.2.1 语音基音检测的重要性 2
1.2.2 影响语音基音检测的因素 3
1.2.3 语音基音检测的方法 3
1.3论文的主要工作和结构安排 4
1.3.1 论文的主要研究内容 4
1.3.2 论文的结构安排 4
第2章 语音信号分析 6
2.1语音信号时域分析 6
2.2 语音信号的频域分析 9
2.3 本章小结 10
第3章 基音检测算法 11
3.1 自相关函数(ACF)法 11
3.2 平均幅度差函数(AMDF)法 12
3.3 小波变换法 13
3.4 本章小结 15
第4章 基于小波变换的基音检测 16
4.1 算法总框架 16
4.2 基音周期粗定位 16
4.3 基音周期轨迹平滑 21
4.3.1轨迹平滑流程图 22
4.3.2轨迹平滑的四个参数 24
4.4 基音周期精定位 27
4.5本章小结 30
第5章 实验结果 32
5.1 基音检测结果 32
5.2 含噪语音基音检测结果 33
5.3本章小结 34
第6章 总结 36
参考文献 37
致谢 39
第1章 绪论
1.1引言
水声通信是一项在水下收发信息的技术,而语音信号的水下传输是水声通信的重要组成部分,语音信号处理技术发挥着越来越重要的作用。在高度信息化的今天,用现代手段研究语音处理技术,能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进水声通信的发展具有十分重要的意义。基音周期是语音信号处理重要的参数,对于语音识别,语音合成等都非常重要。
1.1.1 语音信号处理的认识
语音信号处理技术简称语音处理,它与语言学、语音学、心理学、声学、计算机学以及人工智能等学科都有着紧密的联系,极大地推动了社会的进步,我们可以用自动语音识别技术,使手写文稿和手工打印文本变成自动听写机操作;把人工查阅各种书面文字资料的操作变成为口呼自动查阅各种各样的数据库;可以采用语音合成技术,将存储的语音或文字资料转化成语音高质量的回放,甚至自动翻译成另外一种语言的语音回放或者进行文字显示。随着计算机运行速度越来越快,可以想象语音处理领域也会不断繁荣,不久的将来会进入一个真正的人机交互时代。总而言之,语音信号处理技术的研究对于信息化社会的发展有着极其重要的意义[1]。
语音信号处理主要包括语音识别、语音合成、语音编码和语音增强等四大分支。语音识别技术是指计算机系统能够根据输入的语音识别出其代表的具体意义,进而完成相应的功能[2-3]。一般的方法是事先让用户朗读有一定数量文字、符号的文档,通过录音装置输入、存储到计算机,作为声音样本。以后,当用户通过语音识别系统操作计算机时,用户的声音通过转换装置进入计算机内部,语音识别技术便将用户输入的声音与事先存储好的声音样本进行对比。系统根据对比结果,输入一个它认为最“像”的声音样本序号,就可以知道用户刚才念的声音是什么意义,进而执行此命令。因此通过语音识别技术,计算机可以“听”懂人的语言。
语音合成是人机语声的一个重要组成部分,语音合成技术赋予机器“人工嘴巴”的功能,即解决让机器说话问题。是将计算机自己产生的或外部输入的文字信息,比如文本文件内容、WORD文件内容等文字信息,按语音处理规则转换成语音信号输出,即使计算机流利地读出文字信息,使人们通过“听”就可以明白信息的内容。也就是说,使计算机具有了“说”的能力,能够将信息“读”给人类听。
语音编码就是将模拟语音信号数字化,数字化之后可以作为数字信号传输、存储或处理,可以充分利用数字信号处理的各种技术。为了减小存储空间或降低传输比特率节省带宽,还需要对数字化之后的语音信号进行压缩编码,这就是语音压缩编码技术。语音压缩编码的目的就是用尽可能低的数码率获得尽可能好的合成语音质量,同时又要使编码过程的计算代价尽可能小。语音压缩编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到普遍应用,起着举足轻重的作用。语音增强就是从有噪声语音中提取纯净语音,也即语音消噪。语音增强主要应用范围是降低听觉噪声、识别系统的预处理和线性预测编码的预处理,这种技术对于语音识别和说话人识别是十分重要的。
1.1.2 语音信号的基音周期
人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量[1]。这种声带振动的频率称为基频,相应的周期就称为基音周期(Pitch),它由声带逐渐开启到面积最大(约占基音周期的50%)、逐渐关闭到完全闭合(约占基音周期的35%)、完全闭合(约占基音周期的15%)三部分组成。
基音周期具有时变性和准周期性,它的大小与个人声带的长短、厚薄、韧性和发音习惯有关,还与发音者的性别、年龄、发音时的力度及情感有关,一般来说,男性说话者的基音频率较低,大致分布在70~200Hz的范围内,而女性说话者和小孩的基音频率相对较高,在200~450Hz之间。
1.2 语音的基音检测
1.2.1 语音基音检测的重要性
基音周期的估计称为基音检测 (Pitch Detection),基音检测的最终目标是画出和声带振动频率完全一致的基音周期变化轨迹曲线,如不可能则尽量找出相吻合的轨迹曲线。在语音信号处理中,语音信号参数提取的准确性非常重要。只有获得准确的参数,才能利用这些参数进行高效的处理,而在许多参数提取中,基音周期的提取尤为重要,广泛地应用于语音压缩编码、语音分析合成以及语音识别等方面,所以,准确可靠地估计并提取基音周期对语音信号处理至关重要 。它直接影响到合成语音是否真实再现原始语音信号,影响到语音识别的识别率,影响到语音压缩编码的正确率。
1.2.2 影响语音基音检测的因素
基音周期的精确检测是一件比较困难的事情,基音提取的主要困难反映在 :
语音信号变化十分复杂,声门激励的波形并不是一个完全的周期序列。在语音的头尾部并不具有声带振动那样的周期性,对有些清浊音的过渡帧很难判定它属于周期性还是非周期性,从而对估计基音周期带来一定的影响[6-7]。
从语音信号中去除声道的影响,直接取出仅与声带振动有关的声源信息并非易事。如声道共振峰可能强烈改变声门波形的结构,从而严重影响激励信号的谐波结构,会给基音检测造成困难。语音信号是准周期的,且共振峰结构和噪声有时会影响波峰和过零率,很难准确定位基音周期的开始和结束。
区分清音语音和低电平浊音段是导致基音检测困难的另一个重要因素。在许多情况下,清音语音与低电平浊音段之间的过度段是非常细微的,确认它是极其困难的。
基音周期变化范围较大,浊音信号可能包括很多谐波分量,而基波分量往往不是最强的分量,这些谐波成分叠加在一起,使语音信号的波形变得很复杂,给基音检测带来困难,经常发生基频估计结果比实际基音频率大很多。
由于这些困难,尽管基音提取的方法很多,但迄今尚未找到一个完善的方法可以在各种环境条件情况下都能获得满意的检测结果。
1.2.3 语音基音检测的方法
尽管基音周期检测有许多困难,但因为它的重要性,基音周期检测一直是一个研究的重要课题。为了从语音波形中准确地提取基音的工作,使全世界的科学家忙了几十年,从20世纪60年代以来出现了很多种基音周期检测方法,特别是在有噪环境下的语音信号的基音周期检测方面更是提出了许多有效的方法。进行基音检测方面早期研究工作的国家主要有美国等欧美国家,之后,我国在基音检测方面,尤其是对汉语的基音检测工作也取得了很大进展。为了提高基音检测的
方法出发,开发了许多基音检测算法。
自相关函数法(ACF)是Ross等人于1977年提出的 ,自相关函数法的原理是周期信号的自相关函数将在时延等于函数周期的地方产生一个极大值,因此通过计算语音信号的自相关函数可以估计信号的基音。自相关函数方法适合于噪声环境下,但单独使用经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况[8]。
平均幅度差函数法(AMDF)是Ross等人于1974年提出的[14] ,平均幅度差函数法无需乘法运算,因而算法复杂度小。倒谱法是由Noll等人于1967年提出的 ,这种算法的优点是对纯净语音的基音检测精度较高,可以较好地从语音信号中分离出基音信息和声道信息,缺点是算法比较复杂。
平均幅度差法(AMDF)、自相关(ACF)法在静音环境下或噪声较小时都可以取得较好的检测结果,但在语音环境较恶劣、信噪比较低时,检测的结果下降较快,难以让人满意 。
小波变换在时域和频域都具有良好的局部性特性,它是一种信号的时间-尺度分析方法,具有多分辨分析的特点,能有效的从信号中提取信息。小波就像一种共轭镜象滤波器,每一次变换,就是把信号分成高频和低频分量,如果对变换后的低频分量再进行变换,得到的将是更为低频的分量,逐次进行下去,就可以得到去除了高次谐波,保留了基频的成分的低频分量,这样就得到近似于只有基频成分的波形,因此可以在时域上得到所有的基音峰值点。采用小波变换能够很好的进行语音基音的检测提取,和自相关法和平均幅度差函数法相比,精确度高,连续性好,较为准确的提取基音周期[16]。
1.3论文的主要工作和结构安排
1.3.1 论文的主要研究内容
论文主要研究基于gabor波的水声语音基音提取算法研究。gabor波是小波的一种,相对简单,它的窗函数采用的是高斯函数。本文研究的是自适应谱加权算法,通过与自相关法和平均幅度差函数法相比较,来说明自相关法和平均幅度差函数法存在的缺点,体现小波变换法的优点。
1.3.2 论文的结构安排
第一章:绪论。本章首先是对语音信号处理的认识,语音信号处理的意义及其重要性介绍。然后介绍语音基音周期提取在语音处理中的重要意义,阐述基音检测存在的问题和困难性,以及现在基音检测的方法。
第二章:语音信号分析。从语音信号的时域和频域进行分析,利用软件进行仿真做实验,对一段语音进行分析,先直观感受语音的一些特性,根据波形估算出基音周期。
第三章:本章讲一些传统的基音提取检测方法,ACF法和AMDF法。通过介绍这些传统的方法,利用软件分别进行两种方法的基音周期检测,通过实验结果得出基音周期,最后对小波变换进行简单的描述。
第四章:基音检测。这是本章的精髓。本章介绍研究一种基于gabor波的小波算法-自适应谱加权基音检测算法。该种算法从三个方面研究,分为粗定位,轨迹平滑和精定位。这种算法能精确实现基音检测。
第五章:本章是实验结果,用自适应谱加权算法实现基音周期的检测并与传统的方法,ACF法和AMDF法比较。在存在噪声的情况下再次比较效果。
第六章:我会对整个毕业设计做一个总结,总结学习中的经验,遇到的困难。谈谈自己感受。
最后附上参考文献,致谢。
第2章 语音信号分析
2.1语音信号时域分析
语音信号的最基本组成单位是音素,音素可分为“清音”和“浊音”两大类。音节是音素结合而成的语音流最小单位,是发声的最小单位。基音存在于浊音当中。语音信号首先要进行分析才能分清浊音还是清音,这是前提基础。所以要想对基音周期提取,就要对语音进行时域和频率的分析[17-18]。语音信号分析是前提和基础,只有分析出表征语音信号本质特征的参数,才能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。语音合成的音质好坏,语音识别率的高低,都取决于对语音信号分析的准确性和精确性。
摘 要
语音信号的基音周期是描述激励源的重要特征参数之一,无论是语音分析与合成、语音压缩编码,还是语音识别等,准确可靠地检测语音信号的基音周期都至关重要,将直接影响到整个系统的性能。但是影响基音周期提取的因素很多,准确提取基音周期比较困难。
论文首先对语音信号处理作简单的介绍,对基音周期的检测提取的重要性进行说明,然后对语音信号在时域和频域两个方面进行分析讲解。论文重点是基音提取小波算法研究,为了体现小波算法的优点,本文先进行了自相关法和短时平均幅度差函数法的简单介绍。两种方法可以实现基音的检测,但是会出现错误,例如出现“半频”和“倍频”。而且存在噪声时,两种方法对基音检测的精确度就更差了,难以实现基音周期的准确检测和提取。
论文重点介绍的是基于gabor波的语音基音提取算法研究。该算法共三个步骤:基音周期的粗定位,基音周期的轨迹平滑和基音周期的精定位。该方法能较为准确的对基音周期进行检测提取,精度高,连续性好,在噪声存在的情况下也能很好的实现语音基音的检测提取,具有良好的抗噪性能。
查看完整论文请+Q: 351916072
关键字:语音基音提取,自相关函数,平均幅度差函数,小波变换法
目 录
摘 要 I
ABSTRACT II
第1章 绪论 1
1.1引言 1
1.1.1 语音信号处理的认识 1
1.1.2 语音信号的基音周期 2
1.2 语音的基音检测 2
1.2.1 语音基音检测的重要性 2
1.2.2 影响语音基音检测的因素 3
1.2.3 语音基音检测的方法 3
1.3论文的主要工作和结构安排 4
1.3.1 论文的主要研究内容 4
1.3.2 论文的结构安排 4
第2章 语音信号分析 6
2.1语音信号时域分析 6
2.2 语音信号的频域分析 9
2.3 本章小结 10
第3章 基音检测算法 11
3.1 自相关函数(ACF)法 11
3.2 平均幅度差函数(AMDF)法 12
3.3 小波变换法 13
3.4 本章小结 15
第4章 基于小波变换的基音检测 16
4.1 算法总框架 16
4.2 基音周期粗定位 16
4.3 基音周期轨迹平滑 21
4.3.1轨迹平滑流程图 22
4.3.2轨迹平滑的四个参数 24
4.4 基音周期精定位 27
4.5本章小结 30
第5章 实验结果 32
5.1 基音检测结果 32
5.2 含噪语音基音检测结果 33
5.3本章小结 34
第6章 总结 36
参考文献 37
致谢 39
第1章 绪论
1.1引言
水声通信是一项在水下收发信息的技术,而语音信号的水下传输是水声通信的重要组成部分,语音信号处理技术发挥着越来越重要的作用。在高度信息化的今天,用现代手段研究语音处理技术,能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进水声通信的发展具有十分重要的意义。基音周期是语音信号处理重要的参数,对于语音识别,语音合成等都非常重要。
1.1.1 语音信号处理的认识
语音信号处理技术简称语音处理,它与语言学、语音学、心理学、声学、计算机学以及人工智能等学科都有着紧密的联系,极大地推动了社会的进步,我们可以用自动语音识别技术,使手写文稿和手工打印文本变成自动听写机操作;把人工查阅各种书面文字资料的操作变成为口呼自动查阅各种各样的数据库;可以采用语音合成技术,将存储的语音或文字资料转化成语音高质量的回放,甚至自动翻译成另外一种语言的语音回放或者进行文字显示。随着计算机运行速度越来越快,可以想象语音处理领域也会不断繁荣,不久的将来会进入一个真正的人机交互时代。总而言之,语音信号处理技术的研究对于信息化社会的发展有着极其重要的意义[1]。
语音信号处理主要包括语音识别、语音合成、语音编码和语音增强等四大分支。语音识别技术是指计算机系统能够根据输入的语音识别出其代表的具体意义,进而完成相应的功能[2-3]。一般的方法是事先让用户朗读有一定数量文字、符号的文档,通过录音装置输入、存储到计算机,作为声音样本。以后,当用户通过语音识别系统操作计算机时,用户的声音通过转换装置进入计算机内部,语音识别技术便将用户输入的声音与事先存储好的声音样本进行对比。系统根据对比结果,输入一个它认为最“像”的声音样本序号,就可以知道用户刚才念的声音是什么意义,进而执行此命令。因此通过语音识别技术,计算机可以“听”懂人的语言。
语音合成是人机语声的一个重要组成部分,语音合成技术赋予机器“人工嘴巴”的功能,即解决让机器说话问题。是将计算机自己产生的或外部输入的文字信息,比如文本文件内容、WORD文件内容等文字信息,按语音处理规则转换成语音信号输出,即使计算机流利地读出文字信息,使人们通过“听”就可以明白信息的内容。也就是说,使计算机具有了“说”的能力,能够将信息“读”给人类听。
语音编码就是将模拟语音信号数字化,数字化之后可以作为数字信号传输、存储或处理,可以充分利用数字信号处理的各种技术。为了减小存储空间或降低传输比特率节省带宽,还需要对数字化之后的语音信号进行压缩编码,这就是语音压缩编码技术。语音压缩编码的目的就是用尽可能低的数码率获得尽可能好的合成语音质量,同时又要使编码过程的计算代价尽可能小。语音压缩编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到普遍应用,起着举足轻重的作用。语音增强就是从有噪声语音中提取纯净语音,也即语音消噪。语音增强主要应用范围是降低听觉噪声、识别系统的预处理和线性预测编码的预处理,这种技术对于语音识别和说话人识别是十分重要的。
1.1.2 语音信号的基音周期
人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量[1]。这种声带振动的频率称为基频,相应的周期就称为基音周期(Pitch),它由声带逐渐开启到面积最大(约占基音周期的50%)、逐渐关闭到完全闭合(约占基音周期的35%)、完全闭合(约占基音周期的15%)三部分组成。
基音周期具有时变性和准周期性,它的大小与个人声带的长短、厚薄、韧性和发音习惯有关,还与发音者的性别、年龄、发音时的力度及情感有关,一般来说,男性说话者的基音频率较低,大致分布在70~200Hz的范围内,而女性说话者和小孩的基音频率相对较高,在200~450Hz之间。
1.2 语音的基音检测
1.2.1 语音基音检测的重要性
基音周期的估计称为基音检测 (Pitch Detection),基音检测的最终目标是画出和声带振动频率完全一致的基音周期变化轨迹曲线,如不可能则尽量找出相吻合的轨迹曲线。在语音信号处理中,语音信号参数提取的准确性非常重要。只有获得准确的参数,才能利用这些参数进行高效的处理,而在许多参数提取中,基音周期的提取尤为重要,广泛地应用于语音压缩编码、语音分析合成以及语音识别等方面,所以,准确可靠地估计并提取基音周期对语音信号处理至关重要 。它直接影响到合成语音是否真实再现原始语音信号,影响到语音识别的识别率,影响到语音压缩编码的正确率。
1.2.2 影响语音基音检测的因素
基音周期的精确检测是一件比较困难的事情,基音提取的主要困难反映在 :
语音信号变化十分复杂,声门激励的波形并不是一个完全的周期序列。在语音的头尾部并不具有声带振动那样的周期性,对有些清浊音的过渡帧很难判定它属于周期性还是非周期性,从而对估计基音周期带来一定的影响[6-7]。
从语音信号中去除声道的影响,直接取出仅与声带振动有关的声源信息并非易事。如声道共振峰可能强烈改变声门波形的结构,从而严重影响激励信号的谐波结构,会给基音检测造成困难。语音信号是准周期的,且共振峰结构和噪声有时会影响波峰和过零率,很难准确定位基音周期的开始和结束。
区分清音语音和低电平浊音段是导致基音检测困难的另一个重要因素。在许多情况下,清音语音与低电平浊音段之间的过度段是非常细微的,确认它是极其困难的。
基音周期变化范围较大,浊音信号可能包括很多谐波分量,而基波分量往往不是最强的分量,这些谐波成分叠加在一起,使语音信号的波形变得很复杂,给基音检测带来困难,经常发生基频估计结果比实际基音频率大很多。
由于这些困难,尽管基音提取的方法很多,但迄今尚未找到一个完善的方法可以在各种环境条件情况下都能获得满意的检测结果。
1.2.3 语音基音检测的方法
尽管基音周期检测有许多困难,但因为它的重要性,基音周期检测一直是一个研究的重要课题。为了从语音波形中准确地提取基音的工作,使全世界的科学家忙了几十年,从20世纪60年代以来出现了很多种基音周期检测方法,特别是在有噪环境下的语音信号的基音周期检测方面更是提出了许多有效的方法。进行基音检测方面早期研究工作的国家主要有美国等欧美国家,之后,我国在基音检测方面,尤其是对汉语的基音检测工作也取得了很大进展。为了提高基音检测的
方法出发,开发了许多基音检测算法。
自相关函数法(ACF)是Ross等人于1977年提出的 ,自相关函数法的原理是周期信号的自相关函数将在时延等于函数周期的地方产生一个极大值,因此通过计算语音信号的自相关函数可以估计信号的基音。自相关函数方法适合于噪声环境下,但单独使用经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况[8]。
平均幅度差函数法(AMDF)是Ross等人于1974年提出的[14] ,平均幅度差函数法无需乘法运算,因而算法复杂度小。倒谱法是由Noll等人于1967年提出的 ,这种算法的优点是对纯净语音的基音检测精度较高,可以较好地从语音信号中分离出基音信息和声道信息,缺点是算法比较复杂。
平均幅度差法(AMDF)、自相关(ACF)法在静音环境下或噪声较小时都可以取得较好的检测结果,但在语音环境较恶劣、信噪比较低时,检测的结果下降较快,难以让人满意 。
小波变换在时域和频域都具有良好的局部性特性,它是一种信号的时间-尺度分析方法,具有多分辨分析的特点,能有效的从信号中提取信息。小波就像一种共轭镜象滤波器,每一次变换,就是把信号分成高频和低频分量,如果对变换后的低频分量再进行变换,得到的将是更为低频的分量,逐次进行下去,就可以得到去除了高次谐波,保留了基频的成分的低频分量,这样就得到近似于只有基频成分的波形,因此可以在时域上得到所有的基音峰值点。采用小波变换能够很好的进行语音基音的检测提取,和自相关法和平均幅度差函数法相比,精确度高,连续性好,较为准确的提取基音周期[16]。
1.3论文的主要工作和结构安排
1.3.1 论文的主要研究内容
论文主要研究基于gabor波的水声语音基音提取算法研究。gabor波是小波的一种,相对简单,它的窗函数采用的是高斯函数。本文研究的是自适应谱加权算法,通过与自相关法和平均幅度差函数法相比较,来说明自相关法和平均幅度差函数法存在的缺点,体现小波变换法的优点。
1.3.2 论文的结构安排
第一章:绪论。本章首先是对语音信号处理的认识,语音信号处理的意义及其重要性介绍。然后介绍语音基音周期提取在语音处理中的重要意义,阐述基音检测存在的问题和困难性,以及现在基音检测的方法。
第二章:语音信号分析。从语音信号的时域和频域进行分析,利用软件进行仿真做实验,对一段语音进行分析,先直观感受语音的一些特性,根据波形估算出基音周期。
第三章:本章讲一些传统的基音提取检测方法,ACF法和AMDF法。通过介绍这些传统的方法,利用软件分别进行两种方法的基音周期检测,通过实验结果得出基音周期,最后对小波变换进行简单的描述。
第四章:基音检测。这是本章的精髓。本章介绍研究一种基于gabor波的小波算法-自适应谱加权基音检测算法。该种算法从三个方面研究,分为粗定位,轨迹平滑和精定位。这种算法能精确实现基音检测。
第五章:本章是实验结果,用自适应谱加权算法实现基音周期的检测并与传统的方法,ACF法和AMDF法比较。在存在噪声的情况下再次比较效果。
第六章:我会对整个毕业设计做一个总结,总结学习中的经验,遇到的困难。谈谈自己感受。
最后附上参考文献,致谢。
第2章 语音信号分析
2.1语音信号时域分析
语音信号的最基本组成单位是音素,音素可分为“清音”和“浊音”两大类。音节是音素结合而成的语音流最小单位,是发声的最小单位。基音存在于浊音当中。语音信号首先要进行分析才能分清浊音还是清音,这是前提基础。所以要想对基音周期提取,就要对语音进行时域和频率的分析[17-18]。语音信号分析是前提和基础,只有分析出表征语音信号本质特征的参数,才能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。语音合成的音质好坏,语音识别率的高低,都取决于对语音信号分析的准确性和精确性。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/gdxx/481.html