贝叶斯的语音情感识别(附件)
语音是人类进行交流的最直接有效的方式,随着计算机技术的发展与普及,使计算机更好的实现人机交互,成为越来越多人的研究目标。基于这一研究热点,本设计首先对于语音情感识别的相关知识进行介绍,提出将贝叶斯网络分类器应用到语音情感识别中的基本观点。使用CASIA汉语情感语料库已经录制好的语音,通过opensmile软件进行语音情感特征的提取,将提取好语音情感特征按照特定说话人,相同性别,非特定说话人的标准进行分组,再使用weka软件对提取的情感特征进行特征降维,算法选择分析,通过调整贝叶斯网络分类器参数,不断提高语音情感识别率,最终获得较好的情感识别效果,通过比较每组语音情感识别的实验结果,分析贝叶斯网络在语音情感识别方面的作用和改进。关键词 语音情感识别,贝叶斯网络,贝叶斯网络分类器
目 录
1 绪论 1
1.1 研究背景 1
1.2 国内外研究现状 1
1.3 主要研究内容 2
1.4 文章内容框架 2
2 语音情感识别相关理论 3
2.1 语音情感识别系统 3
2.2 语音数据库 3
2.3 语音信号预处理 4
2.4 语音情感特征提取 5
2.5 情感识别分类算法 7
3 贝叶斯网络算法 7
3.1 贝叶斯网络的理论基础 7
3.2贝叶斯网络分类 9
3.3 贝叶斯网络的构建 10
3.4 贝叶斯网络推理 10
4 软件介绍与实验准备 11
4.1 opensmile软件 11
4.2 WEKA软件 11
5 基于贝叶斯网络的语音情感识别实验 12
5.1 语音情感特征提取 12
5.2 交叉验证 14
5.3 实验结果分析 14
5.4实验总结 24
结论 25
致谢 26
参考文献 27
1 绪论
1.1 研究背景
随着社会的发展,科技的进步,计算机技术早已被人们熟练的应用到社会的各个领域。计算机原始的计算辅助功能已经远远不能满足人类的 *好棒文|www.hbsrm.com +Q: ^351916072#
各种需求。让计算机“活起来”,能够像人一样与使用者进行沟通互动,是当今社会的迫切需要。要想让计算机能够顺畅的与人交流,就要使计算机拥有情感智能。计算机的情感智能就是指:能够准确的辨别出说话人的情感,并做出与之相适宜的反应。目前,在人工智能和机器学习领域,面向计算机的语音情感识别研究已经获得越来越多的研究者的关注和研究[1]。
1.2 国内外研究现状
1.2.1 语音情感识别研究现状
最早的语音情感识别研究出现在上个世纪八十年代,1985年Minsky教授提出了“使计算机具有情感能力”观点[2]。从此,语音情感识别的研究进入高速发展的快车道。近年来,国内外有关情感识别技术的研究取得了长足的进步。比较知名的有:在2010年,余华等人通过提取韵律学特征、音质相关特征及谐波噪声比等语音情感特征,使用优化神经网络,比较准确的识别出了生气,恐惧,高兴,平静,悲伤,惊讶六种情感[3]。2011年,黄永明先从不分帧的语音信号中,通过多尺度最优小波包分解提取全局特征,然后再从分帧后的语音信号中提取出局部特征,并利用Fisher准则进行降维,最终提出了一种“弱尺度融合”策略。将这两种特征进行融合,再利用SVM进行情感分类,效果显著[4]。2013年韩志艳等人通过遗传算法,优化小波神经网络的初始参数,能够很好的识别高兴、悲伤、害怕和愤怒这四类情感[5]。2014年,张潇丹等人使用混合蛙跳算法处理支持向量机的参数优化问题,提高了语音情感识别率[6]。2015年,陈晓东创造性地提出了卷积特征选择神经网络算法,对语音情感识别的研究做出了独特贡献[7]。
1.2.2 贝叶斯网络的研究现状
如何让计算机进行正确的情感分类,这里就要涉及到各类算法的研究。比较知名的有:隐马尔可夫型,svm支持向量机,随机森林算法,贝叶斯网络算法等。
其中贝叶斯网络对于语音情感识别方面的研究有着巨大的影响。
1988年,美国加州大学的Pearl通过对图的拓扑结构与变量之间条件独立性之间的关系的研究首次提出贝叶斯网络。贝叶斯网络一经问世就引起了学者们的广泛关注。贝叶斯网络以概率论为基础,它强大建模功能,完美的推理机制是其在各类领域成为自首可热的研究明星。
目前贝叶斯网络模型,主要有3个重点研究方向。(1)贝叶斯网络推理机制的研究[9](2)贝叶斯网络学习方法的研究[10][11](3)在实际问题领域的应用。近年来,贝叶斯网络模型在医疗诊断、自然语言理解、机器故障诊断、软件可靠性分析、机器人以及数据挖掘等方面已经取得了巨大成功和广泛应用[8]。
1.3 主要研究内容
本设计“基于贝叶斯网络的语音情感识别”,主要研究声音信号的情感特征参数,及现阶段研究处理方法。以现阶段信号处理领域使用比较广泛的情感语音信号为具体研究对象,进行相关知识的了解与学习,掌握情感特征参数计算的基本思想,提取语音情感信号的基本特征参数,研究贝叶斯网络的分类方法,并将该算法应用到语音情感识别。将贝叶斯网络分类器作为基本分类器,通过不断调整分类器参数,进行语音情感识别实验,最后分析总结实验结果。
1.4 文章内容框架
本论文的课题为基于贝叶斯网络的语音情感识别,本文共分为五个章节,其主要内容为:
第一章 绪论。介绍语音情感识别的研究背景以及语音情感识别和贝叶斯网络算法的研究现状,然后综合性的介绍本设计的主要研究内容。
第二章 语音情感识别相关理论。首先对语音情感识别系统的五大模块做了简单描述,之后再对语音情感识别系统五大模块进行了详细介绍,包括语音信号预处理,情感征提取以及高维语音信号的降维方法,最后对语音情感识别的常用分类算法进行了介绍。
第三章 贝叶斯网络算法。主要介绍了贝叶斯网络的定义、涉及到的相关概率论的知识、贝叶斯网络的性质、简单的贝叶斯网络实例、叶斯网络的主要构建步骤以及贝叶斯网络的推断。
第四章 软件介绍。此章节对于本次研究所需的软件和资料,包括weka、opensmile、IS09特征集和CASIA语音库进行了一个简单的介绍作为实验准备。
目 录
1 绪论 1
1.1 研究背景 1
1.2 国内外研究现状 1
1.3 主要研究内容 2
1.4 文章内容框架 2
2 语音情感识别相关理论 3
2.1 语音情感识别系统 3
2.2 语音数据库 3
2.3 语音信号预处理 4
2.4 语音情感特征提取 5
2.5 情感识别分类算法 7
3 贝叶斯网络算法 7
3.1 贝叶斯网络的理论基础 7
3.2贝叶斯网络分类 9
3.3 贝叶斯网络的构建 10
3.4 贝叶斯网络推理 10
4 软件介绍与实验准备 11
4.1 opensmile软件 11
4.2 WEKA软件 11
5 基于贝叶斯网络的语音情感识别实验 12
5.1 语音情感特征提取 12
5.2 交叉验证 14
5.3 实验结果分析 14
5.4实验总结 24
结论 25
致谢 26
参考文献 27
1 绪论
1.1 研究背景
随着社会的发展,科技的进步,计算机技术早已被人们熟练的应用到社会的各个领域。计算机原始的计算辅助功能已经远远不能满足人类的 *好棒文|www.hbsrm.com +Q: ^351916072#
各种需求。让计算机“活起来”,能够像人一样与使用者进行沟通互动,是当今社会的迫切需要。要想让计算机能够顺畅的与人交流,就要使计算机拥有情感智能。计算机的情感智能就是指:能够准确的辨别出说话人的情感,并做出与之相适宜的反应。目前,在人工智能和机器学习领域,面向计算机的语音情感识别研究已经获得越来越多的研究者的关注和研究[1]。
1.2 国内外研究现状
1.2.1 语音情感识别研究现状
最早的语音情感识别研究出现在上个世纪八十年代,1985年Minsky教授提出了“使计算机具有情感能力”观点[2]。从此,语音情感识别的研究进入高速发展的快车道。近年来,国内外有关情感识别技术的研究取得了长足的进步。比较知名的有:在2010年,余华等人通过提取韵律学特征、音质相关特征及谐波噪声比等语音情感特征,使用优化神经网络,比较准确的识别出了生气,恐惧,高兴,平静,悲伤,惊讶六种情感[3]。2011年,黄永明先从不分帧的语音信号中,通过多尺度最优小波包分解提取全局特征,然后再从分帧后的语音信号中提取出局部特征,并利用Fisher准则进行降维,最终提出了一种“弱尺度融合”策略。将这两种特征进行融合,再利用SVM进行情感分类,效果显著[4]。2013年韩志艳等人通过遗传算法,优化小波神经网络的初始参数,能够很好的识别高兴、悲伤、害怕和愤怒这四类情感[5]。2014年,张潇丹等人使用混合蛙跳算法处理支持向量机的参数优化问题,提高了语音情感识别率[6]。2015年,陈晓东创造性地提出了卷积特征选择神经网络算法,对语音情感识别的研究做出了独特贡献[7]。
1.2.2 贝叶斯网络的研究现状
如何让计算机进行正确的情感分类,这里就要涉及到各类算法的研究。比较知名的有:隐马尔可夫型,svm支持向量机,随机森林算法,贝叶斯网络算法等。
其中贝叶斯网络对于语音情感识别方面的研究有着巨大的影响。
1988年,美国加州大学的Pearl通过对图的拓扑结构与变量之间条件独立性之间的关系的研究首次提出贝叶斯网络。贝叶斯网络一经问世就引起了学者们的广泛关注。贝叶斯网络以概率论为基础,它强大建模功能,完美的推理机制是其在各类领域成为自首可热的研究明星。
目前贝叶斯网络模型,主要有3个重点研究方向。(1)贝叶斯网络推理机制的研究[9](2)贝叶斯网络学习方法的研究[10][11](3)在实际问题领域的应用。近年来,贝叶斯网络模型在医疗诊断、自然语言理解、机器故障诊断、软件可靠性分析、机器人以及数据挖掘等方面已经取得了巨大成功和广泛应用[8]。
1.3 主要研究内容
本设计“基于贝叶斯网络的语音情感识别”,主要研究声音信号的情感特征参数,及现阶段研究处理方法。以现阶段信号处理领域使用比较广泛的情感语音信号为具体研究对象,进行相关知识的了解与学习,掌握情感特征参数计算的基本思想,提取语音情感信号的基本特征参数,研究贝叶斯网络的分类方法,并将该算法应用到语音情感识别。将贝叶斯网络分类器作为基本分类器,通过不断调整分类器参数,进行语音情感识别实验,最后分析总结实验结果。
1.4 文章内容框架
本论文的课题为基于贝叶斯网络的语音情感识别,本文共分为五个章节,其主要内容为:
第一章 绪论。介绍语音情感识别的研究背景以及语音情感识别和贝叶斯网络算法的研究现状,然后综合性的介绍本设计的主要研究内容。
第二章 语音情感识别相关理论。首先对语音情感识别系统的五大模块做了简单描述,之后再对语音情感识别系统五大模块进行了详细介绍,包括语音信号预处理,情感征提取以及高维语音信号的降维方法,最后对语音情感识别的常用分类算法进行了介绍。
第三章 贝叶斯网络算法。主要介绍了贝叶斯网络的定义、涉及到的相关概率论的知识、贝叶斯网络的性质、简单的贝叶斯网络实例、叶斯网络的主要构建步骤以及贝叶斯网络的推断。
第四章 软件介绍。此章节对于本次研究所需的软件和资料,包括weka、opensmile、IS09特征集和CASIA语音库进行了一个简单的介绍作为实验准备。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/688.html