卷积神经网络的人脸表情识别及特征可视化(附件)
针对人脸表情识别中卷积神经网络和传统算法的区别,搭建卷积神经网络模型,与传统的特征提取算法所提取的特征和准确率进行对比,并使用反卷积可视化技术得到网络提取特征时将眼部和嘴部组成的T型区域作为关键部位。基于TensorFlow框架搭建神经网络,使用Python语言实现,使用扩充后的CK+数据库作为数据集,分别使用最小二值模式,Haar-like特征和Gabor小波变换三种传统的特征提取技术,结合线性判别分析降维和主成分分析,使用支持向量机进行分类。最终准确率分别为0.92,0.82,0.78。而使用CNN得到的预测准确率可以达到0.97。通过反卷积得到网络模型在识别过程中将人脸的眼部、鼻子和嘴部组成的T型区域作为关键部位进行识别。
目录
摘要 3
关键词 3
Abstract 3
Keywords 4
引言 4
1. 选题背景 4
1.1 问题的提出 4
1.2 国内外研究状况 4
1.2.1国外研究状况 4
1.2.1国内研究状况 4
1.3 研究的目的和内容 5
2. 基于传统方法的人脸表情识别 5
2.1 传统特征提取方法 5
2.1.1局部二值模式 5
2.1.2 HaarLike特征 7
2.1.3 Gabor滤波 9
2.4 主成分分析(PAC) 10
2.5 线性判别分析(LDA) 10
2.6 传统方法的结果对比 11
3. 基于深度卷积神经网络的人脸表情识别 11
3.1 卷积神经网络 11
3.1.1卷积神经网络模型 11
3.1.2卷积层 12
3.1.3池化采样 12
3.2 数据集及预处理 12
3.4 神经网络模型训练 13
3.5 模型识别性能比较 14
3.6反卷积可视化 17
3.6.1 反卷积获得的图像特征 17
3.6.2不同参数对反卷结果的影响 19
4. 界面展示 22
5. *好棒文|www.hbsrm.com +Q: ¥351916072$
总结和展望 25
致谢 25
参考文献 25
基于卷积神经网络的人脸表情识别及特征可视化
引言
引言
选题背景
问题的提出
当前,人工智能和图像识别技术日趋成熟,并且不断发展逐渐融入我们的日常生活中。其中,人脸的表情和姿态的识别因其技术的综合性和贴近生活,已经成为了非常热门而且与人们生活关系密切的研究方向。早于上世纪60年代,已经有人开始了人脸表情的研究,经过这么多年的发展和进步,诞生了丰富多样的研究方法。近年来,提出的深度学习的方法,相较于传统的机器学习算法有着很大的不同,也是目前研究的热点之一。卷积神经网络(Convolution Neural Network,CNN)是近年来新发展起来的一种十分优秀的深度学习算法,相比于传统的算法,CNN不再需要专门的特征提取阶段,可以直接将原始图像作为卷积神经网络的输入,将特征提取的过程放在神经网络学习中。我们可以通过反卷积可视化技术获取其学习得到的特征图像,从而更深入了解机器学习的方式,加深对深度学习技术的认识。
国内外研究状况
1.2.1国外研究状况
人脸表情的识别最早开始于1971年,P Ekman和W V Friesen针对人类的面部表情变化[1],设定了6中表情,分别是吃惊,厌恶,害怕,高兴,生气和伤心,这种划分方式直到今天仍在使用。2006年,K.Anderson 和P.W.McOwan提出了一个实时的人脸表情自动识别系统[2],可以对人脸表情 进行实时识别,它涉及到面部动作编码系统(Facial Action Coding System,FACS),采用运动单元(ActionUnit,AU)来对表情进行刻画。Osadchy M等[3]将在人脸检测和姿态估计中应用卷积网络,他们搭建的可训练系统,能够将原始图像映射的低维子空间中。Huang G B等[4]利用卷积深度信念网络(Convolution Depth Belief Network,CDBM)来学习多层次特征,通过局部卷积波尔兹曼机得到全局结构,该网络不仅可以用于训练灰度图像,还可以用于训练LBP图像。
1.2.1国内研究状况
在国内,一些高校,如东南大学,北京大学,中科院等最早开始对人脸表情进行研究并取得了不小的成果。2004年,东南大学就已经成功研发出了一种人脸表情实时识别的系统而且组建了一个大规模的数据库,他们将获取到的表情图片与数据库进行对比从而得到其表情的分类。中科院计算所针对人脸的不同表情进行检测识别并获得了不小的进展。识别时使用机器学习中的传统特征提取方法主要使用Haarlike特征[5],Gabor小波变换[6]和局部二值模式(Local Binary Pattern,LBP)[7]等,然后通过主成分分析(Principal Companent Analysis,PCA)[8]和线性判别分析(Linear Discriminant Analysis,LDA)[9]来进行降维以及处理[10,11]。
研究的目的和内容
本次研究基于卷积神经网络算法对人脸表情进行识别,主要的研究内容如下
(1)学习并了解CNN的基本原理和实现方式,并通过TensorFlow架构搭建神经网络,并实现人脸图像的识别系统。
(2)研究并实现若干种样本扩充技术,对标准库中的有限张图像进行样本扩充,获得足够数量的学习和测试样本。
(3)了解并分析已有的标准人脸表情库,使用标准表情库对神经网络进行训练和测试。调整神经网络参数和探索不同的网络结构和不同参数对表情识别的影响,得到一个预测效果较好的网络模型。并尝试使用反卷积可视化技术得到其提取的特征。
(4)对传统特征提取方法进行学习和实现,使用传统方法进行表情识别,并比较它们的结果和CNN的差异。
本文就使用深度卷积神经网络与传统识别方法在人脸表情识别中进行算法对比。本文共分为六章,第一章根据文献综述问题提出的背景和当前国内外研究的情况,第二章介绍了本文使用到的三种传统特征提取方法和两种降维方法,第三章介绍深度学习中以及卷积神经网络的特点,第四章具体介绍本文使用的神经网络模型以及数据和结果的处理方法,并对传统算法和神经网络预测结果进行对比,第五章介绍最终完成的界面设计和使用说明,第六章总结全文工作。
目录
摘要 3
关键词 3
Abstract 3
Keywords 4
引言 4
1. 选题背景 4
1.1 问题的提出 4
1.2 国内外研究状况 4
1.2.1国外研究状况 4
1.2.1国内研究状况 4
1.3 研究的目的和内容 5
2. 基于传统方法的人脸表情识别 5
2.1 传统特征提取方法 5
2.1.1局部二值模式 5
2.1.2 HaarLike特征 7
2.1.3 Gabor滤波 9
2.4 主成分分析(PAC) 10
2.5 线性判别分析(LDA) 10
2.6 传统方法的结果对比 11
3. 基于深度卷积神经网络的人脸表情识别 11
3.1 卷积神经网络 11
3.1.1卷积神经网络模型 11
3.1.2卷积层 12
3.1.3池化采样 12
3.2 数据集及预处理 12
3.4 神经网络模型训练 13
3.5 模型识别性能比较 14
3.6反卷积可视化 17
3.6.1 反卷积获得的图像特征 17
3.6.2不同参数对反卷结果的影响 19
4. 界面展示 22
5. *好棒文|www.hbsrm.com +Q: ¥351916072$
总结和展望 25
致谢 25
参考文献 25
基于卷积神经网络的人脸表情识别及特征可视化
引言
引言
选题背景
问题的提出
当前,人工智能和图像识别技术日趋成熟,并且不断发展逐渐融入我们的日常生活中。其中,人脸的表情和姿态的识别因其技术的综合性和贴近生活,已经成为了非常热门而且与人们生活关系密切的研究方向。早于上世纪60年代,已经有人开始了人脸表情的研究,经过这么多年的发展和进步,诞生了丰富多样的研究方法。近年来,提出的深度学习的方法,相较于传统的机器学习算法有着很大的不同,也是目前研究的热点之一。卷积神经网络(Convolution Neural Network,CNN)是近年来新发展起来的一种十分优秀的深度学习算法,相比于传统的算法,CNN不再需要专门的特征提取阶段,可以直接将原始图像作为卷积神经网络的输入,将特征提取的过程放在神经网络学习中。我们可以通过反卷积可视化技术获取其学习得到的特征图像,从而更深入了解机器学习的方式,加深对深度学习技术的认识。
国内外研究状况
1.2.1国外研究状况
人脸表情的识别最早开始于1971年,P Ekman和W V Friesen针对人类的面部表情变化[1],设定了6中表情,分别是吃惊,厌恶,害怕,高兴,生气和伤心,这种划分方式直到今天仍在使用。2006年,K.Anderson 和P.W.McOwan提出了一个实时的人脸表情自动识别系统[2],可以对人脸表情 进行实时识别,它涉及到面部动作编码系统(Facial Action Coding System,FACS),采用运动单元(ActionUnit,AU)来对表情进行刻画。Osadchy M等[3]将在人脸检测和姿态估计中应用卷积网络,他们搭建的可训练系统,能够将原始图像映射的低维子空间中。Huang G B等[4]利用卷积深度信念网络(Convolution Depth Belief Network,CDBM)来学习多层次特征,通过局部卷积波尔兹曼机得到全局结构,该网络不仅可以用于训练灰度图像,还可以用于训练LBP图像。
1.2.1国内研究状况
在国内,一些高校,如东南大学,北京大学,中科院等最早开始对人脸表情进行研究并取得了不小的成果。2004年,东南大学就已经成功研发出了一种人脸表情实时识别的系统而且组建了一个大规模的数据库,他们将获取到的表情图片与数据库进行对比从而得到其表情的分类。中科院计算所针对人脸的不同表情进行检测识别并获得了不小的进展。识别时使用机器学习中的传统特征提取方法主要使用Haarlike特征[5],Gabor小波变换[6]和局部二值模式(Local Binary Pattern,LBP)[7]等,然后通过主成分分析(Principal Companent Analysis,PCA)[8]和线性判别分析(Linear Discriminant Analysis,LDA)[9]来进行降维以及处理[10,11]。
研究的目的和内容
本次研究基于卷积神经网络算法对人脸表情进行识别,主要的研究内容如下
(1)学习并了解CNN的基本原理和实现方式,并通过TensorFlow架构搭建神经网络,并实现人脸图像的识别系统。
(2)研究并实现若干种样本扩充技术,对标准库中的有限张图像进行样本扩充,获得足够数量的学习和测试样本。
(3)了解并分析已有的标准人脸表情库,使用标准表情库对神经网络进行训练和测试。调整神经网络参数和探索不同的网络结构和不同参数对表情识别的影响,得到一个预测效果较好的网络模型。并尝试使用反卷积可视化技术得到其提取的特征。
(4)对传统特征提取方法进行学习和实现,使用传统方法进行表情识别,并比较它们的结果和CNN的差异。
本文就使用深度卷积神经网络与传统识别方法在人脸表情识别中进行算法对比。本文共分为六章,第一章根据文献综述问题提出的背景和当前国内外研究的情况,第二章介绍了本文使用到的三种传统特征提取方法和两种降维方法,第三章介绍深度学习中以及卷积神经网络的特点,第四章具体介绍本文使用的神经网络模型以及数据和结果的处理方法,并对传统算法和神经网络预测结果进行对比,第五章介绍最终完成的界面设计和使用说明,第六章总结全文工作。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/416.html