卷积神经网络的研究及其在手势识别上的应用(源码)【字数:9669】
摘 要手势是人们日常交流中的一种重要的肢体语言。手势识别,作为智能化的人机交互方式,具有很大的未来市场。传统的手势识别方法有很多的局限性,于是新的识别方式的引入很有必要。卷积神经网络是一种鲁棒性强的深度学习算法,它在图像识别领域优势明显。所以将卷积神经网络应用到手势识别上很有意义。本课题研究的内容是如何用卷积神经网络实现手势识别,并通过参数调整和优化提高算法的正确率。课题核心介绍了本系统的开发环境和卷积神经网络的算法结构,并通过对比实验证实了本系统的优越性。
on; Good Robustness 目 录
第一章 绪论 1
1.1课题研究的背景和意义 1
1.2课题研究的现状 1
1.2.1手势识别的研究现状 1
1.2.2卷积神经网络的研究现状 2
1.3内容安排 3
第二章 开发环境 4
2.1 Linux 4
2.2 Theano 4
2.3 Keras 5
2.4 Python 5
第三章 基于CNN的手势识别 7
3.1 CNN算法原理 7
3.1.1 CNN网络结构 7
3.1.2 卷积神经网络的训练过程 8
3.2 手势数据 8
3.3 实验系统设计 9
3.4 实验结果 11
3.4.1 实验环境说明 11
3.4.2 实验参数说明 11
3.4.3 实验结果说明 12
结束语 15
致 谢 17
参考文献 18
第一章 绪论
1.1课题研究的背景和意义
前有AlphaGo大战李世石,后有Master屡胜各国围棋高手。人工智能俨然成为人们关注的热点话题。
人工智能(Artificial Intelligence,AI)是计算机科学技术中的一个热点研究方向,它企图了解智能的实质,致力于研究出用于模拟和延伸人的智能的理论和方法,并通过技术手段加以实现。人工智能涉及的领域很多,例如图像识别、语言识别和智能机器人等。目前人工智能的研究方法有六 *好棒文|www.hbsrm.com +Q: @351916072@
种,分别是“结构模拟,神经计算”、“功能模拟,符号推演”、“行为模拟,控制进化”、“群体模拟,仿生计算”、“博采广鉴,自然计算”、“原理分析,数学建模”。其中,以深度学习(Deep Learning)为主题的“结构模拟,神经计算”方法已成为当下的主流研究方向之一。
深度学习的学名为深层神经网络(Deep Neural Networks),是基于人工神经网络的模型延伸发展而来的。在深度学习中,低层特征总是被用来组合成更加抽象的高层以表示对象的属性类别或特征,它通过这种方式统计和分析出数据的分布式特征表示。深度学习常常被用于建立模拟人脑进行分析学习的神经网络。
深度学习的算法库非常丰富,其中常用的算法有卷积神经网络(Convolutional neural network,CNN)、递归神经网络(Recurrent Neural Network,RNN)、长短时记忆网络(LongShort Term Memory,LSTM)、深度置信网络(Deep Belief Networks,DBN)等。本课题所研究的模型是卷积神经网络。作为一种具有多层结构的神经网络,卷积神经网络被广泛运用于图像分类、物体检测、姿态预估等多个领域。良好的容错能力、自我学习能力化及并行处理能力使得卷积神经网络在图像识别上比传统二维图像识别更有优势。
手势控制,作为一种更加智能化的操作方式,即将成为未来人机交互领域的一种流行趋势。现在的很多科技体验馆中已经出现了通过手势控制相机拍照的项目,家庭娱乐中也引入了手势识别控制机器中的角色,智能驾驶中也引入了手势识别进行车辆导航等。手势控制的核心技术难点便是手势识别。手势识别有以下三个阶段分类:二维手型识别、二维手势识别和三维手势识别。本课题研究的是静态的二维手形识别,这种简单直接的二维手形识别是复杂手势识别的第一步,它的准确性高低对后者有着极大的影响。
卷积神经网络在图像识别上的优势能够满足手势识别与日俱增的社会需求,所以基于卷积神经网络的手势识别的研究很有意义。
1.2课题研究的现状
1.2.1手势识别的研究现状
手势识别是一种非常智能化的人机交互方式之一,它能够减少人体对机械设备的依赖。使用手势识别的概念等价于在电脑屏幕上,用手势取代鼠标,这样不仅减少硬件系统的投入和影响,还会增加现实世界对象的使用范围[1]。近年来,随着手势识别受关注度的提升,越来越多的科研人员参与到了手势识别的研究中。
2013年,王先军、白国振等科研人员利用手势图像的肤色特征,结合肤色在RGB空间的阈值分割和YCbCr颜色空间上的聚簇特性,以及背景模型的应用[2],成功降低了背景中类肤色的干扰,完成了手部图像在复杂背景下的检测和分割,最后采用BP神经网络成功完成手势识别。
2014,季怡等人依据实验环境和实际应用的需要,提出了一种在基于OpenCV2.2视觉库和Visual Studio C++来实现的Haar的矩形特征提取并充分利用Adaboost的学习分类模块实现了对特定握拳手势的实时识别和精确定位[3]。
2015年,张圆圆研究基于视觉的手势识别技术,并在OpenCV的平台基础上实现基于该技术的多媒体教学的应用[4],即在幻灯片播放的过程中能够由动态手势来控制幻灯片的翻页。
同年,刘飞飞对手势分割、特征提取、分类识别等关键技术进行了较为深入的研究并将研究成果应用于视频播放器的人机交互控制中[5],实现了一种自然灵活的人机交互方式。
越来越多社会资源的投入给手势识别的应用化提供了广阔的实现空间,由此可见,手势识别的课题研究十分有意义。
1.2.2卷积神经网络的研究现状
on; Good Robustness 目 录
第一章 绪论 1
1.1课题研究的背景和意义 1
1.2课题研究的现状 1
1.2.1手势识别的研究现状 1
1.2.2卷积神经网络的研究现状 2
1.3内容安排 3
第二章 开发环境 4
2.1 Linux 4
2.2 Theano 4
2.3 Keras 5
2.4 Python 5
第三章 基于CNN的手势识别 7
3.1 CNN算法原理 7
3.1.1 CNN网络结构 7
3.1.2 卷积神经网络的训练过程 8
3.2 手势数据 8
3.3 实验系统设计 9
3.4 实验结果 11
3.4.1 实验环境说明 11
3.4.2 实验参数说明 11
3.4.3 实验结果说明 12
结束语 15
致 谢 17
参考文献 18
第一章 绪论
1.1课题研究的背景和意义
前有AlphaGo大战李世石,后有Master屡胜各国围棋高手。人工智能俨然成为人们关注的热点话题。
人工智能(Artificial Intelligence,AI)是计算机科学技术中的一个热点研究方向,它企图了解智能的实质,致力于研究出用于模拟和延伸人的智能的理论和方法,并通过技术手段加以实现。人工智能涉及的领域很多,例如图像识别、语言识别和智能机器人等。目前人工智能的研究方法有六 *好棒文|www.hbsrm.com +Q: @351916072@
种,分别是“结构模拟,神经计算”、“功能模拟,符号推演”、“行为模拟,控制进化”、“群体模拟,仿生计算”、“博采广鉴,自然计算”、“原理分析,数学建模”。其中,以深度学习(Deep Learning)为主题的“结构模拟,神经计算”方法已成为当下的主流研究方向之一。
深度学习的学名为深层神经网络(Deep Neural Networks),是基于人工神经网络的模型延伸发展而来的。在深度学习中,低层特征总是被用来组合成更加抽象的高层以表示对象的属性类别或特征,它通过这种方式统计和分析出数据的分布式特征表示。深度学习常常被用于建立模拟人脑进行分析学习的神经网络。
深度学习的算法库非常丰富,其中常用的算法有卷积神经网络(Convolutional neural network,CNN)、递归神经网络(Recurrent Neural Network,RNN)、长短时记忆网络(LongShort Term Memory,LSTM)、深度置信网络(Deep Belief Networks,DBN)等。本课题所研究的模型是卷积神经网络。作为一种具有多层结构的神经网络,卷积神经网络被广泛运用于图像分类、物体检测、姿态预估等多个领域。良好的容错能力、自我学习能力化及并行处理能力使得卷积神经网络在图像识别上比传统二维图像识别更有优势。
手势控制,作为一种更加智能化的操作方式,即将成为未来人机交互领域的一种流行趋势。现在的很多科技体验馆中已经出现了通过手势控制相机拍照的项目,家庭娱乐中也引入了手势识别控制机器中的角色,智能驾驶中也引入了手势识别进行车辆导航等。手势控制的核心技术难点便是手势识别。手势识别有以下三个阶段分类:二维手型识别、二维手势识别和三维手势识别。本课题研究的是静态的二维手形识别,这种简单直接的二维手形识别是复杂手势识别的第一步,它的准确性高低对后者有着极大的影响。
卷积神经网络在图像识别上的优势能够满足手势识别与日俱增的社会需求,所以基于卷积神经网络的手势识别的研究很有意义。
1.2课题研究的现状
1.2.1手势识别的研究现状
手势识别是一种非常智能化的人机交互方式之一,它能够减少人体对机械设备的依赖。使用手势识别的概念等价于在电脑屏幕上,用手势取代鼠标,这样不仅减少硬件系统的投入和影响,还会增加现实世界对象的使用范围[1]。近年来,随着手势识别受关注度的提升,越来越多的科研人员参与到了手势识别的研究中。
2013年,王先军、白国振等科研人员利用手势图像的肤色特征,结合肤色在RGB空间的阈值分割和YCbCr颜色空间上的聚簇特性,以及背景模型的应用[2],成功降低了背景中类肤色的干扰,完成了手部图像在复杂背景下的检测和分割,最后采用BP神经网络成功完成手势识别。
2014,季怡等人依据实验环境和实际应用的需要,提出了一种在基于OpenCV2.2视觉库和Visual Studio C++来实现的Haar的矩形特征提取并充分利用Adaboost的学习分类模块实现了对特定握拳手势的实时识别和精确定位[3]。
2015年,张圆圆研究基于视觉的手势识别技术,并在OpenCV的平台基础上实现基于该技术的多媒体教学的应用[4],即在幻灯片播放的过程中能够由动态手势来控制幻灯片的翻页。
同年,刘飞飞对手势分割、特征提取、分类识别等关键技术进行了较为深入的研究并将研究成果应用于视频播放器的人机交互控制中[5],实现了一种自然灵活的人机交互方式。
越来越多社会资源的投入给手势识别的应用化提供了广阔的实现空间,由此可见,手势识别的课题研究十分有意义。
1.2.2卷积神经网络的研究现状
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/412.html