复杂环境非标物体图像识别算法研究与实现【字数:13500】
近年来,深度学习是目前最被看好的新兴学科之一。如今,深度学习的加入,解决了困扰从业者多年的问题。尤其是在计算机视觉领域,而目标检测作为计算机视觉的经典问题,综合了图像处理、模式识别、深度学习的相关知识。复杂环境的物体检测主要分为两个任务,目标定位和目标分类[1]。物体检测的主流检测方式是卷积神经网络(CNN),主要采用的模型有两类,基于候选区的目标检测以及基于回归方式的目标。R-CNN系列模型在检测准确度上取得了优异地成果,但实时性较差。基于回归方式地YOLO则是将实时性发挥到极致,但无法保证准确性。SSD则结合了R-CNN系列的准确性以及YOLO的实时性,达到了准确性和实时性的暂时平衡。现在移动端的处理器性能越来约向桌面级靠近,使得在移动设备上也能完成深度学习的操作。本实验基于深度学习目标检测模型,将云端训练好的模型接入至机器人,实现在Cozmo机器人上完成对特定物体的检测。在本实验中,以SSD目标检测模型为基础,结合其他技术的优缺点,将SSD原先的VGG网络结构修改为针对移动平台优化的MobileNet网络架构,降低了运算量,提升了运算速度,保证了Cozmo对于物体检测的实时性。实验测测试结果也表明,使用SSD-MobileNet的目标检测模型在移动端平台表现良好,可实时检测出训练过的物体。在完成检测识别地基础上实现了对特定物体的搬运。本实验的研究内容对其他目标检测技术的研究具有参考意义,并且可应用于多项实际应用中,具有良好的应用前景。
目录
1.绪论 1
1.1课题背景和意义 1
1.2目标检测技术的发展 2
1.3文章结构 5
2.深度学习与神经网络 6
2.1深度学习概论 6
2.2神经网络 7
2.3卷积神经网络的结构 8
2.4本章小结 12
3.基于深度学习的目标检测模型 13
3.1基于候选区的目标检测算法 13
3.1.1 RCNN模型 13
3.1.2 Fast RCNN 14
3.1.3 Faster RCNN 15
3.2基于回归方式的目标检测算法 16
3.2.1 YOLO 16
3.2.2 S *好棒文|www.hbsrm.com +Q: ^351916072#
SD 17
3.3本章小结 18
4.基于SSD网络模型的Cozmo目标检测 19
4.1实验环境搭建 19
4.1.1关于Cozmo 19
4.1.2关于TensorFlow 19
4.1.3实验环境配置 20
4.2实验过程 21
4.3应用 26
4.4本章小结 29
5.总结与展望 30
参考文献 31
附录 32
致谢 36
1.绪论
1.1课题背景和意义
目前,人工之间已经成为世界各国竞争地新领域,我国也针对这一领域出台了相应地政策措施,希望能抓住这一历史发展地浪潮。人工智能的目的是了解智能的实质,模拟人类智能的思考的方式,并做出决策反应。它被广泛应用于机器人、专家系统、自然语言识别与处理、图像识别等领域,其中图像识别作为计算机视觉最重要的分支,也是人工智能最火热的领域,可以说,两者相辅相成才有了今天的高度。据统计,互联网中80%的数据量都是视觉类信息,并且比例每年都在升高。如何将这海量的数据运用起来便成了研究的重中之重。计算机视觉的目的便是使机器能像人类一样理解图像内容,获取有效信息。而计算机视觉的焦点问题便是物体检测与识别,对于计算机来说,图像仅是0~255的矩阵或数组,计算机无法从这样的描述中理解出图像含义,更不用说准确检测与定位物体。图像信息的各种内部干扰大,不确定性高,也使识别变得更困难。对于物体检测与识别的研究,归根到底是要解决物体定位和分类这两项问题,物体检测的主要步骤有训练样本、提取特征、使用训练好的分类器分类,其流程图如图1.1所示。这也是计算机视觉运用的首要一环。
/
图1.1物体检测示意图
目前的目标检测任务都是基于深度学习的,主要体现在以下领域:
无人驾驶
无人驾驶系统中基于各类传感器完成对周围环境地构建分析。使用卷积神经网络完成对车辆运行环境中的目标检测是目前的主流做法[2]。能够完成交通标志、交通灯的检测,车道线的识别与偏航的计算,对于障碍物检测与定位也是至关重要的一部分。
智能监控
目前,监控系统覆盖越来越全面,其中商业、工业、农业对于摄像头监控技术要求越来越高。传统监控大多数是由人类完成大部分工作,费时费力。而智能监控系统可在无人监管的情况下将系统黑名单内的人进入监控范围便锁定并报警,另外还可检测并标记非法运动、跟踪潜在威胁的对象,实现预警功能。此外,在发生危害事件后,可快速完成事件检索,锁定犯罪嫌疑人,为警方提供有效线索。
医疗检测
目前国内部分医院已上线了的智能医疗检测系统,该系统主要采用的就是基于卷积神经网络的目标检测方案,在完成对病人标本的采样后,检测系统可自动分析,检测出具有隐患的区域,并完成标注。帮助医生节省90%以上的阅片时间。准确度也相当高。谷歌的医疗检测系统Inception的识别准确率可达99.7%,如果发现及时,可为癌症治疗提高宝贵时间。
军事领域
在现代战争中,武器导弹系统广泛采用基于深度学习的目标检测系统[3]。由于军事上的特殊性,对于外来不明物体的识别准确性和实时性要求特别高,所以对于现代战争系统还是很有必要的。目标识别的研究对于军队信息化建设有着深远的影响。
1.2目标检测技术的发展
目标检测是计算机视觉中的底层问题[4],只有打好基础,才能为后续的相关操作提供可靠保障。目标检测需要完成的目标定位和分类两项任务。分类就是明确对象属于哪一个预定义的目标类,输出一系列带分数的标签表明预定义类别出现在输入图像的可能性。目标定位则负责输出相关物体的位置信息,最常见的即为(x,y,w,h),并且框选这一范围,最常见的是方形包围盒。
传统目标检测方案的思路是在一副复杂图像中对可疑检测物体进行窗口标定,并在标定的窗口中使用相关的特征提取算法提取内部特征,最后与训练好的分类器进行特征匹配,输出相应的分类结果。其主要流程图如图1.2所示。
/
图1.2传统目标检测方案示意图
(1)窗口标定模块
其中窗口标定的方法主要包括滑窗法以及块相关性法[5]。滑动窗口法的本质可视为一种简单的循环结构,使用各种大小的窗口循环覆盖图像,计算窗口内为检测物体的可能性,高于某一数值时便保留,然后继续扫描。检测完成后在图像上会得到多个被标记的窗口,根据算法对这些窗口作进一步,最终得到检测物体。由此可知,滑窗法对于复杂程度较低的图像效果良好,但面对复杂程度高的物体就会存在需要多次大量运算导致耗时久,实时性难以得到保证。而块相关性标定法的主要观点就是物体存在的地方必定存在连续性和变化性,并对这些区域搜索提取候选边界框,多次进行区域迭代合并,通过区域融合生产目标检测窗。由于采用选择搜索,提升了计算效率,并且采用区域合并的策略,对于候选框大小没有要求,可检测多个物体,但十分依赖图像滤波的结果,需要多种滤波算法结合才能有较好的效果。
目录
1.绪论 1
1.1课题背景和意义 1
1.2目标检测技术的发展 2
1.3文章结构 5
2.深度学习与神经网络 6
2.1深度学习概论 6
2.2神经网络 7
2.3卷积神经网络的结构 8
2.4本章小结 12
3.基于深度学习的目标检测模型 13
3.1基于候选区的目标检测算法 13
3.1.1 RCNN模型 13
3.1.2 Fast RCNN 14
3.1.3 Faster RCNN 15
3.2基于回归方式的目标检测算法 16
3.2.1 YOLO 16
3.2.2 S *好棒文|www.hbsrm.com +Q: ^351916072#
SD 17
3.3本章小结 18
4.基于SSD网络模型的Cozmo目标检测 19
4.1实验环境搭建 19
4.1.1关于Cozmo 19
4.1.2关于TensorFlow 19
4.1.3实验环境配置 20
4.2实验过程 21
4.3应用 26
4.4本章小结 29
5.总结与展望 30
参考文献 31
附录 32
致谢 36
1.绪论
1.1课题背景和意义
目前,人工之间已经成为世界各国竞争地新领域,我国也针对这一领域出台了相应地政策措施,希望能抓住这一历史发展地浪潮。人工智能的目的是了解智能的实质,模拟人类智能的思考的方式,并做出决策反应。它被广泛应用于机器人、专家系统、自然语言识别与处理、图像识别等领域,其中图像识别作为计算机视觉最重要的分支,也是人工智能最火热的领域,可以说,两者相辅相成才有了今天的高度。据统计,互联网中80%的数据量都是视觉类信息,并且比例每年都在升高。如何将这海量的数据运用起来便成了研究的重中之重。计算机视觉的目的便是使机器能像人类一样理解图像内容,获取有效信息。而计算机视觉的焦点问题便是物体检测与识别,对于计算机来说,图像仅是0~255的矩阵或数组,计算机无法从这样的描述中理解出图像含义,更不用说准确检测与定位物体。图像信息的各种内部干扰大,不确定性高,也使识别变得更困难。对于物体检测与识别的研究,归根到底是要解决物体定位和分类这两项问题,物体检测的主要步骤有训练样本、提取特征、使用训练好的分类器分类,其流程图如图1.1所示。这也是计算机视觉运用的首要一环。
/
图1.1物体检测示意图
目前的目标检测任务都是基于深度学习的,主要体现在以下领域:
无人驾驶
无人驾驶系统中基于各类传感器完成对周围环境地构建分析。使用卷积神经网络完成对车辆运行环境中的目标检测是目前的主流做法[2]。能够完成交通标志、交通灯的检测,车道线的识别与偏航的计算,对于障碍物检测与定位也是至关重要的一部分。
智能监控
目前,监控系统覆盖越来越全面,其中商业、工业、农业对于摄像头监控技术要求越来越高。传统监控大多数是由人类完成大部分工作,费时费力。而智能监控系统可在无人监管的情况下将系统黑名单内的人进入监控范围便锁定并报警,另外还可检测并标记非法运动、跟踪潜在威胁的对象,实现预警功能。此外,在发生危害事件后,可快速完成事件检索,锁定犯罪嫌疑人,为警方提供有效线索。
医疗检测
目前国内部分医院已上线了的智能医疗检测系统,该系统主要采用的就是基于卷积神经网络的目标检测方案,在完成对病人标本的采样后,检测系统可自动分析,检测出具有隐患的区域,并完成标注。帮助医生节省90%以上的阅片时间。准确度也相当高。谷歌的医疗检测系统Inception的识别准确率可达99.7%,如果发现及时,可为癌症治疗提高宝贵时间。
军事领域
在现代战争中,武器导弹系统广泛采用基于深度学习的目标检测系统[3]。由于军事上的特殊性,对于外来不明物体的识别准确性和实时性要求特别高,所以对于现代战争系统还是很有必要的。目标识别的研究对于军队信息化建设有着深远的影响。
1.2目标检测技术的发展
目标检测是计算机视觉中的底层问题[4],只有打好基础,才能为后续的相关操作提供可靠保障。目标检测需要完成的目标定位和分类两项任务。分类就是明确对象属于哪一个预定义的目标类,输出一系列带分数的标签表明预定义类别出现在输入图像的可能性。目标定位则负责输出相关物体的位置信息,最常见的即为(x,y,w,h),并且框选这一范围,最常见的是方形包围盒。
传统目标检测方案的思路是在一副复杂图像中对可疑检测物体进行窗口标定,并在标定的窗口中使用相关的特征提取算法提取内部特征,最后与训练好的分类器进行特征匹配,输出相应的分类结果。其主要流程图如图1.2所示。
/
图1.2传统目标检测方案示意图
(1)窗口标定模块
其中窗口标定的方法主要包括滑窗法以及块相关性法[5]。滑动窗口法的本质可视为一种简单的循环结构,使用各种大小的窗口循环覆盖图像,计算窗口内为检测物体的可能性,高于某一数值时便保留,然后继续扫描。检测完成后在图像上会得到多个被标记的窗口,根据算法对这些窗口作进一步,最终得到检测物体。由此可知,滑窗法对于复杂程度较低的图像效果良好,但面对复杂程度高的物体就会存在需要多次大量运算导致耗时久,实时性难以得到保证。而块相关性标定法的主要观点就是物体存在的地方必定存在连续性和变化性,并对这些区域搜索提取候选边界框,多次进行区域迭代合并,通过区域融合生产目标检测窗。由于采用选择搜索,提升了计算效率,并且采用区域合并的策略,对于候选框大小没有要求,可检测多个物体,但十分依赖图像滤波的结果,需要多种滤波算法结合才能有较好的效果。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/973.html