视觉显著性的图像表征和应用研究
近年来,基于显著性的图像表征已经成为一个热门的研究领域。不断涌现的显著性表征算法不仅为该领域做出了理论贡献,并且成功应用在图像处理,计算机视觉,人类认知系统以及移动机器人等领域。本文首先介绍了人类视觉感知系统和一些简单的视觉现象,并由此引出视觉注意模型。然后,通过比较IT方法,SR方法,FT方法,HC方法,RC方法以及DRFI方法在内的6种显著性表征算法的图像显著性检测效果、正确率-召回率曲线、运行时间的优劣,提出了一种基于视觉显著性的铜带缺陷检测的模型。模型先选择最适合铜带缺陷检测的DRFI方法进行显著性区域提取,然后利用Hu不变矩和PCA进行特征提取,最后通过径向基函数神经网络进行缺陷分类。本论文的方法在铜带缺陷的检测中具有很好的鲁棒性,在没有进行任何图片预处理的情况下,可以达到94%的正确率。但本设计在缺陷检测实时性等方面还存在不足,有待进一步研究。
目录
摘要 I
ABSTRACT II
目录 III
第1章 绪论 1
1.1研究背景与意义 1
1.1.1研究背景 1
1.1.2研究意义 2
1.2国内外研究现状 2
1.3研究内容与组织架构 3
1.3.1论文的主要内容 3
1.3.2论文的章节安排 4
第2章 视觉注意机制 6
2.1人类视觉感知系统 6
2.1.1 最低层次加工的神经机制 7
2.1.2初级视皮层加工的神经机制 7
2.1.3中、高级视皮层加工的神经机制 9
2.2 视觉现象 9
2.2.1 马赫带效应 9
2.2.2 侧抑制效应 10
2.2.3 同时对比现象 11
2.2.4 视觉惰性 11
2.3 视觉注意机制 12
2.3.1 自底向上和自顶向下的注意模式 12
2.3.2 选择性注意机制 13
2.3.3 注意焦点的选择与转移 14
2.4 本章小结 16
第3章 视觉显著性表征 17
3.1 显著性表征算法概述 17<
*好棒文|www.hbsrm.com +Q: ^3^5^1^9^1^6^0^7^2^*
br /> 3.1.1 IT方法 17
3.1.2 SR方法 19
3.1.3 FT方法 21
3.1.4 HC和RC方法 22
3.1.5 DRFI方法 25
3.1.6 实验结果与分析 26
3.2基于视觉显著性的图像表征 29
3.3 本章小结 29
第4章 基于视觉显著性的铜带表面缺陷检测 30
4.1铜带表面缺陷检测概述 30
4.2 基于视觉显著性的铜带表面缺陷检测 30
4.2.1 缺陷检测模型 30
4.2.2 显著性检测模块 31
4.2.3 缺陷区域特征提取 32
4.2.4 缺陷分类 34
4.3 实验 35
4.3.1 视觉显著性算法选择实验 35
4.3.2 铜带缺陷检测实验 37
4.4 本章小结 38
第5章 总结与展望 39
参考文献 40
致谢 44
第1章 绪论
1.1研究背景与意义
1.1.1研究背景
研究表明,人类大部分的信息都是通过眼睛获取的,但大脑对某种任务的处理速度是有限的。神经生物学和心理物理学的研究者们发现人类视觉处理系统在进行深层次的处理前,都会有选择的提取自己感兴趣的区域[1],而对目标以外的区域视而不见,人类视觉可以很容易的分辨出图像中的显著性区域,注意到图像的重要部分,只对重要部分进行处理。Treisman和Gelade[2],以及Koch和Ullman[3]等视觉注意领域的研究者们将视觉注意机制分为自顶向下和自底向上两种注意模式。自底向上的注意模式主要是基于视觉场景的特征的,是快速的,刺激(显著性)驱动的,与任务无关的;自顶向下的注意模式是基于学识,经验,当前目标的,慢速的,与任务有关的。这两种模式结合形成了人类视觉注意机制。概括地说就是人类视觉系统强大的数据实时处理能力得益于它对复杂场景的筛选能力,即选择注意机制。将具有主动性、选择性的人类视觉系统模拟到计算机,从而提高计算机对复杂场景的处理能力是众多神经生物学、心理物理学和计算机视觉研究者研究的热点。
另一方面,随着数码相机、平板电脑、智能手机等设备的普及,图片数据的规模越来越大,同时也越来越复杂,这无疑加大了图像表征和物体分析的复杂性。传统的数字图像处理是对整个图片进行统一处理,均匀的分配资源,然而大部分时候只需要对图片的某一区域进行处理(目标区域),有时需要处理的区域甚至只占了很小的比重,比如现在比较流行的美颜相机,在拍摄完成之后只需要对脸部进行美化修饰,而用传统的处理方法,势必浪费了大量的计算资源,所以通过模拟人类视觉系统,产生具有强大的数据选择性能的注意模型,并将该模型运用到图像表征中具有很好的应用前景。通过显著性区域的提取,从而仅对显著性区域进行处理,不仅可以减少处理的数据量,还可以提高分析的准确性。
将过去的图像表征方法与人类视觉注意系统结合,提取图像的目标区域,对显著性内容优先处理,让计算机这一工具具有人类视觉系统的主动性及选择性,是本领域的研究目的,目前已有许多利用视觉注意机制来提取显著性区域从而进行相关处理的方法。Itti[4]通过中央—周边差来构造特征图,再将特征图融合形成显著性图。MingMing Chen[5]在统计输入图像的颜色这一特征的基础上,提出了基于直方图对比度的显著性图像表征方法(HC方法),之后在HC方法的基础上添加了空间权值形成了区域对比度方法(RC方法),这些方法都在Achanta等人提供的最大的公开测试集中获得了较好的分割效果。
1.1.2研究意义
将人类的视觉注意系统运用到图像表征中,作为图像和视频应用的预处理过程,可以减少甚至避免手工交互的繁琐过程[6],从而将有限的计算资源分配给显著性区域,将大大的提高传统图像表征的效率[7]。因此,提取图像显著性的研究,对图像表征有着非常重要的意义。
将提取的显著性图应用到计算机视觉领域,将会有广泛的应用价值,其中几个热门的方向如下:基于显著性的图像检索[812],基于显著性的图像压缩[1315],基于显著性的图像风格化,基于显著性的智能裁剪等。
1.2国内外研究现状
20世纪90年代末,研究者们迈开了探索基于人类视觉系统的图像显著性分析的步伐[7],研究的日益成熟,使它渐渐取代传统的图像表征的方法。将人类视觉注意机制应用到计算机视觉领域,实现图像更高效、更智能、更准确的表征与分析,是计算机视觉领域,生物心理学领域等研究者共同追求的目标,在这几十年的时间里,不断出现各种优秀的算法,这些模型都在一定程度上解释了视觉注意机制,但是有些模型很合乎生物学原理,有些模型至今未找到合理的生物学解释,但对显著性图的提取有不错的效果。
目录
摘要 I
ABSTRACT II
目录 III
第1章 绪论 1
1.1研究背景与意义 1
1.1.1研究背景 1
1.1.2研究意义 2
1.2国内外研究现状 2
1.3研究内容与组织架构 3
1.3.1论文的主要内容 3
1.3.2论文的章节安排 4
第2章 视觉注意机制 6
2.1人类视觉感知系统 6
2.1.1 最低层次加工的神经机制 7
2.1.2初级视皮层加工的神经机制 7
2.1.3中、高级视皮层加工的神经机制 9
2.2 视觉现象 9
2.2.1 马赫带效应 9
2.2.2 侧抑制效应 10
2.2.3 同时对比现象 11
2.2.4 视觉惰性 11
2.3 视觉注意机制 12
2.3.1 自底向上和自顶向下的注意模式 12
2.3.2 选择性注意机制 13
2.3.3 注意焦点的选择与转移 14
2.4 本章小结 16
第3章 视觉显著性表征 17
3.1 显著性表征算法概述 17<
*好棒文|www.hbsrm.com +Q: ^3^5^1^9^1^6^0^7^2^*
br /> 3.1.1 IT方法 17
3.1.2 SR方法 19
3.1.3 FT方法 21
3.1.4 HC和RC方法 22
3.1.5 DRFI方法 25
3.1.6 实验结果与分析 26
3.2基于视觉显著性的图像表征 29
3.3 本章小结 29
第4章 基于视觉显著性的铜带表面缺陷检测 30
4.1铜带表面缺陷检测概述 30
4.2 基于视觉显著性的铜带表面缺陷检测 30
4.2.1 缺陷检测模型 30
4.2.2 显著性检测模块 31
4.2.3 缺陷区域特征提取 32
4.2.4 缺陷分类 34
4.3 实验 35
4.3.1 视觉显著性算法选择实验 35
4.3.2 铜带缺陷检测实验 37
4.4 本章小结 38
第5章 总结与展望 39
参考文献 40
致谢 44
第1章 绪论
1.1研究背景与意义
1.1.1研究背景
研究表明,人类大部分的信息都是通过眼睛获取的,但大脑对某种任务的处理速度是有限的。神经生物学和心理物理学的研究者们发现人类视觉处理系统在进行深层次的处理前,都会有选择的提取自己感兴趣的区域[1],而对目标以外的区域视而不见,人类视觉可以很容易的分辨出图像中的显著性区域,注意到图像的重要部分,只对重要部分进行处理。Treisman和Gelade[2],以及Koch和Ullman[3]等视觉注意领域的研究者们将视觉注意机制分为自顶向下和自底向上两种注意模式。自底向上的注意模式主要是基于视觉场景的特征的,是快速的,刺激(显著性)驱动的,与任务无关的;自顶向下的注意模式是基于学识,经验,当前目标的,慢速的,与任务有关的。这两种模式结合形成了人类视觉注意机制。概括地说就是人类视觉系统强大的数据实时处理能力得益于它对复杂场景的筛选能力,即选择注意机制。将具有主动性、选择性的人类视觉系统模拟到计算机,从而提高计算机对复杂场景的处理能力是众多神经生物学、心理物理学和计算机视觉研究者研究的热点。
另一方面,随着数码相机、平板电脑、智能手机等设备的普及,图片数据的规模越来越大,同时也越来越复杂,这无疑加大了图像表征和物体分析的复杂性。传统的数字图像处理是对整个图片进行统一处理,均匀的分配资源,然而大部分时候只需要对图片的某一区域进行处理(目标区域),有时需要处理的区域甚至只占了很小的比重,比如现在比较流行的美颜相机,在拍摄完成之后只需要对脸部进行美化修饰,而用传统的处理方法,势必浪费了大量的计算资源,所以通过模拟人类视觉系统,产生具有强大的数据选择性能的注意模型,并将该模型运用到图像表征中具有很好的应用前景。通过显著性区域的提取,从而仅对显著性区域进行处理,不仅可以减少处理的数据量,还可以提高分析的准确性。
将过去的图像表征方法与人类视觉注意系统结合,提取图像的目标区域,对显著性内容优先处理,让计算机这一工具具有人类视觉系统的主动性及选择性,是本领域的研究目的,目前已有许多利用视觉注意机制来提取显著性区域从而进行相关处理的方法。Itti[4]通过中央—周边差来构造特征图,再将特征图融合形成显著性图。MingMing Chen[5]在统计输入图像的颜色这一特征的基础上,提出了基于直方图对比度的显著性图像表征方法(HC方法),之后在HC方法的基础上添加了空间权值形成了区域对比度方法(RC方法),这些方法都在Achanta等人提供的最大的公开测试集中获得了较好的分割效果。
1.1.2研究意义
将人类的视觉注意系统运用到图像表征中,作为图像和视频应用的预处理过程,可以减少甚至避免手工交互的繁琐过程[6],从而将有限的计算资源分配给显著性区域,将大大的提高传统图像表征的效率[7]。因此,提取图像显著性的研究,对图像表征有着非常重要的意义。
将提取的显著性图应用到计算机视觉领域,将会有广泛的应用价值,其中几个热门的方向如下:基于显著性的图像检索[812],基于显著性的图像压缩[1315],基于显著性的图像风格化,基于显著性的智能裁剪等。
1.2国内外研究现状
20世纪90年代末,研究者们迈开了探索基于人类视觉系统的图像显著性分析的步伐[7],研究的日益成熟,使它渐渐取代传统的图像表征的方法。将人类视觉注意机制应用到计算机视觉领域,实现图像更高效、更智能、更准确的表征与分析,是计算机视觉领域,生物心理学领域等研究者共同追求的目标,在这几十年的时间里,不断出现各种优秀的算法,这些模型都在一定程度上解释了视觉注意机制,但是有些模型很合乎生物学原理,有些模型至今未找到合理的生物学解释,但对显著性图的提取有不错的效果。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/1103.html