内容的相似图像搜索设计与实现(源码)

在如今互联网平台上,信息与网络的发展十分迅速,需要处理的图像也变得越来越多,在短时间内对图像进行检索就显得非常重要了。在早期,它被用来手动注释关键字,然后通过检索文本图像。这个方法有一个弊端就是工作量太大,太主观。关键词 SIFT特征,图像检索,特征聚类,特征匹配 现在的社会已经离不开网络,网络给信息交流提供了极大的方便。但是在大量的信息里也夹杂着许多没有价值的信息。所以如何检索出有用的信息成为一门关键技术。在1970年以前,人们使用的检索方法是通过文本、图片的标签进行查询的。在这之后,图像检索[1]这个名词才出现在人们的眼中。一开始,人们使用自然语言对图片进行关键字搜索。通过人工参与的方式对图片所描绘的环境、人物、心情等进行标签化。只有在图像检索的检索需求能够实现的情况下,才有它的独特之处。谷歌、百度和其他搜索引擎的技术已经被广泛应用在这里,本系统也有一定局限性:因为上面的几个原因,基于文本的图像搜索技术[2]已经满足不了人们对搜索出想要的图片的需求。人们希望查询图片不再是根据人工的关键字定义得出结果,而是根据图片本身的内容、主题、背景、颜色等特点来自动识别图像,得到查询结果,这种技术是基于内容的图片搜索,也是计算机视觉[3]的一部分。在早期的进行图像检索的本质依然是文本检索,他们在数据库里将图像所表达的内容进行关键字描述,比如主题、背景、人物、地点等文字信息,通过关键字可以将数据库里面的图片进行分类。最后,使用关键字进行检索得到查询结果。在1970年以后,人们就初步使用基于内容的图像检索(Content Based Image Retrieval,简称CBIR)这一新兴技术,它不仅能提高图片检索速度、检索精度,也能高效地分辨出图片的颜色特征和纹理特征,更快的得出检索结果。
目 录
1 引言 1
1.1 课题的研究背景和意义 1
1.2 国内外研究现状 2
1.3 基于内容的图像检索面临的挑战与本文创新 3
2 系统设计 5
2.1 系统框架 5
2.2 SIFT特征算法 7
2.3 kmeans聚类 10
2.4 特征归一化 11
2.5 特征匹配 12
2.6 检索评价指 *好棒文|www.hbsrm.com +Q: ¥351916072¥ 
标 13
3 系统实现 15
3.1 系统的功能模块 15
3.2 图像获取模块的实现 16
3.3 图像SIFT特征提取与匹配模块的实现 16
3.4 匹配模块的实现 16
3.5 用户界面模块的实现 19
4 系统测试 21
4.1 测试目标 21
4.2 系统测试内容 21
4.3 系统性能分析 24
结 论 26
致 谢 27
参 考 文 献 28 1 引言
1.1 课题的研究背景和意义
现在的社会已经离不开网络,网络给信息交流提供了极大的方便。但是在大量的信息里也夹杂着许多没有价值的信息。所以如何检索出有用的信息成为一门关键技术。在1970年以前,人们使用的检索方法是通过文本、图片的标签进行查询的。在这之后,图像检索[1]这个名词才出现在人们的眼中。一开始,人们使用自然语言对图片进行关键字搜索。通过人工参与的方式对图片所描绘的环境、人物、心情等进行标签化。只有在图像检索的检索需求能够实现的情况下,才有它的独特之处。谷歌、百度和其他搜索引擎的技术已经被广泛应用在这里,本系统也有一定局限性:
1)在现在的信息时代,每天网民们所产生的图片量是巨大的。日积月累的情况下,图片的数量不可估量。如果对每一张图片都进行人工定义,明显是不现实的,而且人工所花费的成本代价太大。
2)人类发明了自然语言,但每个人都有不同的见解,比如描绘一幅意义的场景,不同的人有自己独特的理解,这就创造了一个图像标签不是唯一的,不能准确的安全图像检索。
3)一些图片可能不容易用几句话来描述,或者内容太乱,使得手工标记这些图像更加困难。
因为上面的几个原因,基于文本的图像搜索技术[2]已经满足不了人们对搜索出想要的图片的需求。人们希望查询图片不再是根据人工的关键字定义得出结果,而是根据图片本身的内容、主题、背景、颜色等特点来自动识别图像,得到查询结果,这种技术是基于内容的图片搜索,也是计算机视觉[3]的一部分。
本系统开发的意义:
①在现在信息时代的每一天、每一个时间段都会产生无可估量的图片信息。这庞大的信息量靠人工干预的方式进行传统意义上的图片检索是效率低下的。所以,为了降低人工在处理信息问题上的成本,提高图片检索效率是研究本系统的初衷。
②本系统有很大的发展空间,不仅适用于用户对景色地点的搜索,也可以用于人脸识别、文物图片探索等,使得这一技术的成果有很大的市场力的需求。
本文在图像检索上得以应用,用户可以将图片拍照留存的计算机,数据库是足够大的,通过相应的检索技术类似于查询图像库中图像,和有效的信息反馈给用户。
1.2 国内外研究现状
在早期的进行图像检索的本质依然是文本检索,他们在数据库里将图像所表达的内容进行关键字描述,比如:主题、背景、人物、地点等文字信息,通过关键字可以将数据库里面的图片进行分类。最后,使用关键字进行检索得到查询结果。在1970年以后,人们就初步使用基于内容的图像检索(Content Based Image Retrieval,简称CBIR)这一新兴技术,它不仅能提高图片检索速度、检索精度,也能高效地分辨出图片的颜色特征和纹理特征,更快的得出检索结果。
在国外,最早使用CBIR系统进行商业运作的的是IBM公司所研发的QBIC系统,还有美国麻省理工学院实验室所研发的Photobook系统,Virage公司所设计的VIR系统、加州大学伯克利分校的Blobworld系统等。在国内,比较先进的图像检索是百度识图,淘宝应用里面的“拍立淘”,谷歌、搜狗浏览器应用里的的搜索图片等系统。
为了使图像检索系统发展的更加成熟,Seetharaman等人提出一种叫作CBIR的提高检索速度、检索精度的方法,它是一种能高效的分辨出图片的颜色特征和纹理特征[4]的方法。Seetharaman认为,图片的相关颜色的色相(H)和饱和度(S)、图片的纹理特征、图片的颜色特征都是以计算这两个特征的矩阵特征向量为基础得到的,如“正交多项式模型”,这个方法是在HSV的图像颜色特征和图像纹理[5]的基础上实现的。因此,HSV颜色描绘是以获得的结构元直方图来统计数据。使用结构元直方图的实验检索结果是使用MFC来描述图像,和MFC元结构相关梯度体现出相关价值和梯度方向。首先,利用块截断编码生成位图图像和平均颜色分量,二次使用元结构相关梯度值来提取图像表面特征。使用块截断编码生成了位图中每一个小块的结构和关系,这表明图像形状和边缘的纹理特征和颜色特征都可以描述出图像,但是对于图像的变形和不同的光线方面,其效果仍有待改进。
因此,虽然图像的检索技术在现在已经获得了一定的改进和进步。但是,在查询大量数据库时,图片的检索精度和人工检索依然存在差距,这是一个需要克服的难点。另一难点是检索系统在大数据图像面前的运算能力和存储能力,如何加强检索系统的运算能力也是我们需要考虑的问题。
1.3 基于内容的图像检索面临的挑战与本文创新
本系统的开发是具有的一定难度,计算机是没有办法直接识别自然语言的,如何表达的,以及如何沟通的更自然,在用户交互时如何拓展更广泛的应用程序,使得图像内容检索技术[67]被更广泛的使用。实际上,有必要加速和促进技术的发展来解决这个问题。
图像检索[8]关键点的研究主要在于,在基于内容的图像检索实现的基础上,能够使我们提取到的图像特征可以表达出实际图像的内容。如果一个检索系统不能做到这一点,那么它的检索效果就会很差。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1077.html

好棒文