哈希的图像检索系统(源码)
1图像检索一直是计算机视觉领域的研究热点问题之一,近年来,基于哈希的图像检索算法凭借其在计算速度方面的优越性被广泛关注。本文首先实现了基于卷积神经网络哈希的检索算法,然后通过与传统哈希算法的对比实验,得出深度哈希图像检索算法的检索效率要优于传统的哈希算法,最后,基于上述神经网络模型,设计并实现了一个图像检索系统,系统主要实现了获取图像,图像预处理,检索图像等功能。
目录
引言
1 绪论
1.1课题背景
当今社会,人们获取信息最直接的方式就是通过视觉,每天每个人都会接触大量的图像信息。如今图像在人们生活中随处可见,从海量的图像中获取人们需要的信息具有广阔的应用前景和价值,同时,当前计算机图像处理领域的一个热点问题,就是图像检索技术。
图像检索即根据用户输入的信息,返回与用户输入信息想匹配的图像,用户输入的信息既可以是文本也可以是图像,如图1所示,即为基于文本的图像检索[1],用户输入彩虹,则检索出大量与彩虹相关的图像。
/
图1 基于文本的图像检索
基于文本的图像检索方式由于人工标注存在主观差异,检索结果因人而异,不能很好地满足用户的需要。为了避免这种主观差异造成检索结果不满意的问题,一种基于图像内容的检索(ContentBased Image Retrieval , CBIR)[23]方式出现了,这种方式考虑的是图像的内容信息,如图2所示,用户上传了一张马的图像,系统检索出了与上传的马相似的马的图像。
/
图2 基于内容的图像检索
基于内容的图像检索方式考虑的是图像的特征信息,通过提取图像的特征信息与数据库中的特征信息匹配,从而返回内容上相似的图像,这种检索方式当应用于大规模图像检索时,建立的索引将很难起到作用,即“维度灾难”问题,为此,人们又提出了一种基于哈希的图像检索技术。哈希算法的原理是将高维的特征向量映射到低维的汉明空间,并且使得在高维空间中相似的特征向量在低维的汉明空间中仍能保持很高的相似度,高维空间中不相似的,映射到低维汉明空间也不相似,这样我们只需要计算哈希码之间的汉明距离就可以确定图像之间的相似度,不仅大大减少了计算量,而且加快了检索速度。
图像检索系统在各行各业都有广泛的 *好棒文|www.hbsrm.com +Q: *351916072*
应用,公安局通过比对犯罪嫌疑犯的图像信息可以加速破案;消费者只需要拍一张照片就可以很方便快捷地检索出成千上万的商品;在医学领域,使用图像检索技术可以快速高效地对医学图像进行识别与分类;商标注册时,图像检索技术还可以避免侵权的发生。
1.2 研究现状
1.2.1国外研究现状
人们对图像检索的研究,最早开始于二十世纪七十年代末,那时人们首先提出了基于文本的图像检索方式,这种方式的缺点是:工作量巨大,需要大量的人工操作,人工主要是为图像加标注信息,但是这种标注信息主观性较浓,从而导致准确率以及检索效率不能保证。直到20世纪90年代末,出现了对图像特征的定义,如图像的颜色、形状、纹理等特征信息,通过对特征信息进行分析,从而实现检索,即现在流行的基于内容的图像检索技术,无论基于哈希算法,还是基于深度学习,其根本都是基于内容的图像检索。
在国外,许多大学的实验室和商业公司都开发过图像检索系统,商业领域如IBM公司,自主研发了QBIC系统,QBIC系统不仅支持基于图像颜色,图像形状,图像纹理等特多种特征的检索,还可以通过人工草图和扫描图像来进行图像检索。非商业领域主要有University of Michigan和MIT两所大学合作的Virage系统和MIT自己研发的PhotoBook系统,Virage系统同样支持基于图像的三种特征——颜色、纹理、形状的检索,同时用户可以将以上三种特征进行组合来满足不同需要,Virage系统还提供了供用户为特征设置权重的功能,这样,针对不同的图像使用者可以通过调整权重来更好的满足需要。PhotoBook系统将纹理,颜色,形状三种特征分为三个子系统,每个子系统负责基于以上三种特征中的一种特征的检索。
近年来,由于深度神经网络更能够获得图像的内在特征,且在图像检索方面表现出了良好的性能,利用深度CNN学习图像特征,文献[4]中首先提出了一种卷积神经网络框架,且取得了不错的效果。哈希算法在解决大规模数据的近似最近邻检索问题中有着快速高效的优点。
1.2.2国内研究现状
在国内,图像检索技术相较国外起步较晚,但是也有许多优秀的图像检索系统,非商业领域,如清华大学设计实现的ImgRetr系统和中国科学院大学设计实现的MIRES系统,商业领域,如百度公司的识图、阿里巴巴公司的淘淘搜[5]等,以上两个商业系统均有很好的检索效率。
2 基础知识
2.1哈希算法
哈希算法主要针对于大规模图像检索中因高维特征向量引起的“维度灾难”问题。哈希算法核心思想是将图像的高维特征向量映射到低维的汉明空间,在汉明空间中用汉明距离(码间异或)作为图像相似度度量,对图像进行检索。传统的基于内容的图像检索技术是在图像特征空间,即一般的欧氏距离进行相似度度量,这种方式对计算机内存要求很高,而哈希算法可以大大降低计算量,从而加快检索速度。
经典的非监督哈希算法有局部敏感哈希(Locality Sensitive Hashing ,LSH)[5] 谱哈希(Spectral Hashing ,SH) [7];LSH的基本思路是通过n个哈希函数,这n个哈希函数具有位置敏感性,经过哈希函数的映射,图像高维特征值被映射为低维的哈希码,并且保证映射之后的哈希码仍然保持在高维特征空间的相似性。谱哈希索引算法基本思路是,首先对原始高维特征进行谱分析,然后放松限制的条件,将问题转换成Laplace feature Map的降维问题,最后进行求解。与非监督哈希算法不同的是,监督哈希算法是利用的数据集的标注信息来构建哈希函数,这样构建出来的哈希函数使得监督哈希算法的检索准确率很高,经典的监督哈希算法是受限玻尔兹曼机(Restricted Boltzmann Machines, RBMs)[8],RBMs主要训练和调整两个阶段,训练阶段是非监督的,调整阶段则利用图像的标注信息调整训练阶段得到的模型,最终得到一个可以很好地实现检索功能的模型, 2010年,王骏[9]等人提出了一种半监督哈希算法,所谓半监督即不需要对所有的图像都进行标注,这种半监督哈希算法分别利用标注信息和图像的内容信息来构造,而对于大规模图像检索来说,减少标注工作无疑是提高效率的一种好的方式。
2.2卷积神经网络
目录
引言
1 绪论
1.1课题背景
当今社会,人们获取信息最直接的方式就是通过视觉,每天每个人都会接触大量的图像信息。如今图像在人们生活中随处可见,从海量的图像中获取人们需要的信息具有广阔的应用前景和价值,同时,当前计算机图像处理领域的一个热点问题,就是图像检索技术。
图像检索即根据用户输入的信息,返回与用户输入信息想匹配的图像,用户输入的信息既可以是文本也可以是图像,如图1所示,即为基于文本的图像检索[1],用户输入彩虹,则检索出大量与彩虹相关的图像。
/
图1 基于文本的图像检索
基于文本的图像检索方式由于人工标注存在主观差异,检索结果因人而异,不能很好地满足用户的需要。为了避免这种主观差异造成检索结果不满意的问题,一种基于图像内容的检索(ContentBased Image Retrieval , CBIR)[23]方式出现了,这种方式考虑的是图像的内容信息,如图2所示,用户上传了一张马的图像,系统检索出了与上传的马相似的马的图像。
/
图2 基于内容的图像检索
基于内容的图像检索方式考虑的是图像的特征信息,通过提取图像的特征信息与数据库中的特征信息匹配,从而返回内容上相似的图像,这种检索方式当应用于大规模图像检索时,建立的索引将很难起到作用,即“维度灾难”问题,为此,人们又提出了一种基于哈希的图像检索技术。哈希算法的原理是将高维的特征向量映射到低维的汉明空间,并且使得在高维空间中相似的特征向量在低维的汉明空间中仍能保持很高的相似度,高维空间中不相似的,映射到低维汉明空间也不相似,这样我们只需要计算哈希码之间的汉明距离就可以确定图像之间的相似度,不仅大大减少了计算量,而且加快了检索速度。
图像检索系统在各行各业都有广泛的 *好棒文|www.hbsrm.com +Q: *351916072*
应用,公安局通过比对犯罪嫌疑犯的图像信息可以加速破案;消费者只需要拍一张照片就可以很方便快捷地检索出成千上万的商品;在医学领域,使用图像检索技术可以快速高效地对医学图像进行识别与分类;商标注册时,图像检索技术还可以避免侵权的发生。
1.2 研究现状
1.2.1国外研究现状
人们对图像检索的研究,最早开始于二十世纪七十年代末,那时人们首先提出了基于文本的图像检索方式,这种方式的缺点是:工作量巨大,需要大量的人工操作,人工主要是为图像加标注信息,但是这种标注信息主观性较浓,从而导致准确率以及检索效率不能保证。直到20世纪90年代末,出现了对图像特征的定义,如图像的颜色、形状、纹理等特征信息,通过对特征信息进行分析,从而实现检索,即现在流行的基于内容的图像检索技术,无论基于哈希算法,还是基于深度学习,其根本都是基于内容的图像检索。
在国外,许多大学的实验室和商业公司都开发过图像检索系统,商业领域如IBM公司,自主研发了QBIC系统,QBIC系统不仅支持基于图像颜色,图像形状,图像纹理等特多种特征的检索,还可以通过人工草图和扫描图像来进行图像检索。非商业领域主要有University of Michigan和MIT两所大学合作的Virage系统和MIT自己研发的PhotoBook系统,Virage系统同样支持基于图像的三种特征——颜色、纹理、形状的检索,同时用户可以将以上三种特征进行组合来满足不同需要,Virage系统还提供了供用户为特征设置权重的功能,这样,针对不同的图像使用者可以通过调整权重来更好的满足需要。PhotoBook系统将纹理,颜色,形状三种特征分为三个子系统,每个子系统负责基于以上三种特征中的一种特征的检索。
近年来,由于深度神经网络更能够获得图像的内在特征,且在图像检索方面表现出了良好的性能,利用深度CNN学习图像特征,文献[4]中首先提出了一种卷积神经网络框架,且取得了不错的效果。哈希算法在解决大规模数据的近似最近邻检索问题中有着快速高效的优点。
1.2.2国内研究现状
在国内,图像检索技术相较国外起步较晚,但是也有许多优秀的图像检索系统,非商业领域,如清华大学设计实现的ImgRetr系统和中国科学院大学设计实现的MIRES系统,商业领域,如百度公司的识图、阿里巴巴公司的淘淘搜[5]等,以上两个商业系统均有很好的检索效率。
2 基础知识
2.1哈希算法
哈希算法主要针对于大规模图像检索中因高维特征向量引起的“维度灾难”问题。哈希算法核心思想是将图像的高维特征向量映射到低维的汉明空间,在汉明空间中用汉明距离(码间异或)作为图像相似度度量,对图像进行检索。传统的基于内容的图像检索技术是在图像特征空间,即一般的欧氏距离进行相似度度量,这种方式对计算机内存要求很高,而哈希算法可以大大降低计算量,从而加快检索速度。
经典的非监督哈希算法有局部敏感哈希(Locality Sensitive Hashing ,LSH)[5] 谱哈希(Spectral Hashing ,SH) [7];LSH的基本思路是通过n个哈希函数,这n个哈希函数具有位置敏感性,经过哈希函数的映射,图像高维特征值被映射为低维的哈希码,并且保证映射之后的哈希码仍然保持在高维特征空间的相似性。谱哈希索引算法基本思路是,首先对原始高维特征进行谱分析,然后放松限制的条件,将问题转换成Laplace feature Map的降维问题,最后进行求解。与非监督哈希算法不同的是,监督哈希算法是利用的数据集的标注信息来构建哈希函数,这样构建出来的哈希函数使得监督哈希算法的检索准确率很高,经典的监督哈希算法是受限玻尔兹曼机(Restricted Boltzmann Machines, RBMs)[8],RBMs主要训练和调整两个阶段,训练阶段是非监督的,调整阶段则利用图像的标注信息调整训练阶段得到的模型,最终得到一个可以很好地实现检索功能的模型, 2010年,王骏[9]等人提出了一种半监督哈希算法,所谓半监督即不需要对所有的图像都进行标注,这种半监督哈希算法分别利用标注信息和图像的内容信息来构造,而对于大规模图像检索来说,减少标注工作无疑是提高效率的一种好的方式。
2.2卷积神经网络
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1665.html