基于颜色纹理的图像检索研究方法研究
基于颜色纹理的图像检索研究方法研究[20191212175051]
摘 要
随着多媒体技术和互联网的迅速发展,图像检索技术已成为一个非常活跃的研究领域。基于内容的图像检索不同于传统的基于文本的图像检索,它实际上是一种模糊查询技术,通过对图像提取颜色、纹理、形状等特征,找出在特征空间中与查询要求最接近的图像。实现快速有效的图像检索,关键在于采用何种特征作为索引以及特征如何匹配。
本文重点针对基于颜色、纹理特征的图像检索技术开展研究。首先,在颜色特征检索方面,选取符合人类视觉特性的HSV空间模型,然后采用3-D HSV颜色直方图均衡化方法实现基于颜色的图像检索,在颜色特征的相似性度量上采用欧氏距离计算相似性。
其次,针对纹理特征检索开展研究。在进行纹理特征提取之前先对图像进行灰度化处理,将原图像变换为灰度图,然后再进行纹理特征提取。考虑到双树复小波的纹理特征提取优势,采用2-D双树复小波(DT-CWT)分解提取图像的纹理特征,采用Canberra距离作为相似性度量标准。
最后,综合颜色和纹理特征进行图像检索。首先提取待查询图像的颜色特征和纹理特征向量,再分别计算每个特征向量与图像库中每个图像对应特征的相似距离,然后对两种特征向量距离进行外部归一化,之后把两个特征距离的加权和作为待查询图像与图像库中图像的相似距离,其中特征向量的权重值可由用户调节,从而完成对图像进行综合特征的图像检索。
为验证以上方法的有效性,对彩色图像、纹理图像进行检索实验,实验结果表明了本研究提出方法的有效性。
查看完整论文请+Q: 351916072
关键字:来进行图像检索。如何实现快速有效的图像检索,关键在于采用何种特征作为索引以及特征如何匹配,这正是基于内容的图像检索技术的核心,对它的研究具有十分重要的意义。人们对于CBIR技术的研究与探讨结合了计算机视觉、图形图像处理、图像理解和数据库,并且是这些计算领域之内的所有技术的一个非常重要的成果,CBIR技术的兴起与发展,同时也会给其他相关领域带来新的发展机会。 基于内容的图像检索,属于图像分析的一个研究领域,它的英语术语叫做CBIR(Content-BasedImageRetrieval)。基于内容的图像检索指的是查询条件本身就是一幅图像(或者是对于图像内容的描述),它建立索引的方式是通过提取图像特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两幅图像的相似程度。图像内容的描述及提取不再依赖于人的手工标注,而是借助于从图像中自动提取的视觉特征,检索过程也不再是关键字匹配,而是视觉特征间的特征匹配。 基于文本的图像检索,其研究主要在数据库领域中进行。其图像检索的一个典型框架是,首先对图像用文本进行注解,根据其内容手工将其标注为一系列关键字,并对关键字建立索引。这样,图像检索就转化为文本检索问题。然后用基于文本的数据库管理系统(DBMS)来进行图像检索。但是,基于文本的图像检索存在两大困难,尤其是当图像的数量非常大的时候。一是必须由人工完整地标注所有图像,当图像数量很大时,这种方法显然不可行;第二个问题是图像包含信息量庞大,不同用户对同一张图像的看法不尽相同,这就导致对图像的标注没有一个统一的标准,检索出的结果不能很好地符合用户的需求。
目 录
摘 要 I
ABSTRACT II
第1章 绪 论 1
1.1 课题研究的背景和意义 1
1.2 基于内容的图像检索技术 2
1.3 国内外研究现状 3
1.4 本文研究内容及章节安排 5
第2章 基于内容的图像检索相关技术 7
2.1 基于内容的图像检索的体系结构 7
2.2 常用的低层特征的描述方法 7
2.2.1 颜色特征 8
2.2.2 纹理特征 10
2.2.3 形状特征 13
2.3 特征匹配技术 14
2.3.1 计量定理 15
2.3.2 常用的匹配方法 15
2.4 基于内容的图像检索技术的基本步骤 20
第3章 基于颜色特征的图像检索 21
3.1 颜色空间 21
3.1.1 RGB颜色空间 21
3.1.2 YCbCr颜色空间与YUV颜色空间 22
3.1.3 HSV颜色空间 23
3.2 3-D HSV颜色直方图均衡化 26
3.3 实验步骤 27
3.4 实验结果 27
第4章 基于纹理特征的图像检索 33
4.1 双树复小波变换原理 33
4.2 图像纹理特征提取 36
4.3 相似性度量 36
4.4 实验算法描述 36
4.5 实验结果 37
4.5.1 Brodatz纹理图像库 37
4.5.2 fenge图像库 38
4.5.3 image1图像库 38
第5章 综合颜色和纹理特征的图像检索 41
5.1 特征向量的外部归一化 41
5.2 综合颜色和纹理特征图像检索的实现步骤 41
5.3 系统设计 42
5.3.1 系统实现流程图 42
5.3.2 系统界面与操作 42
5.4 实验结果 44
第6章 总结与展望 49
6.1 总结 49
6.2 展望 49
参考文献 51
致 谢 53
附录:英文翻译原文 54
英文翻译 69
第1章 绪 论
1.1 课题研究的背景和意义
随着信息化社会的到来以及信息高速公路的实施,人们越来越多的接触到大量的图像信息,大容量高速存储系统为图像的海量存储提供了基本保障,各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得日益重要。图像数据库的研究对多媒体数据库、电子图书馆、医疗学图像管理、罪犯识别系统、卫星遥感图像、地理信息系统、商标版权管理等方面提供了有力的支持。
1.2 基于内容的图像检索技术
基于内容的图像检索具有如下几方面的特点[]:
1、直接从图像内容中提取信息线索。基于内容的图像检索,突破了传统的基于表达式检索的局限,直接对图像进行分析和特征提取。
2、基于内容的图像检索实质上是一种近似匹配的技术。在数据库中,需使用模式识别的方法对图像库中的图像按不同索引特征进行分类;检索过程中,采用某种相似度度量对图像库中的图像进行匹配,以获得查询结果。这一点与常规数据库检索的精确匹配方法明显不同。
3、特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。
特征提取是CBIR研究的核心内容。早期的许多研究工作企图找出一组“最佳”特征表示,它能最有效率地从图像中提取出来,并且能使图像检索的效果变得更好。遗憾的是到目前为止,并没有哪一种图像表示方法被证明适用于所有应用。因此,对于不同性质的图像,需要采用实验方法来确定最适合的图像表示方法。在考察具体的特征提取技术时,可以从三个方面来了解:特征提取(Extraction Method)、特征表示(Feature Representation)以及相似度度量(Similarity Measure)。国际标准MPEG-7的制定,其目的是希望使多媒体数据的特征表示标准化,从而使那些采用MPEG-7作为特征表示的系统达到跨系统检索的能力。
在图像检索系统中,特征提取方法和特征匹配方法是两个重要部分,有效的特征提取方法和匹配方法的选取对于一个图像检索系统是至关重要的,它们决定了图像检索系统的有效性和效率。图像的特征主要包括低层特征(Primitive Features)和语义特征(Semantic Features)(也称为高层特征)。低层特征主要包括图像的颜色、形状、纹理和空间关系等一些定量的特征,这些特征可以通过计算机自动或人机交互的方法来提取。图像的语义特征是一种定性特征,是对图像内容的抽象描述,语义特征主要通过人工或人机交互(如相关反馈、机器学习等方法)的方式提取。而且,CBIR在不同的应用领域可以采用不同的特征或特征组合进行检索。例如,在卫星系统中图像的纹理特征是十分重要的,而在商标配准系统中,商标的形状特征是最为重要的。在提取完图像的特征后,图像检索的主要任务就变成度量图像特征间的相似度问题。合理的相似度度量方法也是执行有效图像检索的关键,常用的相似度度量方法主要包括:欧氏距离、城区距离、二次式距离、直方图相交法等。不同的相似度度量方法也有其内在的优点和缺点,并非某一种度量方法对所有的图像检索系统均适用,它们也有各自的适用范围。图像检索时,应根据所提取的特征特点,选择合适的相似度度量方法。
CBIR分为三个层次[]:一是依据提取图像本身的颜色、形状、纹理、等低层特征进行检索;二是基于图像的低层特征,通过识别图像中的对象类别及对象间的空间拓扑关系进行检索;三是基于图像的语义特征(场景语义、行为语义和情感语义)的推理学习进行检索。上述三个层次由低到高,与人的认知接近。下一个层次通常包含了比上一个层次更高级的语义,而更高层的语义往往通过较低层的语义推理而获得。每个层次的检索算法有别,相似层次则需研究其映射关系。由此可见,基于内容的图像检索涉及图像处理、计算机视觉、数据挖掘、机器学习、模式识别、人机交互等诸多技术,是各种计算机技术的综合用用。CBIR实现的途径有基于传统的数据库检索方法及基于信号处理理论、采用模式识别和特征抽取的混合方法,可应用于社会安全、遥感、医学、数字图书馆、建筑、计算机辅助设计、地理信息系统、商标版权管理等诸多领域。
1.3 国内外研究现状
图像检索技术自20世纪70年代开始便成为一个非常活跃的研究领域,其推动力来源于两大研究团体[]:数据库系统和计算机视觉,它们从基于文本以及基于内容这两个不同的角度,对图像检索进行了研究。
90年代早期,由于大规模图像数据库出现,利用人工标注的图像检索已经不能满足人们的需要。1992年,美国自然科学基金组织的可视化信息系统研讨会提出采用更加有效的、直观的方式表现图像内在的可视属性,并应用这些属性进行图像的检索。于是,基于内容的图像检索技术开始产生了[]。这种检索技术是一项复杂的工作过程,融传统的模式识别技术与多媒体人机交互技术为一体,是多种高技术合成的新兴的检索技术。
图像检索系统的用户是人,因此通过交互手段来捕获人对图像内容的认知是相当重要的。为了把用户模型嵌入到图像检索系统,最近几年在基于内容的图像检索领域引入了相关反馈机制,基于内容的相关反馈是一个逐步求精的过程。
目前,美国麻省理工学院、伊利诺斯大学、荷兰阿姆斯特丹大学等相继开展了相关反馈在图像检索系统中的应用,其典型代表是Rui提出的调整权的方法和
Vasconcelos提出的贝叶斯方法[]。
随着基于内容的图像检索技术研究的不断深入,需要对图像低层特征的提取和描述制定新的标准。MPEG组织制定了MPEG-7国际标准,其主要是对多媒体如:视频、图像、音频等的内容描述进行研究。
提高图像检索性能的一个研究方向是基于图像的低层特征向量和先验知识,利用已有的机器学习理论(Machine learning)提取图像的语义信息,再基于语义进行查询,以提高检索准确率。经典的机器学习理论包括Bayesian理论,自组织映射(Self-Organization Map)理论,支持向量机(Support Vector Machine)理论主动学习(Active Learning)理论等,研究者们将这些理论应用到图像的语义聚类上,并结合相关反馈技术使系统能够动态学习相关性知识,自动将图像按语义相关性强度聚类,以达到更接近于人脑理解的图像检索效果。由于此类技术还很不成熟,所以成型的检索系统不多,多是研究者提出的理论框架。
几乎每年都会召开很多非常重要的,并且非常有权威的相关国际会议。IEEE Conference on ICIP是其中一个很重要的国际会议,除了这个会议,每年召开的比较著名的还有IEEE Conference on CVPR,SPIE Conference on Electronic Imaging。一些著名国际期刊如《IEEE Transaction on Image processing》,除了这个著名期刊,还有《IEEE Transactions on patter Analysis and Machine intelligence》,以及《Computer vision and Image Understanding》等纷纷设专刊介绍该领域研究成果[]。
在国内,基于内容的图像检索系统主要有中国科学院计算技术研究所智能信息处理重点实验室开发的基于内容的图像检索演示系统(Mires),Mires系统是一个综合利用高层语义特征和低层可视特征的图像检索系统。它通过机器学习的办法提取图像语义类别来表示图像高层内容;低层特征则集成图像的颜色、纹理、边缘特征。该系统还实现了基于核函数和SVM的相关反馈算法。Mires系统对各种类别的图像都能进行有效的检索。它可通过两种方式进行图像检索:
l、通过图像浏览方式,用户浏览图像数据库中各个图像类别的图像,选定感兴趣的图像后可根据该图像从图像数据库中检索出相似的图像。
2、通过图像检索方式,用户直接从列出的典型图像中选择感兴趣的图像进行检索。
概括起来,有以下几个著名的成果:IBM公司的QBCI系统,UIUC的MARSI,麻省理工学院的Photobook,加利福尼亚大学的Virage以及哥伦比亚大学开发的VisualSEEK系统等,国内的主要研究单位有:国防科技大学多媒体实验室、中科院自动化所、浙江大学计算机系。
1.4 本文研究内容及章节安排
本文重点针对基于颜色、纹理特征的图像检索技术开展研究。首先,在颜色特征检索方面,选取符合人类视觉特性的HSV颜色空间模型,用颜色直方图均衡化的方法实现检索过程;其次,针对纹理特征检索,则采用双树复小波的方法进行特征提取,并用Canberra距离进行特征匹配;最后,综合颜色和纹理特征检索,将颜色、纹理特征向量进行外部归一化,把特征距离的加权和作为相似距离。实验结果表明,所提出的方法具有较好的检索效果。
本文共分为六个章节,具体安排如下:
第一章简要介绍了图像检索的研究背景和意义,以及在国内外的发展情况,同时说明了本文的内容安排和所进行的重要研究工作。
第二章详细阐述了基于内容的图像检索的相关技术。首先介绍CBIR系统的体系结构,接着详细介绍颜色、纹理、形状特征的描述方法以及特征匹配技术的算法,最后给出基于内容的图像检索的基本步骤及流程图。
第三章详细介绍了各种颜色空间模型,选取符合人类视觉特性的HSV空间模型,采用3-D HSV颜色直方图均衡化的方法实现对图像特征的提取,用欧氏距离计算相似距离进行特征匹配,最后显示基于颜色特征检索的实验结果。
第四章首先介绍了双树复小波变换的原理。在进行纹理特征提取之前先对图像进行灰度化处理,将原图像变换为灰度图,然后采用2-D双树复小波(DT-CWT)3级分解提取图像的纹理特征并用Canberra距离进行特征匹配,最后显示基于纹理特征检索不同图像库的实验结果。
摘 要
随着多媒体技术和互联网的迅速发展,图像检索技术已成为一个非常活跃的研究领域。基于内容的图像检索不同于传统的基于文本的图像检索,它实际上是一种模糊查询技术,通过对图像提取颜色、纹理、形状等特征,找出在特征空间中与查询要求最接近的图像。实现快速有效的图像检索,关键在于采用何种特征作为索引以及特征如何匹配。
本文重点针对基于颜色、纹理特征的图像检索技术开展研究。首先,在颜色特征检索方面,选取符合人类视觉特性的HSV空间模型,然后采用3-D HSV颜色直方图均衡化方法实现基于颜色的图像检索,在颜色特征的相似性度量上采用欧氏距离计算相似性。
其次,针对纹理特征检索开展研究。在进行纹理特征提取之前先对图像进行灰度化处理,将原图像变换为灰度图,然后再进行纹理特征提取。考虑到双树复小波的纹理特征提取优势,采用2-D双树复小波(DT-CWT)分解提取图像的纹理特征,采用Canberra距离作为相似性度量标准。
最后,综合颜色和纹理特征进行图像检索。首先提取待查询图像的颜色特征和纹理特征向量,再分别计算每个特征向量与图像库中每个图像对应特征的相似距离,然后对两种特征向量距离进行外部归一化,之后把两个特征距离的加权和作为待查询图像与图像库中图像的相似距离,其中特征向量的权重值可由用户调节,从而完成对图像进行综合特征的图像检索。
为验证以上方法的有效性,对彩色图像、纹理图像进行检索实验,实验结果表明了本研究提出方法的有效性。
查看完整论文请+Q: 351916072
关键字:来进行图像检索。如何实现快速有效的图像检索,关键在于采用何种特征作为索引以及特征如何匹配,这正是基于内容的图像检索技术的核心,对它的研究具有十分重要的意义。人们对于CBIR技术的研究与探讨结合了计算机视觉、图形图像处理、图像理解和数据库,并且是这些计算领域之内的所有技术的一个非常重要的成果,CBIR技术的兴起与发展,同时也会给其他相关领域带来新的发展机会。 基于内容的图像检索,属于图像分析的一个研究领域,它的英语术语叫做CBIR(Content-BasedImageRetrieval)。基于内容的图像检索指的是查询条件本身就是一幅图像(或者是对于图像内容的描述),它建立索引的方式是通过提取图像特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两幅图像的相似程度。图像内容的描述及提取不再依赖于人的手工标注,而是借助于从图像中自动提取的视觉特征,检索过程也不再是关键字匹配,而是视觉特征间的特征匹配。 基于文本的图像检索,其研究主要在数据库领域中进行。其图像检索的一个典型框架是,首先对图像用文本进行注解,根据其内容手工将其标注为一系列关键字,并对关键字建立索引。这样,图像检索就转化为文本检索问题。然后用基于文本的数据库管理系统(DBMS)来进行图像检索。但是,基于文本的图像检索存在两大困难,尤其是当图像的数量非常大的时候。一是必须由人工完整地标注所有图像,当图像数量很大时,这种方法显然不可行;第二个问题是图像包含信息量庞大,不同用户对同一张图像的看法不尽相同,这就导致对图像的标注没有一个统一的标准,检索出的结果不能很好地符合用户的需求。
目 录
摘 要 I
ABSTRACT II
第1章 绪 论 1
1.1 课题研究的背景和意义 1
1.2 基于内容的图像检索技术 2
1.3 国内外研究现状 3
1.4 本文研究内容及章节安排 5
第2章 基于内容的图像检索相关技术 7
2.1 基于内容的图像检索的体系结构 7
2.2 常用的低层特征的描述方法 7
2.2.1 颜色特征 8
2.2.2 纹理特征 10
2.2.3 形状特征 13
2.3 特征匹配技术 14
2.3.1 计量定理 15
2.3.2 常用的匹配方法 15
2.4 基于内容的图像检索技术的基本步骤 20
第3章 基于颜色特征的图像检索 21
3.1 颜色空间 21
3.1.1 RGB颜色空间 21
3.1.2 YCbCr颜色空间与YUV颜色空间 22
3.1.3 HSV颜色空间 23
3.2 3-D HSV颜色直方图均衡化 26
3.3 实验步骤 27
3.4 实验结果 27
第4章 基于纹理特征的图像检索 33
4.1 双树复小波变换原理 33
4.2 图像纹理特征提取 36
4.3 相似性度量 36
4.4 实验算法描述 36
4.5 实验结果 37
4.5.1 Brodatz纹理图像库 37
4.5.2 fenge图像库 38
4.5.3 image1图像库 38
第5章 综合颜色和纹理特征的图像检索 41
5.1 特征向量的外部归一化 41
5.2 综合颜色和纹理特征图像检索的实现步骤 41
5.3 系统设计 42
5.3.1 系统实现流程图 42
5.3.2 系统界面与操作 42
5.4 实验结果 44
第6章 总结与展望 49
6.1 总结 49
6.2 展望 49
参考文献 51
致 谢 53
附录:英文翻译原文 54
英文翻译 69
第1章 绪 论
1.1 课题研究的背景和意义
随着信息化社会的到来以及信息高速公路的实施,人们越来越多的接触到大量的图像信息,大容量高速存储系统为图像的海量存储提供了基本保障,各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得日益重要。图像数据库的研究对多媒体数据库、电子图书馆、医疗学图像管理、罪犯识别系统、卫星遥感图像、地理信息系统、商标版权管理等方面提供了有力的支持。
1.2 基于内容的图像检索技术
基于内容的图像检索具有如下几方面的特点[]:
1、直接从图像内容中提取信息线索。基于内容的图像检索,突破了传统的基于表达式检索的局限,直接对图像进行分析和特征提取。
2、基于内容的图像检索实质上是一种近似匹配的技术。在数据库中,需使用模式识别的方法对图像库中的图像按不同索引特征进行分类;检索过程中,采用某种相似度度量对图像库中的图像进行匹配,以获得查询结果。这一点与常规数据库检索的精确匹配方法明显不同。
3、特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。
特征提取是CBIR研究的核心内容。早期的许多研究工作企图找出一组“最佳”特征表示,它能最有效率地从图像中提取出来,并且能使图像检索的效果变得更好。遗憾的是到目前为止,并没有哪一种图像表示方法被证明适用于所有应用。因此,对于不同性质的图像,需要采用实验方法来确定最适合的图像表示方法。在考察具体的特征提取技术时,可以从三个方面来了解:特征提取(Extraction Method)、特征表示(Feature Representation)以及相似度度量(Similarity Measure)。国际标准MPEG-7的制定,其目的是希望使多媒体数据的特征表示标准化,从而使那些采用MPEG-7作为特征表示的系统达到跨系统检索的能力。
在图像检索系统中,特征提取方法和特征匹配方法是两个重要部分,有效的特征提取方法和匹配方法的选取对于一个图像检索系统是至关重要的,它们决定了图像检索系统的有效性和效率。图像的特征主要包括低层特征(Primitive Features)和语义特征(Semantic Features)(也称为高层特征)。低层特征主要包括图像的颜色、形状、纹理和空间关系等一些定量的特征,这些特征可以通过计算机自动或人机交互的方法来提取。图像的语义特征是一种定性特征,是对图像内容的抽象描述,语义特征主要通过人工或人机交互(如相关反馈、机器学习等方法)的方式提取。而且,CBIR在不同的应用领域可以采用不同的特征或特征组合进行检索。例如,在卫星系统中图像的纹理特征是十分重要的,而在商标配准系统中,商标的形状特征是最为重要的。在提取完图像的特征后,图像检索的主要任务就变成度量图像特征间的相似度问题。合理的相似度度量方法也是执行有效图像检索的关键,常用的相似度度量方法主要包括:欧氏距离、城区距离、二次式距离、直方图相交法等。不同的相似度度量方法也有其内在的优点和缺点,并非某一种度量方法对所有的图像检索系统均适用,它们也有各自的适用范围。图像检索时,应根据所提取的特征特点,选择合适的相似度度量方法。
CBIR分为三个层次[]:一是依据提取图像本身的颜色、形状、纹理、等低层特征进行检索;二是基于图像的低层特征,通过识别图像中的对象类别及对象间的空间拓扑关系进行检索;三是基于图像的语义特征(场景语义、行为语义和情感语义)的推理学习进行检索。上述三个层次由低到高,与人的认知接近。下一个层次通常包含了比上一个层次更高级的语义,而更高层的语义往往通过较低层的语义推理而获得。每个层次的检索算法有别,相似层次则需研究其映射关系。由此可见,基于内容的图像检索涉及图像处理、计算机视觉、数据挖掘、机器学习、模式识别、人机交互等诸多技术,是各种计算机技术的综合用用。CBIR实现的途径有基于传统的数据库检索方法及基于信号处理理论、采用模式识别和特征抽取的混合方法,可应用于社会安全、遥感、医学、数字图书馆、建筑、计算机辅助设计、地理信息系统、商标版权管理等诸多领域。
1.3 国内外研究现状
图像检索技术自20世纪70年代开始便成为一个非常活跃的研究领域,其推动力来源于两大研究团体[]:数据库系统和计算机视觉,它们从基于文本以及基于内容这两个不同的角度,对图像检索进行了研究。
90年代早期,由于大规模图像数据库出现,利用人工标注的图像检索已经不能满足人们的需要。1992年,美国自然科学基金组织的可视化信息系统研讨会提出采用更加有效的、直观的方式表现图像内在的可视属性,并应用这些属性进行图像的检索。于是,基于内容的图像检索技术开始产生了[]。这种检索技术是一项复杂的工作过程,融传统的模式识别技术与多媒体人机交互技术为一体,是多种高技术合成的新兴的检索技术。
图像检索系统的用户是人,因此通过交互手段来捕获人对图像内容的认知是相当重要的。为了把用户模型嵌入到图像检索系统,最近几年在基于内容的图像检索领域引入了相关反馈机制,基于内容的相关反馈是一个逐步求精的过程。
目前,美国麻省理工学院、伊利诺斯大学、荷兰阿姆斯特丹大学等相继开展了相关反馈在图像检索系统中的应用,其典型代表是Rui提出的调整权的方法和
Vasconcelos提出的贝叶斯方法[]。
随着基于内容的图像检索技术研究的不断深入,需要对图像低层特征的提取和描述制定新的标准。MPEG组织制定了MPEG-7国际标准,其主要是对多媒体如:视频、图像、音频等的内容描述进行研究。
提高图像检索性能的一个研究方向是基于图像的低层特征向量和先验知识,利用已有的机器学习理论(Machine learning)提取图像的语义信息,再基于语义进行查询,以提高检索准确率。经典的机器学习理论包括Bayesian理论,自组织映射(Self-Organization Map)理论,支持向量机(Support Vector Machine)理论主动学习(Active Learning)理论等,研究者们将这些理论应用到图像的语义聚类上,并结合相关反馈技术使系统能够动态学习相关性知识,自动将图像按语义相关性强度聚类,以达到更接近于人脑理解的图像检索效果。由于此类技术还很不成熟,所以成型的检索系统不多,多是研究者提出的理论框架。
几乎每年都会召开很多非常重要的,并且非常有权威的相关国际会议。IEEE Conference on ICIP是其中一个很重要的国际会议,除了这个会议,每年召开的比较著名的还有IEEE Conference on CVPR,SPIE Conference on Electronic Imaging。一些著名国际期刊如《IEEE Transaction on Image processing》,除了这个著名期刊,还有《IEEE Transactions on patter Analysis and Machine intelligence》,以及《Computer vision and Image Understanding》等纷纷设专刊介绍该领域研究成果[]。
在国内,基于内容的图像检索系统主要有中国科学院计算技术研究所智能信息处理重点实验室开发的基于内容的图像检索演示系统(Mires),Mires系统是一个综合利用高层语义特征和低层可视特征的图像检索系统。它通过机器学习的办法提取图像语义类别来表示图像高层内容;低层特征则集成图像的颜色、纹理、边缘特征。该系统还实现了基于核函数和SVM的相关反馈算法。Mires系统对各种类别的图像都能进行有效的检索。它可通过两种方式进行图像检索:
l、通过图像浏览方式,用户浏览图像数据库中各个图像类别的图像,选定感兴趣的图像后可根据该图像从图像数据库中检索出相似的图像。
2、通过图像检索方式,用户直接从列出的典型图像中选择感兴趣的图像进行检索。
概括起来,有以下几个著名的成果:IBM公司的QBCI系统,UIUC的MARSI,麻省理工学院的Photobook,加利福尼亚大学的Virage以及哥伦比亚大学开发的VisualSEEK系统等,国内的主要研究单位有:国防科技大学多媒体实验室、中科院自动化所、浙江大学计算机系。
1.4 本文研究内容及章节安排
本文重点针对基于颜色、纹理特征的图像检索技术开展研究。首先,在颜色特征检索方面,选取符合人类视觉特性的HSV颜色空间模型,用颜色直方图均衡化的方法实现检索过程;其次,针对纹理特征检索,则采用双树复小波的方法进行特征提取,并用Canberra距离进行特征匹配;最后,综合颜色和纹理特征检索,将颜色、纹理特征向量进行外部归一化,把特征距离的加权和作为相似距离。实验结果表明,所提出的方法具有较好的检索效果。
本文共分为六个章节,具体安排如下:
第一章简要介绍了图像检索的研究背景和意义,以及在国内外的发展情况,同时说明了本文的内容安排和所进行的重要研究工作。
第二章详细阐述了基于内容的图像检索的相关技术。首先介绍CBIR系统的体系结构,接着详细介绍颜色、纹理、形状特征的描述方法以及特征匹配技术的算法,最后给出基于内容的图像检索的基本步骤及流程图。
第三章详细介绍了各种颜色空间模型,选取符合人类视觉特性的HSV空间模型,采用3-D HSV颜色直方图均衡化的方法实现对图像特征的提取,用欧氏距离计算相似距离进行特征匹配,最后显示基于颜色特征检索的实验结果。
第四章首先介绍了双树复小波变换的原理。在进行纹理特征提取之前先对图像进行灰度化处理,将原图像变换为灰度图,然后采用2-D双树复小波(DT-CWT)3级分解提取图像的纹理特征并用Canberra距离进行特征匹配,最后显示基于纹理特征检索不同图像库的实验结果。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/gdxx/474.html