2-D双树复小波(DT-CWT)分解提取图像检索研究方法研究
2-D双树复小波(DT-CWT)分解提取图像检索研究方法研究
本文重点针对基于颜色、纹理特征的图像检索技术开展研究。首先,在颜色特征检索方面,选取符合人类视觉特性的HSV空间模型,然后采用3-D HSV颜色直方图均衡化方法实现基于颜色的图像检索,在颜色特征的相似性度量上采用欧氏距离计算相似性。
其次,针对纹理特征检索开展研究。在进行纹理特征提取之前先对图像进行灰度化处理,将原图像变换为灰度图,然后再进行纹理特征提取。考虑到双树复小波的纹理特征提取优势,采用2-D双树复小波(DT-CWT)分解提取图像的纹理特征,采用Canberra距离作为相似性度量标准。
最后,综合颜色和纹理特征进行图像检索。首先提取待查询图像的颜色特征和纹理特征向量,再分别计算每个特征向量与图像库中每个图像对应特征的相似距离,然后对两种特征向量距离进行外部归一化,之后把两个特征距离的加权和作为待查询图像与图像库中图像的相似距离,其中特征向量的权重值可由用户调节,从而完成对图像进行综合特征的图像检索。 20190805185802
为验证以上方法的有效性,对彩色图像、纹理图像进行检索实验,实验结果表明了本研究提出方法的有效性。
关键词:图像检索;颜色特征;纹理特征;欧氏距离;Canberra距离
1.2 基于内容的图像检索技术
基于内容的图像检索,属于图像分析的一个研究领域,它的英语术语叫做CBIR(Content-Based Image Retrieval)。基于内容的图像检索指的是查询条件本身就是一幅图像(或者是对于图像内容的描述),它建立索引的方式是通过提取图像特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两幅图像的相似程度。图像内容的描述及提取不再依赖于人的手工标注,而是借助于从图像中自动提取的视觉特征,检索过程也不再是关键字匹配,而是视觉特征间的特征匹配。
基于内容的图像检索具有如下几方面的特点[[[3]孙君顶, 赵珊. 图像低层特征提取与检索技术[M]. 电子工业出版社, 2009.]]:
1、直接从图像内容中提取信息线索。基于内容的图像检索,突破了传统的基于表达式检索的局限,直接对图像进行分析和特征提取。
2、基于内容的图像检索实质上是一种近似匹配的技术。在数据库中,需使用模式识别的方法对图像库中的图像按不同索引特征进行分类;检索过程中,采用某种相似度度量对图像库中的图像进行匹配,以获得查询结果。这一点与常规数据库检索的精确匹配方法明显不同。
3、特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。
特征提取是CBIR研究的核心内容。早期的许多研究工作企图找出一组“最佳”特征表示,它能最有效率地从图像中提取出来,并且能使图像检索的效果变得更好。遗憾的是到目前为止,并没有哪一种图像表示方法被证明适用于所有应用。因此,对于不同性质的图像,需要采用实验方法来确定最适合的图像表示方法。在考察具体的特征提取技术时,可以从三个方面来了解:特征提取(Extraction Method)、特征表示(Feature Representation)以及相似度度量(Similarity Measure)。国际标准MPEG-7的制定,其目的是希望使多媒体数据的特征表示标准化,从而使那些采用MPEG-7作为特征表示的系统达到跨系统检索的能力。
在图像检索系统中,特征提取方法和特征匹配方法是两个重要部分,有效的特征提取方法和匹配方法的选取对于一个图像检索系统是至关重要的,它们决定了图像检索系统的有效性和效率。图像的特征主要包括低层特征(Primitive Features)和语义特征(Semantic Features)(也称为高层特征)。低层特征主要包括图像的颜色、形状、纹理和空间关系等一些定量的特征,这些特征可以通过计算机自动或人机交互的方法来提取。图像的语义特征是一种定性特征,是对图像内容的抽象描述,语义特征主要通过人工或人机交互(如相关反馈、机器学习等方法)的方式提取。而且,CBIR在不同的应用领域可以采用不同的特征或特征组合进行检索。例如,在卫星系统中图像的纹理特征是十分重要的,而在商标配准系统中,商标的形状特征是最为重要的。在提取完图像的特征后,图像检索的主要任务就变成度量图像特征间的相似度问题。合理的相似度度量方法也是执行有效图像检索的关键,常用的相似度度量方法主要包括:欧氏距离、城区距离、二次式距离、直方图相交法等。不同的相似度度量方法也有其内在的优点和缺点,并非某一种度量方法对所有的图像检索系统均适用,它们也有各自的适用范围。图像检索时,应根据所提取的特征特点,选择合适的相似度度量方法。
CBIR分为三个层次[[[4]陈秀新, 邢素霞. 图像/视频检索与图像融合[M]. 机械工业出版社, 2011.]]:一是依据提取图像本身的颜色、形状、纹理、等低层特征进行检索;二是基于图像的低层特征,通过识别图像中的对象类别及对象间的空间拓扑关系进行检索;三是基于图像的语义特征(场景语义、行为语义和情感语义)的推理学习进行检索。上述三个层次由低到高,与人的认知接近。下一个层次通常包含了比上一个层次更高级的语义,而更高层的语义往往通过较低层的语义推理而获得。每个层次的检索算法有别,相似层次则需研究其映射关系。由此可见,基于内容的图像检索涉及图像处理、计算机视觉、数据挖掘、机器学习、模式识别、人机交互等诸多技术,是各种计算机技术的综合用用。CBIR实现的途径有基于传统的数据库检索方法及基于信号处理理论、采用模式识别和特征抽取的混合方法,可应用于社会安全、遥感、医学、数字图书馆、建筑、计算机辅助设计、地理信息系统、商标版权管理等诸多领域。
第2章 基于内容的图像检索相关技术
2.1 基于内容的图像检索的体系结构
一个典型的CBIR系统结构我们可以图2.1来表示,很明显,它一般可以分为两大比较大的组成部分:上半部分叫做图像特征提取子系统;下半部分叫做图像检索子系统。
图2.1 CBIR系统的体系结构
在传统的典型的CBIR系统中,其中非常重要的一个组成部分就是图像特征
提取子系统,它要完成的主要任务是:获取原始图像,之后对图像进行相关的预
处理,之后便自动进行特征提取和描述,并生成图像特征库,这样我们就可以完
成了图像特征的提取以及存储过程,并生成了系统的图像特征库,用于查询时的
一个数据库。
基于内容的图像检索体系结构的核心模块是图像检索模块,它的主要功能我
们可以大致概括如下:它首先要根据用户的图像查询需求,然后按照特征提取算
法,自动的进行查询图像的特征提取,之后就按照一些相似度算法,完成对图像
的相似性匹配并显示检索结果。一个CBIR系统,应该也必须为有查询要求的用户提供一个可以进行交互的查询界面,方面用户进行查询参考图像的输入或者用于匹配的特征的输入,并能将检索的结果直观的返回给交互界面。
摘 要 I
ABSTRACT II
第1章 绪 论 1
1.1 课题研究的背景和意义 1
1.2 基于内容的图像检索技术 2
1.3 国内外研究现状 3
1.4 本文研究内容及章节安排 5
第2章 基于内容的图像检索相关技术 7
2.1 基于内容的图像检索的体系结构 7
2.2 常用的低层特征的描述方法 7
2.2.1 颜色特征 8
2.2.2 纹理特征 10
2.2.3 形状特征 13
2.3 特征匹配技术 14
2.3.1 计量定理 15
2.3.2 常用的匹配方法 15
2.4 基于内容的图像检索技术的基本步骤 20
第3章 基于颜色特征的图像检索 21
3.1 颜色空间 21
3.1.1 RGB颜色空间 21
3.1.2 YCbCr颜色空间与YUV颜色空间 22
3.1.3 HSV颜色空间 23
3.2 3-D HSV颜色直方图均衡化 26
3.3 实验步骤 27
3.4 实验结果 27
第4章 基于纹理特征的图像检索 33
4.1 双树复小波变换原理 33
4.2 图像纹理特征提取 36
4.3 相似性度量 36
4.4 实验算法描述 36
4.5 实验结果 37
4.5.1 Brodatz纹理图像库 37
4.5.2 fenge图像库 38
4.5.3 image1图像库 38
第5章 综合颜色和纹理特征的图像检索 41
5.1 特征向量的外部归一化 41
5.2 综合颜色和纹理特征图像检索的实现步骤 41
5.3 系统设计 42
5.3.1 系统实现流程图 42
5.3.2 系统界面与操作 42
5.4 实验结果 44
第6章 总结与展望 49
6.1 总结 49
6.2 展望 49
参考文献 51
致 谢 53
附录:英文翻译原文 54
英文翻译 69
本文重点针对基于颜色、纹理特征的图像检索技术开展研究。首先,在颜色特征检索方面,选取符合人类视觉特性的HSV空间模型,然后采用3-D HSV颜色直方图均衡化方法实现基于颜色的图像检索,在颜色特征的相似性度量上采用欧氏距离计算相似性。
其次,针对纹理特征检索开展研究。在进行纹理特征提取之前先对图像进行灰度化处理,将原图像变换为灰度图,然后再进行纹理特征提取。考虑到双树复小波的纹理特征提取优势,采用2-D双树复小波(DT-CWT)分解提取图像的纹理特征,采用Canberra距离作为相似性度量标准。
最后,综合颜色和纹理特征进行图像检索。首先提取待查询图像的颜色特征和纹理特征向量,再分别计算每个特征向量与图像库中每个图像对应特征的相似距离,然后对两种特征向量距离进行外部归一化,之后把两个特征距离的加权和作为待查询图像与图像库中图像的相似距离,其中特征向量的权重值可由用户调节,从而完成对图像进行综合特征的图像检索。 20190805185802
为验证以上方法的有效性,对彩色图像、纹理图像进行检索实验,实验结果表明了本研究提出方法的有效性。
关键词:图像检索;颜色特征;纹理特征;欧氏距离;Canberra距离
1.2 基于内容的图像检索技术
基于内容的图像检索,属于图像分析的一个研究领域,它的英语术语叫做CBIR(Content-Based Image Retrieval)。基于内容的图像检索指的是查询条件本身就是一幅图像(或者是对于图像内容的描述),它建立索引的方式是通过提取图像特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两幅图像的相似程度。图像内容的描述及提取不再依赖于人的手工标注,而是借助于从图像中自动提取的视觉特征,检索过程也不再是关键字匹配,而是视觉特征间的特征匹配。
基于内容的图像检索具有如下几方面的特点[[[3]孙君顶, 赵珊. 图像低层特征提取与检索技术[M]. 电子工业出版社, 2009.]]:
1、直接从图像内容中提取信息线索。基于内容的图像检索,突破了传统的基于表达式检索的局限,直接对图像进行分析和特征提取。
2、基于内容的图像检索实质上是一种近似匹配的技术。在数据库中,需使用模式识别的方法对图像库中的图像按不同索引特征进行分类;检索过程中,采用某种相似度度量对图像库中的图像进行匹配,以获得查询结果。这一点与常规数据库检索的精确匹配方法明显不同。
3、特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。
特征提取是CBIR研究的核心内容。早期的许多研究工作企图找出一组“最佳”特征表示,它能最有效率地从图像中提取出来,并且能使图像检索的效果变得更好。遗憾的是到目前为止,并没有哪一种图像表示方法被证明适用于所有应用。因此,对于不同性质的图像,需要采用实验方法来确定最适合的图像表示方法。在考察具体的特征提取技术时,可以从三个方面来了解:特征提取(Extraction Method)、特征表示(Feature Representation)以及相似度度量(Similarity Measure)。国际标准MPEG-7的制定,其目的是希望使多媒体数据的特征表示标准化,从而使那些采用MPEG-7作为特征表示的系统达到跨系统检索的能力。
在图像检索系统中,特征提取方法和特征匹配方法是两个重要部分,有效的特征提取方法和匹配方法的选取对于一个图像检索系统是至关重要的,它们决定了图像检索系统的有效性和效率。图像的特征主要包括低层特征(Primitive Features)和语义特征(Semantic Features)(也称为高层特征)。低层特征主要包括图像的颜色、形状、纹理和空间关系等一些定量的特征,这些特征可以通过计算机自动或人机交互的方法来提取。图像的语义特征是一种定性特征,是对图像内容的抽象描述,语义特征主要通过人工或人机交互(如相关反馈、机器学习等方法)的方式提取。而且,CBIR在不同的应用领域可以采用不同的特征或特征组合进行检索。例如,在卫星系统中图像的纹理特征是十分重要的,而在商标配准系统中,商标的形状特征是最为重要的。在提取完图像的特征后,图像检索的主要任务就变成度量图像特征间的相似度问题。合理的相似度度量方法也是执行有效图像检索的关键,常用的相似度度量方法主要包括:欧氏距离、城区距离、二次式距离、直方图相交法等。不同的相似度度量方法也有其内在的优点和缺点,并非某一种度量方法对所有的图像检索系统均适用,它们也有各自的适用范围。图像检索时,应根据所提取的特征特点,选择合适的相似度度量方法。
CBIR分为三个层次[[[4]陈秀新, 邢素霞. 图像/视频检索与图像融合[M]. 机械工业出版社, 2011.]]:一是依据提取图像本身的颜色、形状、纹理、等低层特征进行检索;二是基于图像的低层特征,通过识别图像中的对象类别及对象间的空间拓扑关系进行检索;三是基于图像的语义特征(场景语义、行为语义和情感语义)的推理学习进行检索。上述三个层次由低到高,与人的认知接近。下一个层次通常包含了比上一个层次更高级的语义,而更高层的语义往往通过较低层的语义推理而获得。每个层次的检索算法有别,相似层次则需研究其映射关系。由此可见,基于内容的图像检索涉及图像处理、计算机视觉、数据挖掘、机器学习、模式识别、人机交互等诸多技术,是各种计算机技术的综合用用。CBIR实现的途径有基于传统的数据库检索方法及基于信号处理理论、采用模式识别和特征抽取的混合方法,可应用于社会安全、遥感、医学、数字图书馆、建筑、计算机辅助设计、地理信息系统、商标版权管理等诸多领域。
第2章 基于内容的图像检索相关技术
2.1 基于内容的图像检索的体系结构
一个典型的CBIR系统结构我们可以图2.1来表示,很明显,它一般可以分为两大比较大的组成部分:上半部分叫做图像特征提取子系统;下半部分叫做图像检索子系统。
在传统的典型的CBIR系统中,其中非常重要的一个组成部分就是图像特征
提取子系统,它要完成的主要任务是:获取原始图像,之后对图像进行相关的预
处理,之后便自动进行特征提取和描述,并生成图像特征库,这样我们就可以完
成了图像特征的提取以及存储过程,并生成了系统的图像特征库,用于查询时的
一个数据库。
基于内容的图像检索体系结构的核心模块是图像检索模块,它的主要功能我
们可以大致概括如下:它首先要根据用户的图像查询需求,然后按照特征提取算
法,自动的进行查询图像的特征提取,之后就按照一些相似度算法,完成对图像
的相似性匹配并显示检索结果。一个CBIR系统,应该也必须为有查询要求的用户提供一个可以进行交互的查询界面,方面用户进行查询参考图像的输入或者用于匹配的特征的输入,并能将检索的结果直观的返回给交互界面。
摘 要 I
ABSTRACT II
第1章 绪 论 1
1.1 课题研究的背景和意义 1
1.2 基于内容的图像检索技术 2
1.3 国内外研究现状 3
1.4 本文研究内容及章节安排 5
第2章 基于内容的图像检索相关技术 7
2.1 基于内容的图像检索的体系结构 7
2.2 常用的低层特征的描述方法 7
2.2.1 颜色特征 8
2.2.2 纹理特征 10
2.2.3 形状特征 13
2.3 特征匹配技术 14
2.3.1 计量定理 15
2.3.2 常用的匹配方法 15
2.4 基于内容的图像检索技术的基本步骤 20
第3章 基于颜色特征的图像检索 21
3.1 颜色空间 21
3.1.1 RGB颜色空间 21
3.1.2 YCbCr颜色空间与YUV颜色空间 22
3.1.3 HSV颜色空间 23
3.2 3-D HSV颜色直方图均衡化 26
3.3 实验步骤 27
3.4 实验结果 27
第4章 基于纹理特征的图像检索 33
4.1 双树复小波变换原理 33
4.2 图像纹理特征提取 36
4.3 相似性度量 36
4.4 实验算法描述 36
4.5 实验结果 37
4.5.1 Brodatz纹理图像库 37
4.5.2 fenge图像库 38
4.5.3 image1图像库 38
第5章 综合颜色和纹理特征的图像检索 41
5.1 特征向量的外部归一化 41
5.2 综合颜色和纹理特征图像检索的实现步骤 41
5.3 系统设计 42
5.3.1 系统实现流程图 42
5.3.2 系统界面与操作 42
5.4 实验结果 44
第6章 总结与展望 49
6.1 总结 49
6.2 展望 49
参考文献 51
致 谢 53
附录:英文翻译原文 54
英文翻译 69
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/2269.html