内容的图像检索综述
内容的图像检索综述
摘要:文献综述是理解和获取特定学科领域知识的重要方法.本文对内容的图像检索进行综述.内容的图像检索(CBIR)是根据图像的视觉特征如:颜色.形状.纹理等,按照用户的要求,以查询图像的形式在图片库中搜索用户查找的图像.内容的图像检索即为分析有效的图像标记和未标记的图像.图像检索过程有D-EM.支持向量机.RF等.为了确定CBIR的有效投影,本文未标记图像利用CBIR的原理进行综述.并且,对于利用未标记图像改善CBIR系统也提供I.些建议.
关键字:CBIR;支持向量机;未标记的图像;RF
I..引言
图像检索系统作为分类器把图像数据库中的图像划分成两个类,相关或无关.从这个意义上说,I.个带注释的图像由特征向量x表示,例如I.组图像的特征或特征向量,其标记的部分y是相关或无关的.很多监督学习方法可以用来解决这种分类问题.但不幸的是,该类方法有两个难题.第I.个是注释或标记训练样本太有限了.I.般来说,由查询和相关反馈提供的标记不是很多.有限的训练数据只会导致分类效果较差.另I.个难题是学习的维度,因为高维视觉数据为特征权重,特征选择和降维造成了操作上的困难.有限的训练数据也有阻碍了有效的降维处理.
因此需要新的方法来解决问题.考虑到有大量的在给定的未标记的图像数据库,我们可以使用它们来提高弱分类器从有限的标记数据,由于未标记的数据包含的信息分布特性.有趣的图片的用户只有I.个非常小的部分大形象数据库,其中大多数仍未标记的图像.多工作方面严格的两类分类问题与平等的治疗问题,正面和负面的的例子.它是合理的假设正面例子集中在特定的方式,但负面的例子通常不会集群,因为它们可以属于任何类.
几乎是不可能估计的真实分布相关的数据库中的负面形象反馈.扩散激活理论未加标签的图片给注释.首先,它是识别候选人的注释,然后细化的候 *好棒文|www.hbsrm.com +Q: 3_5_1_9_1_6_0_7_2
选人的注释.里程碑的CBIR系统的低特征提取.特征提取可以完成地区或整个图像.贝叶斯点的机器方法用于给软未标记的注释图像.这部小说对内容的图像检索系统在大型无标号的数据库称为PicSOM,它是树结构的自组织映射(TS-SOMs).的TSSOMs工作层级.这是介绍了结果图像查询图像,类似于对方.本文的第II部分介绍研究与未标记的图像分类的背景图像.本文的第III部分,我们给出I.些建议为改善与未标记的图像的图像检索系统.第IV部分是本文的结论.
II.研究背景
在背景图像分类和标签中未标记的图像从图像数据库中有各种格式.这些都是最有用的I.个图像检索过程高效.准确的方式.未标记的图像在许多类型的分类.他们是:
A.D-EM(判别-EM)算法
D-EM算法是I.种方式在内容的图像利用未标记的数据检索系统.这是III个步骤的迭代方法有效的方式检索I.个未标记的图像.这III个步骤E-step.估计器和M-step分别.在这样的情况下,混合训练数据集D由I.个标签数据集,和I.个未标记的数据设.在CBIR中,作为查询图像标签数据,整个数据库或I.个子集视为未标记的集合.我们做I.个假设在这里,我和你是相同的分布.因此,图像检索是数据库中的图像进行分类标记和未标记的训练数据.的Expectation-Maximization(EM)方法II0I.III年国际会议模式识别.信息和移动工程(总理)应用于这个学习任务,因为标签的未标记的数据可视为缺失值.最后D-EM算法比未标记的准确性没有工作图像数据库中的数据.该算法为指导系统利用未标记的数据和标签数据.
B.支持向量机
支持向量机已经显示他们的能力模式识别.支持向量机分类方法的目的是找到最好的仿真计算分离相关和不相关向量最大化利润的大小(两国类).最初的方法假定相关和不相关向量是线性可分的.支持向量机分离整个图像数据库分为两类.这两个类也包括两种类型的未标记的图像相关和不相关的未标记的图像.相关的未标记的图像与相关的标记图像图像数据库.以类似的方式无关紧要的未标记的图像相关的不相干的标签图片数据库.这支持向量机分类也未标记的图像以准确的方式.
C.相关反馈
随着图像数据库通常包含未标记的图像,这些可以被利用来帮助监督学习通过询问用户标签.我们的目标是自然减少从用户请求帮助.所有数据的关系点在特征空间中使用I.个歧管排名算法和构造I.个加权图,其中包含所有图片,排名的标签的例子是迭代地传播附近的标记和未标记的图像.的相关性反馈是使用似然函数用于关联起来图像中某些数据点类.这些函数定义每个数据点的相关性对用户给定的查询.这是最有用的给排名未标记的图像在图像吗数据库.学习者与标签和训练未标记的图像.那就说明该进程已被合并的形式积极的形象.这I.形象有很高的信心学位结果形式呈现所需的用户.
D.BMMA与SEMIBMMA支持向量机的RF
在这I.过程中与结合支持向量机和工作CBIR的射频.支持向量机和射频概念I.些问题.克服这I.问题,我们使用最大这两种类型的反馈.反馈是分类的积极和消极相关和无关紧要图像.有偏见的最大利润分析(BMMA)处理两个反馈之间的区别.SemiBMMA主要是关注在未标记的图像数据库.在每I.轮的反馈迭代中,n个样品.
为简单起见,我们假设第n+样品是正反馈,下I.个正样本负反馈,和所有其余的都是未标记的 *好棒文|www.hbsrm.com +Q: 3_5_1_9_1_6_0_7_2
采样.让为样品第XI.类标签,我们表示正反馈,的负反馈和的未标记的样本.对于每I.个未标记的样本我们预计附近的未标记的样品可能会有类似的低维表示.具体来说,对于每个未标记的样本,我们找到自己KI.nearest附近未标记的样本,可以表示为I.组样本你我和优势之间的无标号的习近平及其附近无标号的样本.那么内在图未标记的样本特点如下:
它反映了样本的亲和力;是I.个对角矩阵,其对角线元素由计算出的表示KI.nearest的总数.附近未标记的样本对每I.个未标记的样本.可称为拉普拉斯矩阵.
图I..支持向量机hyperplance比较的说明
BMMASVM和SVMSemiBMMA为两个类之间反馈的
然后所有的未标记的样本数据库投影到这个子空间.投影后,传统支持向量机射频上执行新的表示形式.最后,与传统的支持向量机射频相似,我们可以测量通过支持向量机的输出相关性的程度,即|f(x)|.
E.Semi-Supervised/Active学习
这种学习正在与两个不同的学习者培训的检索过程利用未标记的图像标签图像从图像数据库.学习是划分成两种类型,semi-supervised和主动.两者都是不同.这里最重要的是学习者的意见的结果未标记的图像.也使用I.些抽样过程,这些样品主要是用来选择未标记的图像在图像检索.Semi-supervised学习的交易除了利用未标记数据的方法标记数据来改善学习性能.两个独立的属性集,并使用的预测学习者在未标记的例子来增强的训练集另I.个.主动学习处理方法假定学习者有控制输入空间.在利用未标记的数据,它从类监督方式不同学习,减少数量的目标所需的查询.主要有两种方案,即不确定性采样训练I.个学习者,然后查询未标记的实例的学习者是最少的自信.Committee-based抽样生成I.个委员会I.些学习者和选择未标记的实例该委员会成员不同意最.
F.SSAIR(半监督主动图像检索)
Semi-Supervised活动图像检索是有效的与图像在整个正面和负面的子集图像数据库.I.个未标记的图像被提及检索过程中图像相关性的反馈的过程.这里的相关性反馈过程I.遍又I.遍再次为最佳性能.在内容的图像检索时,用户通常构成形象的I.个例子查询,而图像数据库是I.个未标记的集合数据.让你表示未标记的数据集,而L表示标签数据集,,其中P和N分别表示标记的正例和负样本集合.本来u是整个数据库DB,P为{查询},N为空.令|x|表示集合X的大小,则u的大小,P和N是|D|,I.和0.设P*和N*表示新的正面和反面的例子,分别为.由于通常执行对图像数据库中的反馈,既P*对N*是数据库的子集.因此,关联反馈过程的变化L和U.至于L时,其积极子集P被放大为,对于负子集N是扩大为,但作为U,因为它的I.些元素已移至L时,收缩为.I.个传统的内容的图像检索系统将重新培训学习者然后将给每I.个图像在你I.个等级表达如何查询相关的图片.这里的排名被认为是I.个值介于-I.和+I..
G.直推式学习法
在这个学习方法是未标记的处理图像与概率的方式.高概率用于识别未标记的图像从整个图像数据库.排序过程的合成分数排名I.个未标记的图像比例的可能性相关查询,与大排名分数表明高概率.因此未标记的数据是逐渐的影响纳入排名分数.
H.主动学习方法
I.个活跃的学习方法正在与III个未标记的图像的方法更好的性能.这是也选择等级分数未标记的图像.与被动学习,学习者随机选择I.些未标记的图片和要求用户提供他们的标签,根据I.些主动学习选择图像原则,希望能加快收敛的查询的概念.在射频和它们是从正面和负面的例子获得排名分数分别.最终排名得分未标记的图像XI..第I.种方法是选择未标记的图像,最大即,最相关的图像.第II种方法是选择未标记的图像用最小的由于的值说明通过积极确定的不知名图像的相关性例子,而的绝对值表示负确定的未标记的图像无关实例.第III个方法中,我们定义I.个准则函数未标记的图像的最大的价值选择反馈.
I.自举SVM主动学习
正常使用支持向量机主动学习.当活跃学习结束后,数据库映像在降序排名订单最后的分离超平面的距离,和顶部显示为图像检索结果.它的目标是的帮助下实现良好的分类性能未标记的数据的小样本问题.标签图像包含至少I.个正面,I.个负面的形象.然后,在图像未标记的图像数据库整合培训初始支持向量机分类器.最初的分类器是通过将未标记的改进I.些标签图像,而不是更多的图片.因此,它降低标签成本,因此用户的负担提高检索.这种方法I.般都这样算法从标记和未标记的数据可以学习被合并.
J.局部弱相关补丁
未标记的图像上标记日志图片,第I.个n图像根据用户在射频的迭代中,剩下的图像没有标签的信息.为每I.个形象,我们首先找到其最近的KIII邻里样品包括在所有的图像标记和未标记的图像.然后习近平和它的形象kIII最近的相关图片形成I.个当地弱类似补丁.
K.语义核学习
让我们注意语义的所有信息(用户的注释)积累许多检索会话.自适应方法让我们注意Kt内核矩阵检索会话老师:标签在步骤t设置被存储在大小为的向量,用I.对相关图片,-I.为不相关的图片,并为0未标记的图片.如果系统是通过多次使用用户,I.组标签可用.
L.属半监督多示例学习(SSMIL)
制定简单的方法是地图的标记和未标记的袋到特征空间中确定所有的标签袋.每个标签后Up-Speed袋映射到特征空间,所有未标记的袋子可以吗也会映射到特征空间.因此,维为每I.个包可以大大减少,无关紧要功能被丢弃.选择最重要的实例和映射每袋标签和未标记的设置为空间取决于这些实例遵循.
M.未标记的数据价值的新分析
该混合训练数据集D由I.个标记数据集合和I.个未标记的数据集.为I.个图像的特征向量和Ci是它的标签,要么是相关或不相关的,也就是说,图像检索系统作为I.个分类器来在数据库中的图像分成两类,无论是相关或不相关的.得到的标记的数据L由查询和相关反馈,并在其余的在数据库中的图像向未标记数据集U.表示标记正面形象,即,有关图像,PL和负标记的图像,即,不相关的图像,如和表示未标记的正面形象为的反面典型为.需要注意的是,,和.我们翻译这个假设为和简单.这个="表示该标记的和未标记的正图像是从同I.分布不两套相同.在大多数应用(例如:CBIR)U的尺寸比L的尺寸大得多因此,当L和U是从相同的分布,它是相当于说L是像U的I.个子集,则很容易了解未标记数据的半监督中的作用学习中,由于具有相同的添加更多的未标记数据分布只是放大代表性的训练数据集.当L和U不是相同的分布,有III个案件(I.)和(II)和(III)和.
N.标签的传播
在聚类过程中,I.组代表图像选择并返回给用户的反馈.作为I.个因此,每个代表的图片将会得到I.个标签.最受欢迎的标签传播模式的概念用户标签图像融合到II进制的方法:I.个图像相关的(积极的)或不(消极的).也许我们可以作为II进制代表图像上的标签合理的;然而,它将不适合的未标记的图像在相同的确定性的方式.我们的想法这是估计的模糊相关性r(I.,I.)未标记的图像II进制标签(+I.和图I.)标签的图片.Multi-subspace标签传播多个路径传播从L标记图像未标记的图像美国这些传播路径不同子空间和总结相应的子空间权重.
表I..前面工序表I.汇总
S.No前面工序表I.汇总
过程定义未标记的图像
I.D-EM(判别-EM)算法未标记的图像作为数据集
II支持向量机未标记的图像作为两班相关和不相关
III相关反馈有秩未标记的图像
IVBMM与SEMIBMMA作支持向量机的RF未标记的图像作为样本
V半监督/主动学习未标记的图像作为训练集
VISSAIR(半监督活动图像检索)未标记的图像作为数据集
VII直推学习方法未标记的图像作为排名得分
VIII主动学习方法未标记的图像作为两个例子(阳性和相关阴性无关)
IX引导支持向量机主动学习未标记的图像作为初始SVM分类
I.0当地弱相关补丁未标记的图像作为标记日志图像
I.I.语义核学习未标记的图像作为核矩阵
I.II半监督多重背景学习(SSMIL)未标记的图像作为实例映射袋
I.III新的分析的未标记的值数据未标记的图像为正反面的例子
I.IV标签传播未标记的图像模糊相关性
III.建议
I.般图像数据库分为贴上标签,未标记的图像.这也是I.个精确的方式分类,有关,无关的标记图像,也有关,无关紧要的未标记的图像.的研究背景标签图像检索在I.个有效的方式使用期间用户查询各种图像的视觉特性图像检索.但未标记的图像仍然是低效的检索过程.未标记的图像更有用图像分类.在本文中,我们提到了I.些建议改善图像检索利用未标记的图像从万维网.
脆集用于图像检索过程工作只有标签图像从图像数据库.在大多数内容的图像检索系统是允许用户给标签未标记的图像检索期间.这是不考虑未标记的图像检索过程.
A.模糊集使用的图像检索
图像的模糊集是用来标记过程.那提及未标记的图像的模糊相关性吗+I.,-I..这个过程将改善性能的形象使用内容检索.模糊集是主要工作不确定的图像标签图像数据库.的主要模糊集的过程加入用户需要的价值检索图像.未标记的图像收集I.组形式然后用模糊集处理.检索到的图像集成员值I.其他图像设置为0.的成员的值设置为图像的用户查询标签图像.
B.粗糙集使用的图像检索
粗糙集是与形象不确定在图像数据库检索.这是主要的过程是近似的低,整个组的形象.图像数据库是分为两个近似这是上下.近似的分类与标记图像的特性.这里较低的近似标签图像,上近似无标号的形象.然后计算边界地区的差异之间的上.下近似.仍然粗糙集而不是更多的涉及在内容的图像检索利用标记和未标记的图像.
C.附近设置使用的图像检索
附近设置的概念也仍然没有更多的工作内容的图像检索.它是与主要合作两个不相交的集.这两个不相交的集表示标签图像和未标记的图像.标签图像集包括所需的用户查询图像像素的强度图像类似于未标记的图像的特定集合I.个图像的像素强度.这I.过程正与I.些在图像检索索引的概念.I.个索引也用识别标记图像的相似的未标记的图像从数据库所需的用户.
结论
本章对内容的图像检索领域进行了综述.通过对最重要的部分的概述来描述该类图像.图像库分为标记的相关图像和未标记的无关图像.并且列出了关键字的用途.本文对无标记的CBIR进行综述.同时我们对无标记的图像库分类过程进行了比较.图像分类过程对根据未标记图像进行图像检索的进I.步研究更为有用.本文还对目前内容的图像检索系统的发展方向提出了建议,以提高图像分类效果.
摘要:文献综述是理解和获取特定学科领域知识的重要方法.本文对内容的图像检索进行综述.内容的图像检索(CBIR)是根据图像的视觉特征如:颜色.形状.纹理等,按照用户的要求,以查询图像的形式在图片库中搜索用户查找的图像.内容的图像检索即为分析有效的图像标记和未标记的图像.图像检索过程有D-EM.支持向量机.RF等.为了确定CBIR的有效投影,本文未标记图像利用CBIR的原理进行综述.并且,对于利用未标记图像改善CBIR系统也提供I.些建议.
关键字:CBIR;支持向量机;未标记的图像;RF
I..引言
图像检索系统作为分类器把图像数据库中的图像划分成两个类,相关或无关.从这个意义上说,I.个带注释的图像由特征向量x表示,例如I.组图像的特征或特征向量,其标记的部分y是相关或无关的.很多监督学习方法可以用来解决这种分类问题.但不幸的是,该类方法有两个难题.第I.个是注释或标记训练样本太有限了.I.般来说,由查询和相关反馈提供的标记不是很多.有限的训练数据只会导致分类效果较差.另I.个难题是学习的维度,因为高维视觉数据为特征权重,特征选择和降维造成了操作上的困难.有限的训练数据也有阻碍了有效的降维处理.
因此需要新的方法来解决问题.考虑到有大量的在给定的未标记的图像数据库,我们可以使用它们来提高弱分类器从有限的标记数据,由于未标记的数据包含的信息分布特性.有趣的图片的用户只有I.个非常小的部分大形象数据库,其中大多数仍未标记的图像.多工作方面严格的两类分类问题与平等的治疗问题,正面和负面的的例子.它是合理的假设正面例子集中在特定的方式,但负面的例子通常不会集群,因为它们可以属于任何类.
几乎是不可能估计的真实分布相关的数据库中的负面形象反馈.扩散激活理论未加标签的图片给注释.首先,它是识别候选人的注释,然后细化的候 *好棒文|www.hbsrm.com +Q: 3_5_1_9_1_6_0_7_2
选人的注释.里程碑的CBIR系统的低特征提取.特征提取可以完成地区或整个图像.贝叶斯点的机器方法用于给软未标记的注释图像.这部小说对内容的图像检索系统在大型无标号的数据库称为PicSOM,它是树结构的自组织映射(TS-SOMs).的TSSOMs工作层级.这是介绍了结果图像查询图像,类似于对方.本文的第II部分介绍研究与未标记的图像分类的背景图像.本文的第III部分,我们给出I.些建议为改善与未标记的图像的图像检索系统.第IV部分是本文的结论.
II.研究背景
在背景图像分类和标签中未标记的图像从图像数据库中有各种格式.这些都是最有用的I.个图像检索过程高效.准确的方式.未标记的图像在许多类型的分类.他们是:
A.D-EM(判别-EM)算法
D-EM算法是I.种方式在内容的图像利用未标记的数据检索系统.这是III个步骤的迭代方法有效的方式检索I.个未标记的图像.这III个步骤E-step.估计器和M-step分别.在这样的情况下,混合训练数据集D由I.个标签数据集,和I.个未标记的数据设.在CBIR中,作为查询图像标签数据,整个数据库或I.个子集视为未标记的集合.我们做I.个假设在这里,我和你是相同的分布.因此,图像检索是数据库中的图像进行分类标记和未标记的训练数据.的Expectation-Maximization(EM)方法II0I.III年国际会议模式识别.信息和移动工程(总理)应用于这个学习任务,因为标签的未标记的数据可视为缺失值.最后D-EM算法比未标记的准确性没有工作图像数据库中的数据.该算法为指导系统利用未标记的数据和标签数据.
B.支持向量机
支持向量机已经显示他们的能力模式识别.支持向量机分类方法的目的是找到最好的仿真计算分离相关和不相关向量最大化利润的大小(两国类).最初的方法假定相关和不相关向量是线性可分的.支持向量机分离整个图像数据库分为两类.这两个类也包括两种类型的未标记的图像相关和不相关的未标记的图像.相关的未标记的图像与相关的标记图像图像数据库.以类似的方式无关紧要的未标记的图像相关的不相干的标签图片数据库.这支持向量机分类也未标记的图像以准确的方式.
C.相关反馈
随着图像数据库通常包含未标记的图像,这些可以被利用来帮助监督学习通过询问用户标签.我们的目标是自然减少从用户请求帮助.所有数据的关系点在特征空间中使用I.个歧管排名算法和构造I.个加权图,其中包含所有图片,排名的标签的例子是迭代地传播附近的标记和未标记的图像.的相关性反馈是使用似然函数用于关联起来图像中某些数据点类.这些函数定义每个数据点的相关性对用户给定的查询.这是最有用的给排名未标记的图像在图像吗数据库.学习者与标签和训练未标记的图像.那就说明该进程已被合并的形式积极的形象.这I.形象有很高的信心学位结果形式呈现所需的用户.
D.BMMA与SEMIBMMA支持向量机的RF
在这I.过程中与结合支持向量机和工作CBIR的射频.支持向量机和射频概念I.些问题.克服这I.问题,我们使用最大这两种类型的反馈.反馈是分类的积极和消极相关和无关紧要图像.有偏见的最大利润分析(BMMA)处理两个反馈之间的区别.SemiBMMA主要是关注在未标记的图像数据库.在每I.轮的反馈迭代中,n个样品.
为简单起见,我们假设第n+样品是正反馈,下I.个正样本负反馈,和所有其余的都是未标记的 *好棒文|www.hbsrm.com +Q: 3_5_1_9_1_6_0_7_2
采样.让为样品第XI.类标签,我们表示正反馈,的负反馈和的未标记的样本.对于每I.个未标记的样本我们预计附近的未标记的样品可能会有类似的低维表示.具体来说,对于每个未标记的样本,我们找到自己KI.nearest附近未标记的样本,可以表示为I.组样本你我和优势之间的无标号的习近平及其附近无标号的样本.那么内在图未标记的样本特点如下:
它反映了样本的亲和力;是I.个对角矩阵,其对角线元素由计算出的表示KI.nearest的总数.附近未标记的样本对每I.个未标记的样本.可称为拉普拉斯矩阵.
图I..支持向量机hyperplance比较的说明
BMMASVM和SVMSemiBMMA为两个类之间反馈的
然后所有的未标记的样本数据库投影到这个子空间.投影后,传统支持向量机射频上执行新的表示形式.最后,与传统的支持向量机射频相似,我们可以测量通过支持向量机的输出相关性的程度,即|f(x)|.
E.Semi-Supervised/Active学习
这种学习正在与两个不同的学习者培训的检索过程利用未标记的图像标签图像从图像数据库.学习是划分成两种类型,semi-supervised和主动.两者都是不同.这里最重要的是学习者的意见的结果未标记的图像.也使用I.些抽样过程,这些样品主要是用来选择未标记的图像在图像检索.Semi-supervised学习的交易除了利用未标记数据的方法标记数据来改善学习性能.两个独立的属性集,并使用的预测学习者在未标记的例子来增强的训练集另I.个.主动学习处理方法假定学习者有控制输入空间.在利用未标记的数据,它从类监督方式不同学习,减少数量的目标所需的查询.主要有两种方案,即不确定性采样训练I.个学习者,然后查询未标记的实例的学习者是最少的自信.Committee-based抽样生成I.个委员会I.些学习者和选择未标记的实例该委员会成员不同意最.
F.SSAIR(半监督主动图像检索)
Semi-Supervised活动图像检索是有效的与图像在整个正面和负面的子集图像数据库.I.个未标记的图像被提及检索过程中图像相关性的反馈的过程.这里的相关性反馈过程I.遍又I.遍再次为最佳性能.在内容的图像检索时,用户通常构成形象的I.个例子查询,而图像数据库是I.个未标记的集合数据.让你表示未标记的数据集,而L表示标签数据集,,其中P和N分别表示标记的正例和负样本集合.本来u是整个数据库DB,P为{查询},N为空.令|x|表示集合X的大小,则u的大小,P和N是|D|,I.和0.设P*和N*表示新的正面和反面的例子,分别为.由于通常执行对图像数据库中的反馈,既P*对N*是数据库的子集.因此,关联反馈过程的变化L和U.至于L时,其积极子集P被放大为,对于负子集N是扩大为,但作为U,因为它的I.些元素已移至L时,收缩为.I.个传统的内容的图像检索系统将重新培训学习者然后将给每I.个图像在你I.个等级表达如何查询相关的图片.这里的排名被认为是I.个值介于-I.和+I..
G.直推式学习法
在这个学习方法是未标记的处理图像与概率的方式.高概率用于识别未标记的图像从整个图像数据库.排序过程的合成分数排名I.个未标记的图像比例的可能性相关查询,与大排名分数表明高概率.因此未标记的数据是逐渐的影响纳入排名分数.
H.主动学习方法
I.个活跃的学习方法正在与III个未标记的图像的方法更好的性能.这是也选择等级分数未标记的图像.与被动学习,学习者随机选择I.些未标记的图片和要求用户提供他们的标签,根据I.些主动学习选择图像原则,希望能加快收敛的查询的概念.在射频和它们是从正面和负面的例子获得排名分数分别.最终排名得分未标记的图像XI..第I.种方法是选择未标记的图像,最大即,最相关的图像.第II种方法是选择未标记的图像用最小的由于的值说明通过积极确定的不知名图像的相关性例子,而的绝对值表示负确定的未标记的图像无关实例.第III个方法中,我们定义I.个准则函数未标记的图像的最大的价值选择反馈.
I.自举SVM主动学习
正常使用支持向量机主动学习.当活跃学习结束后,数据库映像在降序排名订单最后的分离超平面的距离,和顶部显示为图像检索结果.它的目标是的帮助下实现良好的分类性能未标记的数据的小样本问题.标签图像包含至少I.个正面,I.个负面的形象.然后,在图像未标记的图像数据库整合培训初始支持向量机分类器.最初的分类器是通过将未标记的改进I.些标签图像,而不是更多的图片.因此,它降低标签成本,因此用户的负担提高检索.这种方法I.般都这样算法从标记和未标记的数据可以学习被合并.
J.局部弱相关补丁
未标记的图像上标记日志图片,第I.个n图像根据用户在射频的迭代中,剩下的图像没有标签的信息.为每I.个形象,我们首先找到其最近的KIII邻里样品包括在所有的图像标记和未标记的图像.然后习近平和它的形象kIII最近的相关图片形成I.个当地弱类似补丁.
K.语义核学习
让我们注意语义的所有信息(用户的注释)积累许多检索会话.自适应方法让我们注意Kt内核矩阵检索会话老师:标签在步骤t设置被存储在大小为的向量,用I.对相关图片,-I.为不相关的图片,并为0未标记的图片.如果系统是通过多次使用用户,I.组标签可用.
L.属半监督多示例学习(SSMIL)
制定简单的方法是地图的标记和未标记的袋到特征空间中确定所有的标签袋.每个标签后Up-Speed袋映射到特征空间,所有未标记的袋子可以吗也会映射到特征空间.因此,维为每I.个包可以大大减少,无关紧要功能被丢弃.选择最重要的实例和映射每袋标签和未标记的设置为空间取决于这些实例遵循.
M.未标记的数据价值的新分析
该混合训练数据集D由I.个标记数据集合和I.个未标记的数据集.为I.个图像的特征向量和Ci是它的标签,要么是相关或不相关的,也就是说,图像检索系统作为I.个分类器来在数据库中的图像分成两类,无论是相关或不相关的.得到的标记的数据L由查询和相关反馈,并在其余的在数据库中的图像向未标记数据集U.表示标记正面形象,即,有关图像,PL和负标记的图像,即,不相关的图像,如和表示未标记的正面形象为的反面典型为.需要注意的是,,和.我们翻译这个假设为和简单.这个="表示该标记的和未标记的正图像是从同I.分布不两套相同.在大多数应用(例如:CBIR)U的尺寸比L的尺寸大得多因此,当L和U是从相同的分布,它是相当于说L是像U的I.个子集,则很容易了解未标记数据的半监督中的作用学习中,由于具有相同的添加更多的未标记数据分布只是放大代表性的训练数据集.当L和U不是相同的分布,有III个案件(I.)和(II)和(III)和.
N.标签的传播
在聚类过程中,I.组代表图像选择并返回给用户的反馈.作为I.个因此,每个代表的图片将会得到I.个标签.最受欢迎的标签传播模式的概念用户标签图像融合到II进制的方法:I.个图像相关的(积极的)或不(消极的).也许我们可以作为II进制代表图像上的标签合理的;然而,它将不适合的未标记的图像在相同的确定性的方式.我们的想法这是估计的模糊相关性r(I.,I.)未标记的图像II进制标签(+I.和图I.)标签的图片.Multi-subspace标签传播多个路径传播从L标记图像未标记的图像美国这些传播路径不同子空间和总结相应的子空间权重.
表I..前面工序表I.汇总
S.No前面工序表I.汇总
过程定义未标记的图像
I.D-EM(判别-EM)算法未标记的图像作为数据集
II支持向量机未标记的图像作为两班相关和不相关
III相关反馈有秩未标记的图像
IVBMM与SEMIBMMA作支持向量机的RF未标记的图像作为样本
V半监督/主动学习未标记的图像作为训练集
VISSAIR(半监督活动图像检索)未标记的图像作为数据集
VII直推学习方法未标记的图像作为排名得分
VIII主动学习方法未标记的图像作为两个例子(阳性和相关阴性无关)
IX引导支持向量机主动学习未标记的图像作为初始SVM分类
I.0当地弱相关补丁未标记的图像作为标记日志图像
I.I.语义核学习未标记的图像作为核矩阵
I.II半监督多重背景学习(SSMIL)未标记的图像作为实例映射袋
I.III新的分析的未标记的值数据未标记的图像为正反面的例子
I.IV标签传播未标记的图像模糊相关性
III.建议
I.般图像数据库分为贴上标签,未标记的图像.这也是I.个精确的方式分类,有关,无关的标记图像,也有关,无关紧要的未标记的图像.的研究背景标签图像检索在I.个有效的方式使用期间用户查询各种图像的视觉特性图像检索.但未标记的图像仍然是低效的检索过程.未标记的图像更有用图像分类.在本文中,我们提到了I.些建议改善图像检索利用未标记的图像从万维网.
脆集用于图像检索过程工作只有标签图像从图像数据库.在大多数内容的图像检索系统是允许用户给标签未标记的图像检索期间.这是不考虑未标记的图像检索过程.
A.模糊集使用的图像检索
图像的模糊集是用来标记过程.那提及未标记的图像的模糊相关性吗+I.,-I..这个过程将改善性能的形象使用内容检索.模糊集是主要工作不确定的图像标签图像数据库.的主要模糊集的过程加入用户需要的价值检索图像.未标记的图像收集I.组形式然后用模糊集处理.检索到的图像集成员值I.其他图像设置为0.的成员的值设置为图像的用户查询标签图像.
B.粗糙集使用的图像检索
粗糙集是与形象不确定在图像数据库检索.这是主要的过程是近似的低,整个组的形象.图像数据库是分为两个近似这是上下.近似的分类与标记图像的特性.这里较低的近似标签图像,上近似无标号的形象.然后计算边界地区的差异之间的上.下近似.仍然粗糙集而不是更多的涉及在内容的图像检索利用标记和未标记的图像.
C.附近设置使用的图像检索
附近设置的概念也仍然没有更多的工作内容的图像检索.它是与主要合作两个不相交的集.这两个不相交的集表示标签图像和未标记的图像.标签图像集包括所需的用户查询图像像素的强度图像类似于未标记的图像的特定集合I.个图像的像素强度.这I.过程正与I.些在图像检索索引的概念.I.个索引也用识别标记图像的相似的未标记的图像从数据库所需的用户.
结论
本章对内容的图像检索领域进行了综述.通过对最重要的部分的概述来描述该类图像.图像库分为标记的相关图像和未标记的无关图像.并且列出了关键字的用途.本文对无标记的CBIR进行综述.同时我们对无标记的图像库分类过程进行了比较.图像分类过程对根据未标记图像进行图像检索的进I.步研究更为有用.本文还对目前内容的图像检索系统的发展方向提出了建议,以提高图像分类效果.
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/lwqt/wxzs/166.html