特征提取算法的比较研究

本文概括和总结了主成份分析(Principle Component Analysis)和独立成份分析(Independent Component Analysis)两种经典的特征提取算法的原理和实现过程,并将两种算法应用于图像识别中,根据识别效果比较了两种算法的优缺点。首先,详细地介绍了主成份分析和独立成份分析实现的基本原理及相关理论知识。其次,介绍了两种提取算法在图像特征提取中的应用。最后,将两种算法分别用于运动模糊图像的检索中,通过构建车型库,比较两种算法所提取特征进行检索时的检索率。实验结果表明,PCA与ICA都能有效的检索出高速运动的模糊图像,但与PCA相比,ICA的图像模糊检索率较高,检索的效果更好。关键词 主成份分析,独立成份分析,车型库,模糊检索
目 录
1 绪论 1
1.1 研究背景和意义 1
1.2 国内外研究现状 2
1.3 论文主要工作及章节安排 3
2 主成份分析的原理及应用 4
2.1 引言 4
2.2 基于PCA的图像特征提取 4
2.3 本章小结 9
3 独立成份分析的原理及应用 9
3.1 引言 9
3.2 基于ICA的图像特征提取 11
3.3 本章小结 13
4 PCA/ICA图像识别的应用 13
4.1 基于FastICA的图像特征提取 13
4.2 特征匹配 14
4.3 检索流程 14
5 算法的实现 15
5.1 实验环境 15
5.2 实验数据 16
5.3 实验结果 17
5.4 本章小结 18
结 论 19
致 谢 20
参 考 文 献 21
附 录 22
1 绪论
1.1 研究背景和意义
在过去的几十年里,随着时代的发展、计算机领域的蓬勃崛起以及微电子领域的盛行之际,人们对计算机行业越来越有信心,更加希望计算机可以识别人类的听觉、视觉等方面,人们也越来越多的关注 *好棒文|www.hbsrm.com +Q: ¥351916072$ 
人工智能和模式识别等领域的研究。计算机的智能识别图像已成为近些年来研究者对模式识别领域[1]的忠实研究对象。
图像识别一般包含图像预处理、目标分割、特征提取与分类识别[2]。预处理是为了更好地使图像目标和背景分离出来。为了实现这一目标,我们需要减少除去隐藏在图像中的噪声;图像目标分割的目的是区分图像目标与背景;而特征提取是在图像中找出有效的信息,这些信息往往在目标图像中的结构或性质方面有着突出的表现,常常用多维特征向量来展示提取的结果;图像分类识别的含义是在特征向量表示图像目标的时候,利用分类器计算出某一类的概率。
含有大量信息的媒体有很多种,而图像就是其中之一[3]。正常图像的维数都能达到很高。我们处理图像时,如果直接识别原始的高维图像,这会使算法更加复杂,也会让我们对识别结果失望。所以我们需要减少原始图像的维度。在大量的原始图像中,如何找出少量特征,以便后续的分类识别,这就成为特征提取的基本问题。而这些少量特征是最能代表原始图像本质的。因此,提取图像特征不仅是图像分类识别的重要步骤,而且还能够使图像维数得到最小化。特征提取在当今社会中已经得到广泛应用与关注,主要在人脸、表情、步态、掌纹等识别中应用。对图像识别来说,特征提取已然成为它的重要组成部分。
在处理图像的时候,特征提取包括了图像的复原、重构、搜索、分类等方面的问题。在人工智能、计算机视觉等方面,特征提取有着重要的意义。在图像分类识别过程中,特征提取是它的重要部分,所以已经在国内外学者中引起广泛关注,就目前特征提取的技术已经成功运用到各个领域的分类识别技术中,尤其应用在军事方面,如红外图像目标识别与跟踪。
总之,特征提取是图像分类的重要解决方法。为了提取图片特征,最经典使用频繁的算法是主成份分析和独立成份分析的特征提取算法。随着科技的迅速发展, 主成份分析和独立成份分析的提取算法在图像特征提取领域也得到更好的改善,应用范围也会更加深入和广泛。在未来十几年内,特征提取技术定会成为一个非常有研究价值的领域。本文重点研究PCA/ICA的特征提取算法的理论、两种算法对人脸提取的实现以及两种实验结果的比较。
1.2 国内外研究现状
在模式识别领域中,其中一个根本问题是特征提取,而解决目标分类识别问题的首要条件是提取有效的识别特征。研究特征提取主要为了以下原因:第一是找到目标之间辨别性最强的叙述,以便使不同分类的目标彼此区分;第二是降低目标数据的维数,使其能达到要求维数。
根据是否能够线性可分,通常有两种特征提取方法:线性的特征提取和非线性的特征提取[4]。迄今为止,人们想出了许多方案来解决线性可分的特征提取问题,其中比较有用的有主成份分析[5](Principle Component Analysis, PCA),独立成份分析[6] (Independent Component Analysis, ICA),因素分析,局部保持投影,线性判别分析,局部特征分析,多维尺度分。对于线性的特征提取算法来说,主成份分析是最为著名的,也是使用地最为频繁的方法。如今,人们对线性特征提取的研究已经很成功了。该方法已经广泛地应用在各个领域,如识别人脸、识别字符、识别语音以及分类文本等。由于线性的特征提取方法理解起来比较简单,实现方便,所以现已广泛流传使用。
在众多特征提取算法中,人们普遍认为最经典、最广泛的特征提取算法是PCA。该算法最早出现在1873年,由Beltrami和Jordan在做实验中无意发现。他们因奇异值分解(SVD)意外地独立推导出了PCA[7]。之后,Pearson对PCA进行了几何描述,Hotelling对PCA进行了代数描述。1972年,K.Fukunagal在他的专著中对PCA做了系统的阐述[8]。随后,Kirby和Sirovich等人提出了一个困惑,关于怎样利用PCA来最优化地表示人脸图像,经他们的不懈研讨,终于弄明白了这个疑问。Turk与Pentland等人发现特征向量进过KL变换展开后的向量可以重新组合成图像矩阵。经变换后的矩阵可以很容易看出标准化的人脸。所以使用一系列标准化的人脸图像进行加权组合可以来显示人脸特征。在此后的分类识别过程中,想要分析人脸图像的特征,可以识别这些表示系数。
当PCA不能满足研究者的需要时,独立成份分析(ICA)就出现了。ICA着重研究数据之间的高阶关系。ICA使得变换后的各向量之间高阶独立统计。ICA能够快速展现出数据间的本质关系。ICA是为了解决盲源信号分离(BSS)的问题。1986年,Herault和Jutten等人想出的一个办法。该办法是神经网络模型[9]。然后惊奇地发现ICA可以处理盲源分离(BSS)问题。随后,在前人的研究基础上,Bell和Sejnowski研究出新方案,该方案是基于信息极大化的ICA算法Infomax算法[10]。这种算法能有效解决超高斯信号的盲分离问题,如语音分离。这也使得ICA得到了许多学者的关注和认可。在关于ICA的第一届国际会议上,M.Bartlett等人提出并将ICA算法运用到提取和识别人脸图像中。在此之后,ICA算法得到了广泛地研究和改进。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1238.html

好棒文