几种典型特征选择算法的功能实现与性能对比分析(源码)【字数:14086】

摘 要摘 要随着全球信息化程度的快速提升,数据的处理,已经让很多人将目光聚焦于此。因此,对数据进行特征选择已成为一种必要的手段。从而实现从庞大的数据堆里提取出足够数量用来分析的样本数据。本文根据所介绍的多种特征搜索策略,从中选取了三种特征选择算法(SFS,SSFS,RSFS),并对其进行功能实现和性能对比分析。在评估准则的选取方面,对选取的评估准则进行解释,然后根据得出的数据,得到不同算法在不同的评估准则的情况下的比较情况,具体来说就是总分类准确率的异同,包含相对分类准确率的异同及其他。根据实验数据得出实验结论,并根据文内出现的算法进行结合的方式,提出未来算法的发展趋势。最后对文章的整体进行总结和对本次实验和论文的不足提出展望。关键词特征选择;算法对比;评价准则;算法准确性
目 录
第一章 绪论 1
1.1 研究背景 1
1.2 研究现状 1
1.3 目的及意义 1
1.4 文章框架及结构 2
1.5 本章小结 2
第二章 特征选择理论 3
2.1 特征选择概念和基本框架 3
2.2 搜索策略 4
2.2.1 完全搜索策略 4
2.2.2 启发式搜索策略 4
2.2.3 随机搜索策略 5
2.3 本章小结 7
第三章 典型特征选择算法模型 8
3.1 序列前向选择算法(SFS) 8
3.1.1 算法模型 8
3.1.2 算法流程 8
3.1.3 算法流程图 9
3.2 序列浮动前向搜索(SFFS) 10
3.2.1 算法模型 10
3.2.2 算法流程 10
3.2.3 算法流程图 11
3.3 随机特征子集选择算法(RSFS) 11
3.3.1 算法模型 12
3.3.2 算法流程 12
3.3.3 算法流程图 13
3.4 数据样本的获取 13
3.5 本章小结 14
第四章 特征选择算法的功能实现和性能对比 15
4.1 整体思 *好棒文|www.hbsrm.com +Q: &351916072& 
路 15
4.2 实验内容 15
4.3 评估准则的选取及意义 15
4.3.1 算法准确性 16
4.3.2 绝对准确性 16
4.3.3 相对准确性 17
4.3.4 算法适应性 17
4.4 实验结果分析 18
4.5 本章小结 19
第五章 算法思考 20
5.1 算法发展联想 20
5.2 本章小结 21
第六章 总结与展望 22
6.1 总结 22
6.2 展望 23
致谢 24
参 考 文 献 26
第一章 绪论
1.1 研究背景
最早的数据特征选择研究是出现在上世纪60年代末的时期,当时的主要研究方向是统计学及其信号处理上面。而后经过30年发展出现了的大规模机器学习等问题,当时现有的算法不能满足实际需求,急需满足大规模数据综合性能更优的新型算法。此时,特征选择算法引起了诸多研究机器学习领域的学者的兴趣。
1.2 研究现状
新世纪以来,短短不到20年的时间里,信息数据的存在的量级出现了几何倍数的增长,数据信息爆炸式的增长在近几年里被一个词汇来形容,那就是全球数据大爆炸。这就已经充分的表现出了数据信息的存在量已经达到了一个天文数字级的单位。与之对应到我们的生活和工作中,一切所有我们所牵涉到的数据信息也都变的臃肿起来,更细致、更具象的数据同时也带来了庞大的数据集让我们难以迅速的查找到我们所需要的信息。更别提涉及到数据更庞大的数据挖掘以及深度学习等新型学习领域的研究,因此此时特征选择算法已经成为处理数据的一种不可或缺的手段。
1.3 目的及意义
本文名为对多种典型特征选择算法的功能实现和性能对比分析,实则是通过特征选择算法对数据的处理,得到不同特征选择之间的异同。从得到的实验结论上分析不同的特征选择算法在不同规模的特征子集的情况下得到的“准确率”。进而选出在同种情况或类似情况下,拥有最优特征子集的特征选择算法的试用范围。通过得到的数据的直观描述,也可以更明显的提供算法之间的对比优劣。
在特征选择算法在各学科领域以及实际应用中大放异彩的情况下,研究经典算法的意义在那?一般认为算法本身固然存在优缺点,但对于具体的问题,具体的研究对象,简单的算法不一定达不到实验目的,而复杂的研究算法并不一定是现实问题所采用的解决方法。因此,经典算法的存在意义就是让我们理解简单问题的解决途径,解决思路,由此推向复杂问题的解决过程,由易到难,一步一步的将复杂问题分割成一个个简单的问题,从而得到其解决方法。实则,更本质的原因在于未来的算法发展趋势必然是多种算法融合的发展模式,或是自己制定规则,标准的‘新型’算法。这类融合算法或者新型算法都明显或隐约的把握住算法的基础,乃至算法思考问题的灵魂,从而达到解决复杂问题或快速解决简单问题的目的。正所谓青出于蓝而胜于蓝,我们研究旧有的经典算法,其本质目的是为了推陈出新,在新的研究算法上才能够一骑绝尘,阔步前行。
1.4 文章框架及结构
第一章 介绍特征选择的背景,现状,研究目的及意义。
第二章 介绍特征选择理论以及特征选择方法的类别。
第三章 介绍本文所选择的特征选择算法的流程步骤,实现代码以及数据样本的获取。
第四章 介绍算法的评估准则和根据评估准则得出的实验结果,并对其进行实验结论分析。
第五章 介绍个人对算法发展和发展趋势的看法,并提出要根据实际问题针对性的选择算法。
第六章 总结本文和做出展望,总结文章整体的思想结构,并象征性的提出文章在实际实验中面临的问题,对这些问题的改进提出展望。
1.5 本章小结
具体的分析特征选择算法的发展背景与现状,提出研究经典特征选择算法的目的和意义。并对文章的整体结构在第四小节提出概述,让读者更易接受并掌握整体文章的脉络。
特征选择理论
2.1 特征选择概念和基本框架

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/848.html

好棒文