粗糙集理论的决策规则获取方法研究(附件)【字数:9727】

摘 要摘 要对于不确定性数据的处理,统计或者其他的处理技术需要数据以外的其他先验知识,而粗糙集是处理不确定性数据的一种有效工具,它用于分析处理不确定或不完备的复杂信息,能够从大量的数据中挖掘出潜藏在事物表象之下的本质规律,并且粗糙集理论与概率论、模糊集理论等其它处理不确定性问题的方法相比较,最大的优点是不需要提供解决问题所需要的数据集以外的任何先验知识。本文对经典粗糙集模型的决策规则获取以及规则的度量方法进行研究,并通过实例分析,证明了其规则获取以及度量方法的有效性。此外,本文在经典粗糙集模型规则获取及度量方法的基础上继续研究多粒度粗糙集模型中决策规则获取以及规则度量的方法 ,并通过实例分析,证明了其有效性、可行性。关键词 粗糙集;规则获取;度量;多粒度。
目 录
第一章 绪论 1
1.1 研究背景和意义 1
1.2 课题的研究现状 2
1.3 论文主要工作 2
第二章 粗糙集理论简述 3
2.1 基本概念 3
2.1.1 上近似、下近似 3
2.1.2 决策信息系统 4
2.1.3 近似精度 4
2.1.4 不可分辨关系 4
2.1.5 约简 5
第三章 单粒度下的决策规则获取 7
3.1 决策规则获取 7
3.2 决策规则的度量 8
3.3 实例分析 8
3.3.1 未处理的决策信息表 9
3.3.2 规则获取 11
第四章 多粒度下的决策规则获取 15
4.1 多粒度的基本概念 15
4.2 约简 16
4.3 决策规则 16
4.3 决策规则的度量 18
4.4 实例分析 18
4.4.1未处理的决策表 19
4.4.2 规则获取 21
结论 27
致谢 28
参考文献 29
第一章 绪论
1.1 研究背景和意义
粗糙集理论作为一种数据分析处理的理论,它是由波兰科学家Z.Pawlak[1]首先提出 *好棒文|www.hbsrm.com +Q: ^351916072* 
来的。后来全国各地的学者积极的研究并且对其进行广泛地应用。随着数据量的不断增长,我们要想从这些浩瀚的数据里获得所需要或研究的数据,就需要一种针对性的方法来对这些数据进行去粗取精,基于粗糙集理论,设计并实现知识获取和约简方法,对影响决策的多个要素进行分析,获取决策规则,从而获得我们所需要的知识,数据挖掘就是我们所说的知识获取,它是从海量的不完整而且又模糊的、带有随机性的数据集中发现潜藏在表象之下、不容易被人们发现、但又具有一定价值的信息。被提取出来的知识可以表示为概念、规律、模式或者是规则等形式。在知识获取的过程中,人们既要面对巨大容量的数据,同时也可能面临数据质量差的问题,即面对的是大量的不确定信息,而处理不确定的信息虽然有很多种方法,如模糊集理论, 概率统计方法等。但是这些方法不仅需要数据集,还需要一些数据集以外的附加信息,比如在模糊集理论的数据分析方法中需要隶属函数,而在概率统计的相关数据分析方法中需要数据集的概率分布函数等。但是在一些错综复杂又不完整的大容量数据中,要想准确地确定隶属函数或概率分布对人们来说是一个很大的难题。因此,在当前的大数据时代,人类对信息的完整、全面越难以把握的条件下,粗糙集理论作为一种可以客观有效地处理不完整、不确定性信息的强大数学工具对于信息的挖掘有着巨大的应用价值。但是单粒度下的经典粗糙集模型只有一个条件属性集,即只有一族等价关系,而且对于约简的决策数据表要求较为严格。为此,我国著名的教授钱宇华首次提出了粗糙集中多粒度的概念,对于现在复杂多变的信息的处理分析具有重要而且有效的作用。从而,研究基于粗糙集理论的决策规则的获取和知识约简的一般方法,并将其推广到多粒度粗糙集模型下的决策规则获取和约简,是一个非常具有现实应用价值的课题。
1.2 研究现状
在处理不完备的知识以及数据的表达、学习、归纳的数学工具和方法中,粗糙集理论是一种能够有效地分析和处理不精确的、不完整和不一致等等的各种信息的数学工具和方法[1],并且能够从错综复杂的海量信息中挖掘出潜在的知识,从而揭示出隐含在其中的规律。当今,国内外的学者对于粗糙集理论中的知识获取和约简的研究主要集中在有关粗糙集模型的拓展的研究、粗糙集理论的有关属性约简算法的研究、不确定性的度量的研究、粗糙集与其它的处理不确定性问题的方法相结合的研究以及基于粗糙集的应用研究等方面;许多国际重要学术会议或学术研讨班也都把粗糙集理论的研究列入会议和讨论班的主要内容之一,在人工智能领域中基于粗糙集理论的相关数据处理分析方法已经成为一个较新的学术热点。
1.3 论文主要工作
通过查阅资料以及向老师请教,主要完成了如下内容:
(1)粗糙集理论的基本理论概念
(2)经典单粒度粗糙集的约简与决策规则的获取方法
(3)将单粒度的决策规则获取方法向多粒度推广
(4)结论
第二章 粗糙集理论简述
2.1 基本概念
设//是全体对象组成的一个有限集合,则称//为论域。对?一个//中的子集 //, 称为//中的一个概念[3]。而我们把//中的任何一个概念称作是//的抽象知识,我们把它简称为知识。假设//是由//上的一簇等价关系所决定的一个集合,我们则把知识基用//来表示。 对?//,//上的一个近似空间用//来表示。对?//, 若//,我们在近似空间//中把对象// 与//称为是不可分辨的。 通过离散数学的知识有: //上的一个二元等价关系跟//上的一个划分是相互对应的,因此如果我们假设由二元等价关系//所导出的一个关于论域//的划分用//表示,则//中的元素被称作基本集或原子集。而近似空间//中的对?//,若//是由一些基本集组成的并集,则称//是//上可定义的,反之是不可定义的。
2.1.1 上近似、下近似

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/sxtj/201.html

好棒文