卫星图像数据的分类实现(附件)
本课题主要是在熟悉有指导学习的基本概念和基本内容下,采用基于Excel的iDdata分析器对给定的地球资源探测卫星的图像数据进行分析,以分类方式挖掘出有趣的模式,并设计相关图表进行解释。 分类技术在数据挖掘的应用领域中非常重要,本文便着重讲述了运用分类算法进行的数据挖掘。其主要的分类算法有决策树、神经网络、关联规则、遗传算法等等。每一种算法都有它的用武之地,而在这个课题上我选择采用决策树来研究卫星图像数据,通过这些数据从中挖掘出固定的模型并用C#做成图表来进行比较。关键词 数据挖掘、分类算法、决策树、C#
目 录
1 引言 1
1.1概述 1
1.2研究目的和意义 2
1.3研究现状 2
1.3.1数据挖掘现状 2
1.3.2图像数据挖掘的发展现状 3
2数据挖掘 4
2.1数据挖掘定义 4
2.3数据挖掘的主要分类算法 4
2.3.1基于决策树的分类算法 4
2.3.2基于关联规则的分类算法 5
2.3.3基于神经网络的分类算法 5
2.3.4基于遗传的分类算法 6
2.4数据挖掘应用 6
2.5数据挖掘策略 7
3实验部分 8
3.1环境搭建 8
3.2操作步骤 11
4分析与总结 18
4.1课题分析 18
4.2课题总结 18
致 谢 19
参考文献 20
1 引言
1.1概述
我们所有学习到的知识都是来源于数据。然而,拥有大量的数据和拥有大量的知识并不相等。在过去,因为广阔的市场需求和巨大的研究利益从,在数据库中发现知识并进行数据挖掘得到了迅猛的发展,所以数据挖掘这一领域得到了长足的进步。现在,因为随着计算机的技术提高和数据采集技术的迅猛发展,所以我们可以从不同的领域、不同的空间、不同的地点进行数据收集和存储,并且其速度快到我们无法想象。在数据挖掘中获取数据是收集信息的根本目的,然而,我们所获取的大量数据中都是一些无用的信息,所以我们有必要对数据进行分析来把所获取的数据中有用 *好棒文|www.hbsrm.com +Q: ^351916072*
的信息提取出来。虽然现代数据库技术使人们能够存储大量的数据变得容易和方便,但现在我们还缺乏一些成熟的技术来将这些数据用人们理解的方式表达出来,对于这些技术的研究能够帮助我们理解所获取数据的意义,这个问题非常值得我们取探索和研究。知识工程师通过对专家经验知识的分析、选择、比较和总结,我们可以提取有用的知识和规则,这是我们获取知识的方法。但是,对于所获得的知识的可信度并没有通过计算机获得的高,因为Knowledge engineer拥有的知识是有局限性,并不是无所不知[1]。人们对大型数据仓想要通过传统的知识获取技术解决是无能为力的,而正因如此,数据挖掘技术的出现恰好满足了人们的需要。
由于数据分析方法的滞后,其远远跟不上数据增加的速度,所以人们迫切地希望可以在对已有的大量数据分析的基础上进行深层次的数据分析,但是人们目前所拥有的数据分析工具是很难做到的。数据挖掘的出现正是弥补了传统分析方法不能满足人们需要这一缺点,它是专门用于分析处理拥有大规模数据的数据仓库的[2]。通过在大量基础数据进行各种学习算法的训练,人们可以利用数据挖掘得到数据对象间反映数据的内在特征的关系模式,而这些模式更高层次的概括了数据包含的信息。目前,数据挖掘凭借其优势受到了在需要处理大数据量的科研领域的越来越多的重视。在解决实际问题中,数据挖掘很大程度上促进了科学研究的发展,因为它在人们对大规模数据进行的分析处理时,具有高效率、节省时间的优点,使得人们将更多的时间和精力投入到更高层次的研究中。
分类技术在数据挖掘的应用领域极中是一种极其广泛的重要技术。迄今为止针对不同问题已经提出了多种分类算法,主要的分类算法有决策树、关联规则、神经网络、支持向量机和贝叶斯、k-临近法、遗传算法、粗糙集以及模糊逻辑技术等[3]。大部分算法都是使用学习算法确定分类模型,拟合输入数据中样本类别和属性集之间的联系来预测未知样本的类别。训练算法的主要目的就是建立具有良好的泛化能力的模型,通过该模型来准确地预测未知样本的类别。
1.2研究目的和意义
随着人类科技的进步,人类对于太空的探索的数据越来越多,尤其是得到的卫星图像数据。根据对本课题的研究,我们可以发现这些卫星数据之间有趣的模式,并且开创了我们对于图像数据挖掘的研究的新方法。
1.3研究现状
1.3.1数据挖掘现状
数据库中的信息挖掘与知识的发现在数据挖掘这个领域中是一个非常重要的主题。“KDD”(Knowledge Discovery in Database)俗称数据库中的知识发现,这一词最早是在八十年代美国举办的第二届国际人工智能国际会议上首次被介绍的[4]。九十年代的时候,在蒙特利尔举办了第一次KDD与数据挖掘国际会议,也正是在此次的会议上,人们将数据挖掘技术分成了两类,一类是工程领域的知识发现和另一类是数据挖掘。在此之后,人们每年都会举行这样的会议便于人们对数据挖掘进行研究。随着科技的进步,各位专家多年的不懈努力,人类对数据挖掘这一领域的研究硕果累累,许多研究都已经运用到实际生活中,为人类提供了更为便捷的生活。而现在,数据库中的知识发现这个课题的主要研究方向大概是三个方面:理论、技术和应用。
经过许多研究者的努力研究证明,合理地利用不同的方法和理论对于数据挖掘十分有效。国外最新开发的数据挖掘中,现在主要是进行更多的研究知识发现方法的应用主要体现在商业软件KDD过程中的一个解决问题的工具,我们主要可以通过这个系统来解决一些问题、方便销售人员指定销售策略、银行和保险公司建立有利于本公司的战略部署。
随着社会的不断发展,人们对于数据挖掘的需求愈来愈烈。因此,很多计算机软件公司也越来越重视数据挖掘这一学科,并先后投入资金开始对数据挖掘进行研究来抢占市场。许多软件公司在对数据挖掘工具的研究方面都取得了重大的突破,开发了很多技术十分成熟的数据挖掘工具以方便人们进行数据挖掘。但是由于我们所获得的数据流实在是太大,相比于我们所开发的数据挖掘工具我们还有很长一段路要走。世界各大软件公司也正在继续发展应用价值更高的数据挖掘软件。现在世界上最新的数据挖掘软件主要有:Knowledge Studio、IBM Intelligent Miner、SPSS Clementine、Cognos Scenario
目 录
1 引言 1
1.1概述 1
1.2研究目的和意义 2
1.3研究现状 2
1.3.1数据挖掘现状 2
1.3.2图像数据挖掘的发展现状 3
2数据挖掘 4
2.1数据挖掘定义 4
2.3数据挖掘的主要分类算法 4
2.3.1基于决策树的分类算法 4
2.3.2基于关联规则的分类算法 5
2.3.3基于神经网络的分类算法 5
2.3.4基于遗传的分类算法 6
2.4数据挖掘应用 6
2.5数据挖掘策略 7
3实验部分 8
3.1环境搭建 8
3.2操作步骤 11
4分析与总结 18
4.1课题分析 18
4.2课题总结 18
致 谢 19
参考文献 20
1 引言
1.1概述
我们所有学习到的知识都是来源于数据。然而,拥有大量的数据和拥有大量的知识并不相等。在过去,因为广阔的市场需求和巨大的研究利益从,在数据库中发现知识并进行数据挖掘得到了迅猛的发展,所以数据挖掘这一领域得到了长足的进步。现在,因为随着计算机的技术提高和数据采集技术的迅猛发展,所以我们可以从不同的领域、不同的空间、不同的地点进行数据收集和存储,并且其速度快到我们无法想象。在数据挖掘中获取数据是收集信息的根本目的,然而,我们所获取的大量数据中都是一些无用的信息,所以我们有必要对数据进行分析来把所获取的数据中有用 *好棒文|www.hbsrm.com +Q: ^351916072*
的信息提取出来。虽然现代数据库技术使人们能够存储大量的数据变得容易和方便,但现在我们还缺乏一些成熟的技术来将这些数据用人们理解的方式表达出来,对于这些技术的研究能够帮助我们理解所获取数据的意义,这个问题非常值得我们取探索和研究。知识工程师通过对专家经验知识的分析、选择、比较和总结,我们可以提取有用的知识和规则,这是我们获取知识的方法。但是,对于所获得的知识的可信度并没有通过计算机获得的高,因为Knowledge engineer拥有的知识是有局限性,并不是无所不知[1]。人们对大型数据仓想要通过传统的知识获取技术解决是无能为力的,而正因如此,数据挖掘技术的出现恰好满足了人们的需要。
由于数据分析方法的滞后,其远远跟不上数据增加的速度,所以人们迫切地希望可以在对已有的大量数据分析的基础上进行深层次的数据分析,但是人们目前所拥有的数据分析工具是很难做到的。数据挖掘的出现正是弥补了传统分析方法不能满足人们需要这一缺点,它是专门用于分析处理拥有大规模数据的数据仓库的[2]。通过在大量基础数据进行各种学习算法的训练,人们可以利用数据挖掘得到数据对象间反映数据的内在特征的关系模式,而这些模式更高层次的概括了数据包含的信息。目前,数据挖掘凭借其优势受到了在需要处理大数据量的科研领域的越来越多的重视。在解决实际问题中,数据挖掘很大程度上促进了科学研究的发展,因为它在人们对大规模数据进行的分析处理时,具有高效率、节省时间的优点,使得人们将更多的时间和精力投入到更高层次的研究中。
分类技术在数据挖掘的应用领域极中是一种极其广泛的重要技术。迄今为止针对不同问题已经提出了多种分类算法,主要的分类算法有决策树、关联规则、神经网络、支持向量机和贝叶斯、k-临近法、遗传算法、粗糙集以及模糊逻辑技术等[3]。大部分算法都是使用学习算法确定分类模型,拟合输入数据中样本类别和属性集之间的联系来预测未知样本的类别。训练算法的主要目的就是建立具有良好的泛化能力的模型,通过该模型来准确地预测未知样本的类别。
1.2研究目的和意义
随着人类科技的进步,人类对于太空的探索的数据越来越多,尤其是得到的卫星图像数据。根据对本课题的研究,我们可以发现这些卫星数据之间有趣的模式,并且开创了我们对于图像数据挖掘的研究的新方法。
1.3研究现状
1.3.1数据挖掘现状
数据库中的信息挖掘与知识的发现在数据挖掘这个领域中是一个非常重要的主题。“KDD”(Knowledge Discovery in Database)俗称数据库中的知识发现,这一词最早是在八十年代美国举办的第二届国际人工智能国际会议上首次被介绍的[4]。九十年代的时候,在蒙特利尔举办了第一次KDD与数据挖掘国际会议,也正是在此次的会议上,人们将数据挖掘技术分成了两类,一类是工程领域的知识发现和另一类是数据挖掘。在此之后,人们每年都会举行这样的会议便于人们对数据挖掘进行研究。随着科技的进步,各位专家多年的不懈努力,人类对数据挖掘这一领域的研究硕果累累,许多研究都已经运用到实际生活中,为人类提供了更为便捷的生活。而现在,数据库中的知识发现这个课题的主要研究方向大概是三个方面:理论、技术和应用。
经过许多研究者的努力研究证明,合理地利用不同的方法和理论对于数据挖掘十分有效。国外最新开发的数据挖掘中,现在主要是进行更多的研究知识发现方法的应用主要体现在商业软件KDD过程中的一个解决问题的工具,我们主要可以通过这个系统来解决一些问题、方便销售人员指定销售策略、银行和保险公司建立有利于本公司的战略部署。
随着社会的不断发展,人们对于数据挖掘的需求愈来愈烈。因此,很多计算机软件公司也越来越重视数据挖掘这一学科,并先后投入资金开始对数据挖掘进行研究来抢占市场。许多软件公司在对数据挖掘工具的研究方面都取得了重大的突破,开发了很多技术十分成熟的数据挖掘工具以方便人们进行数据挖掘。但是由于我们所获得的数据流实在是太大,相比于我们所开发的数据挖掘工具我们还有很长一段路要走。世界各大软件公司也正在继续发展应用价值更高的数据挖掘软件。现在世界上最新的数据挖掘软件主要有:Knowledge Studio、IBM Intelligent Miner、SPSS Clementine、Cognos Scenario
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wlw/563.html