vc的主成分分析设计
本文介绍了主成分分析的算法,同时也详细的叙述了主成分分析在实际生活中的应用。在现代科学和工程领域中,海量的数据都是高维数据,利用主成分分析是如何对这些数据进行处理,找到数据之间存在的相关性,降低样本的数据量,提取有用的信息。利用visual C++设计编程和程序开发工具,可有效地直视的对相关数据分析并且数据可靠性和准确性。避免大量的运算,操作简单,性能稳定快速。
目录
1.引言 1
1.1 研究背景 1
1.2 课题的研究目的和意义 1
1.3 主成分分析的发展现状及趋势 1
1.4 课题主要研究内容 2
2.主成分分析基础理论 3
2.1 基本原理 3
2.2流程图制作 4
2.3主成分分析计算步骤 5
3. 设计思路 6
3.1 总体架构 6
3.2 程序总流程图 6
3.3 设计思路及实现功能 7
3.4 显示结果 7
4. 系统软件设计 8
4.1 visual c++简介 8
4.2建立工程框架 8
4.3工程设计 8
4.4 主成分分析模块 9
4.5 数据的导入与导出 9
4.6本章小结 10
5. 系统应用 11
5.1 实例运用一 11
5.1.1自变量的选取 11
5.1.2原始数据标准化 12
5.1.3求解相关系数矩阵 12
5.1.4计算矩阵R的特征值及相应的特征向量 12
5.1.5计算各主成分 12
5.2实例运用二 14
6. 全文总结 17
6.1 所做的工作 17
致谢 18
参考文献 19
附录 20
1.引言
1.1 研究背景
在科学技术领域综合评价问题中,数据的复杂程度越来越高,人们在学习和工作中会遇到海量的数据,数据都是具有高维性。高维数据难以被发现规律或者关系,大量的数据也给存储或者传输还有处理造成了
*好棒文|www.hbsrm.com +Q: ¥3^5`1^9`1^6^0`7^2$
很大的资源浪费,大大减缓了工作效率。所以降维技术发展越来越迅速。主成分分析就是一种典型的降维统计方法,也称作主分量分析。这个理论是皮尔逊在1901年提出的,后来有霍特林在1933年进行推广,如今主成分分析在结合其它模型进行预测、数据压缩、信号处理、综合评价、模式识别还有过程控制与诊断等众多领域获得广泛的应用。
1.2 课题的研究目的和意义
主成分分析的主要目的是用较少的变量去解释原有数据中的大部分变量,将原数据中相关性的变量转化成彼此相互独立或不相关的变量。一般提取比原始变量个数要少,能解释大部分资料中变量的几个新变量,就称为原始数据的主成分,并用以解释资料的综合性指标。主成分分析通过降维大大提高数据信息的分析效率。人们总是希望在分析数据的过程中,涉及的变量较少,得到的信息量较多。
1.3 主成分分析的发展现状及趋势
主成分分析是一种典型的降维算法,比较规范偏于在计算机上实现。主成分计算量实在很庞大,而且需要一定的线性知识。在高维数据中有很多信息都不一定需要,在每维数据之间存在着多余的信息,这些数据具有一定的关联性,一般的人员难以通过经验来观察出随后做初步的判断,所以只能借助一些计算机程序进行筛选信息。降维技术出的产生就是保留绝大部分的原始数据,用尽量少的综合数据来代替原来复杂庞大的数据。首先减少了工作量,然后消除评价数据之间的相关影响。
主成分分析发的理论与计算是比较成熟的,但在解决实际问题中,主成分分析法的应用并没有达到较成熟状态。利用软件MATLAB、C等许多计算机软件,可以很容易地时间主成分分析算法。随着科技的发展,越来越多的问题被发现提出,人们运用主成分分析的方法对问题进行特征提取研究,解决了许多关于经济、科学、发展等方面的问题。虽然主成分分析的应用十分广泛,但由于有关文献没有完整,没有系统地阐述主成分分析的综合评价步骤,主要靠人为定义解释。以致应用主成分分析法进行综合评价时出现的一些问题和困难。
主成分分析在各种领域中的广泛应用促进了方法自身的不断完善和改进,呈现出方法的多样化与其他方法结合的特点,以适应解决复杂性更强的问题。研究主成分的人在传统的分析算法上有了很大的改进加入了其他算法。
主成分分析现在发展出很多特色的新颖的算法:比如简单主成分分析它是一种兼具性能和速度基于数据型的算法,具有算法简单,速度快性能优越等特点。或者说主成分分析与遗传算法,这遗传算法具有很好的全局优化性能和稳定性。把遗传算法与主成分分析相结合可以用于人脸识别,这种技术也是目前为止主成分分析使用最突出的地方,在选取的特征向量的个数上明显减少,不仅提高了算法的运算速度,而且识别能力强。还有核函数主成分分析。这些都是以主成分分析为基础扩展出来的算法,还有类似独立成分分析、模块主成分分析、二维主成分分析。每种算法在可以识别的领域中都起着非常重要的作用,这也就是为什么主成分分析具有强大的生命力。但是主成分分析设计到了协方差矩阵的计算、矩阵特征、贡献率等计算。需要考虑数据储存、数据转换与显示等数学运算的实现、矩阵特征分析的实现,这些复杂的数学运算成为软件设置的一个难处。
1.4 课题主要研究内容
了解主成分在现实生活中的作用,但由于大量的计算量或者使用它的人要具有一定的线性代数知识,对数据分析又不够全面。理解主成分分析原理,数学分析步骤。然后对主成分分析用VC++进行编程制作,使分析更加方便,还有解释软件构成的思想。在此基础上通过查阅文献、查阅相关设计完成本课题要求的开题报告、外文翻译及文献综述。
设计内容:对数据进行导入、提取、选择分析的类型。最后输出结果以文档的形式表现在输入界面上。对软件进行使用调试。以2份数据为例进行样本提取之后,进行主成分分析的计算,分析最后综合评价样本数据。最后对主成分分析以及设计进行一个总结。
2.主成分分析基础理论
2.1 基本原理
主成分分析主要是一种探索性的技术,为了全面、系统地分析问题,我们把涉及到的因素通常成为指标。将多指标问题化为较少的综合指标问题,而综合指标是原来多个指标的线性组合。在多元统计分析中指标也称为变量,比如p个变量,重新组合成一组较少个数的互补相关的综合变量Fm来代替原来变量。主成分分析可以帮助判断是否存在共线性。在用统计方法研究多变量的时候,由于变量太多会增加计算量和复杂性,如果变量之间存在有一定的相关性,也就是反映数据上会存在一定的重叠。
主成分分析的重点在于解释线性组合中各个变量,设为m维正态随机列向量,由一定的线性代数知识可知,每个主成分的提取的信息量可以用其方差来度量,其方差Var(F1)越大,表示第一主成分包含的信息越多。通常第一主成分信息量最大,这里涉及到贡献率的问题来反应信息量的大小,因为只有当主成分累计贡献率大于百分之85的时候,才能足够的反映原来变量的信息了,可当作评估的精度。
目录
1.引言 1
1.1 研究背景 1
1.2 课题的研究目的和意义 1
1.3 主成分分析的发展现状及趋势 1
1.4 课题主要研究内容 2
2.主成分分析基础理论 3
2.1 基本原理 3
2.2流程图制作 4
2.3主成分分析计算步骤 5
3. 设计思路 6
3.1 总体架构 6
3.2 程序总流程图 6
3.3 设计思路及实现功能 7
3.4 显示结果 7
4. 系统软件设计 8
4.1 visual c++简介 8
4.2建立工程框架 8
4.3工程设计 8
4.4 主成分分析模块 9
4.5 数据的导入与导出 9
4.6本章小结 10
5. 系统应用 11
5.1 实例运用一 11
5.1.1自变量的选取 11
5.1.2原始数据标准化 12
5.1.3求解相关系数矩阵 12
5.1.4计算矩阵R的特征值及相应的特征向量 12
5.1.5计算各主成分 12
5.2实例运用二 14
6. 全文总结 17
6.1 所做的工作 17
致谢 18
参考文献 19
附录 20
1.引言
1.1 研究背景
在科学技术领域综合评价问题中,数据的复杂程度越来越高,人们在学习和工作中会遇到海量的数据,数据都是具有高维性。高维数据难以被发现规律或者关系,大量的数据也给存储或者传输还有处理造成了
*好棒文|www.hbsrm.com +Q: ¥3^5`1^9`1^6^0`7^2$
很大的资源浪费,大大减缓了工作效率。所以降维技术发展越来越迅速。主成分分析就是一种典型的降维统计方法,也称作主分量分析。这个理论是皮尔逊在1901年提出的,后来有霍特林在1933年进行推广,如今主成分分析在结合其它模型进行预测、数据压缩、信号处理、综合评价、模式识别还有过程控制与诊断等众多领域获得广泛的应用。
1.2 课题的研究目的和意义
主成分分析的主要目的是用较少的变量去解释原有数据中的大部分变量,将原数据中相关性的变量转化成彼此相互独立或不相关的变量。一般提取比原始变量个数要少,能解释大部分资料中变量的几个新变量,就称为原始数据的主成分,并用以解释资料的综合性指标。主成分分析通过降维大大提高数据信息的分析效率。人们总是希望在分析数据的过程中,涉及的变量较少,得到的信息量较多。
1.3 主成分分析的发展现状及趋势
主成分分析是一种典型的降维算法,比较规范偏于在计算机上实现。主成分计算量实在很庞大,而且需要一定的线性知识。在高维数据中有很多信息都不一定需要,在每维数据之间存在着多余的信息,这些数据具有一定的关联性,一般的人员难以通过经验来观察出随后做初步的判断,所以只能借助一些计算机程序进行筛选信息。降维技术出的产生就是保留绝大部分的原始数据,用尽量少的综合数据来代替原来复杂庞大的数据。首先减少了工作量,然后消除评价数据之间的相关影响。
主成分分析发的理论与计算是比较成熟的,但在解决实际问题中,主成分分析法的应用并没有达到较成熟状态。利用软件MATLAB、C等许多计算机软件,可以很容易地时间主成分分析算法。随着科技的发展,越来越多的问题被发现提出,人们运用主成分分析的方法对问题进行特征提取研究,解决了许多关于经济、科学、发展等方面的问题。虽然主成分分析的应用十分广泛,但由于有关文献没有完整,没有系统地阐述主成分分析的综合评价步骤,主要靠人为定义解释。以致应用主成分分析法进行综合评价时出现的一些问题和困难。
主成分分析在各种领域中的广泛应用促进了方法自身的不断完善和改进,呈现出方法的多样化与其他方法结合的特点,以适应解决复杂性更强的问题。研究主成分的人在传统的分析算法上有了很大的改进加入了其他算法。
主成分分析现在发展出很多特色的新颖的算法:比如简单主成分分析它是一种兼具性能和速度基于数据型的算法,具有算法简单,速度快性能优越等特点。或者说主成分分析与遗传算法,这遗传算法具有很好的全局优化性能和稳定性。把遗传算法与主成分分析相结合可以用于人脸识别,这种技术也是目前为止主成分分析使用最突出的地方,在选取的特征向量的个数上明显减少,不仅提高了算法的运算速度,而且识别能力强。还有核函数主成分分析。这些都是以主成分分析为基础扩展出来的算法,还有类似独立成分分析、模块主成分分析、二维主成分分析。每种算法在可以识别的领域中都起着非常重要的作用,这也就是为什么主成分分析具有强大的生命力。但是主成分分析设计到了协方差矩阵的计算、矩阵特征、贡献率等计算。需要考虑数据储存、数据转换与显示等数学运算的实现、矩阵特征分析的实现,这些复杂的数学运算成为软件设置的一个难处。
1.4 课题主要研究内容
了解主成分在现实生活中的作用,但由于大量的计算量或者使用它的人要具有一定的线性代数知识,对数据分析又不够全面。理解主成分分析原理,数学分析步骤。然后对主成分分析用VC++进行编程制作,使分析更加方便,还有解释软件构成的思想。在此基础上通过查阅文献、查阅相关设计完成本课题要求的开题报告、外文翻译及文献综述。
设计内容:对数据进行导入、提取、选择分析的类型。最后输出结果以文档的形式表现在输入界面上。对软件进行使用调试。以2份数据为例进行样本提取之后,进行主成分分析的计算,分析最后综合评价样本数据。最后对主成分分析以及设计进行一个总结。
2.主成分分析基础理论
2.1 基本原理
主成分分析主要是一种探索性的技术,为了全面、系统地分析问题,我们把涉及到的因素通常成为指标。将多指标问题化为较少的综合指标问题,而综合指标是原来多个指标的线性组合。在多元统计分析中指标也称为变量,比如p个变量,重新组合成一组较少个数的互补相关的综合变量Fm来代替原来变量。主成分分析可以帮助判断是否存在共线性。在用统计方法研究多变量的时候,由于变量太多会增加计算量和复杂性,如果变量之间存在有一定的相关性,也就是反映数据上会存在一定的重叠。
主成分分析的重点在于解释线性组合中各个变量,设为m维正态随机列向量,由一定的线性代数知识可知,每个主成分的提取的信息量可以用其方差来度量,其方差Var(F1)越大,表示第一主成分包含的信息越多。通常第一主成分信息量最大,这里涉及到贡献率的问题来反应信息量的大小,因为只有当主成分累计贡献率大于百分之85的时候,才能足够的反映原来变量的信息了,可当作评估的精度。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/3170.html