多元统计分析方法的应用(附件)【字数:9759】
21世纪以来,我国的经济迅速发展,但是,全国各省经济发展的水平是不均衡的,梯度特征十分明显,一些省市与上海市、北京市、广东省和江苏省相比而言差距还是很大的,而且其差距有逐渐拉大的趋势。深究其根本原因不难发现,现在沿海地区与中西部地区的经济发展极度不平衡。因此,本文是针对全国各个省市的经济发展状况做出相应的研究,来分析全国区域经济发展的梯度特征,以及对全国各省市的经济建设发展做出相应的较为合理的分析,并且为之提出适当的建议。本文根据中国统计年鉴上的数据资料,主要采用关于经济发展的一些数据指标,使用SPSS软件对这些数据进行聚类分析和因子分析。进行数据分析之前,要先对数据进行标准化和建立合理的模型。根据实验结果,将其进行合理的划分,找出各个省市之间的差距,并提出合理建议,促进全国经济建设的共同发展。关键字多元统计分析;K-均值聚类法;因子分析
目 录
第一章 绪论 1
1.1 研究目的与意义 1
1.2 国内外研究现状及存在的问题 1
1.3 多元统计分析方法的介绍 2
1.3.1 聚类分析 3
1.3.2 因子分析 4
第二章 模型的基本建立 6
2.1 基本假设 6
2.2 符号说明 6
2.3 数据呈现 6
2.4数据标准化 6
第三章 聚类分析模型 9
3.1 K均值聚类法 9
3.1.1 K均值聚类法的简单介绍 9
3.1.2 K均值聚类法的步骤 9
3.2 SPSS具体实现 10
3.3结果分析 12
第四章 因子分析模型 13
4.1 因子分析 13
4.1.1 因子分析模型 13
4.1.2 因子分析的步骤 14
4.2 SPSS具体实现 15
4.2.1相关性分析 15
4.2.2 公共因子的提取 16
4.2.3 旋转矩阵 17
4.2.4 因子得分 18
4.3 结果分析 20
结论 21
致谢 23
参考文献 2 *好棒文|www.hbsrm.com +Q: #351916072#
4
第一章 绪论
1.1 研究目的与意义
近几年来,我国的经济发展势态十分迅猛,但是,我国各省的经济发展水平相对来说是不均衡的[1,2],一些省市的经济发展水平与我国的上海市、北京市、天津市和江苏省相比而言,还是有一定的差距的,并且其差距有逐渐拉大的趋势。深究其根本原因不难发现,现在沿海地区与中西部地区的经济发展极度不平衡。因此,对全国各省市的经济发展状况进行研究是很有必要的,同时可以分析全国区域经济发展的梯度特征,针对我国各省市的经济建设做出相应的且较为合理的分析以及提出一些恰当的建议,这对我国经济全局统筹兼顾的发展具有重大的意义。
1.2 国内外研究现状及存在的问题
国内外对多元统计分析的运用已经普及到各个方面,比如工业、农业、教育学、医学、经济学、生态学和社会学等[3]。这些方面存在的问题都能通过多元统计方法的分析和研究得到解决,这能够让我们进一步了解到问题的本质。例如,在经济学中,可以根据人均国民收入、人均农业产值、人均消费水平和人均收入水平等多个指标判定一个国家或一个区域经济发展程度所属的类型。在工业和农业方面,可以根据全国各个地区农民生活消费支出的情况来研究农民消费结构的趋势;可以对企业的人力、物力、财力和市场条件因素进行分析,研究出企业的经济效益等情况[4]。
多元统计分析领域也存在着未能解决的一些问题,比如在研究统计量的精确分布和优良性的方面,有一些多元统计分析的重要问题存在了将近几十年,最著名的有威尔克斯Λ统计量以及最大相对特征根统计量。
我国的经济发展水平从2000年开始以8%左右的年平均增长率稳步增长。随着这两年我国经济的快速发展,使得经济发展水平的增长率保持在9%以上。根据联合国发布的 《贸发组织》预测法来预测我国的经济发展水平,其预测结果为:我国的经济发展水平将平稳增长,在未来十年中其发展平台将十分广阔。当我们在关注经济发展的同时也应该关注一些实际的问题,比如说,进入21世纪以来,从我国人口登记中不难发现我国城镇的失业率也逐渐上升,这个上升的幅度是比较大的,增长趋势也十分明显。从我国普通高校的调查中得知,我国的大学生的就业率也一直在70%左右徘徊。从以上问题中可以看出问题的重点在于,我国普通高校毕业生人数将越来越多,那么失业率就会逐渐增长。根据我国国家统计局的统计分析,我国从2000年至今,其每增长1个百分点的国内生产总值,就可以为我国提供将近240万个岗位的就业机会,这说明国内生产总值对于我国经济发展具有拉动的作用,并且这个拉动是弹性的拉动。那么可以这样理解就业弹性,即当国内生产总值每增长一个百分点时,可以带动0.1个百分点的就业增长率。
国外经济发展较国内来说更为迅速[5],国家与国家之间呈现出一种快速的发展模式。资源是当前经济推动力中最重要的因素,越来越多的国家认识到资源的重要性。更多的国家开始致力于能源的开发使用,其中可再生资源是国家经济发展的依托,可再生资源的利用使得经济发展水平提高更为快速。国外为达到经济快速发展的目的,组织企业不断开发挖掘大量新能源,就此可以为社会提供广阔的商机和提供大量的就业岗位。法国国家预计在本世纪20年代,能够向社会提供20万到30万的工作岗位。同时,还考虑到次债危机中很多国家选择的应对措施,其中不恰当的措施使得很多国家处于低谷的发展状态,但是,随着国家自身的调整和改变,一些国家的经济发展水平还是快速回升了,次债危机的影响也快速消退了。
1.3 多元统计分析方法的介绍
多元统计分析(multivariate statistical analysis)[6]是一种具有综合运用功能的统计分析方法,当多个对象或者多个指标互相关联的时候,它能够分析对象和指标的统计性规律。
多元统计分析方法[7,8]可以对多个随机变量的观测数据同时进行有效的分析和研究,通过分析多个随机变量的观测数据,可以得到变量与变量之间的相互关系,同时还可以揭示这些变量潜在的变化规律。如果一元统计分析方法是研究单个随机变量统计规律的学科,那么多元统计分析方法就是研究多个随机变量之间相互依赖的关系,同时研究它们内在的统计规律性。
多元统计分析的主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、聚类分析、判别分析、主成分分析、因子分析、对应分析和相关分析等。[9]当选择样本总体的分布是多维或者多元概率分布的时候,那么分析和研究该总体所运用的方法就是多元统计分析。
本文主要运用的是聚类分析和因子分析这两种方法,下面简单介绍一下这两种方法。
1.3.1 聚类分析
目 录
第一章 绪论 1
1.1 研究目的与意义 1
1.2 国内外研究现状及存在的问题 1
1.3 多元统计分析方法的介绍 2
1.3.1 聚类分析 3
1.3.2 因子分析 4
第二章 模型的基本建立 6
2.1 基本假设 6
2.2 符号说明 6
2.3 数据呈现 6
2.4数据标准化 6
第三章 聚类分析模型 9
3.1 K均值聚类法 9
3.1.1 K均值聚类法的简单介绍 9
3.1.2 K均值聚类法的步骤 9
3.2 SPSS具体实现 10
3.3结果分析 12
第四章 因子分析模型 13
4.1 因子分析 13
4.1.1 因子分析模型 13
4.1.2 因子分析的步骤 14
4.2 SPSS具体实现 15
4.2.1相关性分析 15
4.2.2 公共因子的提取 16
4.2.3 旋转矩阵 17
4.2.4 因子得分 18
4.3 结果分析 20
结论 21
致谢 23
参考文献 2 *好棒文|www.hbsrm.com +Q: #351916072#
4
第一章 绪论
1.1 研究目的与意义
近几年来,我国的经济发展势态十分迅猛,但是,我国各省的经济发展水平相对来说是不均衡的[1,2],一些省市的经济发展水平与我国的上海市、北京市、天津市和江苏省相比而言,还是有一定的差距的,并且其差距有逐渐拉大的趋势。深究其根本原因不难发现,现在沿海地区与中西部地区的经济发展极度不平衡。因此,对全国各省市的经济发展状况进行研究是很有必要的,同时可以分析全国区域经济发展的梯度特征,针对我国各省市的经济建设做出相应的且较为合理的分析以及提出一些恰当的建议,这对我国经济全局统筹兼顾的发展具有重大的意义。
1.2 国内外研究现状及存在的问题
国内外对多元统计分析的运用已经普及到各个方面,比如工业、农业、教育学、医学、经济学、生态学和社会学等[3]。这些方面存在的问题都能通过多元统计方法的分析和研究得到解决,这能够让我们进一步了解到问题的本质。例如,在经济学中,可以根据人均国民收入、人均农业产值、人均消费水平和人均收入水平等多个指标判定一个国家或一个区域经济发展程度所属的类型。在工业和农业方面,可以根据全国各个地区农民生活消费支出的情况来研究农民消费结构的趋势;可以对企业的人力、物力、财力和市场条件因素进行分析,研究出企业的经济效益等情况[4]。
多元统计分析领域也存在着未能解决的一些问题,比如在研究统计量的精确分布和优良性的方面,有一些多元统计分析的重要问题存在了将近几十年,最著名的有威尔克斯Λ统计量以及最大相对特征根统计量。
我国的经济发展水平从2000年开始以8%左右的年平均增长率稳步增长。随着这两年我国经济的快速发展,使得经济发展水平的增长率保持在9%以上。根据联合国发布的 《贸发组织》预测法来预测我国的经济发展水平,其预测结果为:我国的经济发展水平将平稳增长,在未来十年中其发展平台将十分广阔。当我们在关注经济发展的同时也应该关注一些实际的问题,比如说,进入21世纪以来,从我国人口登记中不难发现我国城镇的失业率也逐渐上升,这个上升的幅度是比较大的,增长趋势也十分明显。从我国普通高校的调查中得知,我国的大学生的就业率也一直在70%左右徘徊。从以上问题中可以看出问题的重点在于,我国普通高校毕业生人数将越来越多,那么失业率就会逐渐增长。根据我国国家统计局的统计分析,我国从2000年至今,其每增长1个百分点的国内生产总值,就可以为我国提供将近240万个岗位的就业机会,这说明国内生产总值对于我国经济发展具有拉动的作用,并且这个拉动是弹性的拉动。那么可以这样理解就业弹性,即当国内生产总值每增长一个百分点时,可以带动0.1个百分点的就业增长率。
国外经济发展较国内来说更为迅速[5],国家与国家之间呈现出一种快速的发展模式。资源是当前经济推动力中最重要的因素,越来越多的国家认识到资源的重要性。更多的国家开始致力于能源的开发使用,其中可再生资源是国家经济发展的依托,可再生资源的利用使得经济发展水平提高更为快速。国外为达到经济快速发展的目的,组织企业不断开发挖掘大量新能源,就此可以为社会提供广阔的商机和提供大量的就业岗位。法国国家预计在本世纪20年代,能够向社会提供20万到30万的工作岗位。同时,还考虑到次债危机中很多国家选择的应对措施,其中不恰当的措施使得很多国家处于低谷的发展状态,但是,随着国家自身的调整和改变,一些国家的经济发展水平还是快速回升了,次债危机的影响也快速消退了。
1.3 多元统计分析方法的介绍
多元统计分析(multivariate statistical analysis)[6]是一种具有综合运用功能的统计分析方法,当多个对象或者多个指标互相关联的时候,它能够分析对象和指标的统计性规律。
多元统计分析方法[7,8]可以对多个随机变量的观测数据同时进行有效的分析和研究,通过分析多个随机变量的观测数据,可以得到变量与变量之间的相互关系,同时还可以揭示这些变量潜在的变化规律。如果一元统计分析方法是研究单个随机变量统计规律的学科,那么多元统计分析方法就是研究多个随机变量之间相互依赖的关系,同时研究它们内在的统计规律性。
多元统计分析的主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、聚类分析、判别分析、主成分分析、因子分析、对应分析和相关分析等。[9]当选择样本总体的分布是多维或者多元概率分布的时候,那么分析和研究该总体所运用的方法就是多元统计分析。
本文主要运用的是聚类分析和因子分析这两种方法,下面简单介绍一下这两种方法。
1.3.1 聚类分析
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/sxtj/227.html