利用excel解决回归分析中的序列相关问题(附件)【字数:9711】
摘 要摘 要回归分析是计量经济分析中利用次数最多的一种工具,是用来分析两个及两个以上的变量相互之间因果关系的统计方法,其理论与方法已经形成了一个完整的体系,并在社会经济现象与科技领域得到了广泛的应用。对时间序列进行回归分析,往往会遇到大量的时间序列之间存在这由于某种因素影响形成的长期趋势,因为在数列的前后期数据之间存在着一定程度的依存关系。这种关系被称为序列相关性。假如时间序列之间存在序列相关性,将会产生什么后果呢?首先是回归模型中误差项必须遵守的基本要求和条件受到破坏,特别是相互独立性受到破坏,现象之间存在的真实关系可能会被歪曲或被掩盖起来。相关数列中的波动,取决于数列自身的发展趋势,即受到数列内部存在的序列相关性的制约。在这种情况下,通常的各种显著性检验也会失效,预测分析也都会失去自身的意义。为了避免上述情况的发生,并满足回归分析的基本要求,就需要对时间序列数据进行序列相关性的检验,如果存在序列相关性,就需要采取科学方法予以消除,以求通过回归得出正确的结论。本论文的前半部分内容主要是介绍回归分析与序列相关性的基本理论知识。微软公司的Office系列软件是普及度最广的软件之一,其中的组件Excel又是其中的一个重要组成部分。它作为一个电子表格软件,作用不仅仅局限于处理表格,它还可以进行各种模型建立、数据处理、统计分析和辅助决策等操作,被广泛的应用于金融、管理、统计、财经等领域。因此,本论文的后半部分主要讲解用Excel分别对一元回归与多元回归的实例进行序列相关性的检验与处理。关键字 时间序列;回归分析;Excel;序列相关性;DW检验
目 录
第一章 绪论 6
1.1 研究背景 6
1.2 序列相关性产生的主要原因 8
1.3 序列相关性的检验 10
1.3.1 基本思路 10
1.3.2 具体的检验方法 10
1.3.3 图解法 10
1.3.4 杜宾沃森检验 11
第二章 出现序列相关性时的处理方法 14
2.1 引言 14
2.2 序列相关系数//已知的情况 14
2.3 序列相关系数//未知的情形 16
2.4 由DW统计量估计// 16 *好棒文|www.hbsrm.com +Q: ¥351916072$
2.4.1 杜宾(Durbin)两步法 16
2.4.2 柯克兰奥兰特(CochraneOrcutt)迭代法 17
2.4.3 广义最小二乘法(GLS:Generalized least squares) 19
第三章 回归实例 20
3.1 一元回归实例 20
3.1.1 具体数据 20
3.1.2 图解法 20
3.1.3 DW检验 21
3.2 消除一元回归中的序列相关性 22
3.2.1 广义差分法 22
3.2.2 CO迭代法 23
3.3 多元回归实例 24
3.3.1 具体数据 24
3.3.2 DW检验 25
3.4 消除多元回归中的序列相关性 25
3.4.1 广义差分法 25
3.4.2 CO迭代法 27
第四章 结论 28
致谢 29
参 考 文 献 30
第一章 绪论
1.1 研究背景
1980年,著名未来学家阿尔文?托夫勒在其出版的经典著作《第三次浪潮》中预言:如果说IBM的主机拉开了信息化革命的大幕,那么“大数据”则是第三次浪潮的华彩乐章。
2011年5月,麦肯锡公司发布了《大数据:创新、竞争和生产力的下一个前沿领域》报告,陈述了“大数据”时代的到来,指出“数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素”。
2012年,Twitter上每天发布超过4亿条微博,Facebook上每天更新的照片超过1000万张,Farecast公司用将近10万亿条价格记录来预测机票价格。
关于数据在我们这个时代所起的作用,其实也无需赘言。但如何把隐没在一大批看起来杂乱无章的数据里的信息、规律、关键点萃取出来,却是很多人都应该了解,甚至是应该深入研究的学问。对很多在工作中需要跟数据打交道的人,或者就是以数据统计、分析为工作的人来说,不仅仅是需要一定的统计学知识,而且还需要用统计分析工具将结果呈现出来。
毋庸置疑,对大多数人来讲,用得最多的可以用来进行数据统计与分析的工具就是Excel[6]。Excel是微软Office系统中的重要组件之一,被广泛的加载安装于各种电脑。正由于Excel相对容易获得,以及具有丰富的统计与分析功能,Excel才能成为最受欢迎的统计软件。在实际应用中,它常常用于对数据进行统计与分析,进行专业的科学统计运算,简化统计工作,或是作为其他专业的数据分析软件的备用工具。
回归分析方法是处理多个变量之间相互关系的一种数学方法,是数理统计常用方法之一。从分析测试的观点来看,回归分析的任务就是找出响应值y(因变量)与影响它的诸因素xi(自变量,i=1,2,3,,n)之间的统计关系(回归模型),利用这些统计关系在一定置信度下由各因素的取值去预测响应值的范围,在众多的预报变量中,判断哪些变量对自变量的影响是显著的,哪些变量的影响是不显著的;根据预报变量的给定值来估计和预测精度[7]。
序列相关(serial correlation),又名自相关(autocorrelation),是指在用时间序列数据进行回归分析时经常出现的问题,意指误差项之间存在着相互关系。尤其是在经济活动中,当期的活动会对以后时期的活动有影响,容易出现序列相关[8]。这就意味着我们在处理这些数据前需要对数据进行序列相关的检验,假若随机误差项之间具有序列相关性,便需要消除序列相关性,以确保在以后对数据进行进一步的处理时不会影响到数据结果的准确性。
序列相关主要是在时间序列中提出的概念,在截面数据形成的序列中很少出现。但在研究时间序列时,也因研究目的和数列自身性质的不同采取不同的步骤和方法。当研究的是由一个变量组成的单一时间序列,研究目的是为了分析其自身的变化规律而不涉及与其它变量的关系,特别是当某一现象的变化难于与其它原因建立联系时,这就需要从变量自身的变化中提取有关未来的信息。另一种情况是研究的对象不是单一的时间数列,而是由双变量或多变量组成的相关时间序列。在这种情况下,要确定的不是单一序列自身的增长趋势,而是确定解释变量变动与因变量变动之间的依存关系。这时要用到各项回归与相关分析的理论和方法,但不同的是这里的数据是动态的,存在序列相关,问题因此变得复杂起来,由此而产生了时间序列中应用回归分析方法的特殊性[9]。
1.2 序列相关性产生的主要原因
目 录
第一章 绪论 6
1.1 研究背景 6
1.2 序列相关性产生的主要原因 8
1.3 序列相关性的检验 10
1.3.1 基本思路 10
1.3.2 具体的检验方法 10
1.3.3 图解法 10
1.3.4 杜宾沃森检验 11
第二章 出现序列相关性时的处理方法 14
2.1 引言 14
2.2 序列相关系数//已知的情况 14
2.3 序列相关系数//未知的情形 16
2.4 由DW统计量估计// 16 *好棒文|www.hbsrm.com +Q: ¥351916072$
2.4.1 杜宾(Durbin)两步法 16
2.4.2 柯克兰奥兰特(CochraneOrcutt)迭代法 17
2.4.3 广义最小二乘法(GLS:Generalized least squares) 19
第三章 回归实例 20
3.1 一元回归实例 20
3.1.1 具体数据 20
3.1.2 图解法 20
3.1.3 DW检验 21
3.2 消除一元回归中的序列相关性 22
3.2.1 广义差分法 22
3.2.2 CO迭代法 23
3.3 多元回归实例 24
3.3.1 具体数据 24
3.3.2 DW检验 25
3.4 消除多元回归中的序列相关性 25
3.4.1 广义差分法 25
3.4.2 CO迭代法 27
第四章 结论 28
致谢 29
参 考 文 献 30
第一章 绪论
1.1 研究背景
1980年,著名未来学家阿尔文?托夫勒在其出版的经典著作《第三次浪潮》中预言:如果说IBM的主机拉开了信息化革命的大幕,那么“大数据”则是第三次浪潮的华彩乐章。
2011年5月,麦肯锡公司发布了《大数据:创新、竞争和生产力的下一个前沿领域》报告,陈述了“大数据”时代的到来,指出“数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素”。
2012年,Twitter上每天发布超过4亿条微博,Facebook上每天更新的照片超过1000万张,Farecast公司用将近10万亿条价格记录来预测机票价格。
关于数据在我们这个时代所起的作用,其实也无需赘言。但如何把隐没在一大批看起来杂乱无章的数据里的信息、规律、关键点萃取出来,却是很多人都应该了解,甚至是应该深入研究的学问。对很多在工作中需要跟数据打交道的人,或者就是以数据统计、分析为工作的人来说,不仅仅是需要一定的统计学知识,而且还需要用统计分析工具将结果呈现出来。
毋庸置疑,对大多数人来讲,用得最多的可以用来进行数据统计与分析的工具就是Excel[6]。Excel是微软Office系统中的重要组件之一,被广泛的加载安装于各种电脑。正由于Excel相对容易获得,以及具有丰富的统计与分析功能,Excel才能成为最受欢迎的统计软件。在实际应用中,它常常用于对数据进行统计与分析,进行专业的科学统计运算,简化统计工作,或是作为其他专业的数据分析软件的备用工具。
回归分析方法是处理多个变量之间相互关系的一种数学方法,是数理统计常用方法之一。从分析测试的观点来看,回归分析的任务就是找出响应值y(因变量)与影响它的诸因素xi(自变量,i=1,2,3,,n)之间的统计关系(回归模型),利用这些统计关系在一定置信度下由各因素的取值去预测响应值的范围,在众多的预报变量中,判断哪些变量对自变量的影响是显著的,哪些变量的影响是不显著的;根据预报变量的给定值来估计和预测精度[7]。
序列相关(serial correlation),又名自相关(autocorrelation),是指在用时间序列数据进行回归分析时经常出现的问题,意指误差项之间存在着相互关系。尤其是在经济活动中,当期的活动会对以后时期的活动有影响,容易出现序列相关[8]。这就意味着我们在处理这些数据前需要对数据进行序列相关的检验,假若随机误差项之间具有序列相关性,便需要消除序列相关性,以确保在以后对数据进行进一步的处理时不会影响到数据结果的准确性。
序列相关主要是在时间序列中提出的概念,在截面数据形成的序列中很少出现。但在研究时间序列时,也因研究目的和数列自身性质的不同采取不同的步骤和方法。当研究的是由一个变量组成的单一时间序列,研究目的是为了分析其自身的变化规律而不涉及与其它变量的关系,特别是当某一现象的变化难于与其它原因建立联系时,这就需要从变量自身的变化中提取有关未来的信息。另一种情况是研究的对象不是单一的时间数列,而是由双变量或多变量组成的相关时间序列。在这种情况下,要确定的不是单一序列自身的增长趋势,而是确定解释变量变动与因变量变动之间的依存关系。这时要用到各项回归与相关分析的理论和方法,但不同的是这里的数据是动态的,存在序列相关,问题因此变得复杂起来,由此而产生了时间序列中应用回归分析方法的特殊性[9]。
1.2 序列相关性产生的主要原因
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/sxtj/188.html