回归分析法的淘宝交易额数据研究

摘要:本文应用以回归分析法为主的统计方法研究时下与人们生活密不可分的网络购物现象。本文以淘宝网作为实例对象,以年交易总额作为我们最关心的因变量,研究其他几种因素对年交易总额的影响。本文无法对网络购物这种火热的现象做出总结与预测,而是意在将统计学的思想应用于对实际问题的浅显分析。研究初期拟定对年交易总额的影响因素有居民消费水平、居民消费价格指数、淘宝网注册人数和互联网上网人数,以此建立多元回归分析模型,着重以统计学的角度分析自变量的选取是否有意义,对于问题的影响程度,再给出模拟回归方程,并且提供给读者研究实际问题的心得。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1 变量2
1.1 淘宝网年交易总额2
1.2 居民消费水平2
1.3居民消费价格指数3
1.4 淘宝网注册人数3
1.5 互联网上网人数3
2 多元回归分析4
2.1 回归分析4
2.2 多元回归分析4
2.3多元回归分析与简单回归分析的差别4
3 再看变量5
3.1 数据删改5
3.2 数据标准化6
4 数据分析6
4.1 散点图6
4.2 回归方程8
4.3 检验8
4.3.1 R检验9
4.3.2 F检验9
4.3.3 t检验9
4.3.4结论10
5 讨论10
致谢11
参考文献11
基于回归分析法的淘宝交易额数据研究
引言
引言
统计学与数学的关系非常微妙,但是现在主流的观点是,统计学是一门与数学有联系的完全独立的学科[1]。这其中重要的原因是统计学需要通过实际应用进行验证,统计学注重对事实的归纳而数学更注重对假设的演绎,这是统计学与数学的区别。另一方面,这说明了统计学逐渐受到了人们的重视。但是,这种程度的重视是远远不足够的,因为我们生活中处处几乎都有统计的影子,小到未来几天的天气,大到新发明的特效药
 *好棒文|www.hbsrm.com +Q: 3 5 1 9 1 6 0 7 2 
是否能够上市,同时统计学支持的学科包括金融、医疗、社会学、信息产业等等[2]。统计学家用一种不轻易下判断的眼光看待这个充满可能的世界,任何事情都有可能性,考虑事情尽量保持客观。同时统计学需要耐心与时间,历史上有统计学家抛硬币几万次为了计算概率、花几十年的时间观察吸烟者的健康情况,这是我们要尊敬统计这个学科的原因。虽然目前计算机科学的发展使得统计学在模拟实验、计算分析等方面变得更加有效率,不过观察研究等领域仍需要投入大量的人力、物力和时间。现今社会有一个很火的词,叫做数据。数据在信息产业尤其别重视,我们发现往往是最强大的IT公司掌握的最庞大的数据资源,可见数据的重要性。然而,所谓的“大数据”或“数据制胜”的概念早在几十年前变成了另一门产业的法则,那就是医疗行业。大的医药公司能够最快速的推出好的药品正是因为他们拥有最庞大的数据资源。而使这些原本只是一串串数字富有意义的就是统计学,离开了统计学数据便没有了意义。所以你可以看到,默默支持着现今最流行的“数据”这一资源的统计学,是何等的重要。随着社会经济的迅速发展以及网络技术的不断突破,网络购物产业以势如破竹的姿态打开中国的经济市场[3]。网络购物逐渐成为人们的生活常态同时也改变了人们以往的很多行为,同时促进了国民经济发展。人们度过了对网络购物不了解、不信任的阶段,这个行业已经变得规则制度完善并且一定程度上造福了消费者。所以对一个已经接近成熟的产业进行分析是有意义的,它有利于正确引导消费需求,建立更好的行业生态[4]。本文将对具有代表性的淘宝网作为例子,应有统计的思想,分析影响该行业的因素。
1 变量
本文希望研究是什么因素影响了中国电子商务产业。我们选择目前中国电子商务产业中的代表公司——淘宝网作为研究的实例。那么显然,本文例子所受到的影响因素不会完全适用于整个行业,但是下面解释一下例子选择的合理性,即例子能够具有代表性的原因:
其一,淘宝网所占产业份额巨大,可以理解为“样本容量”足够大。
其二,目前电商产业规模最大的两种模式是B2C模式和C2C模式。简单介绍,B2C指的是卖家是企业而买家是个人,企业将商品卖给个人;C2C指的是卖家、买家都是个人,个人将商品卖给个人。淘宝网属于C2C模式而B2C模式中也是京东等著名的企业。两种模式虽有所不同但是受到影响的因素大致相同[5]。
1.1淘宝网年交易总额
淘宝网的年交易总额代表着在淘宝网上进行的交易的活跃程度,我们认为年交易总额越大,其中进行的交易越活跃,同时其流动资本的数目也与所带来的经济价值成正相关。
我们在网上搜集了20062015年淘宝年交易额的粗略值(表1),由于涉及商业秘密数据并不好收集,并且数据的准确精度有限。这对分析造成了一定的影响实属遗憾,但是本文重在解决问题的思想而非数字的结果,相当于降低了数据精度带来的影响。年交易额越高,一定程度上代表了电商产业的繁荣程度越高。
表1淘宝网年交易总额

下面考虑哪些因素对年交易总额产生了影响,即自变量有哪些。
1.2居民消费水平
近十年来中国人的生活水平极大的提高,这不仅因为科技的发展,也因为人们手里可以支配的金钱越来越多。居民消费水平,指按常住人口平均水平计算的居民消费支出,随着居民消费水平的提高,人们花在网络购物的金额随之提高是可以预见的[6]。我们在国家统计局的数据库里找到了20062014年我国居民消费水品(表2),2015年的数据网站上还未更新。
表2居民消费水平
1.3居民消费价格指数
居民消费价格指数是反映一定时期内居民所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格指数是表现社会通货膨胀率的一种方式,那么年交易总额的逐年增加可能受到了物价上涨带来的影响,我们将在后面进行验证。依然由国家统计局数据库提供20062014年的数据(表3)。
表3居民消费价格指数

1.4 淘宝网注册人数
由于淘宝网的特性,用户需要在网站注册方可进行交易。所以进行过交易的人必然是注册用户,注册用户有一定的概率进行交易。需要注意的是这里的淘宝网注册人数对于企业并不是一个很重要的数据,相比之下企业更看重月活跃用户等参数。本文在网上收集到了20062012年淘宝网注册人数(表4),20132015年的数据无法得知,对分析有一定的影响。
表4淘宝网注册人数
1.5 互联网上网人数

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/973.html

好棒文