面向用户偏好挖掘的商业数据分析(附件)【字数:15553】
如今的社会在经济迅速发展的作用下,推动了商业的发展。那么商业的发展崛起必定会产生大量的商业用户的数据信息,而这些信息的种类是多样化的、量是庞大的、处理过程也是复杂的。如何利用这些商业用户的数据信息,通过数据挖掘技术对用户偏好进行挖掘,实现数据蕴藏的商业价值是现在企业首要关心的问题。所以对商业用户数据信息挖掘用户的偏好显得尤为重要,意义也非常重大。挖掘出商业用户的偏好,也就意味着知道了用户的需求,根据挖掘出用户偏好需求可以对症下药。如何对症下药主要体现在对用户服务和营销,在了解了用户的偏好需求情况下,针对不同用户偏好需求的群体制定精准营销方案来产生利益,针对不同的用户偏好群体在服务方面实现个性化,提高用户的服务体验。本文主要探讨了面向用户偏好挖掘的商业数据分析。首先,本文对一个跨国非商店在线数据基本信息处理和聚类算法研究。挖掘出用户购买最多的商品和光临商店最多国家,以及商品购买数量和商品单价的偏好。其次对银行营销的数据做分类决策树研究。对训练集建立模型一并且优化模型,优化模型后对测试集进行预测评估,然后除去一些关键影响因素建立新的模型,优化新模型二并预测评估,对比模型一优化前后和模型二预测错误率从而说明模型的有效性。从而挖掘客户是否订阅定期存款的偏好。最后对R语言包中的杂货店数据进行关联算法研究用户偏好行为。用支持度、置信度和提升度对数据进行规则挖掘和搜索其他的规则挖掘用户的偏好,并给出一些销售建议。本文全部过程使用数据挖掘工具R语言进行研究用户偏好行为。挖掘过程中包括了建立模型、分析模型并且评价解释模型,可视化呈现模型分析结果,以及有效的预测评估。关键词用户偏好;数据挖掘;Apriori算法;K-均值算法;决策树
目录
0 引言 1
1 绪论 2
1.1 选题的背景 2
1.2 研究的意义 2
1.3 国内外现状 3
1.3.1 商业数据分析 3
1.3.2 数据挖掘用户偏好 3
1.3.3 评述 4
1.4 相关理论与技术介绍 4
1.4.1 用户偏好数据挖掘 4
1.4.2 决策树 4
1.4.3 K均值聚类算法 5
1.4.4 Apriori关联算法 5
*好棒文|www.hbsrm.com +Q: ^351916072*
1.5 本文主要研究内容 5
1.6 论文研究内容技术路线图 6
2 基于跨国在线非商店数据的预处理 8
2.1 研究问题 8
2.2 研究内容 8
2.2.1 数据介绍 8
2.2.2 数据处理 8
2.2.3 数据探索 9
2.2.4 频繁项集 10
2.3 分析结果并评价 11
2.4本章总结 11
3 K均值算法研究用户偏好 13
3.1 研究问题 13
3.2 研究内容 13
3.2.1 数据属性选取 13
3.2.2 数据特征标准化和降维 13
3.2.3 K均值聚类分析 14
3.3 分析结果并评价 15
3.4 本章总结 17
4 分类决策树算法研究用户偏好 18
4.1 研究问题 18
4.2 研究内容 18
4.2.1 数据介绍 18
4.2.2 数据处理 18
4.2.3 选择并建立模型 19
4.2.4 模型优化与可视化 20
4.2.5 预测结果并评价 22
4.2.6 重新选择变量建立模型 22
4.3 分析结果图并评价 25
4.4 本章总结 25
5 关联算法研究用户偏好 27
5.1 研究问题 27
5.2 研究内容 27
5.2.1 数据信息 27
6.2.2 规则挖掘 29
5.2.3 搜索挖掘 29
5.3 分析结果 30
5.4 本章总结 30
结 论 31
致 谢 33
参考文献 34
附录 36
附录一 36
附录二 40
附录三 43
附录四 51
面向商业用户偏好挖掘的商业数据分析
0 引言
随着社会快速的发展,互联网的普及,推动了商业的快速发展。越来越多的商业用户数据信息随之产生,而这些数据信息就是商业价值[1]。当然数据信息的大量产生使企业需要通过数据挖掘技术发现数据隐藏价值,这也就意味企业这方面的需求人才会紧缺,对于喜爱这方面人们来说何不是一个好机会呢?
如果进数据挖掘的世界,何不走进R的世界?引用这句话就是体现R是很好的数据挖掘工具[2]。R最大的优点是一个开源软件,我们可以使用或者修改许多编程牛人预先编写好的包代码,解决需要解决的各种数据挖掘问题。当下使用好R对于从事数据挖掘者而言是比较重要的。处于“大数据“时代的我们来说,数据挖掘不单单在互联网公司,在商业经济领域也已经普及应用。所以机会也在我们身边。
数据挖掘在未来几年会很流行,对于自己而言比较喜欢数学对数据挖掘产生很大兴趣。虽然学校对我们专业开设的数据挖掘课程是选修课程,但是正因为这样我才对数据挖掘产生兴趣,并且最后选择了该课程老师的数据挖掘论文。通过本论文的工作,在数据挖掘认识和相关挖掘技术方面对我今后从事这个行业有了更大的帮助。
1 绪论
1.1 选题的背景
社会的快速发展推动下,商业也快速的发展并且会产生大量用户的商业数据信息。这些信息一方面通过数据挖掘技术不仅提供了商业价值并且带给人们方便。另一方面产生很多难题,第一信息量过于庞大,很难及时消化处理;第二信息有真有假,辨别真假难度高;第三只有保证了信息的安全性才能提供可靠的价值;第四是信息形式种类多,处理时当然难度会更高[3]。商业用户的数据信息是庞大的、海量的,那么如何挖掘商业数据信息中有效的、潜在的以及有价值的信息来发现用户的偏好也是企业所要解决的问题。通过对商业数据挖掘的有价值信息,发现用户偏好并辅助企业和决策者决策以及预测未来可能或者肯定的发生的事物[4]。以前的企业追求产品质量,只要产品好才能吸引顾客,而现在的企业是以“用户为中心”,只有了解了用户的偏好需求才能制定满足和符合用户需求的精准营销,才能提供满足和符合用户需求的个性化服务[5][6]。想要挖掘商业用户的偏好需求行为,必然要从用户产生的大量的数据信息中挖掘用户偏好。通过这些商业数据信息挖掘的用户偏好来辅助决策者决策,提供相应的服务或者制定相应的营销方案为企业带来真正的巨大的价值,进而获得利润。当然如何分析商业用户产生的数据信息,找到对企业有价值的数据信息,来帮助管理者便于决策,就需要有更先进的数据挖掘技术和数据挖掘工具支持。
数据挖掘技术是为分析大量复杂用户数据,挖掘用户价值提供了良好的技术支持。数据挖掘就是从大量数据信息中发现有价值的信息,对数据处理后选择适当的数据挖掘算法和适当的模型进行分析,最后预测评估。本文使用了当下流行的数据挖掘工具R来实现全部论文工作[7][8]。
目录
0 引言 1
1 绪论 2
1.1 选题的背景 2
1.2 研究的意义 2
1.3 国内外现状 3
1.3.1 商业数据分析 3
1.3.2 数据挖掘用户偏好 3
1.3.3 评述 4
1.4 相关理论与技术介绍 4
1.4.1 用户偏好数据挖掘 4
1.4.2 决策树 4
1.4.3 K均值聚类算法 5
1.4.4 Apriori关联算法 5
*好棒文|www.hbsrm.com +Q: ^351916072*
1.5 本文主要研究内容 5
1.6 论文研究内容技术路线图 6
2 基于跨国在线非商店数据的预处理 8
2.1 研究问题 8
2.2 研究内容 8
2.2.1 数据介绍 8
2.2.2 数据处理 8
2.2.3 数据探索 9
2.2.4 频繁项集 10
2.3 分析结果并评价 11
2.4本章总结 11
3 K均值算法研究用户偏好 13
3.1 研究问题 13
3.2 研究内容 13
3.2.1 数据属性选取 13
3.2.2 数据特征标准化和降维 13
3.2.3 K均值聚类分析 14
3.3 分析结果并评价 15
3.4 本章总结 17
4 分类决策树算法研究用户偏好 18
4.1 研究问题 18
4.2 研究内容 18
4.2.1 数据介绍 18
4.2.2 数据处理 18
4.2.3 选择并建立模型 19
4.2.4 模型优化与可视化 20
4.2.5 预测结果并评价 22
4.2.6 重新选择变量建立模型 22
4.3 分析结果图并评价 25
4.4 本章总结 25
5 关联算法研究用户偏好 27
5.1 研究问题 27
5.2 研究内容 27
5.2.1 数据信息 27
6.2.2 规则挖掘 29
5.2.3 搜索挖掘 29
5.3 分析结果 30
5.4 本章总结 30
结 论 31
致 谢 33
参考文献 34
附录 36
附录一 36
附录二 40
附录三 43
附录四 51
面向商业用户偏好挖掘的商业数据分析
0 引言
随着社会快速的发展,互联网的普及,推动了商业的快速发展。越来越多的商业用户数据信息随之产生,而这些数据信息就是商业价值[1]。当然数据信息的大量产生使企业需要通过数据挖掘技术发现数据隐藏价值,这也就意味企业这方面的需求人才会紧缺,对于喜爱这方面人们来说何不是一个好机会呢?
如果进数据挖掘的世界,何不走进R的世界?引用这句话就是体现R是很好的数据挖掘工具[2]。R最大的优点是一个开源软件,我们可以使用或者修改许多编程牛人预先编写好的包代码,解决需要解决的各种数据挖掘问题。当下使用好R对于从事数据挖掘者而言是比较重要的。处于“大数据“时代的我们来说,数据挖掘不单单在互联网公司,在商业经济领域也已经普及应用。所以机会也在我们身边。
数据挖掘在未来几年会很流行,对于自己而言比较喜欢数学对数据挖掘产生很大兴趣。虽然学校对我们专业开设的数据挖掘课程是选修课程,但是正因为这样我才对数据挖掘产生兴趣,并且最后选择了该课程老师的数据挖掘论文。通过本论文的工作,在数据挖掘认识和相关挖掘技术方面对我今后从事这个行业有了更大的帮助。
1 绪论
1.1 选题的背景
社会的快速发展推动下,商业也快速的发展并且会产生大量用户的商业数据信息。这些信息一方面通过数据挖掘技术不仅提供了商业价值并且带给人们方便。另一方面产生很多难题,第一信息量过于庞大,很难及时消化处理;第二信息有真有假,辨别真假难度高;第三只有保证了信息的安全性才能提供可靠的价值;第四是信息形式种类多,处理时当然难度会更高[3]。商业用户的数据信息是庞大的、海量的,那么如何挖掘商业数据信息中有效的、潜在的以及有价值的信息来发现用户的偏好也是企业所要解决的问题。通过对商业数据挖掘的有价值信息,发现用户偏好并辅助企业和决策者决策以及预测未来可能或者肯定的发生的事物[4]。以前的企业追求产品质量,只要产品好才能吸引顾客,而现在的企业是以“用户为中心”,只有了解了用户的偏好需求才能制定满足和符合用户需求的精准营销,才能提供满足和符合用户需求的个性化服务[5][6]。想要挖掘商业用户的偏好需求行为,必然要从用户产生的大量的数据信息中挖掘用户偏好。通过这些商业数据信息挖掘的用户偏好来辅助决策者决策,提供相应的服务或者制定相应的营销方案为企业带来真正的巨大的价值,进而获得利润。当然如何分析商业用户产生的数据信息,找到对企业有价值的数据信息,来帮助管理者便于决策,就需要有更先进的数据挖掘技术和数据挖掘工具支持。
数据挖掘技术是为分析大量复杂用户数据,挖掘用户价值提供了良好的技术支持。数据挖掘就是从大量数据信息中发现有价值的信息,对数据处理后选择适当的数据挖掘算法和适当的模型进行分析,最后预测评估。本文使用了当下流行的数据挖掘工具R来实现全部论文工作[7][8]。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/238.html