数据挖掘技术的电信业客户流失分析

系负责人: 丁海军 , 2014 年 12 月 20 日摘 要近年来,随着电信行业的竞争日趋激烈,如何有效地避免客户流失成为目前运营商亟待解决的问题。本文将数据挖掘方法应用于电信行业客户流失分析中,以探索数据挖掘技术在电信行业的应用。SPSS Modeler是模型丰富的数据挖掘平台,具有可扩展性和强大的数据处理能力,可以帮助解决电信行业客户流失分析问题。因此,本文采用理论与实际相结合的研究方法,基于SPSS Modeler数据挖掘平台,针对电信行业某运营商给出的客户数据,利用K-means聚类算法、C5.0决策树算法以及将K-means算法和C5.0算法进行混合分别建立数据挖掘模型。本文首先介绍了电信行业客户流失问题的研究现状,以此引出本文的研究背景及意义,随后,对本文中所涉及的相关理论知识做了详细的介绍,包括聚类算法、分类算法、CRISP-DM方法论以及数据挖掘工具等。接着,文章重点介绍了电信业客户流失问题的需求分析、数据处理过程、建模过程以及对模型结果的评估分析。最后,对本文做了总结与展望。本文利用电信行业某运营商提供的客户数据,对模型进行了测试和评估。在对模型进行评估时采用了数值化指标和图形化指标,结果显示,聚类模型主要是完成客户的细分工作,比较适合低价值客户群体;决策树模型直观的体现了易流失客户的基本特征,且模型可靠性较好,适合高价值客户;K-C模型结合了K-means和C5.0两者的特点,使得预测分析更合理,准确率也比较高。
目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1研究背景及意义 1
1.1.1我国电信市场发展历程及现况 1
1.1.2我国电信行业客户流失现状 2
1.2数据挖掘在电信行业的应用现状 3
1.3本文的主要内容及组织结构 4
第二章 相关理论和技术 6
2.1 数据挖掘概述 6
2.1.1数据挖掘的概念 6
2.1.2数据挖掘的基本步骤 6
2.1.3数据挖掘方法简述 7
2.1.4聚类方法详述 8
2.1.5分类方法详
 *好棒文|www.hbsrm.com +Q: ^3^5^1^9^1^6^0^7^2^* 
述 9
2.2 CRISPDM方法论 11
2.3数据挖掘工具的介绍 13
第三章 SPSS Modeler数据挖掘平台 15
3.1 SPSS Modeler数据挖掘平台简介 15
3.2 SPSS Modeler数据挖掘平台的系统结构 15
3.3 SPSS Modeler数据挖掘平台的特点 16
3.4 SPSS Modeler数据挖掘平台的操作介绍 16
第四章 客户流失分析需求描述 18
4.1客户流失问题的分析流程 18
4.2 客户流失概念描述 18
4.3数据处理 19
4.3.1数据抽取 20
4.3.2数据清洗 21
4.3.3数据转换 22
4.4建模方案设计 22
第五章 基于SPSS Modeler的电信业客户流失分析 24
5.1相关算法详解 24
5.1.1 Kmeans算法 24
5.1.2 C5.0算法 25
5.2建立模型与结果分析 26
5.2.1 Kmeans建模 26
5.2.2 C5.0建模 30
5.2.3 KC混合建模 34
第六章 总结与展望 38
6.1总结 38
6.2展望 39
致 谢 40
参考文献 41
附 录 43
绪论
本章首先介绍本课题的研究背景和意义,其次介绍目前该课题的研究现状,然后介绍了本文主要研究内容及文章的主要结构。
1.1研究背景及意义
1.1.1我国电信市场发展历程及现况
自上世纪70年代末,改革开放开始实施,我国的国民经济开始飞速发展,经济的迅猛发展使得社会对于信息技术和网络服务等方面的需求不断增加,电信行业的发展迫在眉睫。
20世纪80年代中后期,中国的固定电话网正处于转型时期,当时电话普及率还不到0.5%的中国市场蕴含了巨大商机,吸引了世界各国的交换机厂商来中国吸金,从而形成了中国通信史上较为有名的“七国八制”。 “七国八制”,顾名思义,全中国的电信版图被七个国家八种制式占领,,然而这些来自不同国家,使用不同制式的交换机是互不相通的,这就造成了中国通信市场一片混乱。1992年,中国电话用户数已经达到1000万户,这其中的设备基本上全部由国外公司所提供。但是国外企业忽略了农村市场,这就为中国厂商寻到突破口提供了机会,国内企业开始在农村市场寻求发展。在迅速获得市场反应后,实行由农村包围城市的战略计划,引入接入网技术,将七国八制从中国国土上赶走。
随后,电信行业又经历了一系列重大变革,从电信政企分离、增值业务市场开放,到随着中国加入WTO,基础电信业务初步开始形成竞争格局,再到现在的电信业务广泛融入到人们的工作和生活中,电信行业一直处于发展与挑战并存的状态,从未停歇。
现如今,电信行业在社会服务中占有着至关重要的地位,它的发展不仅能够大大加速信息的流动,缩短人与人交流的空间距离,同时还提高了社会的运行效率和发展速率,创造出巨大的社会利益。
从图1.1显示的数据可以得出,2014年电信业务收入完成11541.1亿元,按可比口径测算同比增长了3.6个百分点,跟上年相比,下降了5.1个百分点。电信业务总量完成18149.5亿元,同比增长16.1%,跟上年相比,提高了0.7个百分点。电信业务总量与电信业务收入增长的剪刀差由2012年的1.8个百分点持续拉大至12.5个百分点。

图1.1 20092014年电信业务总量与业务收入增长情况
我们可以看到2014年电信业务总量提高了0.7个百分点,但是业务收入却反而下降了5.1个百分点。究其原因,可总结归纳为如下两点:一是由于互联网创新应用的蓬勃发展,给传统的电信行业带来了巨大的震撼和冲击;二是因为在电信行业,客户的流失会给企业造成了较大的经济损失。
1.1.2我国电信行业客户流失现状
我国的电信行业,从垄断到竞争,从政企合一到政企分开,从两个竞争主体发展到多个竞争主体,一直处于在改革中发展,在发展中改革的状态。第四次电信重组采用“六合三”重组方案,中国电信收购中国联通CDMA 网络,中国铁通并入中国移动,中国联通和中国网通合并,我国电信业正式进入“三足鼎立”时代。近期,第五次电信重组的消息不胫而走。企业之间竞争愈来愈激烈,客户对于企业来说,成为了最重要的资源。如何把客户吸引过来并且留住就成为了电信企业的工作重点。鹬蚌相争,渔翁得利,消费者们因为激烈的市场竞争得到了越来越多的实惠,但是对于运营商来说,客户的质量是在不断下降的。
据统计,中国移动通信市场客户年度离网率高达百分之五十左右,且增长幅度较快,中国联通GSM网络客户的月流失率甚至能达到百分之三十,CDMA用户的流失率也一直居高不下。为了能够大幅获取客户资源,在市场中占有更大份额,中国移动往往采取利用价格优势参与竞争,但是这样的举措会吸引大量短期客户,导致客户流失率愈发增长。短时间内看,似乎的确占有了较多的市场份额。但从长远发展的角度看,这种价格战最终只能导致恶性竞争,两败俱伤。原因如下:

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/1790.html

好棒文