cnki的数据挖掘主题核心文献的可视化分析

本文以CNKI数据库为检索平台,收集了发表于1997-2016年间,主题词为“数据挖掘”的分类为信息科技下的数据库理论及系统,来源为SCI来源期刊、EI来源期刊以及核心期刊的期刊文献,利用可视化分析软件Cite Space III对搜集到的文献数据从时间序列上的发文量、关键词、研究作者以及研究机构等方面进行了描述,并且对高频关键词以及每个阶段内的关键词分别进行了详细的可视化分析。根据可视化分析结果得出,该领域的发文量当前整体已趋于平稳状态,因此创新难度提高,但仍旧时有新生关键词引起关注。总的来说,本文描述了数据挖掘研究领域的发展轨迹,揭示了其研究热点等各相关要素的发展概况和变化情况。
目录
摘要 3
关键词 3
Abstract 3
Keywords 3
一、引言 4
(一)研究背景 4
(二)可视化工具简介 4
(三)数据挖掘领域的可视化研究现状 4
二、数据的搜集与处理 5
(一)CNKI数据库 5
(二)数据搜集 5
(三)数据处理 5
三、可视化分析 5
(一)时间序列上的文献数量分析 5
(二)关键词分析 6
1.19972002年关键词分析 8
2.20032012年关键词分析 10
3.20132016年关键词分析 11
4.高频关键词 12
(三)研究机构分析 13
1.主要机构 14
2.机构性质 14
(四)研究作者分析 14
四、结论与讨论 16
(一)结论 16
(二)讨论 16
(三)可能存在的问题 17
致谢 17
参考文献 18
图1 数据挖掘主题研究年度核心期刊发文量变化趋势图 6
图2 关键词知识图谱 7
图3 删去检索词之后的关键词知识图谱 8
图4 删去检索词之后的关键词知识图谱(按时间序列) 8
图5 19972002年关键词知识图谱 9 *好棒文|www.hbsrm.com +Q: *351916072* 

图6 19972002关键词知识图谱主要部分 9
图7 20032012年关键词知识图谱 10
图8 20132016年关键词知识图谱 11
图9 20132016年关键词知识图谱(按时间序列) 12
图10 相关机构研究知识图谱 13
图11 相关作者知识图谱 15
表1 数据挖掘主题研究核心期刊文献的年度分布与积累历史性变化 6
表2 知识图谱中显示出的高频关键词 7
表3 高频关键词在20032012年与整体数据出现频次比较 11
表4 不同阶段知识图谱中显示出的高频关键词比较 13
表5 高产机构 14
表6 高产作者 15
基于CNKI的数据挖掘主题核心文献的可视化分析
引言
引言
(一)研究背景
互联网技术的出现和发展带给了人们太多的便利,在网上互换信息和合作变得越来越容易,计算机不断地提高对各种类数据和信息的收集存储和处理能力,数据库技术的成熟和普及带来的结果是所积累的信息量以指数方式暴涨[1]。各行各业都积累了海量异构的数据资料。这些数据往往隐含着各种各样有用的信息,仅仅依靠数据库的查询检索机制和统计学方法很难获得这些信息,为了达到决策服务的目的,将这些数据转化成有用的信息和知识迫在眉睫。作为一个新兴的多学科交叉应用领域,数据挖掘正在各行各业的决策支持活动中扮演着越来越重要的角色。随着信息技术的迅速发展,只要是有分析价值的数据库,都可以利用数据挖掘工具来挖掘有用的信息。
(二)可视化工具简介
知识图谱以科学知识为对象,是学科的发展进程与结构关系的一种直观图形展示方式,具有“图”和“谱”的双重性质与特征。可视化软件作为绘制知识图谱的载体工具,赋予了知识图谱直观、定量、简单与客观等诸多优点;经大量实践研究证明,通过生成知识图谱的方法可以得到较为可靠的研究结论,是一种有效的、综合性的知识可视化分析方法和工具,因此被广泛应用于学科发展进程的科学研究;目前成为科学计量学、科学学、管理学等领域的研究热点与实践探索趋势所必不可少的工具。Cite Space、Histcite[7]、VOS viewer[8]、SATI[9]、Bib Excel[10]等软件都具有可视化的功能。
其中Cite Space是一款在科学文献中识别与可视化新趋势与新动态的,在Java环境下运行的可视化的文献计量分析工具,目前已成为信息分析领域中影响力较大的信息可视化软件[11]。Cite Space系列软件的主要开发者是者美国德雷克塞尔大学信息科学与技术学院的华人学者陈超美(Chaomei Chen) 博士。通过Cite Space软件运行出的知识图谱网络,一个研究领域来龙去脉的历史演进历程被集中的展现在一幅引文网络图谱上,并且作为知识基础的引文节点文献和共引聚类所表征的研究前沿都被自动标识了出来。大连理工大学WISE 实验室的刘则渊[12]教授曾用“四个一”对Cite Space 软件系统进行了概括,“一图展春秋,一览无余;一图胜万言,一目了然”。
(三)数据挖掘领域的可视化研究现状
我国目前对于数据挖掘主题领域的研究虽涉及到各行各业,除了上文提到的,还广泛应用于市场、金融、科学研究 、工程诊断等方面。但是用可视化软件对其数据库理论及系统方面的期刊文献的研究热点进行的分析并不普遍,以检索式“主题词=数据挖掘and cite space”在CNKI中检索,得到最新的结果是邵慧丽[13]于2016年5月发表在图书馆杂志上的基于知识图谱国际视野下大数据研究可视化分析。虽然其研究主题大数据是数据挖掘主题内的一个重要部分,但并不能代表整个领域的研究热点。与其他可视化软件相比,Cite Space软件的可视化功能较为成熟,操作起来较为简便,得到的可视化图谱更为直观。
二、数据的搜集与处理

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/583.html

好棒文