共词分析的基因转录领域热点分析

在信息化飞速发展的现在,随着网络技术的发展,科技文献具有良好的全球共享的功能。因此如何快速地把握研究领域的发展热点动向,是企业和科研人员的关注焦点。本文选定基因转录技术领域,从web of science里获取相关文献作为数据源,将某一时段期刊文献的关注热点进行共词分析和聚类分析,从而确定文献的发表的趋势。根据论文的发表趋势我们可以看出大领域内的某一子技术受科研人员关注程度的强弱。最终,可以利用此规律进行未来一段时间内,科研热点的探究追寻。
目录
摘要3
关键词3
Abstract3
Keyword3
一、引言4
二、本文的分析方法4
(一)共词分析4
(二)聚类分析5
三、基因转录领域的共词分析5
(一)基因转录领域简介5
(二)数据采集6
(三)数据处理6
(四)结果分析9
四、总结10
致谢11
参考文献11
表1高频关键词表7
表2关键词共现矩阵7
图1高频关键词共词分析可视化8
图2关键词聚类结果9
图3子领域每年发表文献数10
基于共词分析的基因转录领域热点分析
引言
随着全球性经济竞争越来越强以及信息化水平的不断提高,基因生物学研究已成为促进经济高速发展的重要支持,是医学水平提高的重要手段,也是科技飞速进步的重要因素之一。鉴于此,基因生物学的研究也前所未有地引起国际科研工作者的普遍重视。最近几年,国际上基因生物学研究的期刊论文一直不断地增长。无论是学者关注度还是用户关注度,基本都呈上升趋势。随着国际企业信息化程度的逐渐提高,今后基因生物学必将会受到越来越多生物机构以及医学机构重视,发展势头也会日益强劲。因此,从研究内容角度对国际基因生物学的研究进展状况进行分析具有重要意义。
鉴于此,本文利用共词分析,对1993~2013年期国际上发表的基因转录研究相关文献进行关键词词频统计分析,并与相关文献内容结合,通过数据统计分析方法,以可视化的方式科学客观地反映出国际基因生物学研究的演进态势,期望能够全面对当前 *好棒文|www.hbsrm.com +Q: @351916072@ 
国际基因生物学的研究进展进行揭示,来为从事基因生物学研究的学者或机构提供一定参考。
二、本文的分析方法
(一)、共词分析:
共词分析法在文献计量学中是一种非常重要的内容分析法。它通过对能够表达某些学科领域研究热点或研究方向的关键词共同出现在同一篇文章中的现象进行统计分析。[4]然后挖掘这些词之间的关系以及关键词出现的频率。共词分析的方法基础就是词频分析,分析开始的第一步就是要从数据库中提取某一领域的所有文献的关键词。这类词语一般是出现的频次超过了一定阈值,并且能够代表该领域研究主题或研究方向的高频词;其次,两两统计这些高频关键词在同一篇文章中同时出现的次数,形成共词矩阵;最后,围绕着这个共词矩阵进行分析得出结果。
共词分析法能够成立的的假设条件是:文章的关键词是文章主题内容的浓缩,两篇文章如果有两个或两个以上的相同关键词,那么就认为这两篇文章在研究的概念、理论或方法上是相关的,内容是相似的。相关的文章数量越多,就越表明这两个关键词的相关度越大。然后就可以分析这些词所代表的学科和主题的结构变化。然后利用现代的多维统计技术如聚类分析、因子分析或者多维尺度分析等,就可以将一个学科内的重要关键词加以分类,达到将学科内的重要文献进行分类从而区分出学科内研究领域的效果。[8]进而归纳出该学科领域的研究热点构成。
共词分析法适合于探寻新兴学科热点或者学科内新兴的研究领域。因为对新兴学科(领域)的研究往往人数众多却不集中、科技文献也比较分散、引用以及被引用情况也相对不稳定。但是,文章关键词却很好地表达了这个学科研究领域的研究热点、焦点,这些领域、热点和焦点则恰好可以体现出某一个新兴学科领域的发展方向,从而有利于科研人员快速发现这个学科的发展趋势。一般来说,共词分析主要研究下面这两个问题:一方面是探求研究不同领域间的相互关系;另一方面则是寻找非当前热点但是在潜在增长,将来可能成为热点的领域。本文会利用该分析方法,寻找20年间,不同年段的研究热点以及潜在的未来主要研究方向。[3]
(二)、聚类分析:
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。识别与分类是人类最基本的思维活动,只有通过分类来形成假设和建立概念,才能发现和总结规律。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1988.html

好棒文