全文的引用分析及引文分析相关性研究
引文分析被应用至今,仍然是科研水平评价和科学研究领域预测的重要方式。但是一些不足和弊端也逐渐显露出来。一种新的引文分析方式即全文本引用分析的出现很好地解决了引文分析方式太过单一,引用动机不明确等的困局。本文首先回顾了该研究领域的相关研究状况,根据设计的研究路线,选取了相关期刊数据,并对每篇文献的引文数量和引用数量进行统计分析其相关性等,并对不同的期刊的引文数量和引用数量进行对比分析。除了“量的分析”外,还对多次引用的位置及动机进行分析,揭示其中隐含的规律。
目录
摘要 1
关键词 1
Abstract. 1
Keywords 1
一、文献回顾 2
二、指标与方法 3
三、实证过程 3
(一)数据来源与数据清洗 3
(二)数据分析 3
1.引文篇数和引用数量的分布 3
(1)总体情况 3
(2)不同期刊引文篇数和引用数量对比分析 6
2.多次引用发生的位置与动机 7
(1)多次引用出现在文献的研究背景,理论回顾等部分: 8
(2)多次引用出现在文章的方法介绍或演算部分: 8
(3)多次引用出现在模型或者框架设计部分: 8
四、结论 8
致谢 9
参考文献: 9
表 1 数据来源...........................................................................................................................3
表 2引文数量和引用数量的斯皮尔曼相关系数 5
表 3散点分布表 5
表 4不同期刊对比 6
表 5多次引用位置及动机 7
图 1引文数量与引用数量总体分布 4
图 2引用篇数与引文篇数差值分布 4
图 3散点图 5
基于全文的引用分析及引文分析相关性研究
引言
引言:知识在流动的过程中往往会表现出的特殊的变化性和继承性,而这 *好棒文|www.hbsrm.com +Q: ¥351916072¥
种带有特殊性质的过程也就是创新的过程,而科技文献的创新则需要通过引用这一过程来实现。所谓的引文分析,就是通过了解施引文献和被引文献之间的关系,客观的解释它们二者之间的规律和特征,达到评价科技文献的重要性或预测学科发展趋势的效果[1] 随着科技文献数量不断增长,我们也越来越开始重视各科技文献之间相互引用的情况,所以引文分析方法也在不断地发展更新。再近些年来,有不少学者提出基于全文的引文分析这一引文分析方式[2,3],这种新的引文分析方式与传统的引文分析方式的区别在于 传统的citation analysis他们的研究对象主要是位于文尾的参考文献,而不是真正发生在文中的引用,我们常常会误认为在一篇科技文献中,引文和引用存在着一一对应的关系,但事实上经过大量的数据证明,大多数科技文献中,引文与引用并非一一对应[46]。相比较于传统的分析,这种新的引文分析方式,在进行引文分析时,会深入施引文献中,考察被引文献在施引文献中具体的引用,进行具体的分析,能够很好地分辨出不同的被引文献对于施引文献的相对作用和重要性[7,8]。这一点很好地解决了如何区引用者真实的引用意图,同时对于文献的评价也更加真实客观。
一、文献回顾
提及基于文章内容的引文分析,我们常常会将Ding Ying[9] 早期在早期提出的“语法层次”和“语义层次” 相结合的分析方式作为这项研究开始的初始模型。研究分布在不同章节中的引文,我们把这种研究称之为语法层次的研究。而语义层次的研究指的是在特定语境中,引文对施引文献所表达的核心概念究竟是正面影响还是负面影响,比如最常见的是支持观点还是反对观点。而这样的分析过程主要需要借助人工来完成。为了进一步验证这种新的引文分析方式的可行性,moravcsik等[10]引文文本分析的范围不断扩大,调查了理论高能物理领域30篇文献的引文,在这些引用中有不少引用是非常随意的,这样的结果证明了,我们简单的将引文数量作为评价标准的来对科技文献进行评价是不够客观的。随着科学技术的不断发展,我们借助越来越成熟文本挖掘技术,实现全文本获取,越来越多的参与到全文本引文分析的行列中来。结合目前国内外的研究成果来看,目前关于全文本引文分析的引用量化研究研究主要集中于两个部分引用频次研究,引用位置研究。
我们把一篇被引文献在施引文献中实际出现的的次数称之为引用频次。如果一篇被引文献在施引文献中的引用频次很高,那么其对施引文献的影响力可见一斑。我们把这种体现在文中的引用称为引用,将体现在文末参考文献中的引用称为引文。目前对于引用频次的微观研究主要体现在引用频次的计算方法,引用次数和引文篇数的关系,统计引用频次的作用这三方面。例如胡志刚等[11]提出一种新的加权方法来计算引文总被引次数,这种方式是建立在计算实际的引用个数和对应的引文篇数之间的相关系数,又如Ding Ying等[12]在深度研究一本美国社科期刊时发现在这个期刊中的每一篇文章的平均被引用次数大概是1.6次。清晰地阐释了这本期刊杂志中引用次数和引文篇数的关系。 现在引用频次的概念也被应用在高被引文献的计算上。同时,胡志刚等[11]将还在文献检索结果排序这一功能中实际应用了引用频次这一概念,而采用了引用频次的检索结果排序的准确率比CRM系统的准确率高出了许多。现在引用频次开始逐渐被应用在高被引文献的计算上,这种新的统计方法的好处在于,一些经典文章对于排序的干扰可以大幅度降低,如此一来那些影响力比较高的文章更加容易被挖掘出来,为科学评价和预测工作带来了极大的便利。
在施引文献中,作者可能会出于不同的主观目的文中的不同位置对被引文献进行引用,为了更好的研究不同的引用位置对于引用行为究竟存在何种意义,提出了引用位置的概念[13]。最早将引文位置引入文献计量分析中作为一种参考变量的是V.Cano。在近些年,为了找出引用位置对施引文献和被引文献的影响方式,国内外的专家学者也将引用位置作为主要的研究方向。目前关于引用位置研究的主要研究方向主要包括以下三个方面:引用位置表示方法,引文位置分布,高被引文献的引用分布[14]。在实际的研究过程中我们不难发现,被引文献在施引文献中分布并不是均匀的,S.E.Cozzens发现在文献综述部分,引文通常会出现的比较密集,在一些文章中,引言部分也会出现较多的引用[14];胡志刚等在对Journal of Informetrics期刊中的350篇文献进行位置分布研究的时候发现,有50%的引用出现在施引文献的前30%的部分[11]。
目录
摘要 1
关键词 1
Abstract. 1
Keywords 1
一、文献回顾 2
二、指标与方法 3
三、实证过程 3
(一)数据来源与数据清洗 3
(二)数据分析 3
1.引文篇数和引用数量的分布 3
(1)总体情况 3
(2)不同期刊引文篇数和引用数量对比分析 6
2.多次引用发生的位置与动机 7
(1)多次引用出现在文献的研究背景,理论回顾等部分: 8
(2)多次引用出现在文章的方法介绍或演算部分: 8
(3)多次引用出现在模型或者框架设计部分: 8
四、结论 8
致谢 9
参考文献: 9
表 1 数据来源...........................................................................................................................3
表 2引文数量和引用数量的斯皮尔曼相关系数 5
表 3散点分布表 5
表 4不同期刊对比 6
表 5多次引用位置及动机 7
图 1引文数量与引用数量总体分布 4
图 2引用篇数与引文篇数差值分布 4
图 3散点图 5
基于全文的引用分析及引文分析相关性研究
引言
引言:知识在流动的过程中往往会表现出的特殊的变化性和继承性,而这 *好棒文|www.hbsrm.com +Q: ¥351916072¥
种带有特殊性质的过程也就是创新的过程,而科技文献的创新则需要通过引用这一过程来实现。所谓的引文分析,就是通过了解施引文献和被引文献之间的关系,客观的解释它们二者之间的规律和特征,达到评价科技文献的重要性或预测学科发展趋势的效果[1] 随着科技文献数量不断增长,我们也越来越开始重视各科技文献之间相互引用的情况,所以引文分析方法也在不断地发展更新。再近些年来,有不少学者提出基于全文的引文分析这一引文分析方式[2,3],这种新的引文分析方式与传统的引文分析方式的区别在于 传统的citation analysis他们的研究对象主要是位于文尾的参考文献,而不是真正发生在文中的引用,我们常常会误认为在一篇科技文献中,引文和引用存在着一一对应的关系,但事实上经过大量的数据证明,大多数科技文献中,引文与引用并非一一对应[46]。相比较于传统的分析,这种新的引文分析方式,在进行引文分析时,会深入施引文献中,考察被引文献在施引文献中具体的引用,进行具体的分析,能够很好地分辨出不同的被引文献对于施引文献的相对作用和重要性[7,8]。这一点很好地解决了如何区引用者真实的引用意图,同时对于文献的评价也更加真实客观。
一、文献回顾
提及基于文章内容的引文分析,我们常常会将Ding Ying[9] 早期在早期提出的“语法层次”和“语义层次” 相结合的分析方式作为这项研究开始的初始模型。研究分布在不同章节中的引文,我们把这种研究称之为语法层次的研究。而语义层次的研究指的是在特定语境中,引文对施引文献所表达的核心概念究竟是正面影响还是负面影响,比如最常见的是支持观点还是反对观点。而这样的分析过程主要需要借助人工来完成。为了进一步验证这种新的引文分析方式的可行性,moravcsik等[10]引文文本分析的范围不断扩大,调查了理论高能物理领域30篇文献的引文,在这些引用中有不少引用是非常随意的,这样的结果证明了,我们简单的将引文数量作为评价标准的来对科技文献进行评价是不够客观的。随着科学技术的不断发展,我们借助越来越成熟文本挖掘技术,实现全文本获取,越来越多的参与到全文本引文分析的行列中来。结合目前国内外的研究成果来看,目前关于全文本引文分析的引用量化研究研究主要集中于两个部分引用频次研究,引用位置研究。
我们把一篇被引文献在施引文献中实际出现的的次数称之为引用频次。如果一篇被引文献在施引文献中的引用频次很高,那么其对施引文献的影响力可见一斑。我们把这种体现在文中的引用称为引用,将体现在文末参考文献中的引用称为引文。目前对于引用频次的微观研究主要体现在引用频次的计算方法,引用次数和引文篇数的关系,统计引用频次的作用这三方面。例如胡志刚等[11]提出一种新的加权方法来计算引文总被引次数,这种方式是建立在计算实际的引用个数和对应的引文篇数之间的相关系数,又如Ding Ying等[12]在深度研究一本美国社科期刊时发现在这个期刊中的每一篇文章的平均被引用次数大概是1.6次。清晰地阐释了这本期刊杂志中引用次数和引文篇数的关系。 现在引用频次的概念也被应用在高被引文献的计算上。同时,胡志刚等[11]将还在文献检索结果排序这一功能中实际应用了引用频次这一概念,而采用了引用频次的检索结果排序的准确率比CRM系统的准确率高出了许多。现在引用频次开始逐渐被应用在高被引文献的计算上,这种新的统计方法的好处在于,一些经典文章对于排序的干扰可以大幅度降低,如此一来那些影响力比较高的文章更加容易被挖掘出来,为科学评价和预测工作带来了极大的便利。
在施引文献中,作者可能会出于不同的主观目的文中的不同位置对被引文献进行引用,为了更好的研究不同的引用位置对于引用行为究竟存在何种意义,提出了引用位置的概念[13]。最早将引文位置引入文献计量分析中作为一种参考变量的是V.Cano。在近些年,为了找出引用位置对施引文献和被引文献的影响方式,国内外的专家学者也将引用位置作为主要的研究方向。目前关于引用位置研究的主要研究方向主要包括以下三个方面:引用位置表示方法,引文位置分布,高被引文献的引用分布[14]。在实际的研究过程中我们不难发现,被引文献在施引文献中分布并不是均匀的,S.E.Cozzens发现在文献综述部分,引文通常会出现的比较密集,在一些文章中,引言部分也会出现较多的引用[14];胡志刚等在对Journal of Informetrics期刊中的350篇文献进行位置分布研究的时候发现,有50%的引用出现在施引文献的前30%的部分[11]。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/574.html