h指数及其衍生指数的相关性研究以esi生物学学科为例

摘要:h指数应用灵活且计算简单,自提出后受到文献计量领域广泛的关注和认同,许多学者也在h指数的基础上改进并提出了很多衍生指数来弥补h指数的不足。作者采用探索性分析方法和主成份分析方法探究类h指数和h指数的相关性关系,以及不同评价指标对不同层次科研人员的应用效果。作者选择了15种类h指数,以2008年-2012年SCI收录的生物学学科的论文作为研究对象进行相关分析。结果表明g指数能替代作者的总发文量指标;在评价作者的论文被引指标时,A指数、m指数可以替代整体作者、高产高被引作者、低产高被引作者的篇均被引次数;R指数、π指数、χ指数、hw指数则是在对整体作者、高产低被引作者、低产高被引作者评价时才与作者的总被引次数相关;h指数、hr指数、t指数、f指数、hT指数之间则是对高产高被引作者、高产低被引作者进行被引情况评价时才有较强的相关性。
目录
摘要 3
关键词 3
Abstract 3
Key words 3
引言 4
一、相关研究 4
(一)h指数研究进展 4
(二)因子分析与主成份分析的应用 5
1.因子分析方法在图书馆学和情报学领域的应用 5
2.主成份分析方法在图书馆学和情报学领域的应用 5
二、研究方法 6
(一)数据来源 6
(二)数据处理 6
三、结果分析 8
(一)整体相关分析 8
1.整体因子分析 8
2.整体主成份分析 11
(二)不同层次作者的因子分析 12
1.高产高被引作者 13
2.高产低被引作者 16
3.低产高被引作者 19
四、结论 22
五、不足与展望 23
致谢 23
参考文献 24
附录 26
图 1 π指数与f指数计算的程序实现 7
图 2 生物学学科样本整体的相关系数矩阵 9
图 3 生物学学科作者样本整体的因子载荷图 10
图 4 生物学学科作者样本整体的主成分载荷图 12
图 5 生物
 *好棒文|www.hbsrm.com +Q: 3 5 1 9 1 6 0 7 2 
学学科高产高被引作者的因子载荷图 14
图 6 生物学学科高产高被引作者的主成分载荷图 16
图 7 生物学学科高产低被引作者的因子载荷图 17
图 8 生物学学科高产低被引作者主成分载荷图 18
图 9 生物学学科低产高被引作者的因子载荷图 20
图 10生物学学科低产高被引作者主成分载荷图 21
表 1 生物学学科作者样本整体全部指标的均值与标准差分布 8
表 2 生物学学科样本整体的旋转因子矩阵 10
表 3 生物学学科样本整体旋转成份矩阵 11
表 4 生物学学科高产高被引作者全部指标的均值与标准差分布 13
表 5 生物学学科高产高被引作者因子结构矩阵 14
表 6 生物学学科高产高被引作者旋转成分矩阵 15
表 7 生物学高产低被引作者数据的结构矩阵 17
表 8 生物学学科高产低被引作者旋转成份矩阵 18
表 9 生物学学科低产高被引作者数据的结构矩阵 20
表 10 生物学学科低产高被引作者旋转成份矩阵 21
h指数及其衍生指数的相关性研究
——以ESI生物学学科为例
引言
引言:h指数最先由美国物理学家Jorge E. Hirsch于2005年提出,h指数计算简单,变化灵活,应用广泛,而且能反映科学家,机构或者国家科研产出的数量和质量等,主要用于科技评价[]。h指数自提出后受到文献计量学领域广泛的关注和认同,随后针对h指数的不足,研究者们也陆续对h指数进行了修正或者改进,提出了很多衍生指数[]。这些衍生指数都是由h指数发展而来,因此这些指数存在一定的同源性。
目前,国内针对h指数及类h指数的相关性研究主要针对小样本数据集,因此作者以2008年2012年SCI收录的生物学学科的论文作为研究对象,综合探索性因子分析与主成份分析的结果,探究14种主流的类h指数,h指数,发文量,总被引次数,篇均被引次数之间的相关性。再分别分析样本中的高产高被引、高产低被引、低产高被引三个层次的作者的各项指标,探究各指数评价的其有效性和相关性,完善目前国内面向大数据集的h指数与类h指数相关性的研究。
一、相关研究
(一)h指数研究进展
h 指数的最大优势在于发文量和被引量共同作用决定评价结果,而且计算简单,实用性强,指标相对稳定,几乎不受低被引论文的影响。但同时,针对h指数仍然存在的局限性,海内外学者相继提出了一系列改进指数。
比如针对h核内相同h值区分度小,灵敏度低的问题,国内学者金碧辉等人提出了A指数[]和R指数[4],国外学者L.Bornmann[]和C.T.Zhang[]等人分别提出了m指数和e指数。为了使评价指标体现出高被引论文的特性,著名科学计量学家埃格赫( Leo Egghe)[]提出了g 指数,Marek Kosmulski[]提出了h(2)指数。为解决h指数评价高被引论文时被引增加不灵敏的问题,多位学者提出了w指数[]、hw指数[]、χ指数[]、hr指数[]、f指数和t指数[];还有学者以论文的被引频次作为研究重点,并提出了π指数[]等衍生指数。
目前,关于h 指数的分析与研究如日中天,不论是在理论和应用方面,还是在h 指数的修正和完善方面,都呈现出了大量的新兴的科研综合评价方法,使得科研评价更加公平、合理。但是,随着科研评价指标数目的增多,很多情况下,人们都不知道采用哪种指标来对学者们进行科研评价更为合理。因此近年来,很多学者开始关注这些指数之间的相关性和不同指数在不同应用环境下的实用性研究。
宋振世[]首先论述考虑单篇论文被引频次,考虑合作者以及考虑时间因素的三类类h指数,再以中文社会科学引文索引(CSSCI)为数据源,搜集我国图书、情报领域从1998 年到2011年30名知名学者的论文被引用情况,根据Pearson 相关性及显著性统计的实证分析结果发现,g指数和hg指数与h指数具有较高的相关性;w指数和h2指数只关注高被引论文,并且区分度不高;ha指数和hm指数与h指数完全正相关,能较好地区分h指数相同h核内论文被引不同的情况;R指数与h指数具有较高的相关性,但其数字意义没有h指数直白;A指数与h指数的相关性较低;hT指数按所有论文被引频次计分,使得评价较为公平合理,其与h指数高度相关;AR指数引入时间因素,解决了h指数只升不降的问题,但有可能存在导致h指数严重下降。
彭爱东[]分析了47种综合性社科期刊的h指数,被引文献统计年、被引作者、被引篇名等信息,发现,h指数在衡量期刊较长时间内的学术影响力时效果良好;g指数和h指数一致性较强,且优化了h指数,但并不能替代h指数。
(二)因子分析与主成份分析的应用
1.因子分析方法在图书馆学和情报学领域的应用
因子分析[]( Factor analysis) 是由英国心理学家Spearman 提出来的,通过对多个原始变量内部之间依赖关系的研究,找出原数据内部的基本结构,并用较少的假想变量表示,用因子解释原目标变量而达到降维的目的,解释变量间的内部联系。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/947.html

好棒文