信息计量视角下的生物基因序列数据共享分析与研究热点挖掘


目录
摘要 1
关键词 1
Abstract. 1
Keywords 1
引言 2
一、研究概述 2
(一)基因序列概述 2
(二)基因序列数据发展历程及研究现状 2
(三)生物信息数据共享综述 3
二、研究目的与研究思路 4
(一)研究目的 4
(二)研究思路 4
1.研究对象 4
2.研究框架 4
三、实验数据结构与研究方法 5
(一)数据来源 5
(二)物种分类信息统计 6
(三)研究方法 6
1.引文分析法 6
2.比较分析法 6
3.统计分析法 6
四、基因序列数据的研究热点挖掘 7
(一)热点物种领域分析 7
(二)Google scholar文献量分析 8
1.文献数量统计 8
2.高频基因序列号 8
(三)Web of Science被引频次分析 9
五、结论与讨论 10
(一)生物基因序列研究热点挖掘结果 10
(二)关于推动生物基因序列数据共享及几点建议 10
致谢 11
参考文献 12
图 1研究流程框架 4
图 2 GenBank检索界面 6
图 3 文献量排名前10的物种柱状图 7
图 4 序列号文献占比 8
表 1GenBank字段限制检索的字段索引、中文注释及其对应的检索限定词 5
表 2各物种的文献量分布 7
表 3序列号在Google scholar文献量 8
表 4发文量前10的基因序列 9
表 5被引频次排名前10的文献 10
表 6一些生物多样性数据保存机构及其特点 11
信息计量视角下的生物基因序列数据共享分析与研究热点挖掘
引言
引言
一、研究概述
(一)基因序列 *好棒文|www.hbsrm.com +Q: &351916072& 
概述
核酸是生命最为基础的物质之一。核酸普遍存在于所有植物、动物细胞、微生物,生物体内的核酸常与蛋白质联结构成核蛋白。不同的核酸,其化学成分、核苷酸排列顺序也会有所差异。依据化学成分的不同,核酸可分为核糖核酸(RNA)和脱氧核糖核酸(DNA)。DNA作为遗传物质的主要物质基础,决定着生命的表型特征,而遗传信息的基本单位作为基因编码一种蛋白质或RNA具有特定功能的产物,影响着生命的代谢活动。生物体的每个细胞大部分遗传信息就集中在DNA分子中四种碱基A、G、T、C的一定排列片段,通常就决定了生物特定的遗传性状。由于生物信息学的方法从大量的疾病进行相关的研究,基于基因分析技术如测序、基因分型、基因芯片技术得到了迅速的发展,产生了大量的生物序列数据。
GenBank Accession是GenBank的收录号,也是查询号或序列号。科研人员通过实验得到一个基因或蛋白的序列,这个基因或蛋白经过GenBank接受后就会分配一个特定的序列号。以后其他研究人员就可以根据这个序列号在GenBank搜索详细信息。比如在一篇文献“西农萨能奶山羊脂肪酸合酶基因启动子的克隆及活性测定”中作者通过实验得出“得到脂肪酸合酶基因并提交至 GenBank,收录号FJ605482”,FJ605482即accession number。因为基因工程中全数的技术成效,如基因复制、基因转移、转基因产物的制造等都是以发现并成功分离出生物DNA序列开始的。因此,对于那些享有基因序列的专利权的一部分人和机构,依靠数据带来的财富就相当于拥有了一座金山。在实现基因专利潜在商业价值后,基因的“圈地运动”在全世界各地尤其是生物技术研究实力靠前的国家极速地展开,对基因序列的专利申请已成为热门的投资[1]。
(二)基因序列数据发展历程及研究现状
近年来,人类基因组计划逐渐开展,各种生物基因的序列也被纳入研究。因此,大量的生物分子序列数据由此产生。生物信息学的研究目标主要汇集在核酸和蛋白质两个方面,包括核酸和蛋白质的序列、结构和功能的分析研究。具体来说,有以下几个领域:序列(DNA序列和蛋白质序列的比对)、蛋白质结构预测、结构比较、比较基因组学和计算机辅助基因(编码蛋白质的基因),生物进化,基于药物设计的分子识别的结构。现存的数据来源包括大分子结构、基因组、DNA序列和蛋白质序列等。这些数据还要求科研人员继续提出新的生物信息学算法和相应的工具。本文主要是研究我国15种农业学术期刊中出现或提及的GenBank序列号即基因序列号。
到目前为止,生物信息学的发展主要履历了3个阶段:首先是前基因组时代,研究方向主要集中在生物数据库的建设、发展和检索工具的应用以及DNA和蛋白质序列的比较和分析;第二阶段,即基因组时代,这项工作的重点上的核苷酸序列测定和分析阶段和新基因的发现,包括与大型数据库和网络接口和基于信息提取的基因组序列分析中的应用的发展。
在后基因组时期,生物信息学研究中的一个关键问题就是如何快速准确地获取生物体的遗传信息。生物体的所有遗传信息都包含在基因组,是物种的多样性和复杂性的来源。获取遗传信息的基因组的基础上,转录组和代谢组,蛋白质,基因,表观遗传学研究组,随着2代测序技术的发展,可以精确地检测基因组、转录组的遗传信息,为生物信息学的研究提供了丰厚的资源[2]。可以说生物信息学科研究的发展离不开基因测序技术的支持,基因测序技术的飞速发展提供了技术条件。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/575.html

好棒文