以人的细胞系为模型分析mirnas表达量与转录的相关性
利用人的细胞系为研究对象,整合多种生物信息学、统计学方法,探讨在基因组水平上miRNAs表达量和转录活性之间的相关性。本试验利用miRNAs序列与已知基因序列的位置重叠关系,分析了41组人类细胞系的microRNA-seq和mRNA-seq数据集文件、10组microRNA-seq和ChIP-seq数据集文件,这些细胞系涵盖了人类永生细胞系、原代细胞系、干细胞系、诱导多能干细胞系、体外分化型细胞系。结果表明,利用pri-miRNAs信息分析得出miRNAs表达量和转录活性存在显著相关性的结果,相关系数为0.1-0.4;但利用成熟miRNAs信息分析得到miRNAs表达量和转录不存在相关性的结果。基于目前和已公布的数据,我们得出miRNAs表达量和转录活性之间存在一定相关性的结论。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1资料与方法3
1.1材料实验数据的下载、分析平台3
1.1.1数据下载网页平台3
1.1.2数据分析平台及软件3
1.2实验方法3
1.2.1查找基因组数据集3
1.2.2查找人类各细胞系对应的miRNAseq、mRNAseq和ChIPseq的数据集3
1.2.3对所下载的数据进行整理分析3
2结果与分析4
2.1数据汇总4
2.2数据相关性分析4
2.2.1利用PrimiRNAs信息,分析miRNAseq和mRNAseq的相关性4
2.2.2利用成熟miRNAs信息,分析miRNAseq和mRNAseq的相关性5
2.2.3利用PrimiRNAs信息,分析miRNAseq和ChIPseq的相关性6
2.2.4利用成熟miRNAs信息,分析miRNAseq和ChIPseq的相关性6
2.2.5利用总数据结果分析miRNAs表达量和转录的相关性7
3讨论7
致谢8
参考文献9
附录1 数据集编号汇总10
附录2 数据统计结果汇总11
*好棒文|www.hbsrm.com +Q: @351916072@
以人的细胞系为模型分析miRNAs表达量与转录的相关性
引言
microRNAs(miRNAs)是一大家族长度为22个核苷酸(nucleotide, nt)左右、在多细胞生物中广泛表达的非编码RNAs[1,2]。miRNAs主要通过结合靶基因mRNA位于3’非编码区的互补序列而降低靶基因的蛋白质翻译水平和/或mRNA表达水平[1,3]。miRNAs调控各种各样的生理过程;miRNAs表达量的高低、变化可以反映生物个体、组织、细胞的表型,此信息还可能用于人类疾病(如癌症)的诊断、预后及治疗[2,46]。
典型(canonical)动物miRNAs的形成要经过转录及一系列特异性的RNA加工和RNA:蛋白相互作用[7,8],如图1所示。miRNAs基因通常由RNA聚合酶II(PolII)转录,最初产物为primiRNAs (primary miRNAs),和premRNAs相似。细胞核内的Drosha/DGCR8全酶识别并切割primiRNAs上特定的发卡结构,产生约60 nt 的premiRNAs (precursor miRNAs)。转运蛋白Exp5把premiRNAs送到细胞质中。然后,RNA酶Dicer切割premiRNAs,产生约22 nt的miRNAs双链中间物。此双链RNA与Argonaute (Ago)蛋白作用,最终其中一条单链RNA,作为成熟的miRNAs,与Ago蛋白稳定结合。这一miRNAs:Ago复合体即是抑制基因表达的最小功能单位。据miRBase的统计整理,动物基因组有成百上千个miRNAs基因[9]。虽然相当数量的这些基因是否表达真正的miRNAs仍然存疑,但确知的是,一个Drosha蛋白(同理,PolII、 Exp5、 Dicer和Ago)直接作用于数以百计不同的miRNA底物。
和mRNA和蛋白一样,细胞内不同miRNAs的表达水平区别很大。总体而言,成熟的miRNAs半衰期以星期计[10],所以其表达量主要由miRNAs产生的速率,即图1的RNA转录和加工步骤来决定。许多miRNAs基因的转录因子已被报道[11,12]。另外,某些RNA结合蛋白,如Lin28,可与特定的primiRNAs或premiRNAs结合进而影响RNA的加工和miRNAs的成熟[12]。这些研究成果可以解释miRNAs表达的细胞、组织特异性,或同一miRNAs在细胞不同状况、不同处理条件下的表达差异。但是,它们不能解释为什么基因组所有miRNAs的表达量会千差万别。此类问题是功能基因组学和系统生物学最重要的问题之一。例如,研究最久、颇具争议的,mRNA水平与相应蛋白水平之间的关系,即蛋白质表达量到底由什么因素决定?一些研究发现酵母和哺乳动物细胞中全基因组范围内的mRNA丰度和蛋白丰度的相关性约为0.6[13,14],说明蛋白表达量主要在翻译的层次上调控。而近来的研究则认为mRNA丰度和蛋白丰度的相关性可高达0.9[1517],表明转录对基因表达的贡献最大。
虽然转录活性通常被认为在决定miRNAs的整体表达模式中起到重要作用,但直接证据是缺乏的。鉴定个体miRNAs的特异性转录因子本质上并不能解决为什么特定的miRNAs比其他miRNAs的丰度更高或低的问题。
功能基因组学和系统生物学为生物学的研究开阔了新途径,在基因组的水平上解析miRNAs表达的调控。目前已有研究者进行了相关工作[8,18,19],采取了不同以往的研究策略和思路,得到在以前无法获得或不可想象的结论。近年来,曾严等[8]分析了在基因组水平上转录活性和miRNAs表达量之间的关系,发现在人的K562细胞系中相关系数仅为0.3,而在另一细胞系,HeLa,没有显著的相关性。该研究结果始料未及,因为之前并没有这方面的报道,前人一直只是假设转录为miRNAs表达的决定性因素。
本试验极大地巩固和发展现有成果,利用人的细胞系为研究对象,进一步研究清楚基因组水平上转录活性和miRNAs表达量之间的关系,进一步探讨转录对miRNAs差异性表达的影响,以揭示调控机制的保守性及重要性,该成果可以应用到其它非编码RNA、生物系统和领域,为今后的工作指出新的方向,科学意义广泛。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1资料与方法3
1.1材料实验数据的下载、分析平台3
1.1.1数据下载网页平台3
1.1.2数据分析平台及软件3
1.2实验方法3
1.2.1查找基因组数据集3
1.2.2查找人类各细胞系对应的miRNAseq、mRNAseq和ChIPseq的数据集3
1.2.3对所下载的数据进行整理分析3
2结果与分析4
2.1数据汇总4
2.2数据相关性分析4
2.2.1利用PrimiRNAs信息,分析miRNAseq和mRNAseq的相关性4
2.2.2利用成熟miRNAs信息,分析miRNAseq和mRNAseq的相关性5
2.2.3利用PrimiRNAs信息,分析miRNAseq和ChIPseq的相关性6
2.2.4利用成熟miRNAs信息,分析miRNAseq和ChIPseq的相关性6
2.2.5利用总数据结果分析miRNAs表达量和转录的相关性7
3讨论7
致谢8
参考文献9
附录1 数据集编号汇总10
附录2 数据统计结果汇总11
*好棒文|www.hbsrm.com +Q: @351916072@
以人的细胞系为模型分析miRNAs表达量与转录的相关性
引言
microRNAs(miRNAs)是一大家族长度为22个核苷酸(nucleotide, nt)左右、在多细胞生物中广泛表达的非编码RNAs[1,2]。miRNAs主要通过结合靶基因mRNA位于3’非编码区的互补序列而降低靶基因的蛋白质翻译水平和/或mRNA表达水平[1,3]。miRNAs调控各种各样的生理过程;miRNAs表达量的高低、变化可以反映生物个体、组织、细胞的表型,此信息还可能用于人类疾病(如癌症)的诊断、预后及治疗[2,46]。
典型(canonical)动物miRNAs的形成要经过转录及一系列特异性的RNA加工和RNA:蛋白相互作用[7,8],如图1所示。miRNAs基因通常由RNA聚合酶II(PolII)转录,最初产物为primiRNAs (primary miRNAs),和premRNAs相似。细胞核内的Drosha/DGCR8全酶识别并切割primiRNAs上特定的发卡结构,产生约60 nt 的premiRNAs (precursor miRNAs)。转运蛋白Exp5把premiRNAs送到细胞质中。然后,RNA酶Dicer切割premiRNAs,产生约22 nt的miRNAs双链中间物。此双链RNA与Argonaute (Ago)蛋白作用,最终其中一条单链RNA,作为成熟的miRNAs,与Ago蛋白稳定结合。这一miRNAs:Ago复合体即是抑制基因表达的最小功能单位。据miRBase的统计整理,动物基因组有成百上千个miRNAs基因[9]。虽然相当数量的这些基因是否表达真正的miRNAs仍然存疑,但确知的是,一个Drosha蛋白(同理,PolII、 Exp5、 Dicer和Ago)直接作用于数以百计不同的miRNA底物。
和mRNA和蛋白一样,细胞内不同miRNAs的表达水平区别很大。总体而言,成熟的miRNAs半衰期以星期计[10],所以其表达量主要由miRNAs产生的速率,即图1的RNA转录和加工步骤来决定。许多miRNAs基因的转录因子已被报道[11,12]。另外,某些RNA结合蛋白,如Lin28,可与特定的primiRNAs或premiRNAs结合进而影响RNA的加工和miRNAs的成熟[12]。这些研究成果可以解释miRNAs表达的细胞、组织特异性,或同一miRNAs在细胞不同状况、不同处理条件下的表达差异。但是,它们不能解释为什么基因组所有miRNAs的表达量会千差万别。此类问题是功能基因组学和系统生物学最重要的问题之一。例如,研究最久、颇具争议的,mRNA水平与相应蛋白水平之间的关系,即蛋白质表达量到底由什么因素决定?一些研究发现酵母和哺乳动物细胞中全基因组范围内的mRNA丰度和蛋白丰度的相关性约为0.6[13,14],说明蛋白表达量主要在翻译的层次上调控。而近来的研究则认为mRNA丰度和蛋白丰度的相关性可高达0.9[1517],表明转录对基因表达的贡献最大。
虽然转录活性通常被认为在决定miRNAs的整体表达模式中起到重要作用,但直接证据是缺乏的。鉴定个体miRNAs的特异性转录因子本质上并不能解决为什么特定的miRNAs比其他miRNAs的丰度更高或低的问题。
功能基因组学和系统生物学为生物学的研究开阔了新途径,在基因组的水平上解析miRNAs表达的调控。目前已有研究者进行了相关工作[8,18,19],采取了不同以往的研究策略和思路,得到在以前无法获得或不可想象的结论。近年来,曾严等[8]分析了在基因组水平上转录活性和miRNAs表达量之间的关系,发现在人的K562细胞系中相关系数仅为0.3,而在另一细胞系,HeLa,没有显著的相关性。该研究结果始料未及,因为之前并没有这方面的报道,前人一直只是假设转录为miRNAs表达的决定性因素。
本试验极大地巩固和发展现有成果,利用人的细胞系为研究对象,进一步研究清楚基因组水平上转录活性和miRNAs表达量之间的关系,进一步探讨转录对miRNAs差异性表达的影响,以揭示调控机制的保守性及重要性,该成果可以应用到其它非编码RNA、生物系统和领域,为今后的工作指出新的方向,科学意义广泛。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/swgc/smkx/170.html