生物信息学方法的荷花cpplike基因家族的分子进化研究
CPP-like转录因子基因家族(CPP-like gene family)在植物的形态构建中发挥重要功能。CPP-like基因家族成员数目较少, 典型的特征是含有一到两个富含半胱氨酸(cysteine)的结构域,即CXC结构域。通过CPP-like家族中高度保守的CXC结构域,我们在荷花全基因组范围鉴定了6个CPP-like基因,并进行比较分析以及分子进化研究。发现其家族按照物种特异性方式进行了扩张,并且存在基因丢失的现象。进化分析表明 CPP-like基因家族在长期进化过程中存在选择压力的差异。本研究发现其中的5个节点在进化过程中受到正选择压力的影响。正选择压力影响CPP-like基因的进化。协同进化分析表明CXC结构域2与结构域间序列在进化的过程中协同进化,两者的功能也是相互作用的。且基因中获得和丢失内含子都对基因的进化有影响。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1材料与方法2
1.1序列搜索2
1.2多序列联配3
1.3系统发生树的构建3
1.4正选择作用分析3
1.5结构域的协同进化分析3
2 结果与分析3
2.1 荷花基因组中的CPPlike基因4
2.2 荷花CPPlike的保守序列分析5
2.3 系统发生分析 6
2.4 正选择位点的检验7
2.5 两段CXC结构域序列的协同进化分析10
讨论11
致谢11
参考文献12
基于生物信息学方法的
荷花CPPlike基因家族的分子进化研究
园艺 李洁
引言
转录因子(transcription factor, TF)也称反式作用因子, 是一类能够专一性结合于真核生物启动子特定DNA序列的蛋白质分子,或者是具有已知DNA结合结构域特征的并能在转录水平上调节基因表达的蛋白质分子[13]。其主要功能是激活或抑制基因的转录效应。调节这种转录水平,可以控制细胞或组织的很多生理过程,例如:细胞周期、代谢平衡以及参与植 *好棒文|www.hbsrm.com +Q: ^351916072^
物对环境胁迫和病原菌入侵的反应等。通常,每种转录因子的DNA结合域(DNA bind domain)都是高度保守的,根据不同的结合域结构,可以将转录因子划分为不同的家族[4,5]。CPPlike基因家族就属于一类成员数目比较少的转录因子家族,该基因家族的典型特征是含有一到两个保守的富含半胱氨酸(cysteine)的结构域,即CXC结构域[68]。该基因家族的成员广泛存在于动植物中,但是尚未在酵母中发现。
大多数动物和开花植物能够有性繁殖。在这个过程中,必须生产单倍体生殖细胞。开花植物中,雄性生殖细胞被称为精子细胞,产生于植物的花粉囊中。雌性生殖细胞在子房中产生,并在受精后发育成种子。动物的雌雄生殖细胞分别产生于卵巢和睾丸。有性生殖中基因组合的广泛变异能增加子代适应自然选择的能力,加速了进化的进程。促进生殖器官的良好发育是植物和动物的共同挑战。植物与动物相比,通常更容易发生基因突变。因为植物更多地暴露于易引起突变的环境中。而且由于大部分植物经历过染色体加倍,基因组中往往有更多的重复基因。是研究重复基因进化的丰富资源。植物的 CPPlike转录因子基因家族对植物的形态构建起到非常重要的作用,并且可能对植物的进化过程也是关键,所以要重视对植物CPPlike基因家族的分子进化研究[9,10] 。
人类TESMIN基因(CPP同源基因)最初通过在睾丸中的特异性表达而被鉴定出来,随后它也在卵巢发育的特定阶段被检测到特异性表达。同时还确定了导致花和胚珠发育缺陷的拟南芥TSO1基因的突变等位基因。‘TSO’在中文中是“丑陋”的意思, TSO1基因突变会导致花的外形变化。TSO1基因是模式植物拟南芥中第一个通过图位克隆方式被鉴定出的 CPPlike基因, TSO1基因影响细胞的方向性增长以及临近细胞的协调生长,并能调节花发育过程中的有丝分裂和胞质分裂, TSO1突变体会引起花器官发育发生缺陷[1113]。在大豆中也分离出一个属于该家族的基因 CPP1 ,该基因能够与大豆的豆血红蛋白基因 Gmlbc3的启动子区段特异结合并调控其表达[14]。然而表达局限在受感染根瘤的核心部位。CPP1蛋白质和TSO1一样包含两个高度保守的 CXC结构域。且结构域之间序列存在保守性。Hauser 等[12]认为这表明CPPlike基因家族是通过CXC结构域与目标基因的DNA相结合并调控其表达。
通过前人对水稻与模式植物拟南芥的研究,比较分析发现, 由于水稻基因组中的 CPPlike 基因的内含子序列长度显著大于拟南芥中的基因。拟南芥与水稻的CPPlike基因家族的编码序列之间虽然不存在显著差异,但是两者基因的序列全长却有着极显著差异。通过搜索对应的cDNA序列和相匹配的EST序列,发现在拟南芥中所有的 CPPlike基因都表达了,而在水稻基因组中OsCPP6很可能也是表达的。而OsCPP4基因很可能是一个假基因。通过多序列联配表明:除OsCPP4之外,其余的拟南芥和水稻的 CPPlike 基因中均含两个CXC结构域,且高度保守。其基本结构是 CXCX4CX3YCXCX6CX3CXCX2C[1517]。
基因家族的物种特异性扩张是指基因家族成员在特定物种中的数目得到了增加,片段复制、串联重复和逆转录转座等基因复制方式在基因家族的物种特异性扩张方面起到了重要作用。为新基因的产生提供了材料,并促使新功能的产生。有研究表明在模式植物拟南芥基因组中有 80%的基因是物种特异性扩张的结果。而植物的 CPPlike 基因家族成员比动物具有更多。通过系统发生树,发现在单子叶与双子叶植物分离之后, CPPlike基因家族在水稻和拟南芥基因组中进行了物种特异性扩张。单子叶模式植物水稻的基因组至少经历了两次全基因组加倍过程,而双子叶模式植物拟南芥的基因组则至少经历了三次全基因组加倍过程[18,19]。
CPPlike转录因子基因家族对植物的生长发育起到了重要作用,因此对该基因家族进行分子进化研究是十分必要的。荷花是中国十大名花之一,也是重要的水生观赏植物。对荷花的基因组测序计划的完成,为对荷花CPPlike基因进化分析提供了基础。本研究将通过生物信息学方法在荷花基因组范围内鉴定CPPlike基因家族,并进一步分析其进化规律。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1材料与方法2
1.1序列搜索2
1.2多序列联配3
1.3系统发生树的构建3
1.4正选择作用分析3
1.5结构域的协同进化分析3
2 结果与分析3
2.1 荷花基因组中的CPPlike基因4
2.2 荷花CPPlike的保守序列分析5
2.3 系统发生分析 6
2.4 正选择位点的检验7
2.5 两段CXC结构域序列的协同进化分析10
讨论11
致谢11
参考文献12
基于生物信息学方法的
荷花CPPlike基因家族的分子进化研究
园艺 李洁
引言
转录因子(transcription factor, TF)也称反式作用因子, 是一类能够专一性结合于真核生物启动子特定DNA序列的蛋白质分子,或者是具有已知DNA结合结构域特征的并能在转录水平上调节基因表达的蛋白质分子[13]。其主要功能是激活或抑制基因的转录效应。调节这种转录水平,可以控制细胞或组织的很多生理过程,例如:细胞周期、代谢平衡以及参与植 *好棒文|www.hbsrm.com +Q: ^351916072^
物对环境胁迫和病原菌入侵的反应等。通常,每种转录因子的DNA结合域(DNA bind domain)都是高度保守的,根据不同的结合域结构,可以将转录因子划分为不同的家族[4,5]。CPPlike基因家族就属于一类成员数目比较少的转录因子家族,该基因家族的典型特征是含有一到两个保守的富含半胱氨酸(cysteine)的结构域,即CXC结构域[68]。该基因家族的成员广泛存在于动植物中,但是尚未在酵母中发现。
大多数动物和开花植物能够有性繁殖。在这个过程中,必须生产单倍体生殖细胞。开花植物中,雄性生殖细胞被称为精子细胞,产生于植物的花粉囊中。雌性生殖细胞在子房中产生,并在受精后发育成种子。动物的雌雄生殖细胞分别产生于卵巢和睾丸。有性生殖中基因组合的广泛变异能增加子代适应自然选择的能力,加速了进化的进程。促进生殖器官的良好发育是植物和动物的共同挑战。植物与动物相比,通常更容易发生基因突变。因为植物更多地暴露于易引起突变的环境中。而且由于大部分植物经历过染色体加倍,基因组中往往有更多的重复基因。是研究重复基因进化的丰富资源。植物的 CPPlike转录因子基因家族对植物的形态构建起到非常重要的作用,并且可能对植物的进化过程也是关键,所以要重视对植物CPPlike基因家族的分子进化研究[9,10] 。
人类TESMIN基因(CPP同源基因)最初通过在睾丸中的特异性表达而被鉴定出来,随后它也在卵巢发育的特定阶段被检测到特异性表达。同时还确定了导致花和胚珠发育缺陷的拟南芥TSO1基因的突变等位基因。‘TSO’在中文中是“丑陋”的意思, TSO1基因突变会导致花的外形变化。TSO1基因是模式植物拟南芥中第一个通过图位克隆方式被鉴定出的 CPPlike基因, TSO1基因影响细胞的方向性增长以及临近细胞的协调生长,并能调节花发育过程中的有丝分裂和胞质分裂, TSO1突变体会引起花器官发育发生缺陷[1113]。在大豆中也分离出一个属于该家族的基因 CPP1 ,该基因能够与大豆的豆血红蛋白基因 Gmlbc3的启动子区段特异结合并调控其表达[14]。然而表达局限在受感染根瘤的核心部位。CPP1蛋白质和TSO1一样包含两个高度保守的 CXC结构域。且结构域之间序列存在保守性。Hauser 等[12]认为这表明CPPlike基因家族是通过CXC结构域与目标基因的DNA相结合并调控其表达。
通过前人对水稻与模式植物拟南芥的研究,比较分析发现, 由于水稻基因组中的 CPPlike 基因的内含子序列长度显著大于拟南芥中的基因。拟南芥与水稻的CPPlike基因家族的编码序列之间虽然不存在显著差异,但是两者基因的序列全长却有着极显著差异。通过搜索对应的cDNA序列和相匹配的EST序列,发现在拟南芥中所有的 CPPlike基因都表达了,而在水稻基因组中OsCPP6很可能也是表达的。而OsCPP4基因很可能是一个假基因。通过多序列联配表明:除OsCPP4之外,其余的拟南芥和水稻的 CPPlike 基因中均含两个CXC结构域,且高度保守。其基本结构是 CXCX4CX3YCXCX6CX3CXCX2C[1517]。
基因家族的物种特异性扩张是指基因家族成员在特定物种中的数目得到了增加,片段复制、串联重复和逆转录转座等基因复制方式在基因家族的物种特异性扩张方面起到了重要作用。为新基因的产生提供了材料,并促使新功能的产生。有研究表明在模式植物拟南芥基因组中有 80%的基因是物种特异性扩张的结果。而植物的 CPPlike 基因家族成员比动物具有更多。通过系统发生树,发现在单子叶与双子叶植物分离之后, CPPlike基因家族在水稻和拟南芥基因组中进行了物种特异性扩张。单子叶模式植物水稻的基因组至少经历了两次全基因组加倍过程,而双子叶模式植物拟南芥的基因组则至少经历了三次全基因组加倍过程[18,19]。
CPPlike转录因子基因家族对植物的生长发育起到了重要作用,因此对该基因家族进行分子进化研究是十分必要的。荷花是中国十大名花之一,也是重要的水生观赏植物。对荷花的基因组测序计划的完成,为对荷花CPPlike基因进化分析提供了基础。本研究将通过生物信息学方法在荷花基因组范围内鉴定CPPlike基因家族,并进一步分析其进化规律。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/nongxue/yy/95.html