用mine方法研究蛋白质复合物各因素的相关性(附件)【字数:11778】
蛋白质是履行生命体正常功能的关键物质之一,因此探究蛋白质-蛋白质间的相互作用是我们理解生命活动的重要途径之一。本文首先介绍了蛋白质相互作用的一些基本概念和宏观上的一些实验测定方法,之后着重探究在微观上为蛋白质相互作用做出贡献的一些因素,例如亲和能等。在探究为为蛋白质相互作用做出贡献的因素中,我们使用了MINE(非参数最大信息化法)其中的一种MIC(最大信息系数)。MIC指我们首先采样大量的数据,然后按照某一标准进行打分,我们通过这种理论分析后再辅以软件计算,可以深入理解蛋白质复合物结合的因素之间的相关联系。通过这个方法,我们可以更好的,更加深入的理解蛋白质-蛋白质间的相互作用。同时,在计算过程中,我们也发现了已有的测试集存在很多为题,导致对研究因素分析出现问题。这对相关因素的继续研究提出了改进方向。关键词相互作用界面;MINE;蛋白质复合物
目 录
第一章 绪论1
第二章 蛋白质相互作用
2.1 蛋白质相互作用介绍及研究方法3
2.2 相互作用界面5
2.3 亲和能6
第三章 分析算法和计算
3.1拟合模型8
3.2计算梯度和海森矩阵9
3.3 列文伯格法10
3.3 MINE算法13
3.4 数据计算17
3.5 数据处理分析21
结束语24
致谢25
参考文献26
绪论
蛋白质是生命组成必不可少的物质之一,蛋白质通过与其他各个分子相互作用的方式来完成各种生命活动,其中蛋白质之间的相互作用是实现生命活动的主要方式之一,例如:蛋白酶的在各种反应中的催化作用,基因的转录与表达等等。
蛋白质蛋白质相互作用界面是蛋白质相互作用发生的地点,这些多样的相互作用有非常复杂的理化特性,并且各个贡献因素之间关系错综复杂。尽管从几十年前开始,我们已经开始着手收集大量的蛋白质结构信息并建立了蛋白质信息结构库,并且经过长时间补充与发展已经较为完备,我们已经有了一份较为完整的关于受体和配体间相互作用的详细说明。但是生命的复杂性远超我们想象,依然存在着一些“乌云”,因此我们需要更多的数据与更加精确的方法来概括与预测蛋白质相互作用中的 *好棒文|www.hbsrm.com +Q: &351916072&
各个因素的贡献度。
在细胞接受信号时,蛋白质会和他的伴侣分子或者其他的蛋白质分子形成复合物。蛋白质通过这种相互作用来发挥实现生命活动。在实际运用中,我们更加关注的是蛋白质的作用结果,因此更加倾向于实验验证,其中方法包括免疫共沉淀,FarWestern?blotting,生物信息学,酵母双杂交系统,噬菌体展示,表面等离子体共振、荧光能量转移等几种.[1]
在理论计算与预测中,对大数据集的变量间关系的分析越来越重要,在本文中提出了一个衡量变量关系的标准最大信息系数(MIC)。这是度量两个相关(线性与非线性)关系的重要指标。MIC属于较大的一类MINE(非参数最大信息化法)的识别和分类关系统计。在我们研究一个大数据集时,我们可以按照一个标准(MIC)对这个数据集中的数据对进行打分,然后按照得分高低进行排列,并且在分析过程中,要注意普遍性和公平性。完成后,我们可以根据得分情况对数据间的相关性进行分析。MIC(最大信息系数法)和MINE(非参数最大信息化法)在分析过程中已经有了广泛的应用,例如在健康,基因表达,影响收入因素,和人类肠道菌群等领域。同时,这在识别新兴未知关系中也有重要应用。
在本篇文章中,我们的工作有一下几点:首先简单叙述与蛋白质相互作用,相互作用界面,亲和能有关的基本知识和目前国内外的研究方法;之后我们会介绍MINE算法和拟合模型,最后我们把MINE运用到对蛋白质复合物相互作用界面结合的各个因素贡献进行研究中,通过计算跑分数据得出每种因素对相互作用界面结合的贡献度。
第二章 蛋白质相互作用
2.1蛋白质相互作用介绍及研究方法
生命体通过生物分子之间的相互作用来实现它的基本功能,因此研究生物分子间的相互作用在分析生命体功能中扮演了非常重要的角色,而蛋白质的相互作用又是其中最重要的部分。
当细胞接受信号时,细胞会通过特定的途径对基因表达过程进行调节,以保证发挥特定的生物学功能。在此过程中,蛋白质起到了非常重要的作用。蛋白质通过和他的伴侣分子或者与其他的蛋白质分子形成复合物的方式来发挥作用。因此我们必须通过研究蛋白质相互作用间的方式来更好的理解细胞的生物学活性。
在蛋白质相互作用的研究中,我们应该根据不同的实验目的和条件选择不同的实现策略。在研究已知蛋白质之间的相互作用时,我们更加关注的是蛋白质能否结合,因此实验更倾向于验证。在这种情况下,应选择高机动性、高信誉,更接近生理条件的技术方法并且尽量减少实验本身带来的假阴性或假阳性。目前蛋白质相互作用的研究方法主要包括免疫共沉淀,FarWestern?blotting,生物信息学,酵母双杂交系统,噬菌体展示,表面等离子体共振、荧光能量转移等几种[3]。
目 录
第一章 绪论1
第二章 蛋白质相互作用
2.1 蛋白质相互作用介绍及研究方法3
2.2 相互作用界面5
2.3 亲和能6
第三章 分析算法和计算
3.1拟合模型8
3.2计算梯度和海森矩阵9
3.3 列文伯格法10
3.3 MINE算法13
3.4 数据计算17
3.5 数据处理分析21
结束语24
致谢25
参考文献26
绪论
蛋白质是生命组成必不可少的物质之一,蛋白质通过与其他各个分子相互作用的方式来完成各种生命活动,其中蛋白质之间的相互作用是实现生命活动的主要方式之一,例如:蛋白酶的在各种反应中的催化作用,基因的转录与表达等等。
蛋白质蛋白质相互作用界面是蛋白质相互作用发生的地点,这些多样的相互作用有非常复杂的理化特性,并且各个贡献因素之间关系错综复杂。尽管从几十年前开始,我们已经开始着手收集大量的蛋白质结构信息并建立了蛋白质信息结构库,并且经过长时间补充与发展已经较为完备,我们已经有了一份较为完整的关于受体和配体间相互作用的详细说明。但是生命的复杂性远超我们想象,依然存在着一些“乌云”,因此我们需要更多的数据与更加精确的方法来概括与预测蛋白质相互作用中的 *好棒文|www.hbsrm.com +Q: &351916072&
各个因素的贡献度。
在细胞接受信号时,蛋白质会和他的伴侣分子或者其他的蛋白质分子形成复合物。蛋白质通过这种相互作用来发挥实现生命活动。在实际运用中,我们更加关注的是蛋白质的作用结果,因此更加倾向于实验验证,其中方法包括免疫共沉淀,FarWestern?blotting,生物信息学,酵母双杂交系统,噬菌体展示,表面等离子体共振、荧光能量转移等几种.[1]
在理论计算与预测中,对大数据集的变量间关系的分析越来越重要,在本文中提出了一个衡量变量关系的标准最大信息系数(MIC)。这是度量两个相关(线性与非线性)关系的重要指标。MIC属于较大的一类MINE(非参数最大信息化法)的识别和分类关系统计。在我们研究一个大数据集时,我们可以按照一个标准(MIC)对这个数据集中的数据对进行打分,然后按照得分高低进行排列,并且在分析过程中,要注意普遍性和公平性。完成后,我们可以根据得分情况对数据间的相关性进行分析。MIC(最大信息系数法)和MINE(非参数最大信息化法)在分析过程中已经有了广泛的应用,例如在健康,基因表达,影响收入因素,和人类肠道菌群等领域。同时,这在识别新兴未知关系中也有重要应用。
在本篇文章中,我们的工作有一下几点:首先简单叙述与蛋白质相互作用,相互作用界面,亲和能有关的基本知识和目前国内外的研究方法;之后我们会介绍MINE算法和拟合模型,最后我们把MINE运用到对蛋白质复合物相互作用界面结合的各个因素贡献进行研究中,通过计算跑分数据得出每种因素对相互作用界面结合的贡献度。
第二章 蛋白质相互作用
2.1蛋白质相互作用介绍及研究方法
生命体通过生物分子之间的相互作用来实现它的基本功能,因此研究生物分子间的相互作用在分析生命体功能中扮演了非常重要的角色,而蛋白质的相互作用又是其中最重要的部分。
当细胞接受信号时,细胞会通过特定的途径对基因表达过程进行调节,以保证发挥特定的生物学功能。在此过程中,蛋白质起到了非常重要的作用。蛋白质通过和他的伴侣分子或者与其他的蛋白质分子形成复合物的方式来发挥作用。因此我们必须通过研究蛋白质相互作用间的方式来更好的理解细胞的生物学活性。
在蛋白质相互作用的研究中,我们应该根据不同的实验目的和条件选择不同的实现策略。在研究已知蛋白质之间的相互作用时,我们更加关注的是蛋白质能否结合,因此实验更倾向于验证。在这种情况下,应选择高机动性、高信誉,更接近生理条件的技术方法并且尽量减少实验本身带来的假阴性或假阳性。目前蛋白质相互作用的研究方法主要包括免疫共沉淀,FarWestern?blotting,生物信息学,酵母双杂交系统,噬菌体展示,表面等离子体共振、荧光能量转移等几种[3]。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/rwxy/wuli/43.html