蛋白质折叠速率与mRNA(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-17 06:26:31

点击下载

作者:李瑞芳

出版社:上海交通大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

蛋白质折叠速率与mRNA

蛋白质折叠速率与mRNA试读:

前言

20世纪70年代初,Anfinsen提出蛋白质的氨基酸序列包含足够的信息决定其空间结构的假说,并因此获得诺贝尔奖。但是,一些研究者发现存在氨基酸序列相同但构象不同和构象相似而氨基酸序列相差显著的蛋白质。这说明氨基酸序列并不是决定蛋白质结构的充分条件,同时意味着除氨基酸序列以外的其他信息对蛋白质空间结构的形成也是非常重要的。但是这种信息到底储存在哪里?是通过什么途径来传递的?这些问题一直困扰着相关研究者们。如果我们能够找到mRNA除了编码氨基酸之外影响蛋白质结构的其他定性或定量结果,那就意味着我们找到了两者之间的一些联系,这是一项极具挑战性的工作。

如果除氨基酸之外确实还有一些影响蛋白质结构和功能的信息,这种信息很有可能存在于mRNA序列和结构中。但是,现有的报道中没有找到相关的定量描述。考虑到折叠速率包含一些蛋白质结构和功能的信息,那么蛋白质折叠速率与其相应mRNA序列之间的关系就会表明,蛋白质对应的mRNA序列除了编码氨基酸之外确实还携带一些影响蛋白质结构和功能的信息。而蛋白质折叠速率又与蛋白质结构有着非常密切的相关性。如果能找到有关mRNA序列和结构对蛋白质折叠速率影响的一些定量结果,也就意味着找到了mRNA序列和结构与蛋白质结构间相关性的定量结果。这是我们工作思路的出发点。

从最简单的单细胞生物到最高等的人类,其最基本最重要的组成物质是DNA、RNA和蛋白质,这些组成物质是生物体遗传信息的携带者。由于人类基因组计划的顺利实施以及各种后基因组计划的开展,人们获得了大量的生物分子数据。这些生物数据具有丰富的内涵,其背后隐藏着许多人类尚不清楚的生物学知识。利用数学、物理、化学等各种方法,通过大量数据分析来揭示生物分子数据中蕴含的生物信息是一项非常有意义的工作,也为我们的工作提供了研究方法。

基因组中mRNA序列被认为是一种遗传语言,它的词汇组成和语法结构中包含了绝大部分的遗传信息。作为遗传信息的使者,mRNA序列包含的遗传信息也绝非编码规则这一项信息,如密码子第三位点存在的自由度和mRNA序列中复杂的高级结构均是编码规则之外的信息。挖掘这些遗传信息的生物学功能是后基因组时代研究的主要任务。人们发现mRNA序列中存在非常复杂的回文结构分布,而且回文结构可能形成发夹结构和十字形结构并具有重要的生物学功能。

蛋白质是生命活动的主要承担者,是一类最重要的生物大分子,在生物体内占有特殊的地位,蛋白质的一级结构即肽链是没有生物活性的,只有折叠成一定的空间结构,才能具有生物活性。蛋白质的折叠就是指一个蛋白质从它的变性状态转变到它的特定生物学天然构象的过程。异常的蛋白质空间结构很可能导致其生物活性的降低、丧失,甚至会导致疾病。疯牛病、阿尔茨海默病等都是由蛋白质折叠异常引起的疾病。蛋白质折叠问题是分子生物学的核心问题之一,其中有很多谜团尚未解开。蛋白质折叠问题是生命科学领域的前沿课题之一,并且被列为“21世纪生物物理学”的重要课题之一,它是分子生物学中心法则尚未解决的一个重大生物学问题。基于蛋白质一级序列或mRNA预测蛋白质折叠并进一步预测其功能,是极富挑战性的工作。研究蛋白质折叠,尤其是折叠早期过程,即新生肽段的折叠过程是全面的最终阐明中心法则的一个根本问题,是蛋白质分子设计及蛋白质工程的需要,也是越来越多基因工程产物复性复活的需要,更是理解与错折叠相关的疾病起源的需要。人们正从不同角度入手来研究蛋白质的折叠问题。

蛋白质折叠问题非常复杂,具体可分解为两个问题:①蛋白质折叠的热力学(thermodynamics)问题,即什么是蛋白质折叠的驱动力?②折叠的动力学(kinetics)或折叠速率问题,即为什么新生或变性肽链可以迅速折叠成天然构象状态?这两个问题相辅相成,只有同时得到解决,才能彻底揭开蛋白质折叠之谜。我们一直重点关注蛋白质折叠速率问题。

目前,越来越多的研究者加入到蛋白质折叠速率的研究中,提出了诸多蛋白质折叠速率的影响因素,随之提出了一些蛋白质折叠速率的预测方法。但是,还有诸多影响因素,特别是基于蛋白质一级序列的一些因素尚未提出,蛋白质折叠速率的预测精度尚待提高。另外,人们普遍认为决定蛋白质折叠速率的因素主要来自蛋白质的氨基酸序列和各级结构以及环境和温度。虽然有关于氨基酸序列包含了决定蛋白质三维结构全部信息的假说,但决定正常功能蛋白质信息的组分和来源是不完善的,也是非常复杂的。我们坚信这些信息的一部分来自核酸序列,并将提取或定义刻画mRNA特征的信息参数,探讨它们对蛋白质折叠速率的影响。我们认为,决定蛋白质折叠速率的信息还来自mRNA序列,它们在调节蛋白质折叠过程中起着重要的作用。

本书大部分内容是笔者及其团队近几年来的研究工作成果。本研究分析了蛋白质氨基酸序列的特征,以期从中挖掘蛋白质折叠速率的影响因素,指出mRNA序列中复杂的二级结构、同义密码子使用、回文结构等所包含的信息是影响mRNA输运、基因表达调控乃至蛋白质结构的重要根源之一。通过分析mRNA序列这种遗传语言的词汇组成、语法结构信息、同义密码子使用偏好以及回文结构、二级结构的组成和分布,研究它们对相应蛋白质折叠速率的影响,从而挖掘它们蕴含的新的生物学意义。笔者期望通过这些研究工作推进相关学者对mRNA序列以及蛋白质折叠等生物过程的认识,并为青年学者提供研究思路和方法。

感谢为本书研究成果共同奋斗过的几位学生,感谢上海交通大学出版社杨迎春博士对本书的修改和指正,感谢内蒙古大学李宏教授的指导,感谢内蒙古自然科学基金(2016MS0362)对本书的资助。感谢内蒙古师范大学的领导和老师们对我学习的支持和鼓励。感谢我的家人对我的支持和关心!非常感谢我的父母和姐姐,他们始终鼓励我、支持我,帮我做生活琐事,让我有更多的时间投入到科研工作中。感谢我的弟弟和弟妹在英文写作上的有益帮助和支持。感谢我的丈夫和女儿,是他们的爱给予我无穷的动力和战胜困难的勇气。

书中存在的不足与缺点,恳请读者批评和指正。第1章绪论1.1 研究背景

蛋白质(protein)取自希腊文“proteios”,是“首要”“最原始”的意思,可见蛋白质在生命活动中的重要性。蛋白质是决定细胞性质的最主要物质,它是一类重要的生物大分子,在生物体内占有特殊的地位,是生命活动的主要承担者,是生命现象的主要物质基础。蛋白质不仅是构成一切细胞和组织的重要组成成分,而且也是生物体细胞中含量最丰富的高分子有机化合物。蛋白质与生命的基本现象密切相关,许多重要的生命现象和生理活动都是通过蛋白质来实现的,如催化反应、代谢调节、免疫保护、物质运输、机体运动、遗传控制、生[1]长发育等。

然而,蛋白质只有折叠成正确的三维空间结构才能具有正常的生[2]物学功能。错误的折叠、过慢的折叠不仅会导致其生物学功能的丧失,甚至会引起疾病,如可传播性海绵状脑病(CJD)、疯牛病(BSE)、肌萎缩性脊髓侧索硬化症(ALS)、帕金森综合征(PD)、[3]阿尔茨海默病(AD)等。可见蛋白质折叠过程对所有的生物体系来说都是最重要和最基本的过程,这个过程是一个既复杂又深奥的基础理论问题,也是生命科学中最基本的问题之一,但对人类而言仍然是个未解之谜。

蛋白质折叠是一个生命自组织过程,当一个蛋白质自发地经历一个“混乱↔有序(disorder↔order)”转变时,称为蛋白质“折叠↔解折叠(folding↔unfolding)”,其中有很多谜团尚未解开。这是一个非常复杂的过程。在这一过程中,除二硫键外,主要是氢键、盐键等共价键的断裂和形成。这一折叠过程遵循自由能减小的原理,即蛋白质在一定的时间范围内沿着某些或某一特定的路径到达其自由能最小或极小的生物学天然构象。

目前有关蛋白质折叠的研究主要包括以下几个方面:①对蛋白质折叠编码问题的研究,即天然结构是如何选择它的氨基酸序列的,该问题属于蛋白质折叠的热力学问题;②对蛋白质折叠过程的研究,即蛋白质是如何在一定的生物学时间范围内从一条伸展的多肽链到达其特定的天然构象的,该问题涉及蛋白质折叠的动力学和能量变化规律问题,以此为基础可以更好地对蛋白质结构进行预测。蛋白质结构预测是指从蛋白质的氨基酸序列预测其三维空间结构。对于理解蛋白质的结构与功能关系,并在此基础上进行蛋白质复性、突变体设计以及基于结构的药物设计具有重要意义,因而进行蛋白质的结构预测成为一种迫切需要。近年来,随着高精度的蛋白质折叠数据的不断积累,使得从蛋白质折叠速率角度研究蛋白质折叠机制的理论工作者,迎来了前所未有的机遇和挑战。

蛋白质的折叠速率体现了蛋白质折叠的动力学特征,在蛋白质的折叠过程中,有些蛋白质,特别是一些小蛋白质,没有明显的中间态,遵循“全”或“无”的过程,而有些蛋白质则需要中间态的不断积累才能最终完成其折叠过程。在这些蛋白质中,它们的折叠速率又有着-1很大的差异(通常情况下,折叠速率用k表示,单位为s),有些蛋f[4]白质在几微秒内就能完成其折叠过程,而有些则需要几个小时。另外,蛋白质序列的极小差别或溶剂环境的细微变化,都会引起蛋白质折叠动力学的巨大改变。为了更好地解释这一差异,真实地模拟蛋白质的折叠过程,并计算出它们的折叠速率,近年来发展了许多实验方法来研究蛋白质的折叠过程,如各种光谱技术(圆二色、荧光、红[5-9]外)、质谱技术、氢交换以及核磁共振等。迄今为止,蛋白质动力学研究方面已经积累了相当可观的数据,并出现了相应的蛋白质折[10,11]叠数据库,为我们数据库的建设奠定了深厚的基础。

目前,关于蛋白质折叠速率问题,大都是从蛋白质的高级结构、二级结构,乃至氨基酸序列出发进行研究的。然而,我们研究表明,除此之外,RNA也包含了影响蛋白质折叠速率的因素。这是生物学的一个重要问题,如果解决了这一问题,等同于回答了以下多年来一直困惑生物学家们的问题:分子生物学“中心法则”揭示了遗传信息从DNA到RNA到蛋白质的传递过程,在此过程中,通过翻译,由成熟的mRNA序列得到相应的蛋白质氨基酸序列。除了这种翻译信息之外,mRNA是否携带决定蛋白质构象的更为重要的因素呢?1973年,[12]Anfinsen等提出一个原理认为蛋白质的氨基酸序列包含了决定蛋白质结构的全部信息。但是,随后的研究者发现存在着氨基酸序列相同但构象不同的蛋白质,以及构象相似而氨基酸序列相差显著的蛋白质[13]。这说明氨基酸序列并不是决定蛋白质空间结构的充分条件,即除氨基酸序列以外的其他信息对蛋白质空间结构的形成也是重要的。这种信息很有可能存在于mRNA的序列和结构中。基于这个思路,我们就相关问题开展了系列研究。1.2 本书结构

本书内容安排如下:第1章介绍我们工作的研究思路及本书内容的整体安排。第2章介绍蛋白质折叠速率的研究进展及我们关于氨基酸片段的平均极性与蛋白质折叠速率关系的研究。具体做法是按照蛋白质的二级结构类型,从每条氨基酸序列中截取所有的α螺旋和β折叠片段作为研究对象,计算各片段的折叠速率和平均极性,分别在各物种的α螺旋和β折叠两类二级结构片段中分析折叠速率和平均极性的相关性。研究表明,不论是病毒蛋白质还是大肠杆菌中的蛋白酶,其中两类氨基酸片段的平均极性与折叠速率都是极显著相关的:对于所有的α片段,二者呈线性正相关;而对于所有的β片段,二者呈线性负相关。结果证实了在蛋白质折叠中,氨基酸的极性起着非常重要的作用。[14]

第3章中以罗辽复先生提出的基因序列信息参数为基础,研究了RNA序列对相应蛋白质折叠速率的影响。选取了描述遗传语言词汇组成的信息参数一阶信息冗余(D)、描述遗传语言语法结构的信息1参数二阶信息冗余(D)及其衍生的信息参数作为刻画编码序列的2特征参数,并基于一个较大的蛋白质数据集分析它们与蛋白质折叠速率之间的线性关系。结果表明,对于二态蛋白质,D和这一参量组2与全α蛋白质和全β蛋白质的折叠速率均有极显著的相关性,尤其对于全α蛋白质,相关系数达到0.84。而对于多态蛋白质,相应的mRNA序列的GC含量对蛋白质折叠速率的影响较为突出,进一步分析表明对于这种GC含量的影响,其中一部分来自密码子的第三位点,又一次证实了同义密码子的使用对蛋白质折叠速率的影响。为了从多个角度印证mRNA序列的GC含量对蛋白质折叠速率的影响,先选择编码序列的序列参数——GC含量来做初步分析。基于Gromiha给出的13个全β类蛋白质,得到相应编码序列的GC含量并将它加入到Gromiha基于蛋白质序列4个参数的预测折叠速率回归方程中来检验GC含量在蛋白质折叠过程中的作用。与Gromiha的结果比较,预测值和实验值之间的相关系数得到了提高,结果表明GC含量对预测蛋白质折叠速率是有效的,意味着蛋白质编码序列的GC含量确实对蛋白质折叠速率有影响。进一步分析也表明这种影响主要来自密码子的第三位点及其与第二位点的关联,而不是来自从密码子到氨基酸的翻译信息。

第4章详细介绍了回文结构,并介绍了我们关于一些病毒的回文结构研究结果。统计分析和比较了艾滋病病毒(HIV-1)、丙型肝炎病毒、SARS病毒及其他几种冠状病毒的回文结构GC含量的特征和分布,发现了其中一些回文结构的特殊分布。综合考虑几种高致病病毒序列的一些特殊回文结构,如在GC含量,回文长度以及位置等方面特殊分布的回文结构,发现这些特殊回文结构往往分布在病毒序列中较为关键的位置。所以,它们一定不只是普通的序列,而应该是具有某种生物功能的重要元件。我们猜想这些特殊回文一定携带一些影响病毒蛋白质功能的重要信息。既然回文结构与蛋白质的功能有非常紧密的联系,而且它们在mRNA序列中有非常广泛的分布,那么,回文结构完全可以作为研究mRNA与蛋白质之间关系的一个很好的参量。

第5章从不同的角度研究了回文结构对蛋白质折叠速率的影响。首先定义了mRNA序列片段的回文GC含量及回文密度两个参量。基于α螺旋片段及β折叠片段的折叠速率与其平均极性之间的相关性,分析了回文GC含量及回文密度对两者之间关系的影响,研究发现这两个参量确实对氨基酸片段折叠速率和平均极性之间的关系有影响。统计分析表明这两个来自mRNA序列的参量与氨基酸片段的平均极性无显著关系,这间接说明相应mRNA序列片段的回文GC含量及回文密度影响了蛋白质的折叠速率,且蛋白质折叠速率与回文两参量之间均呈正相关。进一步分析表明影响的根源来自回文结构的复杂性或可变性和同义密码子的使用偏好,而不是来自从密码子到氨基酸的翻译信息。这说明mRNA序列确实携带有影响肽链折叠速率乃至蛋白质结构的信息。虽然在第3章中加入mRNA序列的GC含量后预测蛋白质折叠速率的结果有所改善,但回归方程的Jackknife检验结果表明mRNA全序列的GC含量并未完全涵盖影响蛋白质折叠速率的主要信息。我们分析,出现这样的结果是由于mRNA序列的GC含量不能反映编码序列的结构信息。于是,第5章定义了一个既能涵盖序列又能包含序列结构的参数,称为回文GC含量。用mRNA序列中的回文GC含量代替全序列GC含量做同样的分析。与Gromiha的结果比较,蛋白质折叠速率的预测值与实验值之间的相关系数得到了进一步的提高,并且卡方检验、Jackknife检验也表明mRNA序列中回文GC含量对蛋白质折叠速率有更大的影响。这意味着mRNA序列的结构和序列组成是影响蛋白质折叠速率的主要因素。进一步分析也表明这种影响一部分来自回文结构的复杂性和可变性,基于这一思路,我们整理了一个较大的包含蛋白质折叠速率实验值、相应的mRNA序列中回文结构参数等信息的蛋白质数据集,分析了回文结构各参量与蛋白质折叠速率之间的关系,又一次证实了回文结构的复杂性和可变性是影响蛋白质折叠速率的一个重要因素。

在前期的研究过程中发现,影响蛋白质折叠速率的另一部分因素来自同义密码子的使用或者说是密码子第三位碱基的使用。所以,我们认为,同义密码子的使用偏性是体现mRNA特性的另一重要参量。第6章以不同物种为样本,研究了同义密码子使用偏性对蛋白质折叠速率的影响。研究发现了一些关于蛋白质折叠速率与同义密码子使用度之间的相关性,一些密码子的使用与蛋白质的折叠速率显著相关。比较3类蛋白质折叠速率与同义密码子使用度之间的相关性后发现,同一个密码子对不同类蛋白质折叠速率的调节方向一般是不同的。比较二态和多态蛋白质,发现了一些同义密码子的使用对二态和多态蛋白质的区别,它们对蛋白质折叠速率的调节方式是不一样的,说明同义密码子对不同类蛋白质的影响是不同的。

第7章定义了RNA二级结构的信息参量,主要有茎结构含量、环结构含量、平均能量密度,并以此为基础,定义了RNA柔性;建立了一个较大的包括mRNA二级结构的信息参量的蛋白质折叠速率库;研究了RNA二级结构对蛋白质折叠速率的影响。统计结果表明,mRNA二级结构中茎结构的含量与蛋白质折叠速率呈显著的负相关性,而环结构含量与蛋白质折叠速率呈显著的正相关性。另外,结果显示,无论是否考虑蛋白质的结构分类或折叠类型,mRNA柔性与相应蛋白质折叠速率之间均呈现出极显著或显著的正相关性。因此我们认为,mRNA柔性是影响蛋白质折叠速率的普适参量。在前面工作总结的基础上,第8章提出了我们以后工作的方向和思路。参考文献

[1] 朱玉贤,李毅,郑晓峰.现代分子生物学(第三版)[M].北京:高等教育出版社,2007.

[2] 王镜岩,朱圣庚,徐长法.生物化学(第三版)[M].北京:高等教育出版社,2002.

[3] 井明艳,孙建义.分子伴侣与蛋白质折叠[J].科学通报,2004,20(5):407-411.

[4] Kubelka J,Hofrichter J,Eaton W A.The protein folding“speed limit”[J].Curr.Opin.Struct.Biol,2004,14(1):76-88.

[5] Fabian H,Naumann D.Methods to study protein folding by stopped-flow FT-IR[J].Methods,2004,34(1):28-40.

[6] Zeeb M,Balbach J.Protein folding studied by real-time NMR spectroscopy[J].Methods,2004,34(1):65-74.

[7] Maity H,Maity M,Krishna M M G,et al.Protein folding:the stepwise assembly of foldon units[J].Proc.Natl.Acad.Sci.USA,2005,102(13):4741-4746.

[8] Xiao H,Hoerner J K,Eyles S J,et al.Mapping protein energy landscapes with amide hydrogen exchange and mass spectrometry:I.A generalized model for a two-state protein and comparison with experiment[J].Protein Sci,2005,14(2):543-557.

[9] Maxwell K L,Wildes D,Zarrine-Afsar A,et al.Protein folding:defining a“standard”set of experimental conditions and a preliminary kinetic data set of two-state proteins[J].Protein Sci,2005,14(3):602-616.

[10] Fulton K F,Bate M A,Faux N G,et al.Protein folding database(PFD2.0):an online environment for the International Foldeomics Consortium[J].Nucleic Acids Res,2007,35(Database issue):D304-D307.

[11] Bogatyreva N S,Osypov A A,Ivankov D N.KineticDB:a database of protein folding kinetics[J].Nucleic Acids Res,2009,37(Database issue):D342-D346.

[12] Anfinsen C B.Principles that govern the folding of protein chains[J].Science,1973,181(4096):223-230.

[13] Telling G C,Parchi P,Dearmond S J,et al.Evidence for the conformation of the pathologic isoform of the prion protein enciphering and propagating prion diversity[J].Science,1996,274(5295):2079-2082.

[14] 罗辽复.生命进化的物理观[M].上海:科学技术出版社,2000.第2章蛋白质的折叠速率

蛋白质的折叠速率体现了蛋白质折叠动力学的特征,其中包含蛋白质高级结构、二级结构以及序列等特性。本章详细介绍蛋白质折叠速率的相关研究,并介绍我们基于氨基酸特性的研究结果。2.1 蛋白质的折叠速率研究进展

蛋白质的折叠是指一个蛋白质从它的变性状态转变到它的特定的生物学天然构象的过程。现在人们已经普遍接受了共翻译折叠的理论,[1-4]认为mRNA在核糖体上翻译的过程中,蛋白质折叠就开始了,这一过程遵循自由能减少规律,即蛋白质在一定时间内沿着某一或某些特定的路径(过渡态系综)达到其自由能最小(极小)的天然构象[5]。各种光谱技术、质谱和核磁共振等试验方法都可用来研究蛋白质的折叠,为研究蛋白质折叠速率预测积累了许多实验数据。为了理解蛋白质的折叠机理,其重要任务之一便是确定蛋白质折叠速率的决定因素。许多对小的二态蛋白质的理论研究表明,蛋白质的大小、状态以及结构特征等都对其折叠速率产生影响,但在揭示它们的相互关系过程中受到种种限制。经过多年的努力,到现在已经产生了许多较好[6]的方法,能够比较精确地预测出一些小型蛋白质的折叠速率。有的蛋白质折叠需要几毫秒,而有的蛋白质折叠需要几小时,所以不同蛋白质的折叠速率(蛋白质折叠所用时间的倒数,用k表示,单位为秒f-1-1(s))差别很大,为了便于不同蛋白质折叠速率的比较,人们常用ln(k)来表示蛋白质的折叠速率。蛋白质折叠速率的预测方法f大致分为基于蛋白质三级结构的预测方法,基于蛋白质二级结构的预测方法和基于蛋白质一级结构的预测方法。2.1.1 基于蛋白质三级结构的预测方法[7]

1998年,Plaxco和Baker考察了蛋白质三级结构的拓扑复杂性和蛋白质折叠速率之间的关系,发现蛋白质的折叠速率的自然对数ln(k)和接触序(contact order,CO)之间有着反比关系,提出了f一个基于参量CO的预测方法,CO的计算公式如下:

式中,n为蛋白质的氨基酸残基数(即蛋白质序列长度,不包括r无规则区域),n为非局部残基间的接触数,ΔS为接触i和j间的残基ci,j数。

这一发现促进了该领域的快速发展。随后,各种与折叠速率相关的经验参量相继提出。Plaxco和Baker又提出用平均相对接触序(the [8]average relative contact order,RCO)来预测蛋白质的折叠速率。[9]紧接着在1999年,Alm和Baker提出了一种利用蛋白质折叠自由能能量曲面ΔG(free-energy landscapes)预测蛋白质折叠速率的方[10]法。同年,Mounoz和Eaton在Alm和Baker模型的基础上提出了一种基于自由能阻碍及结构构象熵的统计力学模型来预测蛋白质的折叠速率;Debe和Goddard根据蛋白质核缩聚折叠机制,也提出一种基于[11]三级拓扑结构预测蛋白质折叠速率的方法。2001年,Dinner和Karplus把CO和ΔG结合共同作为输入向量,利用神经网络方法进行预测的模型既可以用于二态蛋白质,又可以用于三态蛋白质。选23个蛋白质作为训练集,10个蛋白质为检验集时,相关系数可达[12]0.76。Gromiha和Selvaraj提出用长程序(the long-range order,[13]LRO)来预测蛋白质折叠速率。2002年,Zhou H和Zhou Y提出用[14]总接触距离(the total contact distance,TCD)来预测蛋白质的折叠速率。2003年,Zhang等把CO,LRO和TCD这几个参数进行结合,用前向人工神经网络(BP网络)方法对28个蛋白质进行预测,[15]随机选择3个进行检验,相关系数达到0.89。同年,等又提出链拓扑参量(a chain topology parameter,CTP)来预测蛋白质的[16]折叠速率;Ivankov等也提出绝对接触序(the absolute contact [17]order,ACO)来预测蛋白质的折叠速率。除此之外,早在1993年,[18]Fiebig和Dill提出有效接触序(the effective contact order,ECO)来预测蛋白质的折叠速率。以上提到的参量均来自蛋白质的三级结构,说明蛋白质折叠速率与其三级结构有着很强的相关性。2.1.2 基于蛋白质二级结构的预测方法

Gong等认为CO可能仅是其他一些潜在的物理变量的代理,而那些潜在的物理变量才是决定折叠速率的真正因素。他们认为,CO是一个复合变量,其表征的真正含义是蛋白质二级结构含量(secondary structure contact,SSC)。基于此想法,他们提出了根据[19]SSC来预测蛋白质折叠速率的方法,公式如下:

式中,ln(k)是蛋白质折叠速率的自然对数,T为转角含量,Hf为螺旋含量,B为发卡结构含量,L为残基数(序列长度),a、b、c、d和e为回归系数(可用多元线性回归方法确定)。用该方法对24个二态蛋白质进行预测,相关系数可高达0.91。

此外,基于蛋白质二级结构,2001年,Mirny和Shakhnovich提出[20]参量——局部接触比率来预测蛋白质的折叠速率。2004年,[21]Ivankov和Finkelstein又提出参量——有效接触链长度来预测蛋白质的折叠速率。这些研究说明蛋白质折叠速率与其二级结构也有很强的相关性。2.1.3 基于蛋白质一级结构的预测方法

从以上的结果我们可以看到蛋白质的折叠速率与其结构有着很强的相关性,而结构可由氨基酸序列预测,所以可从氨基酸序列直接预测蛋白质的折叠速率。这方面的研究工作已做了很多。Gromiha等认[22]为蛋白质的折叠速率是由残基间的相互作用决定的,而相互作用又受氨基酸的物理、化学、能量以及构象等属性的影响,而且,不同二级结构的蛋白质与不同的氨基酸属性相关。2005年,他们把蛋白质大致分为α类、β类和无规卷曲类,继而提出了一个简单的统计模型,根据蛋白质的氨基酸属性来预测其折叠速率。氨基酸的平均属性P的计算公式如下:ave

式中,P是蛋白质的氨基酸平均属性,P(j)是氨基酸序列中ave第j个残基的属性,N是氨基酸序列的残基数。[22]

对于α类蛋白质,Gromiha的线性回归公式是

式中,ln(k)是蛋白质折叠速率的自然对数,α是α螺旋的C端fc动力(the power to be at the C-terminal)。[22]

对于β类蛋白质,Gromiha的线性回归公式是0

式中,K是可压缩性,P是β折叠趋势,R是在溶剂中的收缩率,βαΔASA是溶剂可及表面积。

对于无规卷曲类蛋白质,线性回归公式是

式中,ΔG是对于变性蛋白质水合作用的吉布斯自由能变化量,hD其他参量与公式(2-5)相同。

除此之外,基于蛋白质一级序列,2003年Shao等提出了使用螺[23]旋参量(helix parameter,HP)来预测蛋白质的折叠速率,接着,2004年Kuznetsov和Rackovsky提出了氨基酸的物理化学特性作[24]为参量来预测蛋白质的折叠速率。2005年Punta和Rost提出了一种先从氨基酸序列预测蛋白质3D结构中残基间的长程接触序(LRO)[25]的方法来预测蛋白质的折叠速率。2006年Galzitskaya等提出链的[26]长度(L)作为蛋白质折叠速率的预测参量。同年,Huang等也提[27]出了用残基的Ω值做预测参量来预测蛋白质的折叠速率。到2008年,Ouyang和liang提出几何接触数参量(the geometric contact [28]number,n)来根据蛋白质的氨基酸属性预测蛋白质的折叠速a[29]率。2009年Chou和Shen基于同样的数据库创建了一个蛋白质折叠速率的预测软件。

蛋白质折叠问题是分子生物学中心法则尚未彻底解决的一个重大生物学问题。理解蛋白质的折叠机制对理解蛋白质的生物功能、理解与错折叠相关疾病的起源等是非常重要的。从以上对蛋白质折叠的研究进程中可以了解到,蛋白质的折叠速率与蛋白质的各级结构有非常强的相关性,也可以说,蛋白质折叠速率这一参量包含了蛋白质结构的许多信息。我们认为它可以作为体现蛋白质结构信息的一个很好参量。2.2 氨基酸片段的极性对相应肽链折叠速率的影响

理解蛋白质的折叠机制的一个重要任务是了解影响蛋白质折叠速率的因素,很多研究已表明,蛋白质折叠速率不仅与其高级结构相关,而且与蛋白质的一级序列也有很强的相关性。蛋白质功能结构的信息一般遵循由蛋白质的一级序列(氨基酸序列)到二级结构再到空间结构的传递过程,这条链中蛋白质的二级结构起着关键的作用。从蛋白质折叠的形成过程看,规则的二级结构可能在折叠早期就已出现[30]。本节讨论不同二级结构氨基酸片段的折叠速率与氨基酸极性之间的关系,以期进一步丰富从氨基酸序列直接预测蛋白质折叠速率的理论工作。2.2.1 材料准备

本章选取了SARS病毒、艾滋病病毒、丙型肝炎(Hepatitis C Virus,HCV)病毒及乙型肝炎(Hepatitis B Virus,HBV)病毒作为研究对象。它们的全基因组RNA序列、基因注释序列及相关注释文件从GenBank数据库(http://www.ncbi.nih.gov/)获得。另外,由于大肠杆菌是目前研究得最为详尽的原核细菌,为了证明本章得出的关于α螺旋和β折叠两类蛋白质片段的折叠速率与其平均极性之间相关性的普适性,本章还选取了原核生物大肠杆菌中的60个蛋白酶的mRNA序列作为研究对象。2.2.2 统计分析1)α、β片段的获得

本部分所采用的方法是King等提出的蛋白质二级结构分类法[31](discrimination of secondary structure class,DSC),对应的预测在线软件名称为DSC(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl)。比较已发表的有关蛋白质二级结构预测的方法,DSC方法的预测适合于任何类型的蛋白质。它主要基于以下参数进行预测:①GOR(Garnier-Osguthorpe-Robso)信息。这是一个所占比重最大的参数,它是根据对已知二级结构的蛋白质统计结果得出的,统计表明不同二级结构的开始和结尾部分所采用的残基有明显的倾向性,GOR信息就是包含这一倾向性的参量。②每一残基距离末端残基的距离。考虑到距离末端残基较近的残基也是链结构的一部分,这些部分比其他部分的残基易变,而且在形成氢键及牢固结合在核上等方面也较其他部分更困难。③疏水瞬时模式。这一参数对α片段及β片段截然不同,而对无规卷曲片段来说,它基本上没有影响。④插入和删除信息。对于不同二级结构的蛋白质,两种方式(插入和删除)对结构的破坏影响是不同的。⑤保守片段。

用此DSC在线软件获得4种病毒所有蛋白质和大肠杆菌中的60个蛋白酶中的α片段及β片段。α螺旋平均一圈含3.6个残基。所以,本节选取最短的α片段长度为4个残基,对于β折叠片段,选取最短的片段长也为4个残基,本节没有考虑无规卷曲片段。2)氨基酸片段平均极性的计算

氨基酸的平均极性是氨基酸的一个重要特性,它们在蛋白质折叠[32]过程中起着重要作用,这里定义氨基酸片段的平均极性如下:

式中,表示某氨基酸片段的平均极性,Pi表示本段氨基酸中第i[33]个残基的极性(每种氨基酸的极性值见表2-1),N表示本氨基酸片段所包含的残基数。表2-1 氨基酸的极性表3)折叠速率的计算

Gromiha认为蛋白质的折叠速率是由残基间的相互作用决定的,而相互作用又受氨基酸的物理、化学、能量以及构象等属性的影响,[22]继而提出根据氨基酸属性来预测蛋白质速率的Pave模型,对α螺旋、β折叠片段分别采用式(2-4)与式(2-5)计算它们的折叠速率。以此为依据,计算出所有α片段及β片段的折叠速率,并对两类二级结构片段(α和β片段)分别作其折叠速率与平均极性之间的相关性分析。2.2.3 研究结果1)四种病毒中α螺旋和β折叠片段折叠速率与其平均极性之间的相关性

对于四种病毒,基于所有蛋白质的一级序列共得到505个α片段和406个β片段,计算出各片段的折叠速率ln(k)和平均极性,对f每种病毒的两类二级结构片段(α和β片段)分别作其折叠速率与平均极性之间的线性回归分析,结果如表2-2和表2-3所示。表2-2 α片段的折叠速率与其平均极性的线性回归分析结果

注:GC含量为各病毒基因组中鸟嘌呤和胞嘧啶所占的比率,N是片段数,a是线性回归方程的斜率,r是相关系数,p是相关水平。表2-3 β片段的折叠速率与其平均极性的线性回归分析结果

注:GC含量为各病毒基因组中鸟嘌呤和胞嘧啶所占的比率,N是片段数,a是线性回归方程的斜率,r是相关系数,p是相关水平。

拟合结果显示:片段的折叠速率与其平均极性之间存在极显著的线性相关性;对于β片段,折叠速率与平均极性呈线性负相关,就是说,极性越强的β片段,其折叠速率越低;而对于α片段,二者呈线性正相关,即意味着极性越强的α片段,其折叠速率越高;比较两类片段线性关系的斜率a值,发现β片段斜率a的绝对值远大于α片段的斜率值,说明β片段折叠速率对其极性有更强的依赖性。2)大肠杆菌蛋白酶中的α螺旋和β折叠片段折叠速率与其平均极性之间的相关性

对于60个大肠杆菌蛋白酶,基于其一级序列得到696个α片段和[22]473个β片段,用Gromiha提供的软件计算出各片段的折叠速率ln(k),根据式(2-7)计算出各片段的平均极性,分别在两类二f级结构片段(α片段和β片段)中对它们的折叠速率与平均极性作线性回归分析(见表2-4)。表2-4 大肠杆菌蛋白酶的氨基酸片段的折叠速率与其平均极性的线性回归分析结果

注:N是片段数,a是线性回归方程的斜率,r是相关系数,p是相关水平。

结果显示:对于大肠杆菌蛋白酶,片段的折叠速率与其平均极性之间存在着与上述病毒蛋白质的α片段和β片段一致的相关性,说明这种相关性可能是普适存在的。2.2.4 讨论

对于不同蛋白质,它们的折叠速率有很大的差异,有些蛋白质在几微秒内就能完成其折叠过程,而有些则需要较长时间。为了解释这一差异,真实地模拟蛋白质的折叠过程,并计算出它们的折叠速率,理论工作者开展了大量的研究工作。基于蛋白质三级结构和二级结构预测蛋白质折叠速率的研究中,人们发现蛋白质的折叠速率与其结构有很强的相关性,由此提出了多种预测参量,各种预测参量的相继提出不断推动着蛋白质折叠速率预测方法的发展。许多研究工作者正在寻找直接从蛋白质的氨基酸序列预测其折叠速率的方法,为此,需要提出一些从一级序列预测折叠速率的有效参量。本节的研究结果发现,对于α螺旋片段,随着片段氨基酸极性的增加,折叠速率在加快,意味着提高氨基酸极性可以促进α螺旋片段的折叠。而对于β折叠片段,随着片段平均极性的增加,其折叠速率在减小,说明高平均极性可能会阻碍β折叠片段的折叠。而且发现对于两类片段,平均极性对折叠速率的影响是截然相反的。蛋白质结构不仅取决于氨基酸序列的组成,而且取决于其折叠的机制和方式。我们的结果表明:氨基酸的极性在蛋白质折叠进程中起到相当重要的作用。把所选的蛋白质分为不同的二级结构类时,氨基酸的极性与折叠速率有很好的相关性,尤其在β类片段中,二者的相关系数最高可达0.75,这一相关系数可以与先前有关工作中其他参量与折叠速率的相关系数比拟,如Plaxco和Baker提出了一个基于参量CO的预测方法,对于12个蛋白质,相关系数为0.81,对于18个蛋白质,相关系数为0.64。Gong提出了根据SSC来预测蛋白质折叠速率的方法,对24个二态蛋白质进行预测,相关系数可高达0.91,Punta和Rost提出了一种先从氨基酸序列预测蛋白质3D结构中残基间的长程接触序(LRO),再进行折叠速率预测的方法,通过线性拟合对37个蛋白质进行预测,相关系数可达0.68。本节的研究结果中虽然相关系数没有达到最高,但是我们注意到,第一,从所选片段数来说,远远多于以往工作中所选的片段数,如在得到二者相关系数为0.75的大肠杆菌β类片段中,所选片段个数为473个,这足以证明这种相关性的普适性;第二,从所选参量个数来说,本研究所选参量要少于以往工作中所选的参量,只有氨基酸的平均极性这一个参量,所以得到这样的相关系数已经超出了我们预期的结果,为从蛋白质一级序列出发预测其折叠速率提供了非常重要的理论基础。2.3 mRNA对蛋白质结构的影响2.3.1 mRNA对蛋白质结构影响的必然性分析

分子生物学“中心法则”揭示了遗传信息从DNA到RNA再到蛋白质的传递过程,在此过程中,通过翻译,由成熟的mRNA序列得到相应的蛋白质氨基酸序列。除了这种翻译信息之外,mRNA序列中是否[34]携带决定蛋白质构象的更为重要的因素呢?1973年,Anfinsen等提出一个原理认为蛋白质的氨基酸序列包含了决定蛋白质结构的全部信息。但是,随后的研究者发现存在着氨基酸序列相同但构象不同的[35]蛋白质,以及构象相似而氨基酸序列相差显著的蛋白质。说明氨基酸序列并不是决定蛋白质空间结构的充分条件,意味着除氨基酸序列以外的其他信息对蛋白质空间结构的形成也是重要的。这种信息很有可能存在于mRNA的序列和结构中。在后来的工作中,人们发现了蛋白质的结构与mRNA序列信息之间的相关性。相关的工作主要是从以下几个方面开展的。

第一,核糖体在mRNA上翻译时的速率会影响蛋白质的折叠速[36,37]率,从而影响蛋白质的各级结构及其最终的功能。Purvis和Komar在1987年和1988年相继提出蛋白质的折叠可能发生在共翻译折叠的停顿区,这些慢翻译速度区可能作为蛋白质折叠的内在标点符号[36,37]。现在人们普遍认为许多蛋白质在核糖体上合成时,蛋白质的折叠就开始了,由于受到同义密码子使用偏好的调节作用及密码子与反密码子的相互作用、密码子的上下文关系以及mRNA不同区域的二级结构等因素的影响,核糖体在mRNA上翻译时的速率是不均匀的。

第二,蛋白质的结构与功能可能与mRNA的同义密码子使用相关。同义密码子的使用并不影响编码氨基酸序列,但与基因表达水平相关。不同物种的基因在同义密码子使用上存在着明显的偏性。近年来,人们又发现不同功能的基因,其同义密码子使用偏性也存在较大的差[38]异。遗传密码的简并性主要是与密码子的第三位点有关,这使得编码蛋白质的核酸序列有更大的自由度,允许mRNA携带除编码相应氨基酸以外的更大信息量。所以,mRNA的同义密码子使用应该是影响蛋白质结构与功能的重要因素之一。

第三,蛋白质二级结构与mRNA序列信息之间具有显著相关性。单链mRNA通过互补片段的相互作用能够形成局部二级结构。蛋白质结构域以及规则二级结构单元的共翻译折叠对促进蛋白质最终构象的[39]形成是极其重要的。mRNA的二级结构由茎区、环区以及单链区组成,核糖体在阅读mRNA茎区时,需要克服较高的自由能障碍使配对区解链,所以翻译速率要比单链区与环区慢一些。因此,mRNA的结构可能影响翻译速率,进而影响蛋白质的折叠以及蛋白质结构的形成。如:Thanarg和Patrick统计了大肠杆菌的54个蛋白质的密码子使用频率,并与这54个蛋白质的二级结构区域进行比较后得出结论:蛋白质的螺旋构象区偏向由mRNA快翻译区编码,而慢翻译区通常编[40]码β折叠以及无规则卷曲。进一步研究后又发现,蛋白质结构域和规则二级结构单元之间的连接肽大多由mRNA的慢翻译区编码,且组成连接肽的氨基酸会在核糖体肽通道中堆积,使新生肽链有机会进一步折叠。另外,把蛋白质的二级结构分为规则结构(α螺旋和β折叠)和无规则结构(coil)后,发现它们在mRNA水平上有比较显著的差[41]异,蛋白质二级结构与密码子tRNA拷贝数,以及stem/loop结构有[42]着显著的相关性。这些研究均表明mRNA二级结构与蛋白质空间结构之间存在某种相关性。

种种迹象表明,mRNA除了翻译信息之外,对蛋白质功能和结构的影响是非常重要的。但是mRNA对蛋白质的影响信息是在什么时候或通过什么途径传递到蛋白质等问题至今尚未明确。我们分析,在此问题上研究者遇到的困难是:①很难找到一个合适的能刻画蛋白质结构及其变化的参量,同时也很难找到一个包含很多mRNA信息的参量。②mRNA序列对蛋白质结构的影响相对氨基酸序列等其他参量来说比较小,所以直接分析它们之间的关系很难得到一些合理的结论。

通过对回文结构及蛋白质折叠速率研究进程的调研,我们发现回文结构具有分布广泛,既携带mRNA序列的信息,又携带mRNA二级结构的信息等特点。同时,蛋白质的mRNA序列作为一种遗传语言,其中的信息必定储存在这种遗传语言的词汇组成和语法结构里,而蛋白质折叠速率与蛋白质结构又有着非常强的相关性。所以,我们把蛋白质折叠速率作为蛋白质结构的代表参量,把蛋白质mRNA序列中的回文结构、RNA二级结构以及遗传语言的词汇组成和语法结构信息作为mRNA的代表参量,并且研究它们之间的相关性,如果能找到蛋白质折叠速率与mRNA序列参量之间的相关性,那就意味着找到了mRNA与蛋白质结构之间的某种关联。这必将对进一步研究mRNA对蛋白质结构除了翻译信息之外的影响提供有效的方法和思路。2.3.2 数据获得方法1)蛋白质二级结构的获得

考虑到不同二级结构的蛋白质折叠与不同氨基酸属性相关,所以在研究mRNA序列对蛋白质折叠的影响时,首先需要获得蛋白质序列中不同的二级结构片段。预测蛋白质二级结构的方法和软件很多,由于HNN只是根据片段的局部信息来预测其二级结构的,所以我们选择HNN在线软件来获得文章中的α螺旋和β折叠片段。HNN是在Qian[43]和Sejnowski所提出的较权威的预测方法的基础上进行改进的一种方法,它的网址是http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl。因为对于α螺旋来讲,它一圈的平均长度为3.6个碱基,所以我们选择α螺旋和β折叠片段的最小长度均为4个碱基,忽略掉小于4个碱基的片段。2)蛋白质折叠速率实验值的获得

在研究蛋白质编码序列对其折叠速率的影响以及研究蛋白质折叠速率与其编码序列中同义密码子使用之间相关性的问题中,首先需要已知各蛋白质折叠速率的实验值,我们所研究的蛋白质的折叠速率的实验值取自蛋白质折叠速率研究的相关实验工作。3)蛋白质折叠速率理论值的计算

对未知折叠速率的氨基酸片段的相关研究中,需要计算氨基酸片段的折叠速率。我们计算中采用的是Gromiha提供的折叠速率预测模[22]型。4)蛋白质编码序列的获得

蛋白质序列取自PDB库,蛋白质相对应的编码序列取自EMBL库,两个数据库均有各自的命名方式,在PDB库中没有提供与EMBL库的交叉引用。因此,我们只能通过其他提供交叉引用的数据库来建立PDB库和EMBL库之间的联系。具体做法如下:首先在PDB库中找到蛋白质的“structure summary page”;第二,通过它们的“外部连接项”找到该蛋白质在“OCA Browser”中的位置;第三,通过OCA的序列起源信息找到该蛋白质在SWISS-PROT中的位置;最后,利用SWISS-PROT库提供的与EMBL的交叉引用找到该蛋白质的编码序列。2.3.3 数据分析方法[44-46]

生物统计学为我们的相关研究提供了很好的方法,我们的工作中主要应用了如下几种统计学方法。1)相关分析

相关分析是生物统计学中一种重要的统计学方法,它是考察两个或多个数据型变量之间相互变化关系的统计分析方法,其重要任务是研究变量之间关系的密切程度,用相关系数来衡量变量之间的密切程度。相关系数的计算公式如下:

式中,和分别为变量X和Y的平均值,r的取值范围是[-1,+1]。若r为正数,说明两变量呈正相关,即X和Y有相同的变化趋势;若r为负数,说明两变量呈负相关,即X和Y有相反的变化趋势。由样本得到的相关系数是一个统计量,由于可能存在抽样误差,样本相关系数的大小并不能直接说明总体线形相关关系是否确实存在,要通过显著性检验才能对此做出统计推断。建立假设如下。

零假设H:ρ=0,备择假设H:ρ≠0。0A

对此假设可以用3种方法检验,即F检验、t检验和利用相关系数临界值表检验。2)偏相关分析

当多个变量之间彼此互相影响时,其中两个变量之间的相关性要受到其他变量的影响,因而,这时变量之间的两两简单相关系数并不能反映两个变量之间的真正关系。只有在其他变量保持不变的条件下,计算该两变量之间的相关系数才有意义。这样的相关称为偏相关。设有m个变量,首先计算它们之间两两简单相关系数,并将这些相关系数列在下列矩阵中:

其逆矩阵为

偏相关系数r为ij·3)均数差异显著性检验

由于在我们研究的实际问题中,总体方差是未知的,所以采用t检验。

式中,为样本的平均数,n为样本含量,S为样本标准差,μ为样本总体均数。这一统计量不再服从标准正态分布,而是服从n-1的t分布。

t分布与标准正态分布相似,也是对称分布,它关于t=0对称,只有一个峰值,峰值在t=0处,分布曲线受自由度影响,自由度越小,离散程度越大。统计量服从自由度为n-1的t分布,其临界值要由t分布的分布数表查得。4)卡方检验2

卡方检验(χ检验)主要有3种用途,一个样本方差的同质性检验、适合性检验和独立性检验。卡方值的计算公式如下:2

式中,χ为样本的卡方值,O为实际观测值,E为理论推算值。222χ的取值范围是[0,∞],实际上其符合程度由χ概率决定。由χ值表222可知,χ值与概率成反比,χ值越小,概率值越大;χ值越大,概率2值越小。χ检验的步骤如下:(1)提出无效假设H,同时给出相应的备择假设H。0A(2)确定显著性水平α,一般可确定为0.05或0.01。2(3)利用式(2-14)计算χ值。22(4)进行统计推断,从附表中查出χ值,如果实际χ>χ,表α2α明p>α,应接受H,否定H,说明在α显著标准下理论值与实验值之0A2间的相关性不显著;如果实际χ<χ,表明p<α,应否定H,接受2α0H,说明在α显著标准下理论值与实验值之间的相关性是显著的。A5)多元线性回归分析

多元线形回归是研究一个变量(因变量)对其他两个或两个以上变量的线性回归关系。多元线形回归的数学模型如下:

式中,Y为因变量,X,X,…,X为m个自变量,e为随机误12m差。

多元回归方程的显著性检验用F检验方法。6)总体方差分析

为了度量变量的变异程度,可以用各观测值离均差的大小来表示,对于样本来说,其样本方差定义为2

式中,s为样本方差,x为样本的观测值,为样本的平均值,N为样本容量。

对于总体,其样本方差的定义为2

式中,σ为总体方差,x为样本的观测值,μ为该总体算术平均值,N为样本容量。参考文献

[1] Komar A A.A pause for thought along the co-translational folding pathway[J].Trends Biochem.Science,2009,34(1):16-24.

[2] Fedorov A N,Baldwin T O.Cotranslational protein folding[J].J.Biol.Chem,1997,272(52):32715-32718.

[3] Komar A A,Kommer A,Krasheninnikov I A,et al.Cotranslational folding of globin[J].J.Biol.Chem,1997,272(16):10646-10651.

[4] Kolb V A.Cotranslational protein folding[J].J.Mol.Biol,2001,35(35):682-690.

[5] Lindberg M O,Oliveberg M.Malleability of protein folding pathways:a simple reason for complex behavior[J].Curr.Opin.Struct.Biol,2007,17(1):21-29.

[6] 郭建秀,马彬广,张红雨.蛋白质折叠速率预测研究进展[J].生

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载