酵母转录激活因子与DNA分子识别的研究(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-20 13:32:42

点击下载

作者:王旭 著

出版社:化学工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

酵母转录激活因子与DNA分子识别的研究

酵母转录激活因子与DNA分子识别的研究试读:

前言

前 言

GCN4与DNA的分子识别是基因转录过程的重要模型体系之一,研究它们的识别机制有利于揭示生物信息传递及调控的奥秘,并且对识别机制的研究有利于研制和开发以基因转录过程为靶标的新药,因此对GCN4与DNA分子识别的研究不仅具有重要的理论意义,也有很好的应用前景。本书研究的核心是GCN4与DNA分子识别过程的研究,力图阐明GCN4与DNA相互作用所涉及的复杂能量因素,探讨各种因素对识别作用的影响,并建立合理的理论模型来解释实验结果。主要研究如下:

① GCN4单体肽与DNA的分子识别。首次获得了GCN4碱性区,即单体肽GCN4-br能够专一性识别其二聚体的DNA结合位点AP-1和ATF/CREB的热力学证据。单体肽与DNA结合后构象从伸展构象转变为高度的α螺旋构象,热变性曲线为协同的S形曲线,反应焓变随温度的变化关系决定了比热容变化为负值,这都是单体肽GCN4-br与DNA特异性识别的证据。并且我们也首次观察到单体肽可以特异性识别DNA半位点。单体肽与DNA半位点的结合热变性曲线为协同的S形曲线,反应焓变随温度的变化关系决定了比热容变化为负值,这都是单体肽GCN4-br与DNA半位点特异性识别的证据。实验中还首次观察到单体肽GCN4-br与AP-1两个半位点的结合是有略微的差异的,这是因为AP-1位点与单体肽结合的两个大沟的碱基位置不同而引起的。我们的实验结果有力地支持了GCN4单体可以先与DNA结合,然后再二聚的识别机理,这对认识GCN4在基因转录调控过程中的作用具有一定的启示。

② 突变对GCN4与DNA分子识别的影响。设计了一个全新的能够区别性识别AP-1及ATF/CREB DNA位点的突变二聚体肽mGCN4-D。考虑到复合物中两个DNA位点序列和结构上的差异,我们认为略微弯曲的ATF/CREB位点比直链的AP-1位点有更好的疏水环境,可以使得突变后的Leu与ATF/CREB骨架形成更好的疏水作用。因此突变后的二聚体肽mGCN4-D可以区别性识别ATF/CREB和AP-1位点,它比天然GCN4具有更好的序列专一性。另外,我们研究了一系列N端突变单体肽对螺旋形成和对DNA分子识别过程的影响。研究结果显示突变后的单体肽仍然能够专一性识别DNA位点。通过比较分析突变前后的实验数据,我们认为端基上带负电的D和构象刚性的P对螺旋和分子识别过程的影响是有利的,并且在N端突变使其形成增强的N-cap,以及突变成Aib残基对螺旋和分子识别过程都产生正面的影响。我们的实验结果可以更好地理解氨基酸残基在GCN4与DNA分子识别过程中的作用,并对进一步的设计工作具有一定的指导作用。

③ 色氨酸标记的GCN4单体肽与DNA的分子识别。CD实验结果证实,经过色氨酸突变的单体肽GCN4-W仍然可以特异性识别其DNA位点。荧光滴定实验测得了突变单体肽GCN4-W与DNA特异性结合形成的复合物的表观解离常数,实验所得的解离常数与文献报道的解离常数相近,因此在肽链上引入色氨酸,利用荧光强度的变化来测定复合物的解离常数的方法是有效的。实验结果为研究单体肽与DNA的分子识别机理提供了重要的信息,并且这种方法可以用于进一步研究肽与DNA分子识别的快速反应动力学。

④ 多肽合成。根据上述GCN4与DNA分子识别研究的需要,通过多肽固相合成方法,采用Fmoc策略合成了天然蛋白GCN4的碱性区GCN4-br(序列226~252),以及5个以GCN4碱性区为基础的突变单体肽,其中一个C末端含有Cys残基的突变单体肽用空气氧化法得到了相应的二硫键(S—S)连接的二聚体肽。所有的多肽均经过RP-HPLC分离纯化,纯品肽都经过分析型RP-HPLC和MALDI-TOF-MS鉴定来保证多肽的准确性和纯度。

本书的研究是在来鲁华教授的悉心指导下完成的,书中的点滴成果都倾注着来老师的心血。来老师严谨的治学态度、广阔的学术视野和对学科前沿敏锐的洞察力都给我留下深刻的印象。研究进行当中,每当实验遇到困难或者没有思路的时候,总是想从来老师那里得到帮助,来老师耐心解答并且循循善诱,常常让我有豁然开朗的感觉。来老师对我很宽容,也锻炼我独立思考、独立研究的能力,对于我的好的想法和好的思路,总是在实验上不遗余力地支持我。经过历练感觉自己提高了很多,从开始只会跟着别人做实验慢慢向着能够独立思考和解决问题转变。在这个过程中,我从来老师身上学到了很多做学问的态度和方法。

回首二十多年艰辛的求学生涯,曾有成功的喜悦,也曾有失意的困惑。在此我要感谢我的父母、亲人,以及关心过我的朋友们,是他们给予我生活的保障和勇气,他们永远是我前进的动力。特别要感谢我的爱人宋战江,是他的鞭策、鼓励和永远默默地帮助和关心,支持我走过这漫长的岁月。

最后再次感谢所有关心和帮助过我的人!王 旭2018年3月于燕园第1章 绪 论

在生命过程中,生物体从生长到死亡的正常生理过程及病理过程无不涉及各种生物分子之间以及外源性分子与生物分子之间的相互作用,包括生物大分子之间和生物大分子与小分子之间识别与相互作用[1]

。生物体内各种信息的传递是靠生物分子间的相互作用来实现的。

研究生物活性小分子与生物大分子的识别作用,包括信息小分子与靶分子的作用、酶与底物或抑制剂间的作用、药物和外源性物质与生物受体的作用,有助于加深对生物体生理或病理过程的认识以及加强对这些过程的调控。同时由于这些研究与新药的研制和开发密切相关,许多酶的抑制剂、抗原与抗体等都可能成为有活性的药物,因此分子识别研究具有重要的应用前景。

本章将介绍蛋白质与DNA分子识别研究的意义、研究体系GCN4蛋白的研究现状、所用的实验方法,以及研究的意义和研究设想。1.1 蛋白质与DNA分子识别研究的意义

蛋白质、核酸和糖是涉及生命活动本质的三类生物大分子,是维持生命机体正常运转的最重要的物质基础。核酸是遗传信息的携带者,为生命的外在形式提供了建设蓝图。而蛋白质则承担着各种各样复杂的生理功能,例如促进生物体内新陈代谢的催化作用、预防疾病的抗体、在体内起各种调节作用的激素、担负体内呼吸或运输的载体、接受并转换外界信号的受体,以及构成躯体的结构蛋白等。从整体上维持生物机体新陈代谢活动的进行。

细胞遵循化学规律,在细胞中完成具体功能的则是各种各样的蛋白质分子。蛋白质可以被看成一种分子机器,可以精确地实现特定的功能,例如血红蛋白的输氧功能、酶的专一性催化作用、抗体的特异性结合功能等等。这些功能的实现常常涉及蛋白质与各种生物大分子及生物小分子之间的分子识别作用。以基因的表达和调控为例,在生物体内,这是一个复杂的过程,首先涉及蛋白质对核酸的分子识别。

分子识别,是指生物大分子之间,以及生物大分子(受体)与配体之间的一种专一性的、非共价键相互作用的可逆结合。在两个分子的结合部位之间,其构象要能够相嵌互补,形成相当大的接触面积,或经过构象变化达到这一目的;并且两个分子的结合部位各有相应的[2]化学基团,相互之间能产生足够的结合力,使两个分子结合起来。1.1.1 蛋白质与DNA分子识别的规律

蛋白质与脱氧核糖核酸(即DNA)的分子识别可分为“一般识别”和“特异识别”。一般识别是由DNA分子和蛋白质分子的空间结-10构部件的维度和对称性的相容性决定的,表现为7Å(1Å=10m)重复距离和双重对称轴之间的相互识别。根据DNA和蛋白质二级结构中存在的7Å重复距离和双重对称轴的基本结构部件可有三种一般识别的结构模型:α螺旋与DNA之间的相互识别;反平行β片层与DNA之[3]间的相互识别;伸展的多肽链与DNA之间的相互识别。

特异识别的基本因素是氢键的形成和立体接触效应,后者主要取决于胸腺嘧啶甲基的分布。蛋白质的α螺旋可识别并结合DNA的大沟,而反平行的β片层可识别DNA的小沟。

目前蛋白质晶体结构数据库(PDB)里已有200多个蛋白质-DNA复合物的晶体结构。系统分析这些结构表明,自由态DNA的构象及其与蛋白质形成复合物后的构象,以及蛋白质的构象在与DNA结合前后发生了很大的变化。B型DNA的构象变化由相对平滑的弯曲变形到显[4~6]著弯曲直至碱基堆积作用的破坏,蛋白质的构象变化主要包[7,8]括结构域或亚基四级结构的变化、无规的loop区或N端残基的[9,10][11~16]有序化,以及由自由态的伸展构象到α螺旋的形成等。蛋白质与DNA分子识别的这种构象变化是基因信息传递、表达和调控的分子基础,导致构象发生变化的作用力主要有以下几种:

① 核酸分子中磷酸基团与带正电荷氨基酸残基侧链基团之间的静电作用;

② 核酸分子中的磷酸基团、糖基、碱基与蛋白质分子中亲水氨基酸侧链之间的氢键作用;

③ 芳香族氨基酸残基侧链基团与碱基之间的堆积作用;

④ 碱基与蛋白质中非极性氨基酸残基侧链之间的疏水作用;

⑤ 范德华力作用等。1.1.2 蛋白质与DNA分子识别的意义

研究蛋白质与DNA分子识别的主要目标是研究基因调控的机制。核酸由两条互补的多聚核苷酸组成,两条链上的碱基主要借助氢键互相配对,使DNA分子形成稳定的右手双螺旋结构。细胞中大多数DNA以B型右手双螺旋结构存在,碱基对跨越两条包含脱氧核糖-磷酸骨架的链而沿螺旋呈阶梯形排布,由此不对称分布形成B型DNA的两个基本区:大沟与小沟。

以不同形式存在的DNA所表现的功能也不同,这种不同的DNA功能主要是通过识别具有一定的序列、并且固定在某个作用位点上的DNA结合蛋白来调控的。这种蛋白质称为序列特异性DNA结合蛋白。DNA结合蛋白主要是通过氢键在大沟中与DNA产生特异性结合的,伴随着蛋白质的结合,不仅蛋白质的构象发生较大变化,DNA的双螺旋结构也会发生较大程度的弯曲变形,DNA的弯曲变形加强了蛋白质与DNA之间的相互作用。

DNA结合蛋白在DNA的复制、重组、链裂解、基因转录等生命过程中起着极为关键的作用,与细胞周期中染色体的一系列变化有关,正是由于这些序列特异性的DNA结合蛋白的调控作用才产生了基因表达的组织特异性和细胞周期特异性等现象。因此,对蛋白质与DNA相互识别、相互作用的分子机制等问题深入细致地进行研究,对认识结构与功能的关系,揭示生命的奥秘,以及诊断和控制遗传性疾病都有着重要的意义。而且认识蛋白质与DNA分子识别的规律对于改造天然DNA的结合特异性、设计与特定DNA位点特异性结合的全新蛋白质分[17~25]子也具有重要的理论和实践意义。1.1.3 DNA结合蛋白的结构域类型

DNA结合蛋白与DNA结合的方式取决于结合结构域的类型。迄今为止,已经知道DNA结合蛋白和DNA的结合主要有以下几种具有显著特征的结构类型:[26,27](1)螺旋-转折-螺旋结构域(helix-turn-helix,HTH)

HTH结构域约含20个氨基酸残基,两股α螺旋(螺旋2和螺旋3)以120°的转角连接。第三个螺旋(螺旋1)起稳定HTH构象的作用。螺旋3与DNA大沟特异性结合,它称为识别螺旋。它或者通过水分子直接使氨基酸残基的侧链基团与碱基形成氢键,或者与DNA骨架的磷酸基团形成氢键。这种结构域通常以二聚体的双重对称轴与具有回文结构的DNA位点特异性结合,使复合物中二聚体的双重对称轴与DNA回文序列的双重对称轴相容。

大多数原核生物基因转录的调节蛋白属于这种类型,例如:λ阻遏蛋白、λCro蛋白、代谢降解物激活蛋白(CAP)、Hin重组酶(Hin recombinase或invertase)、Lac阻遏蛋白等。真核细胞中,控制果蝇早期发育的同源异形结构域(homeodomian)中也发现了HTH构象。[28~30](2)β折叠片结构域

目前已经发现两类蛋白通过β折叠片结构域与DNA相互作用。一类是大肠杆菌MetJ阻遏蛋白和沙门氏菌噬菌体P22的Arc阻遏蛋白等,在这种结构域中,反平行排列的β片层由两个单体N末端的β片层反平行对称排列形成,位于DNA大沟之中。每个单体C末端含两股α螺旋片段,它的作用是稳定二聚体,形成一个核心区,使β结构域嵌入大沟的核心区。肽链的其他残基结合DNA分子骨架的磷酸基团,有助于蛋白质-DNA复合物的稳定。另一类的代表是细菌中的HU蛋白,其β结构域是由单体本身C端1/3肽链部分以突环的方式形成的。[31](3)锌指结构域(zinc finger,ZF)

Miller等人发现非洲爪蟾转录因子TFⅢA分子中存在连续九次重复的保守序列,每个重复序列的空间结构中有一个锌离子,锌离子与[32]His和Cys以配价键结合。这种空间结构称为锌指结构域。含锌指的蛋白质具有以下保守序列:OXCX2-4CX3OX5OX2HX3-4HX2-6,根据锌指的组成和结构不同,锌指结构域可以分为不同的类型:C2/H2型锌指结构域、C2/C2型锌指结构域、C6型锌指结构域、CC/HC型锌指结构域、锌带(Zn ribbon)型锌指结构域。[33](4)螺旋-连接-螺旋结构域(helix-loop-helix,HLH)

免疫球蛋白基因的增强子结合蛋白E12、E47及Myo、N-myc、C-myc等的DNA结合区中都存在两股两亲性α螺旋,由长短不同的肽链loop连接,N末端区内含有保守的碱性和极性氨基酸。α螺旋中的一些疏水性氨基酸分布在螺旋的一侧,两亲性螺旋是二聚体形成和结合DNA的必要条件。

螺旋-连接-螺旋结构域通常与亮氨酸拉链结构域连接,构成碱性区-螺旋-连接-螺旋-拉链(basic-helix-loop-helix-zipper,bHLH-ZIP)型结构域。这种结构域可分为两个部分,碱性区-螺旋1(basic-helix 1)和螺旋2-拉链区(helix2-zipper)。前者是DNA的识别区域,后者是二聚体形成的结构域,两部分由环状肽段连接起来。

近年来发现的调节蛋白C/EBP、GCN4和核转化蛋白Fos、Jun中的“亮氨酸”型结构域也是DNA结合蛋白中的一种典型的结构域。其中具有“亮氨酸”型结构域的GCN4蛋白结构简单、功能独特,成为研究的热点。1.2 GCN4的结构和功能特点

碱性区-亮氨酸拉链结构域是Landschulz等于1988年在研究调节[34]蛋白c/EBP时发现的一种新的结构域形式。GCN4是碱性区-亮氨酸拉链(basic region-leucine zipper)模型中典型的一种。与其他几种DNA结合蛋白结构域相比,bZIP结构域模型简单清晰,两个结构单元碱性区和拉链区分工明确,既相互依赖又彼此相对独立。因此,bZIP型结构域是人们开展蛋白质与DNA相互识别、相互作用研究的一个理想的结构域类型。人们对这一类蛋白的氨基酸对于蛋白与DNA特异性结合的影响进行了广泛且深入的研究。

酵母转录激活因子GCN4(1~281)在酵母细胞中调控氨基酸的[35]生物合成,是一个非常典型的含bZIP结构域的DNA结合蛋白,它的bZIP结构域位于C端约60个氨基酸残基处(226~281)(如图1-1所示)。GCN4的两个结构单元:拉链区(zipper region)和碱性区(basic region)分工明确,在功能上二者互相依赖,又彼此相对独立,发挥其自身的特定功能,因此,GCN4是研究蛋白与DNA位点识别作用的非常好的蛋白模型。

与bZIP类型结合蛋白特异性结合的DNA位点一般很短,只有7~10个碱基对,并且具有回文结构(图1-1),以满足亮氨酸拉链形成的二聚体对称性的结构特征,即两个单体分别与两个半位点结合,这[36,37]种结构特征有利于与DNA识别的专一性和亲和力的增强。图1-1 GCN4的bZIP结构域与识别位点AP-1、ATF/CREB的序列1.2.1 拉链区的结构特征和功能

拉链区(zipper region)位于蛋白的C端,大约含有30个氨基酸,呈α螺旋构象。它含有重复出现的亮氨酸残基,它们精确地相距7个氨基酸残基重复一次,这些Leu位于螺旋一侧并排成一列,每两圈出现一次。两个这样的分子可以由α螺旋一侧的Leu之间的疏水相互作用形成“拉链”,它以α螺旋超卷曲(α-helical coiled coil)的连接[38~40]方式形成二聚体。

两个蛋白单体形成“拉链式”二聚体时,一般以同型二聚体的形式出现,有时也采取异型二聚体。二聚体的形成具有特异性,如:癌蛋白c-Jun的同型二聚体形式不稳定,结合DNA的效果也不佳;而[41]Jun-Fos异型二聚体却很稳定,增强了与DNA位点结合的亲和力。采用这种相互组合的方式进行基因调节,能增加基因调控的多样性和精确性。

形成的拉链式二聚体有平行和反平行两种形式。P.S.Kim等证实GCN4是以平行方式形成二聚体的,而且形成的是经典式α螺旋超卷[42]曲。CD谱和NMR实验证实这些二聚体几乎形成100%的α螺旋结[43~50]构。研究拉链区的折叠热力学过程和各种变性性质证实,亮氨酸拉链区的热变性是一个两态过程,即只存在折叠二聚体和无序的单体两种形式,不存在折叠的单体。当肽的浓度降低,二聚体就会解离,同时伴随着α螺旋程度降低,T值减小,说明单体不稳定,两m个α螺旋之间的相互作用对二聚体的稳定性起重要作用。1.2.2 碱性区的结构特征和功能

与亮氨酸拉链区相邻的区域富含Arg和Lys等碱性氨基酸,因此称为碱性区(basic region),这是与DNA结合的部位,它含有专一性[40,42]DNA位点识别的残基。这一区域也包含大约30个氨基酸残基。亮氨酸拉链区是具有明确构象的刚性分子,碱性区是相对可变的柔性分子。碱性区片段和连有拉链区的碱性区片段的NMR结构几乎没有多大变化,说明二聚作用不改变碱性区结构。

在溶液中,没有与DNA结合时,碱性区的结构松散,但当与序列特异性DNA位点结合后,其螺旋含量显著增高,几乎形成100%的α螺[42,51,52]旋构象。这是因为没有与DNA结合时,碱性区的带正电的氨基酸侧链之间的作用使其构象不稳定,但与DNA位点大沟的碱基之间的特异性结合以及与磷酸基团之间的相互作用中和了这些正电荷,使碱性区发生构象变化,螺旋含量增高,这一作用是协同的,碱性区的螺旋构象的形成也有利于序列专一性识别。

T.E.Ellenberger等测定了GCN4结合蛋白的碱性区和拉链区bZIP,即GCN4的226~281片段,与AP-1和ATF/CREB位点形成复合[53]物的晶体结构。复合物的晶体结构为深入研究bZIP蛋白的氨基酸残基与DNA位点相互识别的作用机制打下了基础。在这个复合物中,GCN4以Y形的“叉式”模型与DNA结合(图1-3),碱性区与拉链区形成连续的α螺旋,拉链区形成二聚体,在接近DNA双螺旋时分叉,两个叉的碱性区以相反的方向进入DNA的两个半位点的大沟中,产生特异性结合。碱性区中234~243位的氨基酸残基直接涉及与DNA的识别作用,其中5个高度保守的残基Asn-235、Ala-238、Ala-239、Ser-242和Arg-243通过氢键或疏水作用与DNA的碱基接触,直接影响GCN4与DNA识别的特异性。为了更清楚地分析GCN4的碱性区的重要氨基酸残基与DNA的碱基之间的相互作用,将GCN4和AP-1、ATF/CREB的序列编号如下:

根据这两个复合物的晶体结构,GCN4的氨基酸与DNA的碱基主要涉及下列相互作用,如图1-2所示。图1-2 GCN4主要的氨基酸与DNA碱基间的相互作用

具体分析GCN4主要的氨基酸残基与DNA碱基间的相互作用如下[54]:

① 五个直接影响GCN4的、具有DNA结合特异性的氨基酸残基通过氢键或疏水相互作用与DNA的碱基接触(图1-2)。

a. Asn-235的NH和OH提供两个H原子与Cyt-2'L的N4和Thy-3L的O4形成氢键。

b. Ala-238与Thy-3L的CH形成疏水相互作用。3

c. Ala-239与Ade-1L、Thy-1L的5-CH形成疏水相互作用。3

d. Ser-242与Ade-4L、Thy-3L的磷酸基团的非酯氧原子形成氢键,以及与Thy-3L形成疏水相互作用。

e. Arg-243上氨基的1号氢原子、2号氢原子分别与中心的Gua-0'的N6、N7形成氢键,这是蛋白-DNA识别中Arg与Gua相互作用的基本模式。在GCN4:AP-1中,AP-1的左右两个半位点与GCN4的两个单体的作用方式不同,其中一个GCN4分子的Arg-243与AP-1的右半位点的Cyt-O、Ade-1L的磷酸基团的非酯氧原子形成氢键。而在GCN4:ATF/CREB中,两个GCN4单体的Arg-243与ATF/CREB的作用相同,都与Cyt-O的非酯氧原子和Gua-O'的N7形成氢键,形成二重对称的结构。

② Lys-231、Arg-232和Lys-246处于GCN4碱性区的两端,与DNA的磷酸基团形成静电作用或通过HO分子形成氢键,起到稳定复合物2的作用。

a. Lys-231通过HO分子与Ade-3L的非酯氧原子形成氢键。2

b. Arg-232的两个NH与Thy-1L的磷酸基团的两个O原子形成盐桥。

c. Lys-246的NH与Gua-2'R的非酯氧原子形成盐桥。

③ Glu-237和Arg-240分别通过形成氢键起稳定复合物的作用。

a. Glu-237通过HO分子与Ala-233的羰基氧原子形成氢键。2

b. Arg-240与Gua-O的非酯氧原子形成氢键,并通过HO分子与2Cyt-O的磷脂氧原子形成氢键。

c. Glu-237的两个氧原子与Arg-240的氢原子形成氢键。

④ GCN4碱性区α螺旋的中心Thr-236、Ala-238和Ala-239与DNA形成一个疏水核心。Thr-236的C与Gua-O的脱氧核糖的C和C形成r2'3'疏水相互作用。

⑤ 总体观察6个Arg残基,其中5个Arg的侧链(Arg-234、Arg-240、Arg-241、Arg-243、Arg-245)与DNA的碱基形成氢键,只有Arg-232与Thy-1L上的磷酸基团形成盐桥。1.2.3 GCN4与AP-1、ATF/CREB的相互作用分析

综上所述,其中Asn-235、Ala-238、Ala-239、Ser-242和Arg-243五个主要残基决定了GCN4与DNA的专一性识别。Suckow等已详细研[55,56]究了突变这五个残基对GCN4与DNA专一性识别的影响,发现分别将Asn-235用Glu、Trp替换,Ala-238用Asn、Ser、Tyr、Cys替换,Ala-239用Glu、Ser、Thr、Val替换,Arg-243用Lys、Tyr替换,这些突变体与DNA能特异性结合,只是有的结合亲和力降低;但是对于Ser-242,将其突变为Cys、Phe、His、Leu、Met、Glu、Thr、Val和Trp等,几乎与天然GCN4具有相同的DNA结合亲和性,只是专一性有所降低。[57]

酵母转录激活因子GCN4不仅与AP-1位点特异性结合,而[58]且与具有真正回文结构的ATF/CREB位点也结合,结合亲和力基本相同。对比AP-1和ATF/CREB的序列,它们都是由两个具有回文序列的ATGA半位点组成,AP-1位点是在两个半位点之间由单个碱基对C:G隔开,而ATF/CREB位点则由C:G和G:C两个碱基对隔开,形成一个具有真正回文结构、二重对称性的DNA序列。分析GCN4与[59]这两个DNA位点复合物的晶体结构发现,在复合物中GCN4与AP-1、ATF/CREB的作用方式基本相同,都是由5个氨基酸残基与DNA的碱基进行特异性结合,但是AP-1和ATF/CREB位点序列和构象上的差异导致在这两个复合物中存在两点不同:

① 在GCN4:AP-1复合物中,一个单体的Arg-243与G的N6和0'N7形成两个氢键,另一个单体的Arg-243与DNA另一股链的磷酸骨架结合;而在GCN4:ATF/CREB复合物中,两个Arg-243都与G的N70'形成一个氢键,并与邻近的磷酸基团作用。

② AP-1是典型的直链B型构象,而ATF/CREB的双螺旋由中心向蛋白弯曲约20°(图1-3),DNA的构象具有某些A型特征,说明蛋白与ATF/CREB的作用诱导DNA弯曲变形,以保证ATF/CREB位点与AP-1位点一样,与GCN4产生相同的识别作用,因此DNA的弯曲变形是二聚体作用的结果。由于在这两个复合物中,蛋白质-DNA相互作用模式和结合能量的高度相似性,T.J.Richmond认为,这两个复合物的DNA构象能也相同,即具有典型的B型构象和带有某些A型构象特[59]征的变形B型构象的柔性DNA具有相同的能量。图1-3 GCN4与AP-1、ATF/CREB位点的结合方式1.3 GCN4的最新研究进展1.3.1 对结构方面的研究

亮氨酸拉链模型是一个很好的结构,它很简单,全部都是螺旋,而且通过疏水作用形成超螺旋,可以对它进行各种突变来研究各种残基、各种作用力对结构的影响。

H.R.Bosshard的研究小组对亮氨酸拉链区进行了改造,在螺旋内设计形成了最大限度的6对盐桥,来研究盐桥对超螺旋结构的影响[60]。当pH变低时,侧链上的羧基基团被质子化,盐桥被破坏后,超螺旋的稳定性反而略有增加。用盐酸胍变性比尿素变性得到的自由能大17kJ/mol左右,因为盐酸胍具有离子性质,保护了电荷-电荷相互作用。离子对对超螺旋的稳定性的贡献存在一个平衡,能量上有利的库仑引力和不利的电荷去溶剂化及离子对中残基的构象限制之间存在平衡。超螺旋之间有适量的离子对存在的确可以稳定螺旋,而且有[14]时是必不可少的,但过多的离子对受其位置、几何构型的限制不仅不会稳定螺旋,而且可能会破坏螺旋的稳定性。

bZIP类型结合蛋白的碱性区氨基酸残基是高度保守的,这种保守性说明这些蛋白质与DNA的相互识别的位点和方向大致相同,但是这些蛋白质又有不同的DNA识别位点或不同的亲和力,说明拉链区在bZIP类型结合蛋白与DNA的特异性识别中也起重要作用。McKnight等[61]通过交换不同蛋白的拉链区和碱性区,以及突变亮氨酸拉链区[52]的残基等实验证实了这一观点。

K.Struhl等对GCN4的氨基酸残基的突变研究表明,GCN4二聚体的拉链区与碱性区之间的α螺旋叉对GCN4的这种特异性识别起重要

[62]作用。碱性区和拉链区之间的螺旋叉,即连接体,在天然亮氨酸拉链蛋白中序列是非常保守的。二聚体中对于两条碱性区的位置有严格的空间要求,以使碱性区的位置有利于与DNA结合。因此,利用化学手段,对GCN4蛋白进行设计改造,引入不同间隔和角度的螺旋叉是研究GCN4蛋白对DNA序列进行特异性识别的十分有效的手段。

具有bZIP结构域的其他两类DNA结合蛋白,如Jun/Jun同型二聚体和Jun/Fos异型二聚体,与AP-1位点结合时,使DNA发生更大的弯[63][64]曲变形,DNA的弯曲变形加强了蛋白与DNA间的相互作用。到目前为止,这种使DNA弯曲变形的作用机制还不清楚,A.Schepartz等人通过电泳实验研究发现,bZIP蛋白诱导DNA变形是由于碱性侧链与DNA磷酸基团的静电作用的结果,即由磷酸基团电荷[65~67]中和的不对称性引起的。

O’Neil等以全新设计的多肽片段代替GCN4的拉链区,所得到的杂化分子具有与天然蛋白一样的DNA识别特异性,这表明碱性区和拉[40]链区的功能彼此相互独立。因此,可以利用化学手段用一些连接体(linker)代替拉链区而使两个单体形成二聚体。由于连接基团的空间取向不同、手性不同,并且可以连接不同的bZIP蛋白质分子,所以能产生多种多样的DNA结合特异性,扩展了单一用bZIP蛋白自身拉链区形成二聚体的DNA结合特异性。用这种手段研究蛋白与DNA的结合特异性,不仅对探索蛋白质与DNA相互识别的分子机制具有重要意义,而且对指导这类蛋白的全新设计也具有重要的意义。近年来,随着多肽固相合成手段的改进和发展,使其成为快速、准确地研究DNA与蛋白识别的一个具有潜力的发展方向,主要有以下几种连接方式:(1)二硫键(S—S)

天然bZIP蛋白是由拉链区形成二聚体。如果在GCN4碱性区的C末端接上Gly-Gly-Cys,两个单体可通过Cys氧化生成的二硫键达到形成二聚体的目的,这样简化后的蛋白仍能与DNA位点特异性结合。Talanian等利用这一模型研究了与DNA特异性结合所需氨基酸序列的最小长度,他们通过CD、NMR和足迹实验证实20个氨基酸残基已具有与天然蛋白相同的结合能力,参与DNA特异性结合的残基位于231~245之间,得到了与复合物晶体结构相同的信息,这充分说明了这[68]一模型的可行性。[69]

Ebright等利用这种连接方式连接两个不同类bZIP蛋白的碱性区,得到异型二聚体,研究了它们与非对称性DNA位点识别的特异性,这是一种非常有效的研究全新DNA识别专一性的方法。[70]

Verdine等利用二硫键(S—S)将一些短肽(19~24)共价结合到DNA的半位点上,以消除扩散过程和结合过程中不利的能量因素,来研究GCN4蛋白的碱性区与DNA的两个半位点结合时的能量差异和结合强度。从他们的研究结果看,正是由于GCN4蛋白的碱性区与DNA的两个半位点的结合强度明显不同,导致了GCN4二聚体与DNA结合热力学上的不对称性。(2)环糊精(β-cyclodextrin-adamantyl group)

蛋白质与DNA之间的识别作用是一个协同过程,尤其是在亮氨酸拉链结构域中,拉链区蛋白-蛋白间的相互作用对于增强蛋白与DNA特异性结合的选择性起重要作用,但是利用天然蛋白很难研究这种协同作用。Morii等利用环糊精主体(β-cyclodextrin,CD)、客体(adamantyl group,AD)来模拟拉链区的非共价的特异性结合作用[71],利用固相合成方法将主体β-CD与客体AD连在两条不同类的bZIP蛋白的碱性区,形成杂合二聚体,来研究这种杂合二聚体对不同的DNA序列的特异性识别。此后,他们又利用β-CD与AD的包合作用使GCN4的碱性区形成二聚体和三聚体,来识别含重复DNA半位点的[72]序列,研究蛋白-DNA作用的协同性。(3)过渡金属复合物[bis(terpyridyl)iron(Ⅱ) complexe]

bZIP的拉链区通过平行螺旋超卷曲将两个单体组装成二聚体,这种“叉式”构型固定了与DNA结合的单体碱性区的空间关系。碱性区的这种组装方式和方向稍有变化,就会影响蛋白与DNA的结合。为了认识形成二聚体的结构单元对bZIP蛋白的DNA特异性识别能力和亲和[73]力的影响,Schepartz等对GCN4蛋白进行设计,将具有一定空间构型的过渡金属复合物组装到GCN4蛋白的碱性区,形成不同方向和间距的二聚体,利用凝胶电泳法研究了这些改造的蛋白与DNA的特异性识别作用。1.3.2 对识别机制的研究

尽管对bZIP蛋白的结构及其与DNA的特异性识别作用进行了详细且深入的研究,但对bZIP蛋白与DNA识别的动力学过程,尤其是其识别机制的研究却非常少。DNA与bZIP蛋白二聚体复合物的形成有如图1-4所示的两种机制:①bZIP蛋白的两个单体先形成二聚体,然后二聚体再与DNA结合;②bZIP蛋白的一个单体先与DNA结合,然后第二个单体再结合到DNA上并形成二聚体。既然这两种结合途径构成一个热力学循环,那么不论它们的结合是通过单体途径、二聚体途径,还是这两种途径的某种混合途径,bZIP蛋白对于DNA的亲和力应该是等同的,但是单体途径可以为最终复合物的形成提供一个更快的路径[74]。

由于没有DNA时,在溶液中bZIP蛋白本身以二聚体的形式存在,而且没有观察到bZIP蛋白单体与DNA形成的复合物,因此,目前大家普遍接受的是第一种机制,即bZIP蛋白的两个单体先形成二聚体,然后二聚体再与DNA结合。最近,Schepartz和Bosshard等的动力学研究表明,bZIP蛋白与DNA的结合遵循的是第二种机制,即bZIP蛋白的[75,76]单体先与DNA结合,然后第二个单体再结合到DNA上。他们通过对一个含ATF/CREB位点(ATGACGTCAT)的DNA序列与一系列含bZIP结构域的多肽进行识别研究,来驳斥第一种机制。在生物体内存在动态平衡,物质的浓度分布是不均匀的。在浓度较大的区域,二聚体途径可能占主导地位;但是在浓度稀薄的区域,单体途径就有可能成为主要的识别方式。

Schepartz同时提出在单体结合途径的第二步中(即图1-4所示的④步骤),也可能存在两种继续结合的方式,含有两种中间体,有两种可能的途径。①单体-DNA的复合物先与另一单体二聚,然后再与DNA结合;②单体-DNA的复合物中的DNA先与另一单体结合,然后两个单体再二聚(图1-5)。这一设想取决于形成二聚体与单体结合速率的差别,也有可能是混合过程,暂时无法由实验证实。图1-4 bZIP蛋白与DNA的两种识别机制图1-5 单体-DNA复合物形成最终二聚体-DNA复合物的两种途径

近年来,已陆续有单体结合的文章发表。Goddard的研究小组设计并合成了v-Jun蛋白的只含有DNA结合部位的单体。足迹实验证实单体可以与DNA结合位点特异性结合,只是结合力比二聚体弱得多,[77]从而影响了单体与DNA结合的被发现。[78]

Taylor等对单体结合进行了动力学研究,经过设计,他们在单体肽的C末端加了一个稳定螺旋的残基赖氨酸。经过用荧光测定肽与DNA的解离常数,确定加赖氨酸的单体肽比不加赖氨酸的单体肽与DNA结合的自由能增加1.1kcal/mol(1cal=4.18J)。这个结果说明在天然GCN4蛋白中,由亮氨酸拉链区二聚形成的螺旋对碱性区与DNA结合的亲和力有很明显的贡献,即碱性区形成螺旋的倾向性越大,形成的螺旋越稳定,则与DNA结合的亲和力越大。1.3.3 对折叠过程的研究

GCN4亮氨酸拉链区的折叠过程是一个简单的二态模型,在两个去折叠的单体肽链和一个折叠的超螺旋二聚体之间,在这中间没有明显的稳定的中间体态存在。超螺旋折叠过程中的活化态没有完整的结构,而且与折叠好的超螺旋结构相差很远,这时超螺旋和超螺旋的疏水界面都没有很好地形成。实验表明,折叠的速率甚至接近了两个去折叠的肽链遭遇的扩散速率,因此,折叠和结合确实是共同进行的。一种假设认为超螺旋形成遵循“疏水坍塌”机理,两个去折叠的单体通过决速步的中间体结合。在中间体态大多数疏水面被认为是被埋藏的,螺旋结构还没有很好地形成,随后螺旋在非常快的、能量上降低的反应中形成。另一种假设是扩散-碰撞模型,含有部分螺旋的单体结合形成超螺旋。

突变是对亮氨酸拉链区折叠过程最好的研究方法。J.C.Hu研究小组将16位的Asn移动到9位,这种突变使得GCN4的热变性呈现三态的[79]形式。他们认为这个去折叠过程是突变体首先从它的N末端开始去折叠,并且它从寡聚特异性的二聚体改变成一个部分去折叠的中间体,这个中间体是二聚体和三聚体的混合物,然后完全地去折叠成无结构的单体。[80]

周海梦研究小组用圆二色谱(CD)测定了不同浓度SDS下GCN4的构象变化,认为SDS有效地诱导了亮氨酸拉链二聚体的解离,并且这时仍然有部分折叠的单体存在。这个实验结果支持了扩散-碰撞理论,即部分螺旋的形成先于二聚。

正常的从N端到C端的GCN4序列有很好的结构和功能,那么如果序列反过来会怎么样呢?对大多数蛋白来说,反向序列合成的蛋白大多数都没有结构,但是有少量蛋白是有结构的。M.G.Grutter小组[81]反向合成了GCN4的亮氨酸拉链区,并在N端加了一个半胱氨酸,从晶体结构来看,形成了四聚体,是一个稳定的、平行的四螺旋束。这个结构可用来研究序列方向性对蛋白质折叠的影响,从而探讨一级结构是如何影响三级结构的。1.4 研究方法简介1.4.1 圆二色谱法

圆二色(circular dichroism,CD)谱法是研究分子结构不对称性的方法,很多生物大分子,如蛋白质、多肽、核酸、糖等都具有光学活性,因此CD是一种应用广泛的测定生物大分子在溶液状态下构象的方法。与X射线衍射和核磁共振NMR相比,虽然CD谱提供的信息量较少,只能确定蛋白质中以哪种二级结构为主、估计各种二级结构单元的大致含量,但是CD谱对蛋白质和多肽的构象极为敏感,所需样品量极少。它的快速和高灵敏度已使它广泛应用于生物大分子的分子识别研究中。

一束平面偏振光通过光学活性分子后,由于左、右圆偏振光的折射率不同,偏振面将旋转一定的角度,这种现象称为旋光(optical rotation)。光学活性分子不仅对左、右圆偏振光的折射率不同,对它们的吸收也不同,从而使左、右圆偏振光透过后变成椭圆偏振光,这[82,83]种现象称为圆二色性。圆二色性可用左、右圆偏振光的吸收率差ΔA、椭圆度θ和摩尔椭圆值[θ]来度量:ΔA=A-A或Δε=ε-ε   (1-1)LRLRθ=2.303(A-A)/4   (1-2)LR[θ]=3298(ε-ε)≈3300(ε-ε)   (1-3)LRLR22

[θ]的单位是度×厘米/分摩尔[(°)cm/dmol]。在蛋白质研究中,常常使用单位残基摩尔椭圆度,这时的浓度要用肽键的摩尔浓度来计算。

20种氨基酸残基中的紫外生色基团有吲哚基、酚羟基、苯基、二硫键、咪唑基和羧基等,当这些生色基团受到不对称碳原子或其他不对称结构的影响时,在它们各自的吸收区域里表现出圆二色性。除甘氨酸外,所有氨基酸都含有至少一个不对称的碳原子,因而它们都是具有光学活性的,但它们的CD信号都很小。而多肽和蛋白质的构象,即空间中不对称的、周期排列的肽键,能够产生较强的CD信号。根据模型肽和蛋白质CD谱的研究,人们发现不同的蛋白质的二[84,85]级结构都有其特征的CD谱(图1-6)。图1-6 蛋白质的典型CD谱1—α螺旋;2—β折叠;3—无规卷曲

典型的α螺旋构象的CD吸收峰最强,也最具有特征,表现在208nm和222nm处有两个负峰,分别对应于跃迁和跃[86,迁,以及190nm附近的正吸收峰,这是由跃迁所贡献的87][88]。α螺旋的CD谱与螺旋的长度有关。平行和反平行的β折叠的CD谱吸收强度稍弱,峰形也简单一些,表现为在217nm附近有一负峰,195nm附近有一正吸收峰,分别对应于n-p*跃迁和p-p*跃迁[89]。与α螺旋相比,β折叠的CD谱峰的位置,正、负峰的比例和大小与多肽的侧链、溶剂以及环境因素有很大的关系,而且β折叠的形成涉及一系列氢键的协同形成,因此其CD谱也与折叠片的长度有关。无规卷曲则给出200nm附近的负吸收峰,以及220nm附近或正或负的小而平的峰。

酪氨酸和色氨酸等芳香性残基常常被埋藏于蛋白质的疏水核心,受蛋白质内部不对称环境的影响,它们在近紫外区存在特征CD谱,这是研究蛋白质三级结构和疏水核心形成的重要依据。二硫键也常常[90,91]表现出一定的圆二色性,芳香性残基在远紫外区也有一定的CD吸收,在研究蛋白质构象时应考虑它们的影响。

如上所述,蛋白质各种二级结构都有其特征的CD谱,因而蛋白质的CD谱可用来定量计算蛋白质的二级结构含量。现已开发出很多[92]用CD谱来计算蛋白质的二级结构含量的程序,这些程序都是基于蛋白质远紫外CD谱是各二级结构贡献线性加和的假设,即:   (1-4)åf=1   (1-5)i

式中,f为二级结构分数;θ为二级结构的标准CD谱的值。不同ii的计算方法区别在于CD谱的波长范围、选择的基本二级结构的种类和数目、标准CD谱的确定以及算法等方面的差异及式(1-5)是否为限制式等。

早期标准CD谱一般取自模型多肽的CD谱。20世纪60年代,[93]Fasman等以多聚L-赖氨酸的数据为标准提出了用222nm和208nm处的椭圆值按下式计算蛋白质的螺旋含量的公式:   (1-6)X=(-[θ]-4000)/(33000-4000)   (1-7)H208

这种以单波长数据来计算二级结构的方法只适合计算α螺旋含量较高的蛋白质的螺旋含量,因为α螺旋的CD吸收较强,尤其在208nm和222nm处,α螺旋为主要的贡献者。这种方法的优点是能够快速并准确地测得208nm和222nm的CD值。但这种方法对α螺旋含量比较少的蛋白质,由于其他结构因素,如β折叠、转角和芳香环的影响等而不适用。对于只包含单一α螺旋构象的肽来说,可按式(1-8)计算其α螺旋的含量:X=([θ]+2000)/([θ]+2000)   (1-8)H222H

式中多肽和蛋白含100% α螺旋含量的[θ]值为-28400(°)·H2cm/dmol,将无规卷曲构象在222nm处的[θ]值设定为-2000(°)·2cm/dmol。

现在已发展了多种程序可以从一系列已知结构的蛋白质的CD谱解析式[式(1-4)、式(1-5)]得到样品的CD谱。从CD谱分析蛋白质的二级结构最简单的方法是用最小二乘法将蛋白质的CD谱与标准谱拟合(多重线性回归)。在限制性多重线性回归方法中,如[94~96]LINCOMB程序,二级结构的总量等于1;而在非线性多重回[97]归方法中,如MLR程序,则不限制二级结构的总量。Johnson等[98,99]提出了SVD算法,SVD是一个多组分分析的本征矢量方法,可从一组CD谱中提取正交的基本谱。SVD算法不限制各二级结构的总和为1。为了结果可靠,Johnson认为CD谱必须测到184nm。与多重线性回归相比,SVD提高了计算α螺旋的准确度,β折叠没有改善,而转角的计算变差。Johnson开发的VARSLC程序,通过检验所有的参考蛋白的CD谱的组合,排除对计算结果影响不好的参考蛋白,再反复进行拟合,结合SVD方法,显著提高了对各二级结构计算的准确度。我们主要采用VARSLC程序来计算蛋白的二级结构含量。

与蛋白质一样,核酸(DNA和RNA)也是具有光学活性的生物大分子,因此CD谱也广泛用于研究核酸在水溶液中的构象。对DNA纤维的X射线研究显示DNA以三种不同的构象存在,即A、B、C型构象,其中绝大多数DNA分子采取B型构象,这三种构象很容易通过CD谱区分开来。纤维中的相对湿度、离子种类和强度等条件决定它形成何种构象。改变体系中的盐的浓度和种类可以使DNA分子从一种构象转化为另一种构象。此外,溶液的酸碱度、有机溶剂和温度等对DNA的构象也产生很大的影响。

在蛋白质-DNA的识别研究中,CD谱是一种非常重要的、有效的研究手段。不论是蛋白质分子还是DNA分子发生了构象上的变化,都可以通过CD谱观察到。蛋白质分子和DNA分子的CD吸收是互补的,在190~230nm之间,蛋白质的CD吸收很强,而DNA分子的CD吸收,尤其是B型DNA的CD吸收相对较弱;而在240nm以上,DNA的CD吸收很强,蛋白质的吸收则很弱。1.4.2 等温滴定量热法

等温滴定量热(isothermal titration calorimetry,ITC)法以其高灵敏度、高自动化、快速响应和快速平衡等特点,成为基础研究和药[100~104]物工业中进行药物设计的重要方法。

所谓ITC就是在一定温度下,将一种反应物滴到另一反应物(通常为大分子)中,通过监测反应物结合过程中的热效应,进行热力学分析,可定量计算出反应的焓变、熵变、结合常数K、b结合位点数n和结合自由能等热力学参数。自1970年以来,ITC就广泛应用于酶-底物、大分子-配体相互作用以及配体或pH变化引起[105,106]的生物大分子构象变化的热力学性质的研究中。但是,由-3于仪器灵敏度的限制,只能监测到10cal或更大热效应的反应,因此,只局限于研究结合热效应足够大的生物分子识别作用,而且结合常数44也只能局限在10L/mol的水平上。对于亲和力高于10L/mol的结合反应,ITC只能测出结合焓,得不到结合常数。随着现代科学技术的发展,仪器灵敏度迅速提高,ITC已能准确地检测到0.5μcal的热效应,-6可研究极稀(10mol/L)或更稀溶液中生物分子之间的相互作用,10这样就能研究强结合力(10L/mol或更高)的生物体系。

ITC具有以下特点:①与其他分析手段相比,不必修饰或标记反应物分子,ITC测定的是溶液中处于天然状态下的分子之间的相互作用,避免了由于化学修饰、标记等可能引起的复杂作用;②由于生物体系中生物分子之间的相互作用通常都伴随着能量的变化,并以热效应的形式表现出来,因此与各种谱学方法相比,ITC原则上可以应用于生物体系的各种类型的结合反应,如蛋白-蛋白相互作用、酶-药物的相互作用等;③反应后的样品可以回收,进一步用于其他方法的研究;④程序化控制滴定反应,自动化收集数据,在一次滴定实验中就能测得全部热力学参数(K、n、、、),测定不b同温度下的结合反应还能获得的信息。

ITC的检测系统主要由热流传感器(TED)和内部恒温水浴组成。热流传感器由半导体热电堆制成,位于样品池、参比池和由大金属块制成的热装置之间。两个池子一个作为反应池,一个作为参比池,反应池装有搅拌系统,实验开始前,被滴定的生物大分子(如蛋白质)装入反应池,参比池通常装有等体积的缓冲液,起热参比的作用。仪器平衡后,滴定的样品(如配体小分子)由注射器滴加到反应池中进行反应。热流传感器检测两池之间的微热量变化,并转化为电信号输出,再经TED放大器放大,放大倍数可达30000,这样就大大提高了检测灵敏度。放大了的电信号再由数字转换器转化为数字信号,由内部处理器读取,经串行接口输入计算机中。整个实验过程,从实验设计、滴定反应到数据收集都由计算机自动控制,仪器配有相应的软件进行热信号积分和热力学参数K、n、等的计算。因此ITCb具有高灵敏度、信号响应快、噪声低以及操作简便等优良特点。

生物体系中的许多功能都是由生物分子之间的相互作用来实现的,如激素或毒素与受体的结合,信号肽-膜的相互作用,以及蛋白-核酸的相互作用等。ITC可以提供这些结合作用的热力学信息。在ITC实验中,一次滴定反应所放出或吸收的热量为:q=VΔHΔ[L]   (1-9)b

式中,q为配体与受体结合时的热效应;Δ[L]为结合配体的b浓度变化;ΔH为摩尔结合焓;V为反应溶液的体积。q与结合到受体上的配体浓度有关,逐步滴加配体分子,结合趋于饱和时,q值逐渐减小,达到饱和时,q为零。图1-7(a)示出了典型的滴定曲线。

反应的总热效应与结合配体的变化总量成正比:Q=VΔHåΔ[L]=VΔHå[L]   (1-10)bb

式中,Q为总的热效应;[L]为结合配体的总浓度。从式b(1-10)中可看出,反应所放出或吸收的总热效应Q是配体总浓度的函数,[L]是自变量,Q和[L]可由实验直接测定。bb

要从实验数据计算结合常数K和焓变等热力学参数,必b[107~109]须建立正确的结合模型,然后根据模型对反应等温线进行最小二乘法拟合,图1-7(b)所示为典型的拟合等温线。下面简单介绍目前广泛采用的独立的多位点结合模型的数学处理方法。图1-7 典型的ITC滴定反应曲线(a)与拟合等温线(b)

在这一模型中,大分子具有多个独立的结合位点,每个结合位点对配体都有相同的结合力。式(1-10)中,结合总热效应与结合的配体浓度成正比,同样,对于存在多个独立结合位点的体系,已结合的配体的浓度可表示为:   (1-11)

式中,[L]为结合在位点i上的配体浓度;[M]为大分子b,itot的总浓度;K为位点i的结合常数;n为位点i上结合的配体数;[L]ii为自由配体的浓度。

结合反应的总热效应Q由每个位点的热效应的加和得到:   (1-12)

式中,ΔH为位点i的摩尔结合焓。Q可用结合配体的总浓度表示,i这样通过拟合总热效应Q或每次滴定的热效应q(第j次滴定的热效应为q=Q-Q),可得出n、k和ΔH等热力学参数。jjj-1iii

目前,等温滴定量热技术已广泛地应用于生物体系的分子识别研[110~115]究中,主要涉及以下几个体系:酶-抑制剂、蛋白-蛋白、蛋白-离子、抗原-抗体、蛋白-脂、蛋白-糖、蛋白-核酸等的相互作用。随着对各种反应体系的结合热力学性质的深入研究,人们对生物分子行使其生物功能的认识加深了。1.5 研究意义和研究设想1.5.1 研究意义

对于生物大分子之间识别作用的研究,不仅有助于人们探索生命的本质,而且对揭示生物信息传递与生物调控的奥秘具有重要的理论意义。DNA的启动子和增强子由结合蛋白的DNA位点构成,只有当这些启动子与增强子的位点被相应的蛋白结合后,基因才开始大量表达。细致地研究蛋白质与DNA之间特异性识别的分子机制,就可以揭示蛋白质对DNA的调控作用。系统地研究一种DNA结合蛋白的识别机制,对其他基因转录过程的研究具有一定的指导作用。

GCN4蛋白的碱性区与DNA结合前后发生了由伸展构象到高度的α螺旋构象的变化,在这一体系中,识别不是简单的蛋白质与DNA互补界面的刚性结合,而是类似于酶-底物专一性识别作用的“诱导契[116]合”(induced fit)模型,GCN4蛋白与DNA的识别是以典型的[117,118]这种诱导契合模型相互作用的。虽然酶-底物的这种专一性识别的构象变化已被广泛研究,但是引起蛋白构象变化的GCN4与DNA的专一性识别的热力学因素却尚未清楚,而且各种因素对GCN4与DNA分子识别的影响也没有被全面地描述。1.5.2 研究设想1.5.2.1 GCN4蛋白的单体肽与DNA的识别研究

溶液中GCN4本身以二聚体的形式存在,并以二聚体的形式与DNA结合,因此普遍认为,形成二聚体是GCN4序列特异性识别其DNA位点的前提条件。然而,最近的动力学研究对GCN4识别其DNA位点时先二聚再结合的这种动力学机理提出了质疑,但是还没有监测到单体GCN4结合DNA的热力学证据,因此我们进行了单体GCN4与DNA相互作用的热力学研究。

我们利用CD和ITC详细研究了GCN4单体肽与DNA的识别作用,研究结果表明GCN4的碱性区,即模型肽能以单体的形式专一性识别其二聚体的DNA结合位点AP-1和ATF/CREB。用CD监测到单体GCN4与DNA结合后螺旋含量大大增加,并且形成的复合物的热变性曲线呈典型的S形曲线,这都说明单体肽与DNA结合位点的识别是特异性的。ITC测得反应焓变随温度的变化关系决定了比热容变化ΔC为负值,p这是GCN4的单体与DNA特异性结合的一个证据。实验结果对认识GCN4在行使其转录调控作用中识别其DNA结合位点的机理具有一定的启示。1.5.2.2 GCN4单体肽与DNA半位点的识别研究

从GCN4与DNA结合的识别机制中的单体途径可以看到,第一步是GCN4单体与DNA的半位点结合,然后另一个单体再结合上去。文献中已经有关于GCN4二聚体和DNA半位点结合的电泳实验报道[119],但是还没有GCN4单体识别DNA半位点的报道。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载