RNA干扰技术(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-10 20:50:25

点击下载

作者:金由辛、赵波涛、马中良 编著

出版社:化学工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

RNA干扰技术

RNA干扰技术试读:

前言

美国斯坦福大学的安德鲁(Andrew Z Fire)和马萨诸塞大学医学院的克雷格(Craig Mello)在进行线虫基因沉默研究中,分别注射肌肉蛋白的正义、反义和双链RNA。结果表明,双链RNA的抑制效果是单链RNA的10~100倍。他们将这种双链RNA抑制基因表达的现象称为RNA干扰(RNAi),把引发RNA干扰现象的RNA称为干扰RNA(iRNA)。研究论文发表在1998年的《自然》(Nature)周刊上,他们因此获得了2006年诺贝尔生理学或医学奖。我们不说此前的矮牵牛花实验,该实验导致了共阻遏的发现。我们也不追溯到此前发现的miRNA,如let-7和lin-4。仅从1998年安德鲁和克雷格工作算起,RNAi研究已经走过了近15个年头。15年后的今天,RNA干扰,包括miRNA,已经成为被广泛应用的非常有效的敲低基因表达的工具。它们本身也成为探索生命奥秘的工具,构成生命科学研究的前沿和热点。而早在此项目获得诺贝尔奖以前,一些大制药公司已经将此技术引入到了制药研发工作中。如今,它正在生命科学研究中发挥着重要作用,也必将在医药领域有非常好的应用前景,必将会造福于人类。

应化学工业出版社傅四周先生的邀请,我于2011年底开始组织人员,编写本书。参与此书编写的有:上海大学生命科学学院的马中良(博士、副教授,编写第二、三章);韦嘉励(博士、讲师,编写第四章和第五章部分内容);赵波涛(博士、讲师,编写第六、七章);我则写了第一章。另有中科院深圳先进技术研究院医药所的金言(博士,研究组长)完成了韦嘉励博士未完成的第五章。初稿完成后,由中科院华南植物园植物研究所的董志诚(博士、研究员)对第六、七章进行了文字修饰,由我进行了审校。金言审校了第一章,与我共同修改了其他几章,并提出大修意见。对各编写人员修改后的第二稿,上海大学生命科学学院的李艳利(博士、副教授)对第二、三章进行了修改,再由我对第二至第五章进行审校。李艳利对全书的插图进行了统一格式等的改动。本组的研究生参与了本书的绘图及文字校对工作,最后由我为全书定稿。在此,我衷心感谢所有为此书的出版付出辛勤劳动的各位博士及在读研究生。上海大学生命科学学院教授中科院上海生科院生化细胞所退休回聘研究员金由辛2013年7月英文缩略语续表续表续表第1章 绪论1.1 RNAi的发现史

20世纪70年代末,在原核生物中发现一类小分子RNA(长度为100~300个核苷酸)。大肠杆菌细胞膜上有孔,膜孔由OMPF(由ompf基因编码)和OMPC(由ompc基因编码)两种蛋白组成。在任何情况下,组成膜孔的这两种蛋白的物质的量总量是恒定的。但在不同生理条件下,它们的比例是不同的。原来ompc基因的表达受到生理状态的调控,而该基因转录出作为OMPC蛋白合成的模板mRNA时,也转录出一个长度为174个核苷酸(nucleotide,nt)的RNA。这种小分子RNA可以与ompf mRNA的部分序列反向互补配对,由于小分子RNA的占位现象而抑制了ompf mRNA的翻译,因此ompc mRNA翻译越多,ompf mRNA翻译越少。通过这种方式保持了两种蛋白总量的恒定,而两种蛋白的比例可随生理条件的变化而变化。这种小分子RNA与靶mRNA(通常被称为正义链)反向互补,因此被称为反义RNA。这是第一次发现RNA具有调控功能。

此后,虽然很多实验表明,在真核生物中也可能存在反义RNA,但一直未能在真核生物中找到天然的反义RNA。而依据反义RNA的原理,如果人为将反义RNA或反义寡脱氧核苷酸(oligodeoxynucleotide,ODN)导入真核细胞,常常可以成功抑制靶mRNA的翻译。因此,反义RNA和反义ODN这两种技术被广泛应用于生物和医药研究中。如1986年,在烟草植株中高表达反义nos RNA,引发了nos基因沉默。因为它由反义RNA引发,所以被称为反义沉默。沉默的意思是使基因不被表达。

20世纪90年代初,科学家在矮牵牛花中导入与花青素合成有关的查尔酮合成酶基因。原以为转基因的牵牛花会变得更鲜艳,结果却发现,一些花反而被漂白了。这种过度表达内源基因而引发的基因沉默被称为共阻遏。

在上述研究的背景下,幸运的安德鲁(Andrew Z Fire)和克雷格(Craig Mello)摘得了那只已经熟透了的最大的“桃子”。他们在进行线虫基因沉默的研究中,分别注射肌肉蛋白的正义RNA、反义RNA和双链RNA(double-stranded RNA,dsRNA)。结果无论是注射正义RNA,还是反义RNA,均未发现子代线虫有任何表型的变化,但被注射dsRNA的子代线虫则发生了罕见的抽搐运动。这表明肌肉蛋白的翻译受到了抑制,发生了基因沉默(图1-1),并且这种影响可以遗传给子代。他们将这种dsRNA抑制基因表达的现象称为RNA干扰(RNA interference,RNAi),把引发RNAi现象的RNA称为干扰RNA(interference RNA,iRNA)。研究论文发表在1998年的《自然》[1](Nature)周刊上。他们因此获得了2006年诺贝尔生理学或医学奖。图1-1 RNAi实验示意图给线虫分别注射正义RNA、反义RNA和dsRNA,前两种注射物对子代线虫的行为无影响,而注射dsRNA的线虫,其子代发生了罕见的抽搐运动

此后,RNAi现象被证明广泛存在于真菌、线虫、果蝇、植物、动物等多种生物中。在上述的烟草反义沉默中,外源导入基因表达的反义RNA和内源的正义RNA,可形成dsRNA。在共阻遏中,过度表达的正义RNA的高级结构内,存在dsRNA区。因此它们引发的基因沉默,同样是由dsRNA造成的。

2001年,三个实验室同时分别在线虫、果蝇和人中发现一类长度在21~22nt的小分子RNA。这是另一类与RNAi技术有关的RNA[2]——微小RNA(microRNA,miRNA)。miRNA是一类单链RNA(single-stranded RNA,ssRNA),长度与小分子干扰RNA(small interfering RNA,siRNA)相仿。由此向前追溯,1993年发现的线虫lin-4和2000年发现的线虫let-7可以被认为是最早发现的miRNA,它们参与控制线虫的发育时序。let-7(22nt)中一个核苷酸的突变就能使线虫停留在幼虫期,不能成熟,而以前人们认为它们可能是反义RNA。此后几年间发现了大量的天然miRNA,它们来源于斑马鱼、果蝇及其他高等动植物。它们的功能涉及细胞分化、发育生长、细胞凋亡、癌症发生、生物对称性等多个方面。2001年,Elbashir发现长度在30nt以下的短双链siRNA,比以前使用的长dsRNAi技术有更[3]高的专一性,更小的副反应。从此,siRNA技术得到了广泛应用,RNAi技术也得到了突飞猛进的发展。1.2 发现RNAi的意义1.2.1 RNAi的生理意义[4]

RNAi是一种内源机制,其生理意义有五:1.2.1.1 生物的防御机制

RNAi被发现以前,在植物病毒研究中就已发现,植物感染RNA病毒后会发生称为恢复的现象,即感染初期,植株带有大量病毒,植株局部有严重的感染症状,但随后植物组织内病毒数量开始下降,植株对诱导病毒和其他相关病毒会产生抗性。这种现象实际上就是病毒诱导的基因沉默,即在外来病毒诱导下产生的使病毒基因沉默的现象。在RNAi现象被发现后的研究表明,病毒诱导的基因沉默现象是由病毒RNA在滚环复制过程中产生的dsRNA引发的。这也使人们认识到,RNAi现象对于真核高等生物而言,是一种生物防御机制。对于DNA病毒,生物也可通过下述的DNA甲基化修饰途径,抑制病毒DNA基因的开放。1.2.1.2 调控细胞分化与胚胎发育

人有约200种不同的细胞,所有细胞均有相同的基因组。各种细胞是如何开放各自特有的约5000个基因,而特异地关闭其他约2万多个基因呢?原来在受精卵发育分化的过程中,不断有新的不同序列的siRNA出现,并启动染色体不同部位DNA的甲基化反应。siRNA通过碱基配对原理,指导DNA甲基化酶,结合到DNA的特异部位,引发该部位DNA中胞嘧啶的甲基化,这个过程称为从无到有的DNA甲基化合成。这种已被甲基化的DNA,在复制过程中可以指导DNA新生链中GC位点胞嘧啶的甲基化,这被称为甲基化的维持。DNA甲基化进而可引发染色质蛋白的甲基化、乙酰化、泛素化等,并进而造成该区段染色质的异染色质化,异染色质区段的基因被沉默。由于这种沉默依赖于siRNA的转录,因此被称为转录基因沉默(transcriptional gene silencing,TGS),这种方式在植物和动物中都可发生。上述过程是表观遗传学研究的内容。1.2.1.3 维持基因组的稳定

高等真核生物染色体中都含有相当数量的转座子等可移动元件,它们可诱发突变而危害生命。上述的DNA甲基化过程使转座子及移动元件区异染色质化,从而稳定了基因组。分析数据表明,细胞内大量转座子都处于异染色质区。1.2.1.4 RNA水平上的调控机制

遗传信息传到mRNA后,生物还可通过一些其他途径控制mRNA上遗传信息的阅读方式。其中的一种方式就是由siRNA(约21nt的双链;也包括miRNA,约21nt的单链)引发的转录后基因沉默(post-transcriptional gene silencing,PTGS)。细胞质中成熟的双链siRNA[1]与一些蛋白质因子形成分子质量约为5000kDa的“RNA诱导的沉默复合物(RNA-induced silencing complex,RISC)”。siRNA双链中的正义链被排除出复合物,RISC中的siRNA反义链(或miRNA)指导RISC结合到靶mRNA的相应位点,然后由复合物中的核糖核酸酶Ⅲ降解靶mRNA。TGS和PTGS都是生物调控基因表达的方法。1.2.1.5 siRNA的生物起源

一些报道提出了siRNA和miRNA在进化上的关系。RNA病毒的侵染,形成了基因组中的转座子(如L1和Alu等)。转座子可以引起各种DNA的改写事件。当一个蛋白基因被反向倍增,就形成了大发夹结构的转录物。这种转录物成为siRNA的前体。siRNA可以从一个发夹结构的前体上得到一系列长度基本固定而序列不均一的双链短RNA。序列不均一的siRNA中,很多序列是低效的。它们在靶mRNA上的结合位点,因各种原因(如有蛋白结合、处于紧密的RNA结构中等)不是最佳的结合位点。因为进化的压力,从siRNA前体的茎环结构中,逐渐进化出miRNA。miRNA同样来自发夹结构的前体。两者的区别在于,miRNA只从短发夹前体上成熟出固定的一种短ssRNA。

植物中miRNA的积累,需要DCL1、HEN1、HYL1和AGO1蛋白,但不需要DCL3和RDR2蛋白。后两种蛋白是siRNA积累时需要的。有些单链小分子RNA原来被认为是miRNA,而实际上,它们的积累却需要包括DCL3和RDR2在内的上述全部6种蛋白。因此,它们不同于一般的miRNA,而是一类新的小分子调控RNA,被称为是反式siRNA。miRNA与siRNA间的分界变得逐渐模糊。1.2.2 发现RNAi的科学意义1.2.2.1 分子生物学在方法学上取得了新的突破

RNAi技术使分子生物学在方法学上取得了新的突破。在后基因组时代,人们需要基因沉默技术使某一特定基因沉默,通过研究该基因沉默后的生理生化变化,来了解该基因的生物学功能。如果一种miRNA具有抑癌功能,那么这种miRNA即可发展成药物。如果一种基因的表达(如癌基因)可以引起疾病,那么它就是潜在的药物靶标,人们就可以通过基因沉默技术来抑制该基因的表达以达到治病的目的(称为基因治疗)。

RNAi已成为最常用的基因沉默技术。它比以往的其他基因沉默技术,如反义ODN、核酶等技术,更有效、更灵敏、更方便、更安全。Alnylam制药公司是世界上首家专注于RNAi药物开发的公司,在RNAi研究领域中处于领导地位。就在因RNAi技术获得诺贝尔奖的同一年(2006),国际大制药企业——Merck,即投入11亿美元进行[5]siRNA药物的研发。此后,大量制药企业跟进。目前能被RNAi技术沉默的基因数以百计,利用RNAi原理研制的药物也已进入临床研究。1.2.2.2 引起很多新RNA及RNA新功能的发现

RNAi的发现,促进了新RNA及RNA新功能的研究,并导致一系列新RNA和新RNA功能的发现。如2006年发现了从哺乳动物生殖细胞中分离得到的piwiRNA(piRNA,长度为24~33nt),它的主要功能是维持生殖系和干细胞功能。此后又相继发现了ra-siRNA、endosiRNA、Nat-RNA、scnRNA、tncRNA、lnRNA、isRNA(免疫小RNA,immunological small RNA)、qiRNA(抑制干扰RNA,quelling interfering RNA)等。同很多以前已经发现的,只是因为在原有认知框架下无法解释的事实,如小阅读框RNA(sORF RNA)、印迹RNA(imprinted RNA)、应激RNA(stress RNA)、双向转录、微卫星RNA、反转座子等汇集在了一起。真核生物体内,一个由RNA组成的调控DNA遗传信息的网络正在显露出来。1.2.3 科学在思想碰撞中前进

1893年科塞儿(Kossel A)认识到染色质是由核酸和组蛋白组成的。根据生理学的研究,他认为核质与新组织的形成有关。他与其学生们,发现了除鸟嘌呤以外的四种常见碱基和核糖。由于他在蛋白质(组蛋白的分离与命名)、细胞、细胞核化学(核酸)方面的贡献,他获得了1910年的诺贝尔生理学或医学奖。因此,科塞儿是核糖核酸研究的开创者、奠基人。但是,当时生物学界的主导观念是“生命就是蛋白质体”,即生命世界是蛋白质世界。科塞儿也未能跳出旧观念的束缚。他虽然认识到核质与新组织的生成有关,但他没有认识到,核质就是遗传物质。相反,他认为核质并不重要,他本人也因此于1905年起改为研究细胞核中的碱性蛋白质,这使核酸研究发展停滞了几十年。

20世纪50年代初,沃森(Watson)与克里克(Crick)在威尔金斯(Wilkins)关于DNA的X-衍射研究基础上,于1953年提出了DNA的双螺旋结构学说。该学说很好地解释了所有DNA的结构数据,也很好地解释了作为遗传信息携带者的DNA是如何复制、转录的。此后,核酸(DNA)携带遗传信息的观点被普遍接受。DNA的双螺旋结构学说,为分子生物学奠定了坚实的基础。他们三人也因此获得了1962年的诺贝尔生理学或医学奖。DNA双螺旋结构学说最大的贡献是,宣示了“生命世界是蛋白质世界”的破产。从此在人们思想中,生命世界是DNA-蛋白质二元世界。DNA研究进展促进了RNA研究,20世纪50年代中期后的10年间,成为RNA研究的黄金时期,RNA研究达到了它的第一个研究高峰。

但当蛋白质生物合成的基本框架产生后,人们对于生物大分子的注意力更多地集中于DNA和蛋白质。因为人们普遍认为,RNA只是遗传信息,是从DNA到蛋白质传递过程中的中介。从20世纪70年代后期起,RNA研究逐渐积累起各种新发现。经过20多年的积累,直到20世纪末、21世纪初,随着一系列调控RNA的发现,随着“人类基因组计划”的完成、后基因组研究的兴起,RNA研究再次达到另一个研究高峰。而这个发展过程,就是一个不断突破“中心法则”旧观念的过程。

1981年,切赫(Cech T)发现,四膜虫大核rRNA前体内的转录内含子,是通过自我剪接被除去的。这一反应不需要传统意义上的生物催化剂——酶。催化此反应的是RNA。他命名这种RNA催化剂为核酶(Ribozyme)。阿尔特曼(Altman S)在20世纪70年代末发现,大肠杆菌中参与tRNA前体加工的RNase P,含蛋白质和RNA两个组分。RNA组分是酶活力所必需。切赫发现Ribozyme后,阿尔特曼证明体外转录的RNase P的RNA组分,也有催化活力。两人为此共同获得了1989年的诺贝尔化学奖。

Ribozyme的发现,突破了统治生化科学超过半个世纪的一个信条:酶即是蛋白质。它还有助于人们理解探索生命起源过程中长期争论而无结果的问题:生命起源中,首先有蛋白质还是首先有核酸?生物高分子化合物共有三种,即DNA、RNA和蛋白质。DNA,可以携带遗传信息,但它不是功能分子,它的复制需要蛋白质催化。蛋白质,它是重要的功能分子。在生命体中,蛋白质无处不在,功能多样,它催化了生物体内的绝大多数反应。但它不携带遗传信息,蛋白质的生物合成需要使用DNA所携带的遗传信息。只有RNA,它既可携带遗传信息,又可作为功能分子。不需要借助其他生物高分子,RNA自己就有可能完成自我复制。因此,生命起源过程中,可能最早出现的,可以自我复制的生命体,是由RNA组成。更重要的是,Ribozyme的发现,使人们对RNA生物功能多样性的问题有了全新的理解。RNA的功能,不再局限于仅是将遗传信息从DNA传递到蛋白质的过程。人们开始寻找RNA可能具有的其他生物学功能。

20世纪70年代末,夏普(Sharp)和罗伯特(Robert)发现了断裂基因。为此,他们一起获得了1993年度诺贝尔生理学或医学奖。断裂基因继核酶之后,在生命科学界第二次卷起了狂澜,因为它突破了“中心法则”的藩篱。简单地说,“中心法则”的定义为:基因就是连续的DNA序列,DNA是RNA的模板,mRNA是蛋白质生物合成的模板。其核心是说明生命世界是DNA-蛋白质的世界。“中心法则”在原核生物研究中,起到了指导作用,对科学的发展功不可没。问题出在“法则”二字。该词的英文是dogma,原意是“教条”。当把在原核生物中正确的理论当成教条来指导真核生物研究时,问题就出现了。断裂基因的发现,说明在真核生物中,一些基因不是连续的DNA序列,是由两个或多个DNA片段拼接而成的。这个拼接过程是在RNA水平进行的。从DNA到蛋白质的过程,比以前想象的要复杂得多。RNA在其中所起的作用,超出了人们以前对RNA的想象。

在以后的近30年间,RNA新发现不断与“中心法则”发生冲突。1986年,RNA编辑(editing,一种RNA的修饰过程)被发现。RNA剪接和RNA编辑,使RNA从DNA那儿得到的遗传信息,在RNA水平得到了调制。它们都可以开放或关闭基因、改变mRNA的阅读框架,并在RNA水平增加或减少从DNA处获得的遗传信息。通过可变剪接或各种编辑,一种基因在不同的生理病理条件下,在不同的组织细胞中,也即在不同的时空中,可以得到不同的和/或多种蛋白质。

1989年,因发明DNA化学测序法而获得诺贝尔化学奖的吉尔伯特(Gilbert),提出了RNA世界(RNA world)的假说。该假说第一次将RNA摆在生命进化早期的生命中心位置。

此后,在RNA领域又相继发现了mRNA的再编码,snRNA、snoRNA等一批新的RNA种类,RNA的新功能,RNA作用的新机制。有趣的是,RNA研究还曾导致了蛋白质内含子和蛋白质剪接的发现。在比对一基因mRNA与对应蛋白的序列时发现,mRNA序列中的一段,没有存在于对应蛋白的序列中。

2000—2001年,美国《科学》杂志分别将当年十大科技突破的第二条和第四条,评给了RNA的催化功能和核糖体研究。核糖体50S大亚基晶体的高分辨率X衍射分析结果表明,催化蛋白质生物合成,即催化肽键形成的化合物,不可能是蛋白质,只能是rRNA。这说明:“核糖体是核酶”。它再次显示出RNA在生命世界中的重要性。由蛋白质组成的生物催化剂“酶”,几乎催化了所有生物体内的化学反应。但它本身的生物合成却只能由RNA催化。从古老的RNA世界中走出来的自私的RNA,它只是把蛋白质生物合成以外的催化功能交给蛋白质,最终还是把蛋白质生物合成置于自己的控制之下,也即把蛋白质置于自己的严格控制之下:蛋白质生物合成的场地(含rRNA的核糖体)、催化肽键形成的催化剂(作为核酶的核糖体)、蛋白质生物合成中的运转工具(tRNA)、蛋白质生物信息的来源(mRNA)。因此,与其说RNA将催化功能交给了蛋白质,不如说RNA把大量生物体内的催化职责交给了蛋白质。

2001—2003年的三年间,被美国《科学》杂志分别评为当年十大科技突破第二条、第一条、第四条的是RNAi以及包括siRNA和miRNA在内的小分子调控RNA。siRNA和miRNA参与基因转录沉默和基因转录后沉默等。遗传信息在RNA水平的调制,RNA调控功能等方面的事例更加显露。miRNA被称为是“生物领域的暗物质”,它就在我们的周围,但几乎逃离了我们的视线。

小分子调控RNA的发现,对于“中心法则”而言,成了压断骆驼脊梁的“最后一根稻草”。各种为了维护“中心法则”的托词,如“断裂基因中的内含子是进化的痕迹”、“内含子无功能”等,被人们遗忘了。于是,很多以前已经发现的,只是因为在“中心法则”下无法解释的事实,如小阅读框RNA(sORF RNA)、印迹RNA、应激RNA、双向转录、微卫星RNA、反转座子等汇集在了一起。真核生物体内,一个由RNA组成的调控DNA遗传信息的网络正在显露出来。从古老的RNA世界中走出来的自私的RNA,通过各种途径,最终仍然掌控遗传信息的管理与使用权。因此,与其说RNA将携带遗传信息的功能交给了DNA,不如说RNA把记录遗传信息的职责交给了DNA。一个隐藏在表象为DNA-蛋白质世界后面的,当代RNA世界的景象,已经若隐若现地出现在人们面前。在当今的生命世界中,RNA很可能像在古老的RNA世界中一样,仍然处于生命的中心。或者至少可以说,当代生命世界应该是一个RNA、DNA和蛋白质三者缺一不可的三元世界。RNAi现象的发现,正是打开了一扇新的大门,使人们看到了门内那灿烂的景象。它也将RNA研究推向学科发展的前沿和热点。错误的观念总是在阻挡科学的发展,科学总是在战胜错误的观念中前进。上述[4]历史的回顾,应该对当前我国大力提升创新能力有借鉴的作用。1.3 RNAi技术的应用

应用研究中,人们通常使用短dsRNA,因为长dsRNA在哺乳动物系统中常引发干扰素应答。归纳该技术应用的类别,可以分为以下几类。1.3.1 基因敲低

RNAi技术常被用于体内基因的功能研究。合成与目的基因互补的dsRNA,导入体内可显著降低基因的表达。通过检查基因功能的变化,可以知道该基因的生理功能。1.3.2 功能基因组学研究

大多数功能基因组学研究使用模式生物——线虫和果蝇,因为它们是RNAi技术使用最成功的两种生物。线虫特别用得多,因为线虫的基因沉默效果可以遗传到下代,且导入途径非常简单——用含dsRNA的大肠杆菌,喂养线虫。siRNA就可通过消化道进入线虫虫体。这种途径比花费更多且费时地把线虫浸泡于dsRNA溶液或把dsRNA注射到生殖腺的方法更有效。虽然将siRNA导入其他生物的方法更困难,但哺乳动物细胞中大范围的基因组筛选应用正在进行中。RNAi也已成功用于小麦、拟南芥和玉米等植物。1.3.3 医学上的应用

RNAi用于临床治疗是可能的,siRNA已成功用于医学。首先进入一期临床试验的有:黄斑变性、呼吸道融合病毒和肝功能衰竭等。RNAi在小鼠模型中已被证明可有效逆转诱导性肝衰竭。1.3.4 生物技术

RNAi技术已经用于食用植物的基因工程,生产出低天然植物毒素的产品。该技术的优点是具有稳定而且可遗传的RNAi表型。如棉籽中富含食用蛋白,但它天然含有毒素不能用于人类消费,而有抗病害的作用。RNAi可以仅降低种子里的毒素,而不影响该毒素在植物其他部分的抗病虫害的作用。1.3.5 全基因组筛选

RNAi全基因组研究,依赖于高通量筛选技术(HTS)。RNAi HTS技术可以在全基因组范围内进行功能缺失筛选。它被广泛用于特殊生物表型的鉴定。在基因芯片和单核苷酸多态性为代表的基因组学第一次浪潮后,该技术掀起了基因组学的第二次浪潮。全基因组范围的RNAi筛选,其主要优点是能够同时审核数以千计的基因。一次实验可以产生大量的数据,造成数据产生速度的大爆炸。因此,全基因组范围RNAi研究的主要挑战,来自从海量数据中收集生物学意义。这就需要采用近来为了分析RNAi筛选而出版的适合于统计学/生物信息学的方法。RNAi筛选的基本过程,包括:①选择RNAi库;②选择一些生长旺盛的稳定细胞株;③用选好的RNAi转染选好的细胞;④必要的处理或温育;⑤信号检测;⑥统计学或生物信息学分析;⑦决定重要的基因或治疗的靶向。

RNAi技术的产业化,却并非一帆风顺。2010年前后,有一些国际大药业公司感到RNAi药物的用药途径还不够完善。主要困难是进入细胞的效率不高和随之而来的高成本的问题。他们认为,RNAi药物还不太可能在短期内进入临床应用。因此,一些公司停止了RNAi药物的研发工作。不过,仍然有很多公司在继续研发工作。并且,纳米材料的迅速发展,正在迅速改变RNAi药物用药途径的难点。参考文献

[1]Fire A,et al.Potent and specific genetic interference by double-stranded RNA in Camorhabditis elegans.Nature,1998,391(6669):806-811.

[2]Lagos-Quintana M,et al.Identification of novel genes coding for small expressed RNAs.Science,2001,294(5543):853-858.

[3]Elbashir S M,et al.Duplexes of 21-nucleotide RNAs mediate RNA interference in cultured mammalian cells.Nature,2001,411(6836):494-498.

[4]金由辛.核糖核酸与核糖核酸组学.北京:科学出版社,2005.pp232.

[5]Ledford.Drug giants turn their backs on RNA interference.Nature,2010,468(7323):487.(金由辛 编写,金言 审校)-24[1]:1 1Da=1.67×10g,表示分子质量的大小。第2章 RNAi的基本原理

1998年,安德鲁和克雷格,首次在线虫中揭开了RNAi的神秘面纱。随后的研究中,在真菌、拟南芥、水螅、涡虫、锥虫、斑马鱼等[1]大多数真核生物中,均发现RNAi现象。这一现象揭示了,RNAi很可能是出现于生命进化的早期阶段,是生命活动中的保守机制。随着[2]研究的不断深入,RNAi的机制正在被逐步阐明,同时作为功能基[3]因组研究领域中的有力工具,RNAi也越来越为人们所重视。引起RNAi的小分子RNA,按照其前体的来源主要分两大类:小分子干扰RNA(small interfering RNA,siRNA)和微小RNA(microRNA,miRNA)。2.1 与RNAi有关的酶、蛋白

RNAi主要由两种作用类型的分子引起:一种是siRNA,另一种是miRNA。两种RNAi具有相互交叉的作用机制。其基本过程是:双链RNA(double-stranded RNA,dsRNA)经RNaseⅢ家族成员Drosha和Dicer蛋白剪切为21~25个核苷酸(nucleotide,nt)的siRNA(包含3′-端2nt突出单链)或miRNA。此后,siRNA/miRNA结合到RNA诱导沉默复合体(RNA-induced silencing complex,RISC)中,降解mRNA或影响蛋白质生物合成。表2-1列出了参与RNAi的酶及蛋白。2.1.1 Drosha蛋白

Drosha蛋白是一种核蛋白,分子质量约为160kDa,属于RNaseⅢ家族成员,在动物中高度保守。Drosha蛋白由富含脯氨酸的区域(P-rich)以及富含精氨酸和丝氨酸的区域(RS-rich)组成的N-末端、两个对催化至关重要的RNaseⅢ结构域(RNaseⅢdomain,RⅢD)和一个双链RNA结合结构域(double-stranded RNA binding [4]domain,dsRBD)组成(图2-1)。miRNA的转录是由RNA聚合酶Ⅱ或RNA聚合酶Ⅲ来完成的。miRNA初级转录本(primary miRNA,pri-miRNA)是由RNA聚合酶Ⅱ转录的,和mRNA一样,具有5′-端的7mGpppN的帽子结构和3′-端的polyA尾巴。pri-miRNA常常有几千个碱基长度,含有局部的发夹结构。这些发夹结构被核内的RNase Ⅲ类蛋白Drosha识别并切割,形成miRNA的前体(pre-miRNA)。pre-miRNA分子呈发夹结构,它的5′-端有磷酸基团,3′-端有2 nt的突出单链。两个RⅢD的中间区域对pri-miRNA的加工也是不可缺少的,但是P-rich和RS-rich的生物学功能仍不清楚。Drosha和其他辅因子形成一个很大的复合体,称为微处理复合体(microprocessor complex)。该复合体在果蝇中的分子质量约为500kDa,在人类中约为650kDa。Drosha蛋白可以非特异性地切割dsRNA,其自身的酶活性很低。通常需要另一种蛋白DGCR8(迪格奥尔格综合征关键基因,DiGeorge [5]syndrome critical region gene,该蛋白在线虫和果蝇中称为Pasha)的协助。DGCR8与Drosha结合后,增强了Drosha的催化活性,从而特异性地切割pri-miRNA分子。表2-1 参与RNAi的酶及蛋白[6][12]图2-1 五种siRNA/miRNA加工酶及蛋白的结构域Drosha 和Dicer:RNase Ⅲ结构域(RⅢD)是Dicer和Drosha等RNase Ⅲ的催化内切反应的催化结构域。这个结构域在Ⅲ类RNase中都是保守的。双链RNA结合结构域(dsRBD)在许多的双链RNA结合结构蛋白中也是高度保守的。富含脯氨酸的区域(P-rich)及富含精氨酸和丝氨酸的区域(RS-rich)的功能不清楚。PAZ结构域可以结合到小RNA的3′-端。DEAD解螺旋酶结构域利用水解ATP的能量解开RNA双链。DUF283结构域功能未知DGCR8和R2D2:dsRBD结构域结合dsRNA。WW结构域可以和P-rich结构域结合Exp-5:核转运受体存在于许多Ran依赖的核转运因子中,含有核转运受体(NTR)结构域2.1.2 DGCR8蛋白

DGCR8蛋白是Drosha的一个重要辅因子。DGCR8是一个含有两个dsRBD的蛋白,分子质量约为120kDa。它含有一个可能的WW结[4]构域,这个结构域能和特定的富含脯氨酸的序列结合(图2-1)。目前还不知道它是否和Drosha的富含脯氨酸的序列结合。DGCR8蛋白能够与pri-miRNA分子中形成发夹结构的碱基结合。它可帮助Drosha蛋白定位到酶切位点处。该位点有11个碱基对(base pair,bp),位于pri-miRNA分子的茎部,是双链茎部和侧翼单链RNA(single-stranded RNA,ssRNA)序列之间的连接部位。因此,DGCR8蛋白似乎是一个反式作用因子。其作用类似于Dicer蛋白的PAZ结构域,但PAZ结构域是顺式作用因子。人类DGCR8蛋白核心区域与RNA结合的两个dsRBD结构域的结合表面是不连续的,这说明DGCR8蛋白是分别与pri-miRNA分子茎环结构中两个不连续的部分结合。2.1.3 运载蛋白-5

运载蛋白-5(Exportin-5,Exp-5)属于核转运受体(nuclear transport receptor,NTR)家族,含有NTR结构域。其分子质量约为120kDa。Exp-5通过水解GTP获取能量。它将细胞核内生成的pre-miRNA运输到细胞质中。pre-miRNA在鸟苷三磷酸酶Ran(RanGTP)的协助下,与Exp-5结合。Exp-5:RanGTP可以识别pre-miRNA的3′-端突出的2nt及茎环结构中的茎区。这种识别不依赖于RNA的序列[7,8](图2-1)。Exp-5不仅有运输pre-miRNA的功能,而且还具有保护其不受核酸酶降解的作用。2.1.4 Dicer酶

Dicer是RNAi机制中的关键因子,是siRNA/miRNA生成的关键酶。它属于RNase Ⅲ家族成员,在进化上高度保守,是一种依赖于ATP的核酸内切酶。有些物种含有多个Dicer同源物,如在果蝇中,[9]Dicer-1(Dcr-1)负责pre-miRNA的切割,而Dicer-2(Dcr-2)则负责siRNA的产生。各物种的Dicer都具有相似的结构域,分子质量约为200 kDa。它们均含有多个结构域,除了两个RⅢD和一个dsRBD外,还含有DEAD解螺旋酶(Helicase)结构域、DUF283结构域和PAZ结构域(图2-1)。Dicer在切割dsRNA时,需要dsRNA结合蛋白的帮助。PAZ结构域可以结合到miRNA的3′-端。DEAD解螺旋酶结构域利用水解ATP的能量解开RNA双链。DUF283结构域的功能还不清楚。Dicer还和多种蛋白结合形成复合体,包括线虫的RDE-4、果蝇的[0]R2D2和FMR1及多种生物中的Argonaute家族蛋白。[1]

Dicer通过RⅢD和PAZ结构域间的距离(65Å)来辨识siRNA/miRNA的分子(长度为21~25nt)。RⅢD的活性中心可以将dsRNA切割成3′-端突出2nt的siRNA/miRNA,这是RNase产物的典型特征。在执行切割时,每个RⅢD只提供一个活性中心。两个活性中心相距约25nt RNA的长度。因此,产生的siRNA/miRNA长度为21~25nt(图2-2)。siRNA的长度可以通过微调两个RⅢD的距离来改变。Dicer 广泛存在于真核生物中,最早是在果蝇中发现的。随后在线虫、拟南芥、[10]人和小鼠等中都发现了同源基因。在植物中称为类Dicer蛋白[9,11](Dicer-like protein,DCL)。在不同的生物体中,Dicer或DCL[10]的数量,以及在RNAi途径中发挥的功能不尽相同。表2-2列出了不同生物中Dicer的种类及功能。[10]图2-2 兰氏贾第鞭毛虫(G.intestinalis)Dicer作用示意图dsRNA与Dicer结合。PAZ结构域与dsRNA的3′-端突出序列相连。两个RⅢDa/b结构域与PAZ之间以带正电荷的螺旋相连,其催化残基距PAZ 65Å。这段距离相当于一把尺子,决定了产物的长度约25nt表2-2 Dicer的种类及功能

在人类细胞中,Dicer并不是单独作用的,而是和一些蛋白伴侣,如AGO蛋白家族、TRBP(HIV-1 TAR RNA结合蛋白,HIV-1 TAR RNA-binding protien)、蛋白激活因子PKR(PACT)以及其他可[13,14]能的协同蛋白一起发挥功能的。研究显示,Dicer、AGO2、TRBP是RLC(RISC装配复合物,RISC loading complex)和短链[14,15]RNA有效形成的必要组成部分。2.1.5 TRBP蛋白

TRBP蛋白是dsRNA结合蛋白家族成员之一。在哺乳动物细胞中,TRBP蛋白作为Dicer的伴侣,协助双链siRNA进入RISC复合体中。TRBP蛋白有3个亚型,分别命名为TRBP1、TRBP2 和TRBP3。小鼠TRBP和人TRBP高度相似,具有3个主要结构域:2个dsRBD结构域和1个C-末端碱性结构域。其中,位于dsRBD结构域内部的65~70个[16]氨基酸折叠形成α-β-β-β-α的KR-螺旋模体(motif),可以高亲和力介导TRBP与dsRNA的结合。C-末端结构域主要介导蛋白质间的相互

[17]作用。TRBP蛋白C-末端结构域的69个氨基酸残基可以识别并结合Dicer的DEAD-box结构域和Helicase结构域中间的165个氨基酸序列。TRBP与Dicer相互作用并结合dsRNA,随后结合具有裂解dsRNA活性的AGO2蛋白,组成RISC复合体,诱导基因沉默。

TRBP蛋白可以结合双链siRNA,而不是与和它类似的siDNA或者siDNA/RNA杂合链结合。此外,单独的TRBP可以识别出siRNA双链的不对称性,从而确立了TRBP在人类RNAi通路中的关键作用。TRBP结合21nt ssRNA在一定程度上反映了与它配对的siRNA双链的不对称性,预示TRBP-RNA结合可能具有序列依赖性。2.1.6 Argonaute蛋白

对Argonaute(AGO)蛋白的晶体结构研究表明,它是一个由N-末端结构域、PAZ(PiWi-AGO-zwille)、中间结构域(MID)和PIWI结构域组成的月牙形结构。PAZ位于其余3个结构域组成的“叶柄型”的上方(图2-3)。PIWI结构域与核酸酶H相似,具有保守的Asp-Asp-Glu模体。这表明AGO符合沉默蛋白的结构功能。该模型认为,siRNA结合到PAZ结构域凹陷的3′-端,其5′-端结合凹陷的另一端。mRNA从N-末端和PAZ结构域之间进来,从PAZ和MID结构域之间出来。mRNA在PAZ“叶柄型”之间行进,并被PIWI域的活性位点裂解。[18]图2-3 极端嗜高温古细菌火球菌(P.furiosus)AGO蛋白的结构示意图A为AGO蛋白立体结构模拟;B为AGO蛋白中各个结构域的区间大小

AGO蛋白家族是RISC的核心元件,也是RNAi所必需的。目前已经分离出的AGO蛋白家族包括线虫中的RDE-1;果蝇中的AGO-1,AGO-2和Aubergine;锥虫中的TbAGO1和TbPWI1;人类细胞中的PIWI亚家族和eIF2C/AGO亚家族等。AGO蛋白是一个保守的家族,其分子质量约为100 kDa。它们都具有PAZ、MID和PIWI三个主要的结构域。其中,PAZ结构域由约130个氨基酸组成。结构上有一个带正电的凹陷处,可以辨认siRNA/miRNA的3′-端(带负电)并与之结合。RNase Ⅲ家族酶切割形成3′-端2nt突出单链结构。该酶识别RISC[19]中的小RNA结构。但这种结合不具核苷酸特异性。PIWI结构域只存在于AGO家族,约含有300个氨基酸。AGO蛋白的PIWI结构域包含类似RNase H的催化模体——天冬氨酸-天冬氨酸-组氨酸模体(Asp-Asp-His motif)。该模体具核酸内切酶活性,是RISC复合体中起切割mRNA作用的组分。其切割位点由RNA 3′-端结合位点和RNA 5′-端结合位点的间距决定,且多位于自siRNA/miRNA 3′-端10~11个碱基处。切割反应需要ATP的参与。MID结构域具有类似葡萄糖-半乳糖-阿拉伯糖-核糖-结合蛋白的构象,可形成一个与PIWI吻合的口袋型表面。该表面负责与siRNA/miRNA的5′-端结合,活化RISC并维持其稳定。它也使RISC与mRNA的正确位置结合。siRNA/miRNA与AGO蛋白的结合位点,位于MID与PIWI的连接处。该结合需二价金属离子的帮助,并偏好于具有小分子RNA 5′-端的碱基种类和非编码RNA(non-coding RNA,ncRNA)5′-端的磷酸化程度。因此不同的RISC能够选择性地结合特定的小分子RNA,进而行使不同的调控功能。许多真核生物都含有AGO多基因家族。该家族的成员在发挥其生物学功能时具有特异性(表2-3)。在RISC中,AGO蛋白是行使酶蛋白的功能,而siRNA/miRNA组分起到靶向定位作用。

根据AGO蛋白家族成员间的序列同源性,以及不同成员对不同ncRNA的偏好性等,可将AGO蛋白家族分为三类,分别命名为AGO-亚家族(subfamily),PIWI-亚家族和未知家族。AGO-亚家族成员偏好结合miRNA,PIWI亚家族成员偏好结合piRNA。不同的AGO蛋白在各物种中均有发现,但在不同的物种中含量(分布)差异显著,提示RNAi具有广泛性和多样性。表2-3 AGO蛋白的种类及功能2.1.7 RNA依赖的RNA聚合酶

RNA依赖的RNA聚合酶(RNA-dependent RNA polymerase,RdRP)是RNAi信号扩增的主要分子,具有与依赖于DNA的RNA聚合[2,20]酶较高的同源性。在线虫、真菌以及植物中均发现参与RNAi的RdRP家族:如拟南芥中的RDR6,真菌中的QED-1,线虫中的RRF-1[21]等。它们通过次级siRNA(secondary siRNA)的生成,直接或间[21]接参与了RNAi过程。它们各自具体的分工有所不同(表2-4),但具体的作用机制还不是很清楚。研究人员发现病毒侵染植物后,植株体内的RdRP活性可增加100倍,这就提示了RdRP在限制病毒侵染的防御中起了重要的作用。关于RdRP可以调控植物中病毒积累的现象,首次是在拟南芥RDR6缺失突变体中发现的。后来证明RDR6能在植物抗病反应中加强对病毒RNA的沉默,可以催化生成dsRNA。它在转录后基因沉默相关扩大反应中起作用。RDR6还能催化生成参与发育或胁迫反应有关的内源性siRNA(内源基因的反式siRNA途径),该途[22]径依赖于DCL4和RDR6。表2-4 RdRP的种类及功能2.2 细胞质中的RISC2.2.1 RISC的组成

RISC复合体主要由四部分组成:Dicer、AGO蛋白、TRBP及siRNA/miRNA。在RISC中,AGO家族具有举足轻重的地位。它为靶mRNA识别和沉默提供了平台。当mRNA与RISC复合体结合后,RISC开始切割mRNA或是阻断mRNA的翻译。

虽然miRNA和siRNA的生物合成过程不一样,但两个过程都会从前体剪切出21~22 bp的小RNA双链:miRNA/miRNA*双链和siRNA双链。这些小RNA装配到AGO蛋白中,并且形成RISC复合体。这一过程主要包括两个步骤:RISC装配和解旋。在装配过程中,小分子RNA以dsRNA形式进入AGO蛋白,然后解旋成两个单链。其中一条单链被排出RISC,另一条链保留在RISC中。2.2.2 RISC的装配

RISC装配是小RNA调控基因沉默的关键步骤。正确了解RISC的装配机制,对于治疗及研究方法的发现和提高具有很重要的作用。RISC的核心部分是AGO亚家族的蛋白成员。在哺乳动物中有四种(AGO1~AGO4),蝇类中有两种(AGO1~AGO2)。哺乳动物中的四种AGO蛋白中,只有AGO2参与降解靶mRNA。它可诱导转录抑制,或使mRNA脱腺苷化并降低其稳定性,有利于mRNA的降解。

RISC装配起始物形成后,RISC中的其他组分陆续进入RISC的组[23]装过程。这些组分包括Dicer、AGO蛋白以及其他未知功能的蛋白。AGO蛋白可以结合ssRNA,但是AGO蛋白在没有其他RISC组分蛋白帮助的情况下,不能与小分子dsRNA结合。在果蝇中,Dcr-2及dsRNA结合蛋白R2D2对于AGO2是必需的。R2D2结合dsRNA中比较稳定的一端,而Dcr-2结合不太稳定的一端。Dcr-2起稳定起始复合体Dcr-2/R2D2/siRNA结构的作用。Dcr-1则保证RISC中间体能够完成正常的功能。这些功能包括与AGO蛋白及其他蛋白因子的结合,解螺旋酶对复合体的识别及siRNA的解链等。因为在RNAi的起始阶段并没有Dcr-1的作用,而Dcr-1在装配过程中又有助于其他组分的结合,所以Dcr-1应该是在RISC装配起始物形成之后,又先于其他组分,组装到起始复合体。Dcr-1的进入,保证了RISC中间体进一步结合其他组分以完成装配的过程。AGO具有可以与siRNA结合的PAZ结构域和可以与Dicer结合的PIWI结构域。研究也发现,Dicer中的dsRBD与PAZ结构域很相似,能够识别siRNA的3′-端突出单链。因此推测,AGO蛋白是通过PIWI与Dicer互作,而进入RISC的组装过程。同时,Dicer通过dsRBD携带的siRNA的另一末端,将其交给AGO蛋白中的PAZ结构域,以便于siRNA指导RISC由AGO蛋白完成特异性切割作用。在RISC的装配过程中,存在着siRNA的传递过程,AGO蛋白很可能先于其他组分进入Dcr-1/Dcr-2/R2D2/siRNA中间体。

在siRNA途径中,Dicer和AGO在RISC中是有相互作用的。因此,siRNA的生成及其与RISC的装载过程可能是偶联的。如在果蝇中,Dcr-2参与了将siRNA转移给AGO蛋白,另外,还与siRNA一起参与RISC复合体的形成。

近来发现,分子伴侣热休克蛋白家族的HSP70/HSP90,可促进[24]siRNA引导链与AGO蛋白的结合(图2-4)。2-苯基乙炔氨苯磺胺(2-phenylethynesulfonamide,PES),17-烯丙基-17-去甲氧基德干霉素(17-allylamino-17-demethoxygeldanamycin,17-AAG)分别是HSP70和HSP90的特异性抑制剂。果蝇的AGO1和人的AGO2在组装RISC时,大致可以分为装载小分子siRNA的pre-RISC时期,以及结合解旋ssRNA的成熟RISC时期。用同位素标记的dsRNA与AGO组装RISC前体时,当存在PES或17-AAG时,解旋被抑制。同时,内源的AGO1或AGO2也被强烈地抑制。HSP70/HSP90分子伴侣家族在受到抑制时,RISC复合体的功能受到影响。但是如果装配反应中,未标记的siRNA量是同位素标记的siRNA 20倍的话,加入PES 或17-AAG,装配RISC前体不受影响。结果发现成熟RISC的形成,解旋不受抑制剂的影响。因此,HSP家族是siRNA进入RISC组装所必需的辅助蛋白,但对AGO的解旋功能没有影响。[24]图2-4 HSP与AGO蛋白相互作用形成的伴侣AGO蛋白与siRNA结合,HSP70/HSP90协助形成成熟的RISC,此过程需要消耗ATP2.2.3 RISC的解旋

成熟的miRNA来自miRNA前体的5′-端或3′-端。在解旋的过程中,小分子dsRNA中的随从链(the passenger strand)被分解。只有引导链(the guide strand)保留在成熟有功能的RISC复合体中。AGO蛋白与dsRNA结合成为前体RISC,而AGO蛋白与引导链结合时,形成成熟的RISC。选择小分子RNA中的哪一条链作为引导链不是随[23]机的,其中一条链有优先的趋势,称为链的不对称性。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载