高通量测序技术在肺癌领域的应用(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-19 19:19:06

点击下载

作者:罗洁

出版社:上海交通大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

高通量测序技术在肺癌领域的应用

高通量测序技术在肺癌领域的应用试读:

前言

肺癌是对人群健康和生命威胁最大的恶性肿瘤之一,在我国,肺癌发病率和病死率位居所有癌症首位,并有逐年上升的趋势,其5年生存率仅有16.1%左右,国内抗击肺癌的形势严峻。因此,对肺癌进行精准诊断和精准治疗成为改善肺癌预后、延长患者生存的关键。

由于肺癌的肿瘤组织样本较难获取与肿瘤异质性相关等问题,导致用传统检测技术难以获得患者全面和实时的信息。近年来,高通量测序技术又称“下一代”测序(next-generation sequencing,NGS)以其快速、信息全面等优势在肺癌的诊断、治疗和预后等方面得以广泛的应用。

本书系统地阐述了高通量测序、全基因组测序、外显子测序、靶向区域测序及甲基化测序的基本概念和应用进展,并从多个维度介绍了NGS在肺癌领域的应用:如何实现肺癌的精准分子分型,指导靶向治疗;如何鉴定耐药机制,调整治疗策略;如何发现罕见驱动基因,寻找新的治疗靶点;如何联合运用肿瘤突变负荷、微卫星不稳定性、免疫组库、肠道菌群基因组等技术确定免疫治疗的优势人群,指导免疫治疗;肺癌单细胞NGS测序的意义及进展。

本书还总结了6个经典的临床案例。从这些案例我们不难看出,NGS在当前肺癌的诊断和治疗中扮演着越来越重要的角色,能帮助临床医生探寻新的治疗靶点,真正地实现了精准诊断和精准治疗。

我们相信,随着科技的不断进步,NGS技术也将得到进一步发展。如通过对肺癌患者外周血循环肿瘤DNA热点突变的高灵敏度检测,去发现影像学未能检出的微小病灶、耐药及休眠性克隆等。

当然NGS作为一门新兴的技术还存在不少问题:如何在NGS产生的海量数据中发掘出有用的信息及其临床意义;NGS从实验室走进临床的应用目前缺乏统一的质量控制标准;如何优化测序技术,减低成本,缩短检测时间等。

本书从理论到实践,在介绍NGS相关技术要点的同时,着眼于其在肺癌领域的临床应用,内容科学,观点新颖。也许最后进步的并不是NGS技术本身,而是凭借NGS这个工具,让我们对肿瘤复杂性有更深入的理解。

由于笔者能力有限,本书中可能出现纰漏或错误,恳请广大读者和同道给予批评与指正。第一章高通量测序的概念和发展

测序技术诞生于20世纪50年代,经过30年的发展又诞生了第二代测序技术——高通量测序,又称“下一代”测序(next-generation sequencing,NGS)。与一代测序相比,NGS具有通量大、精准度高和信息量丰富等优点,可以在短时间内对感兴趣的基因进行精准定位,也可以对未知的序列进行检测。目前,NGS在无创产前筛查、肿瘤基因检测、遗传性疾病诊断和用药指导等多个临床领域得到广泛应用,极大地推动了肿瘤精准医学的发展。第一节NGS的发展1.DNA和RNA的概念

核酸包括脱氧核糖核酸(deoxyribonucleic acid,DNA)和核糖核酸(ribonucleic acid,RNA),是生命信息的载体,主要功能是信息储存,其中包含生命生长发育所需的全部信息。DNA是储存、复制和传递遗传信息的主要物质基础。RNA在蛋白质合成过程中起重要作用——信使核糖核酸(messenger RNA,mRNA)是合成蛋白质的模板;转运核糖核酸(transfer RNA,tRNA)起携带和转移活化氨基酸的作用;核糖体核糖核酸(ribosomal RNA,rRNA)是蛋白质合成的主要场所。2.测序的发展

由于DNA是生命信息的蓝图,解码DNA信息就可以加深我们对生命过程的理解。从DNA的双螺旋结构被解析开始,人们就一直在努力探究健康与疾病的基因奥秘。DNA测序作为一种重要的实验技术,广泛应用于生物学研究领域。第一代DNA测序技术包括1975年由Sanger和Coulson开创的链终止法(也称Sanger法)以及1976年—1977年由Maxam和Gilbert发明的化学法(链降解法)。1977年,Sanger首次测定了一个噬菌体X174的基因组序列,全长5 375个碱基。自此,生命科学研究步入了基因组学时代。2001年,研究人员在改进的Sanger法基础上完成了首个人类基因组图谱。

Sanger法巧妙地利用了DNA合成的原理。在DNA的复制过程中需要:DNA聚合酶、DNA模板、引物和4种脱氧核糖核苷三磷酸(deoxyribonucleoside triphosphate,dNTP)[脱氧腺苷三磷酸(deoxyadenosine triphosphate,dATP)、脱氧鸟苷三磷酸(deoxyguanosine triphosphate,dGTP)、脱氧胸苷三磷酸(deoxythymidine triphosphate,dTTP)和脱氧胞苷三磷酸(deoxycytidine triphosphate,dCTP)]。聚合酶根据碱基互补配对原则将dNTP加到引物的3′-OH末端,使引物延伸,合成出新的互补DNA链。如果加入双脱氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP),由于它在脱氧核糖的3′位置缺少一个羟基,不能与后续的dNTP形成磷酸二酯键,会导致延伸终止。例如,在存在三磷酸双脱氧胞嘧啶核苷(ddCTP)、dCTP和3种其他dNTP(其32中一种为α-P标记)的情况下,将引物、模板和DNA聚合酶一起延伸,即可形成一种长短不一、具有相同的5′-引物端并以ddC残基为3′端结尾的片段混合物。然后利用变性聚丙烯酰胺凝胶电泳,可以将各个片段按其链长的不同进行条带分离,最后获得相应的放射性自显影图谱,即可从所得图谱直接读取DNA的碱基序列了。这个方法是先合成再测序,准确率高,但费用也高。

Sanger法作为测序的“黄金标准”,为生物医学的发展做出了突出贡献。随着技术的发展,特别是人类基因组计划的推荐,二代测序逐渐进入人们的视野。3.二代测序的基本概念和平台发展

随着人类基因组计划的进行和完成,人们认识到通过测序技术与数据分析可以解答诸多的生物学问题。然而,测序通量的限制以及高昂的成本阻碍了人们对生命活动和疾病的深入了解。2000年之后推出的高通量测序平台很好地解决了这些问题,人类基因组的测序成本直接下降了50 000倍,并且由此产生了一个新名词:二代测序(也称下一代测序,NGS)。在过去的十年中,NGS得到不断发展——测序的数据量较前增加了100~1 000倍。技术方面,研究人员甚至可以在一条读长(read)上读出整条基因组的序列。Veritas Genomics的数据显示,人类基因组的测序成本已下降到1 000美元/人。目前,NGS技术也被广泛应用到临床诊断方面。

NGS是通过高通量技术来实现大规模测序,所以也叫作高通量测序(high-throughput sequencing,HTS),主要包括如下几种方法:①边合成边测序(sequencing by synthesis,SBS),代表性的有Roche公司的454焦磷酸测序、Illumina公司的Solexa合成测序;②边连接边测序(sequencing by ligation,SBL),如ABI公司的SOLiD连接法测序。

454焦磷酸测序的原理是借助生物发光来对DNA序列进行检测。在DNA聚合酶、ATP硫酸化酶、荧光素酶和双磷酸酶的协同作用下,系统将引物上每一个dNTP的聚合都与一次荧光信号相偶联。通过检测荧光信号释放的有无和强度,就可以实时测定DNA序列了。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳,具有分析快速、结果准确、高灵敏度和高自动化的特点。

SBL方法则是使用带有荧光基团的探针与DNA片段杂交,再连接邻近的寡核糖核酸,从而成像,然后通过荧光基团的发射波长来判断碱基或者互补碱基的序列。该方法包括5轮测序反应,每轮又含有多次连接反应(一般情况下,片段文库是7次,末端配对文库是5次。所以片段文库共有35次连接反应,而末端配对文库共有25次连接反应),第一次连接反应由与P1引物区域互补的“连接引物”介导。

绝大多数的SBL和SBS方法,都是在一个固定的表面进行DNA扩增,使特定区域内有成千上万个DNA片段拷贝,可以确保将方法信号与背景信号区别开来。同时,大量的平行碱基信息有助于大批量reads的读取。一个测序平台通常可以达到百万级的数据读取量,也就是能对上百万DNA分子进行同时测序。与一代测序相比,NGS具有通量大、精确度高和信息量丰富等优点,可以对目标基因进行迅速精准定位,也可以用来检测未知序列,还可以对组织在特定时间表达的mRNA进行测序。

不过NGS技术也有其不足之处,它虽然在数据量上有了大幅提升,但质量却有待提高。有报道称,NGS在序列拼接过程中的错误率为0.1%~1%。而且NGS生成的read普遍较短,每条read的长度在35~700 bp之间,比普通的Sanger法测序都要短,这意味着需要更严格且复杂的序列拼接。第二节长读长的NGS测序1.简介

基因组是一个复杂的复合物,其中包含了多种重复序列、拷贝数,,变化和结构变异。这些与进化、适应以及疾病密切相关。许多复合物元件过长,用短读长测序无法进行完整读取。而长读长测序的read可以达到数千个碱基,因此能对大的结构进行解析。长读长测序产生的单一长序列甚至可以跨越不同复合物或者重复序列。长读长测序在转录组的测序中也大有优势,因为长读长的read可以不需要拼接就跨越完整的mRNA转录本,能鉴定出更多的基因亚型。

长久以来,短读长测序都很难解决长链DNA中重复序列以及复合,,序列难以拼接的问题。而Chaisson等应用长读长测序在GRC人类基因组数据库中提交了超过1 MB的新序列,这些长序列甚至弥补了曾经缺失的信息。不仅如此,Chaisson等还鉴定了至少26 000个超过50 bp大小的插入缺失(insertion-deletion,InDel),GRC人类基因组数据库也因此成为最具参考价值的基因组数据库之一。此外,长,,读长还能够为临床诊断提供更有效的依据。

近来,研究人员开发出了两种长读长测序技术,分别是单分子实时测序法(single molecule real time sequencing,SMRT)和利用短读长技术在体外构建长读长的合成法。单分子测序又称为第三代测序技术,与短读长测序完全不同,可以不经过聚合酶链反应(polymerase chain reaction,PCR)扩增就能对每一条DNA分子做单独测序,测序过程中也不需要轮番添加dNTP。代表技术主要为单分子荧光技术,通过识别发光的单个核酸分子来进行实时读取。合成法则是利用条形码拼接来获得长片段,有别于常规长读长测序产生的原始read。

目前最常用的长读长测序是PacBio Biosciences(PacBio)的单,分子实时测序法。短读长SBS技术需要用聚合酶结合DNA,并沿DNA链进行扩增。PacBio采用了类似SBS的方法,不同的是先使用聚合酶捕获模板DNA并锚定在零模波导孔底部,然后让不同荧光标记的dNTP随机进入零模波导孔底部。荧光dNTP与DNA在酶作用下配对合成新的碱基,这时可根据荧光信号的颜色和存在时长来区分游离碱基与配对碱基,从而获得DNA序列。

2014年,第一台纳米孔(nanopore)测序仪——MinION诞生。与其他平台不同,Nanopore测序仪并不是检测与模板DNA结合或杂交的核糖核酸,而是直接读取天然的单链DNA分子。该过程是让DNA通过一个特殊的纳米蛋白孔,此时会产生特定的电压改变,由于不同碱基发出的电流信号强度有差异,由此可对DNA序列进行读取。该方法最突出的优点就是降低了测序成本,几乎没有试剂的耗费,也不像其他测序方式那样需要用到核苷酸、聚合酶等。并且由于不需要克隆、扩增的步骤,也极大地节省了时间。还有一点就是纳米孔测序能测得更长的read,降低了基因组组装的不确定性。但它也有诸多技术问题亟待解决。首先就是纳米孔的结构问题,理想情况应该是孔径仅容1个碱基通过,这样才能获得最大的信号区分度,但目前的技术水平尚无法做到这一点。另外就是DNA分子的穿孔速度过快导致了信号分辨率不高,这也是目前纳米孔测序准确率较低的原因之一。因此,虽然纳米孔测序相比二代测序有很多优势,但还不能完全取而代之。

合成法主要可通过两个系统来实施:Illumina长片段合成系统与10X Genomics乳液系统。Illumina系统不需要借助特殊仪器就能将DNA分隔到微孔板上。而10X Genomics乳液系统则需先使用微流体平台来进行测序前的准备工作,然后再用乳液分隔DNA。在DNA浓度低至1 ng的情况下,10X Genomics乳液系统仍能将DNA分子切割成任意长度的片段(最大达100 KB)。2.PacBio测序技术

现在最常用到的长读长测序设备是PacBio RS Ⅱ。该设备可以生成超过50 KB长度的单个read,长链建库的测序平均长度为10~15 ,KB。这对基因组拼接以及基因组结构的大范围应用都很有帮助。不过其长链测序中单个碱基的错误率在15%左右,又让人们对该仪器的使用有所顾虑。这些错误随机分布于每个read,必须通过足够高的覆盖度才能消除错误率的影响。只要单个碱基的测序次数增多了,所得结果还是比较可靠的,实际上该方法的最高准确率可达到99.999%。这点与Sanger法测序相似,因此该技术与Sanger法一样都被视为研究单核苷酸多态性(single nucleotide polymorphism,[20]SNP)的方法。PacBio RS Ⅱ的运行时间与通量会受到测序读长的影响,长的模板需要更长的时间。举例来说,1 KB的库运行4小时,每个分子可以产生约30 000个碱基,期间可重复测序30次左右。而10 KB的库运行4小时,同样产生30 000个碱基的情况下却只能重复测序3次左右。高成本(1 000美元/GB)、低通量,加上需要较高的覆盖度,使得PacBio RS Ⅱ在一些较小的实验室难以开展应用。

不过PacBio新推出的Sequel系统,通量比RS Ⅱ高出了7倍,测序成本反而下降了一半。二代测序存在的读长较短的问题在Sequel上也得到了改善,其读长一般在9 KB以上,准确率超过85%。虽然Sequel的通量已有大幅提升,但仍较二代测序要低得多,一个细胞才产出5 GB左右,用于临床检测的话成本还是太高。

现阶段Pacbio的产品主要应用在两个方向:一个是基因组的组装;另一个是全长转录组测序。3.MinION测序技术

MinION纳米孔测序仪的主件是2048个纳米孔,分成512组,由专用集成电路控制。测序原理:首先,待测DNA分子连接上引导接头(lead adaptor)、发夹接头(hairpin adaptor)和拖尾接头(trailing adaptor);由引导接头引领进入纳米孔,其后按照待测DNA、发夹接头、待测DNA互补链、拖尾接头的顺序依次通过。经双序列比对后,待测DNA与其互补链可组合成2D read。另外一种方法是不使用发夹接头,只测序待测DNA,这样形成的是1 D read。1 D测序方法通量更高,但是准确性要低于2D read。

ONT MinION是一个小型的USB设备(3cm×10cm),可以在个人电脑上运行,这也是目前最小的测序平台。尽管一些相应的设备必须要有固定场所来安置,如做文库准备的恒温器,但本身小体积仍使其操作极具便利性。不过MinION对测序片段的大小有一定限制。理论上,该设备能测序任意大小的DNA分子,但实际上,对长片段进行测序时还是会出现一定的错误率。同样,如何有效地对核糖核酸复合物进行测序也是ONT MinION面临的一大问题。由于通过纳米孔时的电流信号存在时间很短,加上一些修饰的碱基也会改变原先设定的电压变化,当核糖核酸复合物较长时,也没法准确鉴定其通过纳米孔的顺序。但最近一系列对试剂和算法的改进使其准确率提高了不少。

1)MinION相对于其他NGS测序平台的优势(1)碱基修饰的检测。纳米孔测序技术可以检测4种胞嘧啶的碱基修饰,分别为5-甲基胞嘧啶、5-羟甲基胞嘧啶、5-甲酰胞嘧啶和5-羧基胞嘧啶,检测准确率为92%~98%。(2)实时测序监控。临床实践中,传统的NGS测序要做到实时获取和分析DNA/RNA序列,是一件不容易的事情,但运用MinION则相对容易办到。首先是MinION体积小,方便携带;其次是当待测DNA分子穿过纳米孔时,其电流变化马上被检测并识别,能迅速给出结果。在不考虑错误率的情况下,可以说真正做到了实时监控,这对于一些特定目标的测序有着重要的作用。另外,还可利用这种技术特点实现目标序列的富集:当DNA片段通过纳米孔时,如电流变化与目标序列一致,则能通过;如呈现不同的电流变化,则片段不能通过纳米孔。这样能显著地减少测序时间,有利于野外操作和即时诊疗。(3)测得更长的read。MinION测序仪可以生成300 KB长的1 D read,以及60 KB长的2D read。这种长read,甚至帮助研究人员完善了人类基因组Xq24号染色体上一个长50 KB的间隔。(4)结构变异的检测。由于只能检测短序列的缘故,NGS对结构变异的检测往往不准确,这个问题在肿瘤检测中尤为突出,因为肿瘤组织中充斥着各种结构变异。研究发现MinION通过几百个长reads测得的结构变异结果甚至比NGS所测的上百万reads的结果要更可靠。(5)RNA表达分析。NGS平台测得的短序列都需要进行序列拼接才能得到转录本,通常情况下由于缺乏足够信息而无法区分形式各异的可变剪切。而MinION测序仪产生的长read,可以更好地解决这个问题。以果蝇的唐氏综合征细胞黏附分子1(down syndrome cell adhesion molecule 1,Dscam1)基因为例,其存在18 612种可变剪切形式,MinION测序仪可以检测到其中7 000种以上,这样的结果是NGS短序列测序不可能获得的。

2)MinION目前的应用领域

Nanopore测序仪的具体功能定位仍在探索当中,像快速文库制备、实时数据生产以及小体积等优势都有望转变为实际价值。(1)即时检测传染源。纳米孔测序方法与NGS方法都可以用于院内传染源病菌的检测,而纳米孔技术在测序读长、便携性、检测时长等方面更具优势。文献记载MinION测序从样品准备到发现致病菌只要6小时,其中从样品放入机器到发现致病菌仅需4分钟。有英国的研究人员就将MinION用于监测沙门氏菌的爆发。在2014年的埃博拉病毒爆发事件中,MinION测序仪也有出色的表现。(2)非整倍体检测。MinION在胎儿非整倍体产前检测中也发挥了重要作用。此检测在NGS平台通常需要1~3周时间才能获得结果,而文献报道使用MinION测序只需要4小时。第三节NGS测序在临床和科研中的应用

NGS广泛应用于基因表达和调控研究。像蛋白-DNA相互作用就可以通过染色质免疫共沉淀结合NGS测序来进行鉴定。NGS还可用于修饰碱基的研究。例如,最初的甲基化测序虽然可以实现甲基化DNA的捕获与富集,以及可以在酶作用下选择性区分甲基化与非甲,,基化区段,但其修饰与捕获的过程不够理想。针对这个问题,Flusberg等在2010年发表了一个概念性的研究方法,使用PacBio来区分甲基化与非甲基化的碱基。由于聚合酶在甲基化位点上会停留更多的时间,因此可以通过碱基上的信号改变来分辨是否存在甲基化修饰。同样,Nanopore平台也能够监测到修饰的碱基,因为甲基化同样会引起纳米孔电压的变化。由此甲基化测序可以在不需要化学操作的条件下进行。

接下来主要介绍NGS在临床和科研中的应用。1.全基因组重测序

全基因组重测序(whole-genome resequencing,WGR)是对已知基因组序列的物种进行个体化的基因组测序,并在不同个体或群体间进行差异性分析的方法。人类疾病的致病突变研究已逐渐由外显子区域扩大到全基因组范围。通过构建不同的插入片段文库和短序列,以及应用双末端测序相结合的策略进行高通量测序,可在全基因组水平上检测到疾病相关的常见、低频甚至是罕见的突变位点以及结构变异等。

全基因组重测序是NGS中应用最广泛的方法。该技术与生物学应用相结合,可以获得与疾病相关的那一部分基因组变异信息。2012年,Ellis等报道了芳香酶抑制剂治疗与乳腺癌之间的关联,指出基因突变、治疗效果与病理诊断之间存在联系。这也提示基因突变可能造成了乳腺癌的不同表型,并使其病理学特征变得更为复杂。2010年,1 000基因组计划开放了179个全基因组测序(whole-genome sequencing,WGS)原始数据以及697个个体的测序数据。截至2015年,研究人员已经构建了涵盖2 504个个体、26个不同,人群的基因组群,使我们能够从种群的角度来了解人类的变,异。该项目目前仍在对更多个体进行基因组测序。种群水平的全基因组重测序已经成为了解人类疾病的一个重要的工具,同时也收获了意想不到的结果。Sidore等对2 120个撒丁岛人进行了全基因组重测序,研究发现了一些新的和脂肪相关的基因以及炎症标志物,为人体血液中胆固醇的分子机制研究提供了新思路。2.从头测序

从头测序(de novo sequencing)是指不参照任何现有的序列资料而对某个物种进行测序,利用生物信息学分析手段对序列进行拼接组装,从而获得该物种的基因组图谱。主要应用于对未知物种的基因组序列、基因组成、进化特点等进行解析。对一些已知基因序列、但变异率很高的物种(如病毒),重测序的结果可能会非常复杂,可以按新物种来直接做从头测序。随着技术的革新,从头测序的成本和时间较前都大幅减少,可以帮助研究人员探索更多的未知基因组。3.全外显子组测序

全外显子组测序(whole-exome sequencing,WES)是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。全外显子组测序相对成本较低,对研究已知基因的SNP、InDel等具有较大优势。缺点是无法研究基因组的结构变异,如染色体断裂重组。全外显子组测序的应用范畴也十分广泛。Iossifov等对2 500多个有患孤独症孩子的家庭进行了外显子测序,在30%的样本中发现了错义突变、基因干扰的突变以及拷贝数的变异。另有研究表明,高覆盖度的全基因组测序同样也能检测到复杂变异,但相对于外显子测序,成本和时间的花费高出太多。4.全转录组测序

转录组学是在基因组学后新兴的一门学科,主要研究细胞在某一功能状态下所能转录出来的所有RNA的总和(主要包括mRNA和非编码RNA)。对特定细胞进行全转录组测序(whole-transcriptome sequencing,WTS),几乎可以获取其所有转录本序列信息,所以该方法已被广泛应用在基础研究、临床诊断和药物研发等领域。mRNA测序对引物或探针不进行设计,使其能客观地反映测序结果。通常仅需一次检测即可快速生成RNA的完整序列信息,包括基因表达、基因编码区SNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等。mRNA测序只需用一些简单的样品制备和数据分析软件即可。得益于NGS技术的发展,研究人员还可以对单个转录本进行深度测序研究。2014年,Treutlein等就对不同细胞类群的单细胞RNA进行了测序,发现了可用于鉴定细胞亚群的标志物。长读长测序在转录组研究中也能用到,可以帮助分析转录组的结构变化,但在转录本的定量上并未体现出优势。有研究显示,人类长读长转录组测序的reads中有10%以上是新的可变剪切体。5.小分子RNA测序

小分子RNA包括微小RNA(micro RNA,miRNA)、小干扰RNA(small interfering RNA,siRNA)和与Piwi蛋白相作用的RNA(piwi-interactingRNA,piRNA),是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Solexa合成测序技术能对小分子RNA进行深度测序和定量分析。首先将18~30 nt范围的小分子RNA分离出来,两端分别加上特定接头后进行体外逆转录,生成互补脱氧核糖核酸(complementary DNA,cDNA),进一步处理后再对DNA片段进行单向末端直接测序。通过对小分子RNA的大规模测序分析,可以获得物种全基因组水平的miRNA图谱,从而实现新miRNA分子的挖掘、靶基因的预测和鉴定、样品间差异表达的分析、miRNA聚类和表达谱分析等科学应用。6.miRNA测序

成熟的miRNA是17~24 nt的单链非编码RNA分子,能影响mRNA的稳定性及翻译,最终诱导基因沉默,可起到调控基因表达和细胞生长发育的作用。基于NGS技术的miRNA测序,可以一次性获得数百万条miRNA序列,并能快速鉴定出不同组织、不同发育阶段、不同疾病状态下的miRNA及其表达差异,为研究细胞生长进程中miRNA的作用及生物学影响提供了有力的帮助。7.甲基化测序

肿瘤中存在DNA异常甲基化,但形成机制尚不清楚。对亚硫酸氢盐处理过的DNA进行测序,可检测到DNA中的异常甲基化,结果精确度高,基本能明确DNA片段中每一个胞嘧啶-磷酸-鸟嘌呤位点(CpG位点)的甲基化状态。8.染色质免疫共沉淀结合NGS测序

染色质免疫共沉淀(chromatin immunoprecipitation,ChIP)技术也称为结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。ChIP与第二代测序技术相结合的ChIP-seq技术,能够在全基因组范围内检测与组蛋白、转录因子等有相互作用的DNA区段。

ChIP-seq的原理:通过ChIP特异性地富集目标蛋白结合的DNA片段,将其纯化后进行文库构建,然后对文库DNA进行高通量测序。9.RNA纯化的染色质分离结合高通量测序

RNA纯化的染色质分离(chromatin isolation by RNA purification,ChIRP)与二代测序结合的ChIRP-seq可以检测与RNA起共同作用的DNA,从而判断该RNA能够结合的基因组区域。ChIRP需要对探针做特殊设计。由于蛋白测序技术尚不够成熟,目前还无法检测与该RNA结合的蛋白。10.RNA免疫共沉淀结合高通量测序

RNA免疫共沉淀(RNA immunoprecipitation,RIP)是研究细胞内RNA与蛋白结合情况的技术,能帮助我们发现miRNA的调节靶点。RNA免疫共沉淀结合高通量测序的RIP-seq技术是用目标蛋白的抗体将相应的RNA-蛋白复合物沉淀下来,经分离纯化后对RNA进行高通量测序分析。

RIP类似于普遍的染色质免疫共沉淀技术,只是研究对象换成了RNA-蛋白复合物而不是DNA-蛋白复合物。RIP需要一定的优化条件,如RIP反应体系中的试剂和抗体绝对不能含有RNA酶。11.紫外交联免疫沉淀结合高通量测序

紫外交联免疫沉淀结合高通量测序(crosslinking immunprecipitation and high throughput sequencing,CLIP-seq)可在全基因组水平揭示RNA分子与RNA结合蛋白的相互作用。主要原理:RNA分子与RNA结合蛋白在紫外照射下会发生偶联,利用RNA结合蛋白的特异性抗体将RNA-蛋白复合物沉淀下来,回收其中的RNA片段,经添加接头、逆转录PCR等步骤,最后进行高通量测序和生物信息学分析处理。12.宏基因组学研究

宏基因组学是利用测序技术对整个微生物群落进行研究。相比传统单个细菌研究,它具有更多优势,其中最重要的两个优点是:①微生物通常是以群落方式共生于某一生态环境中,很多特性是由整个群落环境及个体间相互影响所决定的,因此宏基因组研究会更系统性、更全面;②宏基因组研究不需要做细菌的分离培养,研究覆盖的细菌种类更多。

宏基因组学(又称元基因组学、环境基因组学、生态基因组学等)是直接从环境样本中提取基因组遗传物质进行研究,填补了许多传统实验室微生物培养研究的空白。小结

NGS一方面处于飞速发展的时期,技术的革新及成本的降低使得其应用面更为广泛;另一方面也面临着新的挑战。

首先是时间问题。对于那些严重的神经性疾病或者癌症患者,数周的测序及分析时间可能会使他们错过最佳的治疗期。尽管测序技术较前已有大幅提升,但是绝大多数现有的系统还不能满足这种快速产出的需求。

其次是数据量问题。NGS的产能已出现过剩,目前已有超过14 000个基因组序列上传到美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)。2013年,Schatz与Langmead报道了全世界每年可以生产超过15 PB的数据量,并且这个数量还在继续增加。而数据量的富余对分析处理能力也提出了严峻的挑战,这需要更具突破性的存储与生物信息解决方案。加之疾病本身具有极大的差异性,如何将海量的数据转换成有生物学与遗传,,学内涵的结果也是一个问题。况且还需要慎重考虑NGS数据,分析中的假阳性或者假阴性。

随着科技水平的提高,各种测序产品和解决方案正在不断涌现,这也为我们进行基因探索和人类健康的研究提供了更多的帮助。第二章肺癌流行病学和靶向治疗

肺癌是中国和世界范围内癌症死亡的首要原因。2015年全国肿瘤登记中心最新发布的数据显示,我国肺癌新发病例约73.33万(男性50.93万,女性22.4万),占全部恶性肿瘤新发病例的17.09%;肺癌新发死亡病例61.02万,占全部肿瘤新发死亡病例的21.68%。

肺癌中以非小细胞肺癌(non-small cell lung cancer,NSCLC)占比最多,约为85%,而不可手术的NSCLC 5年生存率只有16%。第一节肺癌的诊断

肺癌是一个多基因、多方式、变异积累的复杂病变过程。而早期诊断、及时干预可以预防、阻断或者延迟肺癌的疾病进程,能将早期肺癌患者的5年生存率提高到70%以上,是目前肺癌研究及治疗的关键。遗憾的是,由于缺乏明显的临床征象以及可靠的诊断和预测标志物,70%的患者在确诊时往往已经发生转移,失去了最佳治疗时机。广泛开展肺癌筛查,做到早诊断、早预防、早干预,可显著降低肺癌病死率。

众所周知,吸烟是肺癌的致病因素之一。然而在50岁以前,性别和吸烟对肺癌发病的影响不大。在美国,肺癌筛查人群定为年龄55岁以上、吸烟指数400支/年,不过这个筛查年龄并不适合中国人群。在中国非吸烟相关性肺癌也很常见,这可能与长期接触油烟、二手烟以及环境污染等因素有关。目前有很多学者认为,中国人群的肺癌筛查可能需要从40岁开始。不仅如此,肺癌筛查还有很多问题。例如,缺乏随机对照研究,如何判定高危群体等。如果大规模筛查后发现绝大多数被筛查对象并不是肺癌患者,这势必造成公共医疗资源的浪费以及过度筛查可能带来的对人体的损伤。从数据上看,近年来肺癌高危人群电子计算机断层扫描(computed tomography,CT)筛查阳性率仅为51%。CT在肺癌诊断上也有其局限性,经常会出现CT报告与病理结果不一致。而且CT检查也存在一定程度的放射性危害。由此看来,如果有更灵敏、更安全的筛查工具,就能在疾病早期进行明确诊断,从而有针对性地制订科学合理的个体化治疗方案,也避免了对疑似患者进行不必要的过度治疗。第二节肺癌的常见靶向治疗

虽然临床上大多数肺癌患者初诊时已为晚期,但随着靶向药、化疗药及抗血管生成药物的飞速更新,晚期肺癌患者的总体生存期还是有了明显延长。如何使靶向治疗更精准、预后更好,这需要更合理地将综合治疗手段与基因组学及蛋白组学的检测结合起来。下面介绍一下肺癌靶向治疗与基因检测的应用。

靶向治疗的核心是找到有效的靶点。靶点需具备特异性,在肿瘤细胞内呈高表达或者肿瘤细胞对该靶点有高度的依赖性,而在正常细胞内应该是缺失的,这样才能避免靶向药物杀伤正常细胞而带来严重的不良反应。表皮生长因子受体(epithelial growth factor receptor,EGFR)是肺癌中最早发现的驱动基因。2004年,通过对比EGFR酪氨酸激酶抑制剂(EGFR tyrosine kinase inhibitor,EGFR-TKI)吉非替尼敏感标本与非敏感标本的EGFR基因序列,发现EGFR基因酪氨酸激酶区突变与吉非替尼药物敏感性相关。随着对EGFR信号通路研究的深入,活化突变的EGFR基因成为预测EGFR-TKI疗效最重要的生物标志物,EGFR-TKI治疗EGFR活化突变阳性患者的有效率高达71.2%。EGFR突变的发现使靶向治疗瞄准了肺癌特定驱动基因及其下游信号通路。目前已开发出四代EGFR-TKI,其中多数已用于肺癌的临床治疗。

实施靶向治疗首先必须筛选出对靶向药物敏感、预期疗效较好的患者,基因测序恰恰能提供此类帮助。测序技术的蓬勃发展,加上癌症基因组图谱(The Cancer Genome Atlas,TCGA)计划和癌症体细胞突变目录(Catalog of Somatic Mutations in Cancer,COSMIC)等项目的推进,越来越多的体细胞变异和基因表达变化被挖掘出来,靶向治疗的思路也得到进一步拓宽。1.肺腺癌的驱动基因

我们将与肿瘤发生发展密切相关的基因称为肿瘤驱动基因。关于肺癌的驱动基因是目前研究最多的,60%~70%的肺癌患者都能找到驱动基因,其中又以肺腺癌居多,有80%~90%能找到肿瘤驱动基因,这为肺癌的精准治疗和个体化治疗提供了很大的帮助。美国有研究数据显示,白种人群患肺腺癌时Kirsten鼠肉瘤病毒原癌基因(Kirsten rat sarcoma virus oncogene,KRAS)的突变最常见,占32.2%,其次是EGFR、1型神经纤维瘤(neurofibromatosis type 1,NF1)基因和鼠类肉瘤滤过性毒菌致癌同源体B1(v-raf murine sarcoma viral oncogene homolog B1,BRAF),分别占11.3%、8.3%和7.0%。而有关亚洲人群的研究数据显示,肺腺癌患者中EGFR突变最常见,突变发生率可达50%。除EGFR以外,肺腺癌的主要驱动基因还有间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)基因、c-ROS癌基因-1(c-ROS oncogene 1,ROS1)、人表皮生长因子受体-2(human epidermal growth factor receptor 2,HER2)基因和转染重排(rearranged during transfection,RET)基因等。2.肺鳞癌及小细胞肺癌的驱动基因

肺鳞癌中也发现了很多驱动基因,不同的是,腺癌中主要是基因发生了突变或者融合,而鳞癌中大多是出现了基因拷贝数改变。由于发生基因拷贝数改变的情况较多,所以不能单纯以此来作为衡量鳞癌驱动基因的标准。研究发现,很多肺鳞癌中的基因拷贝数改变,并不是简单的基因重排,也可能是成纤维细胞生长因子受体1(fibroblast growth factor receptor 1,FGFR1)基因扩增、磷脂酰肌醇-3激酶催化α多肽(phosphoinositide-3 kinase,catalytic,α polypeptide,PIK3CA)基因突变或者其他改变所引起的。近年来,有关肺鳞癌驱动基因的研究取得了一些重要成果。大规模测序结果显示,肺鳞癌患者的驱动基因大多数与磷脂酰肌醇-3激酶(phosphatidylinositol-3 kinase,PI3 K)/蛋白激酶B(protein kinase B,PKB也称为AKT)通路(PI3 K/AKT通路)以及EGFR酪氨酸激酶信号转导通路相关,包括PIK3 CA突变(占16%)、第10号染色体同源缺失性磷酸酶-张力蛋白(phosphatase andtensin homolog deleted on chromosome ten,PTEN)基因的突变或缺失(占15%)、FGFR1扩增或突变(占18%)、人血小板源性生长因子受体α(platelet-derived growth factor receptor α,PDGFRα)基因扩增或突变(占9%),以及BRAF突变、HER2扩增和盘状结构域受体2(discoidin domain receptor 2,DDR2)突变(均占4%)等。

小细胞肺癌(small cell lung cancer,SCLC)占肺癌的13%~15%,以分化程度低、恶性程度高、转移早为特点,放、化疗是目前主要的治疗手段,仅2%~5%的局限期患者可进行手术治疗。与NSCLC相比,SCLC预后较差,5年生存率仅为1%~5%。SCLC与吸烟有很大相关性,仅有2%的SCLC是发生在不吸烟人群中。大规模测序发现SCLC的基因突变谱比较复杂多样,最普遍的是肿瘤蛋白53(tumor protein 53,TP53)基因突变和视网膜母细胞瘤1(retinoblastoma 1,RB1)基因功能失活,其他变异还包括骨髓细胞瘤病毒致癌基因(myelocytomatosis viral oncogene,MYC)的扩增,B细胞淋巴瘤-2(B-cell lymphoma 2,BCL-2)基因和干细胞生长因子受体(stem cell growth factor receptor,SCFR也称为KIT)基因的过表达,以及神经内分泌基因如嗜铬粒蛋白A(chromogranin A,CHGA)基因、胰岛素瘤相关基因如胰岛素瘤关联蛋白1(Insulinoma-associated 1,INSM1)基因的过表达等。3.驱动基因突变的靶向治疗

1)EGFR突变(1)第一代EGFR- TKI。很多大型的Ⅲ期临床试验已经证实,EGFR-TKI具有高效低毒的特点,并能带给患者更好的生活质量,比细胞毒药物更有优势。因此,几乎所有的指南都推荐EGFR-TKI作为EGFR突变的一线治疗用药。主要代表药物有吉非替尼、厄洛替尼。(2)第二代EGFR-TKI。LUX-Lung 7临床研究的2期结果显示,对于EGFR突变的初治患者,二代TKI阿法替尼比吉非替尼更能显著地延长中位无进展生存期(progress free survival,PFS)。对于一线化疗期间或治疗后病情进展的肺鳞癌,在LUX-Lung 8临床研究中使用阿法替尼和厄洛替尼进行了头对头比较。数据显示,与厄洛替尼相比,阿法替尼显著地延长了肺癌的无进展生存期,病情进展风险降低19%;同时,阿法替尼也显著地延长了总生存期,死亡风险降低19%;此外,阿法替尼还显著地提高了疾病控制率(51% vs 40%,P=0.02);阿法替尼治疗组患者的生活质量和症状控制也得到了改善;安全性方面,两组间严重不良事件发生率相似,但在特定不良反应上具有差异性。阿法替尼治疗组的严重腹泻和口腔炎发生率较高:3级腹泻(10% vs 2%)、3级口腔炎(4% vs 0%);厄洛替尼治疗组则在皮疹和痤疮方面表现出较高的发生率:3级皮疹/痤疮(10% vs 6%),。(3)第三代EGFR-TKI。EGFR-TKI治疗中最常见的获得性耐药机制是EGFR的二次突变(其中T790M突变占50%~65%),由此也诞生了第三代EGFR-TKI。代表药物为奥希替尼,其对TKI治疗后进展的EGFR-T790M突变患者,总响应率可达61%,中位PFS为9.6个月。

肺癌治疗中并不是一味地单用EGFR-TKI,也有研究在探索与细胞毒药物或贝伐珠单抗的联用方案。临床试验表明,与厄洛替尼单药相比,厄洛替尼联合贝伐珠单抗可显著延长EGFR突变NSCLC患者的PFS。(4)EGFR单克隆抗体。EGFR信号通路在肺癌形成过程中有着重要的作用,即便EGFR没有发生突变也一样,如鳞癌中就常见基因扩增导致的EGFR过表达。除了针对EGFR突变的TKI,EGFR单克隆抗体西妥昔单抗(cetuximab)和耐昔妥珠单抗(necitumumab)在肺癌的治疗中同样也具有较高临床价值。与顺铂或吉西他滨/顺铂相比,耐昔妥珠单抗联合吉西他滨明显提高了晚期肺鳞癌患者的总体生存率(overall survival,OS)。

2)KRAS基因突变

KRAS突变是最常见的驱动基因之一,常见于腺癌,尤以亚洲的不吸烟人群为多,大多数靶向该基因的药物都疗效甚微。临床试验表明司美替尼(selumetinib)可能对抑制KRAS下游信号有较好的效果。司美替尼是丝裂原活化蛋白激酶(mitogen-activated protein kinase kinase,MAPKK也称为MEK)的抑制剂,因此可以抑制KRAS的信号,有研究表明司美替尼联合多西他赛与安慰剂联合多西他赛相比,可显著提高KRAS突变NSCLC患者的无病生存率(PFS)(5.3个月vs 2.1个月,P=0.014)。一直以来,KRAS都是很难成功地进行靶向治疗的一个基因,不过最近的两项研究为人们带来了新的曙光。通过大规模筛选和生物信息学分析,Sai等发现化合物3144可以特异性地结合活化突变的KRAS-G12D,并抑制小鼠肿瘤的生长。另一项研究中,Athuluri等发现rigosertib可以结合在大鼠肉瘤病毒癌基因的结合域,从而抑制了KRAS信号通路的活化。

3)ALK转位

ALK基因的转位激活,在NSCLC患者中占1%~7%。克唑替尼是一种靶向治疗ALK和ROS1基因融合、间质-上皮细胞转换(mesenchymal-epithelial transition,MET)基因跳跃突变的抑制剂,在ALK、ROS1或MET激酶活性异常的肿瘤患者中有良好的疗效。在一线和二线药物治疗ALK阳性肺癌的两项独立随机试验中,克唑替尼较标准化疗能显著延长PFS。但是克唑替尼在ALK融合的NSCLC患者中也有耐药情况发生,主要的耐药机制是ALK二次突变,包括1151 Tins、Leu1152Arg、Cys1156Tyr、Ile1171 Thr、Phe1174Leu、Val1180Leu、Leu1196Met、Gly1202Arg、Ser1206Tyr和Gly1296Ala突变。针对这些二次突变,又开发出了新的ALK抑制剂,第二代ALK抑制剂有色瑞替尼(ceritinib)、艾乐替尼(alectinib)、布吉他滨(brigatinib)和第三代ALK抑制剂洛拉替尼(lorlatinib)等。

ALK的突变非常复杂,我们可以借助NGS来区分突变位点,再根据图2-1选择对应的药物。

4)ROS1转位

1%~2% NSCLC患者的ROS1基因存在6q22染色体重排,腺癌、年轻及不吸烟患者最常见。临床研究数据表明,ROS1阳性的NSCLC患者中,克唑替尼治疗的有效率为72%,中位生存期达19.2个月。包括色瑞替尼、卡博替尼(cabozantinib)、entrectinib和洛拉替尼等一些新的ROS1抑制剂正在评估当中。有病例研究提示色瑞替尼对克唑替尼治疗后进展的ROS1阳性患者可能具有抗肿瘤活性。

5)RET转位

测序发现1%~2% NSCLC患者有RET转位,以不吸烟、年轻腺癌患者或腺鳞癌患者常见。而有研究表明多靶点酪氨酸激酶抑制剂具有抗RET激酶活性,例如舒尼替尼(sunitinib)、索拉非尼(sorafenib)、凡德他尼(vandetanib)、cabozantinib、艾乐替尼、阿帕替尼(apatinib)、乐伐替尼(lenvatinib)和帕纳替尼(ponatinib),这些药物单药治疗的总响应率在17%~63%之间。凡德他尼联合依维莫司响应率更高,可以达到83%。图2-1  ALK突变与相应药物的半抑制浓度图片来源:Gainor JF,Dardaei L,Yoda S,et al.Molecular Mechanisms of Resistance to First-and Second-Generation ALK Inhibitors in ALK-Rearranged Lung Cancer[J].Cancer Discov,2016,6(10):1118-1133.注:EML4-ALK:棘皮动物微管相关类蛋白4(EML4)基因与ALK基因的重排

6)BRAF突变

BRAF是KRAS通路下游重要的信号分子,可激活丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)通路。腺癌患者中有3%~8%发生BRAF突变,主要为吸烟的腺癌患者。50%的BRAF突变是BRAF-V600E突变。其他常见的BRAF突变还包括BRAF-G469A/V、BRAF-D594G,各约占35%、6%。研究显示达帕菲尼(dabrafenib)和其他BRAF抑制剂可引起RAS信号的补偿性增加,因此,通常将BRAF抑制剂与MEK抑制剂联合应用于黑色素瘤和肺癌的相关研究。

7)HER2突变

HER2突变在NSCLC中占1%~2%,主要多见于女性、不吸烟以及腺癌患者。多数HER2突变是第20号外显子读码框移位。一项回顾性分析显示HER2突变阳性患者的疾病控制率可达到非常高的水平:曲妥珠单抗(trastuzumab)联合化疗的有效率为67%,阿法替尼的有效率为33%。

8)NTRK1转位

神经营养性酪氨酸激酶受体1型(neurotrophic tyrosine kinase,receptor,type 1,NTRK1)基因转位是NSCLC中的一种罕见驱动突变,突变率小于1%。在一项涉及1 378名NSCLC患者的研究中仅发现了1例NTRK1转位,最新研究发现一种多靶点TKI可能对NTRK1转位有效。

9)MET扩增或突变

MET的信号能通过基因扩增和受体基因14外显子突变激活。14外显子跳跃突变在肺腺癌人群中大约占3%,扩增占1%~4%。MET的扩增和过表达可能导致EGFR-TKI或其他酪氨酸激酶抑制剂治疗后,出现病情进展。目前在研的MET抑制剂包括INC280、MGCD265等。

10)抗血管生成药物

血管生成在肿瘤发生发展进程中具有非常重要的作用。血管内皮生长因子(vascular endothelial growth factor,VEGF)是血管生成的主要调节因子,VEGF表达增强与预后差相关。临床试验表明VEGF抗体贝伐珠单抗与细胞毒药物联用可有显著获益。在REVEL研究和LUME-lung1研究中,相比多西他赛单药组,VEGF受体抗体雷莫芦单抗(ramucirumab)与多西他赛联用以及靶向VEGF受体的小分子酪氨酸激酶抑制剂ninedanib与多西他赛联用,均可改善PFS和OS。4.免疫靶向治疗

肿瘤免疫治疗,是指利用人体免疫系统的某些成分来对抗肿瘤的治疗方法。可以分为两种方式:第一种是刺激患者自身的免疫系统,使其免疫功能增强并杀伤肿瘤细胞;第二种是给患者输入外源性的免疫系统成分,以增强免疫反应,如人造免疫系统蛋白质。在过去的几十年中,免疫治疗已经成为治疗肿瘤的重要组成部分。

免疫系统是一个非常复杂的全身系统,包含多个器官、特殊的细胞和分子,主要通过细胞免疫和体液免疫来保护机体免受感染和疾病的影响。免疫系统能跟踪检测机体内几乎所有物质,包括任何异体组分。细菌含有的特殊蛋白、肿瘤细胞表达的异常蛋白都会被免疫系统看作是“外来者”而受到攻击,免疫反应可以破坏含有非正常机体分子的细菌或肿瘤细胞。然而免疫系统对抗肿瘤的能力是有限的,许多免疫系统正常的人群仍然会发生肿瘤。这是因为有时候肿瘤细胞与正常细胞差异不大,免疫系统无法识别;有时候免疫系统虽然识别了,但是免疫反应可能并没有产生足够的杀伤力。肿瘤细胞本身也可以释放免疫抑制因子来抵抗免疫细胞的杀伤作用。针对这些问题,研究人员也在寻找一些方法来帮助免疫系统识别肿瘤细胞,同时加强免疫反应以达到消灭肿瘤的目的。下面就近来免疫治疗的研究热点做一下介绍。

单克隆抗体:是人造版本的免疫系统蛋白。抗体在治疗肿瘤方面非常有效,因为它们可以被设计来攻击肿瘤细胞特定的抗原表位。如西妥昔单抗不仅能直接抑制EGFR通路,同时还具备潜在的细胞毒性及补体激活功能。更多单克隆抗体如巴维昔单抗(bavituximab)、patritumab、rilotumumab以及IMMU-132等的研究也在开展中。

免疫检查点抑制剂:避免对机体正常细胞的杀伤,是免疫系统的安全原则,否则其后果可能比肿瘤还严重。而肿瘤细胞也利用了这点来逃避免疫攻击。大量研究发现,肿瘤细胞中高表达的免疫检查点抑制信号分子如程序死亡配体1(programmed death ligand 1 ,PD- L1)、细胞毒T淋巴细胞相关抗原- 4(cytotoxic T lymphocyte-associated antigen-4,CTLA-4)等,对免疫系统有较强的抑制作用,阻止这些分子与肿瘤细胞的结合,有助于免疫细胞(主要是杀伤性T细胞)识别和攻击肿瘤细胞。在肺癌治疗方面,细胞程序死亡受体1(programmed death 1 receptor,PD- 1)抗体纳武单抗

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载