临床实用分子病理学(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-28 05:44:01

点击下载

作者:蒋仲荪,龚永生,王博浩

出版社:浙江大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

临床实用分子病理学

临床实用分子病理学试读:

版权信息书名:临床实用分子病理学作者:蒋仲荪,龚永生,王博浩排版:辛萌哒出版社:浙江大学出版社出版时间:2011-05-01ISBN:9787308085632本书由浙江大学出版社有限责任公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —  第1章基因组概念

基因是指细胞中所有遗传信息的总和,即包含全部遗传信息的核酸量。全部基因组合在一起称基因组。人类基因组分为复杂的核基因组和较简单的线粒体基因组。

线粒体基因组是全长约16569bp环状DNA,其核酸序列早在1981年全部测定完毕。人类绝大多数基因位于核基因组,占所有基因的99.98%,故一般所说的基因组是指核基因组,它位于核内染色体,包含于一个全长DNA分子(约3×109碱基对)中。在全长DNA分子中,已知编码序列仅占全部核基因组的3%,即除具有编码功能的外显子外,存在大量非编码序列,以及大量的功能尚不十分清楚的DNA序列(内含子序列、基因与基因之间的间隔序列、调控序列等)。

基因组DNA系高分子化合物,基本组成单位是单核苷酸,因而有必要简单复习一下核酸的一些基本知识。  第2章核酸组成与结构(一)单核苷酸组成

核苷酸是由磷酸基团、戊糖、碱基通过一定结合方式而构成。

戊糖有核糖和脱氧核糖两种,据此核苷酸分为核糖核酸(RNA)和脱氧核糖核酸(DNA)。构成核酸的碱基主要有五种:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)、尿嘧啶(V)。其中胸腺嘧啶只存在于脱氧核糖核酸中;而尿嘧啶只出现在核糖核酸中。(二)核酸的结构

1.核酸一级结构

核酸由成百上千乃至上百万个结构单位--核苷酸通过四种核苷酸的3′,5′羟基之间形成磷酸二酯键,彼此连接起来的线性顺序,称之为DNA一级结构,即DNA分子中脱氧核糖核酸排列顺序。由于在DNA分子中脱氧核糖和磷酸组成相同,而碱基不同,故碱基排列顺序就可称为DNA一级结构。

一级结构不仅蕴藏着极为丰富的转换蛋白质的遗传信息(结构基因),而且,一些特定序列及其大量信息决定着DNA空间结构及基因间的相互作用和调控功能。在一定意义上可以说,生命过程都是根据储存在DNA内的程序进行的。已完成的人类基因组测序就是对基因组3×109bp的测序,再给予划分、标记,得到人类基因组DNA序列碱基的排列全貌。

2.二级结构--双螺旋结构模型

DNA由两条反向平行的多核苷酸链缠绕同一中心轴,构成双螺旋结构。其特点是磷酸基团与戊糖在链的外侧,两条链上碱基以AT、C≡G相连,构成一平面,碱基平面垂直于螺旋中心轴,位于内侧。维持DNA双螺旋结构的作用力是一条链上碱基与另一条链上碱基严格依据碱基互补配对原则,形成氢键、碱基堆砌力以及离子键。所谓碱基互补配对原则即A-T、G-C配对。其中A-T之间形成两个氢键,G-C之间形成三个氢键,因此G与C之间配对更稳定。

氢键是一低能键,其特性是易断、易建,从而构成DNA变性、复性的特性,此系分子杂交检测的重要理论基础之一。

3.三级结构(超螺旋结构)

DNA的三级结构是指双螺旋结构基础上的卷曲。其普遍形式是环形DNA双螺旋链进一步盘绕形成的超螺旋。

超螺旋无疑有重要的生物学意义:①使DNA体积变得更小,将人类细胞核中46条染色体长达1.7m的DNA压缩成200nm左右;②DNA的线性序列携带有遗传信息,而紧缩的超螺旋态储存着必需的生物学过程的能量和信息,是一种重要的功能态。  第3章人类基因组图谱

单倍体人类基因组由大约30亿个碱基对组成,这些碱基对分布在22条常染色体和一对性染色体中的一条上。随着人类基因组计划开展以来,检测技术的进步,奠定了全基因组自动化测序和基因鉴定的细胞遗传学图谱、遗传连锁图、物理图谱、转录图谱、序列图谱,它们从不同角度为基因组测序和基因鉴定做出了贡献。这些图谱首先解决了基因在染色体上定位,随后基因组被分割成DNA序列片段越来越小,最初的长距离图谱到可以克隆的DNA序列图,分辨率从最初的1~5Mb提高到50~1000kb,因而为基因鉴定提供了理论与技术基础。(一)细胞遗传学图谱

人类染色体应用显带技术,在光镜下可区分出染色体的400余条带,而且人类基因又分布于22条染色体各自特定的染色体之中。后者则通过基因定位的体细胞杂交技术寻找基因特定的染色体,前者则应用荧光原位杂交(FISh),通过荧光标记的基因组克隆,可有效地在细胞遗传学图谱上定位基因或其他DNA片段。

1.基因定位的体细胞杂交

大多数体细胞杂交是用人分离培养的体细胞和小鼠、大鼠或仓鼠的体细胞进行杂交,形成融合细胞(杂种细胞)。此杂种细胞有两个重要特点:(1)此杂种细胞在繁殖传代过程中出现保留齿类一方染色体,而人类染色体则逐渐丢失,最后只剩一条或几条。(2)杂种细胞保留或丢失人类染色体时有重叠现象。

应用上述两个特点而设计的克隆嵌板法来判别人类22对常染色体和一对性染色体是一种简便、有用的基因染色体定位方法。

2.荧光原位杂交(FISh)

应用上述克隆嵌板法基因定位于某一染色体后,尚需进一步了解待测基因的该染色体上的区带定位,此时则要进行荧光原位杂交(FISh)。荧光原位杂交是一种用特殊荧光标记核酸探针,在显微镜载玻片上,对中期染色体标本进行杂交(原位即指标本上DNA原位变性)。通过荧光强弱来确定标记探针(已知基因序列)在染色体上位置(基因定位或DNA片段)。现已用不同荧光染料同时进行多重原位杂交。用不同的荧光染料标记多个探针,进行多个基因片段的染色体定位,获得大量基因组DNA克隆,为DNA序列直接测序提供了理想材料。

原位杂交是一种分子杂交,其基本原理是碱基的互补配对原则,同源的DNADNA双链或DNARNA链在一定条件下能结合成双链,因而必须在已知探针(基因序列)条件下方可进行,而在未知致病基因时,则无法进行基因在染色体上的区带定位。(二)遗传连锁图

应用原位杂交对基因在染色体上的区带进行定位其前提是要了解该基因的碱基序列作为探针,但大多数的情况该基因序列是未知的。

遗传学上有两个重要规律,即基因连锁遗传和基因分离与重组。遗传连锁分析就是据此两规律而设计的一种分析方法。应用与待测基因相邻近的多态性遗传标记(可测序列),以遗传连锁特征和连锁遗传标记之间重组频率作为遗传性距离,观察与疾病风险关系,进行基因在染色体区带定位。

所谓遗传连锁图是以遗传多态性的遗传标记为路标与遗传性距离(图距)的基因图。通过计算由于重组使两个遗传标记的等位基因之间产生分离重组频率,可以估计出两个遗传位点之间的距离(图距),一般用厘摩(cM),即每次减数分裂的重组率为1%来表示。一般控制在0.7cM之内,否则由于重组分离而发生偏差。

建立精细遗传图的关键是要获得足够的高度多态性遗传标记。最初是应用限制性酶切长度多态性(RFIp)作为遗传标记,到20世纪90年代已被微卫星(MS,又称STR)所取代。微卫星标记是散在分布整个基因组中的短串联重复的二核苷酸、三核苷酸或四核苷酸序列,其中最常见的是CA/GT串联重复。在某一染色体特定位点,同源染色体间微卫星标记的重复次数有很大差异,使用微卫星重复序列的侧翼序列作为引物进行聚合酶链反应(pCR)即可检出微卫星片段长度差别。不同的扩增产物(等位片段),可用聚合烯酸胺凝胶电泳方法分离,通过银染或放射自显影、荧光标记等方法加以检测。

总之,由于微卫星分布广、多态性、易检测等特点,已被作为遗传标记广泛采用。近年来第三代的多态性标记--单核苷酸多态性SNp标记开始应用于遗传连锁分析。单核苷酸多态性是稳定的单碱基取代的两个等位基因(二态性),以较高密度遍布于整个基因组中(将两个基因组相比较,约1000个bp出现1个SNp)。这些特性使之成为适合于高通量自动化基因型分析方法的遗传标记。(三)物理图

1.物理图概况

物理图谱是指DNA序列上两点之间实际距离。应用以已定位的DNA序列STS(序列标记位点)作为路标(与遗传图不同,遗传图是以高度多态的遗传标记如简单串联重复序列STR,MS为路标),以DNA实际长度[即bp、kb、Mb(碱基对、千碱基对、百万碱基对)]为图距的基因组图谱(遗传图以重组率为图距),本质上是一种以特异的DNA序列为标志所展示的染色体图。

物理图谱的连续性是大规模测序的基本保障,那么,怎样把染色体划分成可测定形式呢?因而物理图谱中要解决两个问题:①哪些DNA序列可作为序列标记位点(STS)。②DNA克隆(选择性扩增所需DNA片段),用于DNA测序。

2.哪些DNA序列作为序列标记位点(STS)

序列标记位点(STS)作为基因组染色体位标,即每个STS在基因组内有特定而单一的同源位置,应用其作为DNA标志,在染色体上定位。根据这些特性凡是能用简单、快速的pCR方法测定的DNA标志均可作为STS。

STS组成分析:STS中有些来自非编码区的单拷贝DNA顺序只起位标作用,有些还有多态性,这部分STS的引物顺序仍然具有单拷贝性质,但扩增产物中通常含有短串联重复序列(STR),它们可作为基因连锁分析也可作为染色体位标应用。还有一些STS本身就是基因,它们中有些可能原本是从cDNA发展而来的,称之为EST(人类基因表达序列标记)。

总之,在基因组内有其特定而单一的同源位置的DNA顺序包括STR和EST,均可作为序列标记位点(STS)。

3.构建覆盖每条染色体的大片段YAC和/或BAC连续克隆系列

对人类基因组DNA的测序,必须从DNA克隆开始,对基因组DNA的每个基因的研究也需要首先得到DNA克隆。DNA克隆可选择性地扩增所需DNA片段,用于DNA测序。此扩增的片段是通过合适的载体才能获得。载体有酵母人工染色体(YAC)、细菌人工染色体(BAC)等。(1)YAC连续克隆系(YACSTS物理图谱)(人工酵母染色体携带的人类DNA文库)

人工酵母染色体是利用酵母染色体的结构和复制系统来复制DNA大分子,可以用来克隆200kb到2000kb的DNA片段。

YAC载体可以装载大小超过百万碱基对(Mb)的人类DNA片段。绝大多数人类YAC作图是使用pCR扩增标记(序列标记位点STSS)来检测YAC载体中是否存在某一特定基因座。当然也可使用DNADNA杂交技术。如果使用足够多的STSS或杂交探针,就可构建出覆盖人类基因组上较大区域的克隆重叠群(把大片段DNA克隆,依其在染色体上所在位置排序,得到的相应重叠的一系列克隆称为克隆重叠群),选取有关的克隆进行DNA测序,可以较为容易地组装成全染色体或基因组DNA顺序。

YAC的克隆容量大是其主要优点,但YAC载体有两个严重缺陷。首先是将人类DNA克隆进YAC载体过程中会发生因缺失而产生DNA重排,产生嵌合体。嵌合体是由不同染色体来源的DNA片段,连接在一起构成的克隆,使原本两个在人类基因组中物理上无关区域被连接在一起而装载到同一个YAC载体中,因而不能把这种克隆放在任何染色体的任何位置,它不能被用来进行DNA测序或基因的克隆研究。

其次是YAC克隆DNA分离困难。YAC的大小和性质与酵母染色体无明显差异,因而,酵母染色体中分离出来的人工染色体进行鸟枪法克隆和测序是一个费时又低效的过程。

为了给基因组测序提供一定容量,不会发生大量嵌合体,而且又易DNA分离纯化的载体,有人构建了细菌人工染色体BAC载体。(2)BAC(细菌人工染色体)连续克隆系

BAC是以大肠杆菌F质粒为基础构建的(即利用F质粒的单拷贝控制系统来设计的)。BAC是一种环状分子,在大肠杆菌细胞内非常稳定,不会发生缺失或重排,而且易分离纯化,但其克隆容量与YAC载体相比不及YAC,其克隆容量为100~300kb基因组DNA。(四)转录图谱

由于要搞清人类基因组3×109bp全部序列绝非轻而易举的工作,而且人类基因组中大多数成分是重复序列和非编码序列,于是部分科学家重点研究一些可被转录的序列,这就是人类基因组计划中的cDNA计划,它是从研究基因转录产物mRNA开始的。由于mRNA不稳定,以及诺瑟思印迹杂交检测条件苛刻,一般应用逆转录酶把mRNA逆转录成cDNA,故称之为cDNA计划。其主要目标是收集大量cDNA序列片段,这些序列被称为基因表达序列标志(EST)。

EST指长度为300~500bp的一段cDNA。自动化DNA测序仪的应用极大地促进了人体组织中mRNA转录本的详尽测定。它通过polyT(cDNA克隆末端为polyA,T与A互补)或随机引物引导的细胞mRNA逆转录反应构建cDNA。这些克隆末端可测得3′末端非编码区或5′末端非编码区的短序列,即表达序列标志也可获得这些基因表达转录本(蛋白质编码区)。

基因的不同表达序列标志ESTS示意图

目前已经构建了大规模的EST集合。原则上应对所有组织细胞以及其不同的发育阶段都进行测定,找到足够多的表达序列标志。截至1997年底,公共数据库中EST序列已近90万条。据推算现有EST可能包含90%以上人类基因编码序列。(五)序列图谱

高分辨率的遗传图是制作人类基因组物理图的基础,而物理图谱的连续性是大规模测序的基本保障。

人类基因组序列测定,一般利用基因组BAC物理图为基础采用下述步骤:①将待测克隆随机切成小片段(约1500bp);②将小片段DNA克隆入测序载体;③对每千个碱基对的DNA进行10~30个亚克隆,使用荧光标记的双脱氧法和自动序列仪进行测序;④将相互重叠的读出序列组装成连续的多序列重叠线;⑤从质量最高的读出序列中取得最后的确认序列。

关于cDNA测序,其序列仅占总序列的3%~5%,对这部分序列进行测定,将有可能直接导致编码蛋白质基因的发现,获得基因组中对医学和生物制药关系最密切的信息。当前cDNA测序的趋势是由对部分片段(即EST)的随机测序转向全长cDNA的克隆和测序。因为cDNA测序属于编码序列,有潜在的巨大商业价值。

四、基因组DNA序列提供哪些信息,有助于我们对分子生物学的研究(一)DNA序列可推测出基因的结构

基因结构包括启动子、内含子、外显子等,而且多个外显子存在不同的拼接。cDNA是与基因转录信使RNA互补的DNA,代表了基因外显子的生物学信息,依靠表达序列标记技术(EST)推测基因外显子序列提供有力线索,从中有可能找到与疾病相关的新基因。(二)DNA序列中可找出很多与结构有关的序列

例如,端粒特有的序列-GGATTT;染色体与蛋白质之间相互作用,是通过DNA的一些特定序列来实现的,如转录因子与顺式作用元件。(三)非编码大量重复序列和小分子RNA的发现

人类基因组序列分析发现,非编码区存在大量重复序列及与基因沉默有关的miRNA和RNA干扰现象,为基因调控提供了全新的视角。本章主要讨论大量重复序列的意义。(1)上述遗传连锁图中已谈到的短串联重复序列(微卫星)可作为遗传标记。(2)人类DNA序列存在大量重复序列,如果将重复序列比作大海的话,那么基因则是大海中的岛屿,两者同存同消。Alu家族是人类特有的一大类中度重复序列,其成员共有30000多个,平均5~6kbp就有一个这样的结构,每个长度约300bp,它的Alu命名,是由于其序列中第170碱基处有一个限制性内切酶AluI(AG/CT)的酶切位点而得名。Alu序列分散在整个人类基因组中,具有种属特异性。中度重复序列中还有KpnI家族、hinf家族,也有类似效应。它们的共同特征是重复单位序列相似,但不完全一样,散在分布在基因组中,序列的长度和拷贝数很不均一,均具有种属特性,可制成探针,以鉴别不同种属的细胞DNA来源。值得一提的是,Alu序列是人类特有的序列,有别于细菌与病毒,这就为感染性疾病的诊断提供了理论基础。此外,高度重复序列GC,在原核生物DNA中GC含量均匀,而真核细胞大部分片段GC含量在30%~50%,也可作为参考。

基因组比较分析,将会提供基因进化史的相应证据,GC分布比率的差异,重复序列的分布都将可能与基因分布有关,这些非编码区序列的意义有待进一步研究。

总之,基因组测序告诉我们,人类基因组是一个结构稳定的体系,不同民族、群体和个体都有46条染色体(22对常染色体和一对性染色体),有相同数目的基因和基因分布,也有相同的核苷酸序列,从而保证了人类作为一个物种的共同性和稳定性。这就产生了一个重要问题,即基因组测序的了解,对疾病发生发展有什么关系呢?也就是说,不同族群和个体都有相同数目的基因和基因分布,也有相同的核苷酸序列,它是如何导致疾病发生的呢?这就涉及遗传与变异问题。下节将叙述人类基因组DNA序列的变异。  第4章人类基因组DNA序列分类

人类基因组DNA因序列重复性和序列相似性而构成两大类型。序列相似性是理解基因家族系列与基因超家族系列的基础;而序列重复性变异程度较大,又具有个体遗传特性,常作为遗传标记重点介绍。

人类基因组DNA序列的显著特点之一,是含有许多重复序列。所谓重复序列是指含有一个以上相同序列的拷贝数。重复序列的长短和次数有极显著差别,根据重复序列的重复程度(次数),分为高度重复序列(卫星DNA)、中度重复序列和单拷贝序列。中度重复序列中又根据碱基对长度不同,串联重复序列中又有小卫星(15~65bp的基本单位串联重复)和微卫星(基本序列1~8bp重复)。

人类基因组DNA中约有3/4是单拷贝的,即单核苷的序列只出现一次或很少几次,其余1/4则属重复序列。  第5章人类基因组DNA序列的变异

遗传与变异是生物界的普遍现象,这样生物才能生存与发展。DNA水平上变异可表现在重复序列拷贝数不同,也可表现为单拷贝序列的变异。除一卵双生子外没有两个体的基因组序列是完全相同的。个体的这种差异称为DNA多态性(多样性位点),其产生是由于两条染色体分别来自父和母任意两套染色体。绝大多数变异是无害的或者只引起蛋白质的微小变化,仅有很小部分变异会影响基因功能,此种变异称为突变,也就是说,突变通常是指那些可以或可能影响基因表达水平或基因功能的DNA序列变异,即与疾病相关的特定基因状态称为突变。在基因组DNA序列变异中,遗传多态性较多表现在重复序列和单核苷酸的多态性和突变。(一)DNA重复序列的多态性

人类基因组中遗传多态性较多地表现在重复序列,特别是短串联重复序列的小卫星DNA和微卫星DNA。它们的多态性主要基于重复序列拷贝数的变异。

1.小卫星DNA

通常小卫星DNA全长在20kb左右,由15~65bp的基本单位串联重复而成,而重复次数在人群中呈高度变异,从而决定了小卫星DNA区长度的高度变异性。小卫星DNA分散分布在染色体的不同部位,有在基因内,也有不在基因内。由于在个体间的高度变异性,又是按照孟德尔方法遗传的,是一种较好的DNA多态标记,因而基因定位、DNA指纹分析和遗传病连锁诊断中有其应用价值。

2.微卫星DNA

其结构与小卫星DNA类似,也是由核心区与侧翼区两部分组成,其核心区的重复序列串联的基本单位只有1~8bp,如(TA)n(CGG)n,且通常只重复10~60次。与小卫星DNA比较,其分布在染色体上更广泛,也呈孟德尔方式遗传,因而其重复次数在个体间呈高度变异性,在遗传分析和诊断中应用更为广泛。

3.小卫星DNA和微卫星DNA检测

应用限制性酶切割小卫星DNA和微卫星DNA所在区域时,只要酶切位点不在重复区内,就可得到各种长度不同的片段。通过电泳可以检测和分析这些片段。

小卫星DNA和微卫星DNA均由其核心区(重复单位)和侧翼区两部分组成,且侧翼区DNA序列比较固定。以此作为pCR的引物设计,通过pCR直接扩增其所在区域,形成探针,或用电脉分析测定。当然,也可以直接测序来判断小卫星和微卫星的重复单位的拷贝数。

此外,重复序列中尚有Alu家族序列、KpnI家族序列和hinf家族序列,它们具有种属特异性,可制成探针,以鉴别不同种属的细胞DNA来源,因而在人类学研究中有着广泛的用途。(二)单核苷酸多态性和突变

单核苷酸多态性(SNp)是指DNA序列中单个碱基的缺失、插入或置换,是一类比重复序列多态性更普遍、更重要的多态性。单个碱基变异能导致基因功能异常者习惯上称为DNA点突变,包括碱基替换、小片段的插入或缺失。

突变是指与疾病相关的基因状态,除DNA点突变外,尚有由于染色体移位、大片段DNA的缺失或扩增、基因融合、基因插入所造成的突变。随着检测技术的进步,愈来愈多的研究表明,单核苷酸多态性(SNp)有助于阐明个体的表型差异,不同群体和个体对疾病,特别是对复杂疾病的易感性,以及药物基因组学的研究,均与DNA点突变有关,因而单核苷酸多态性(SNp)是一类更重要的突变类型。

据上述分析,单个碱基变异导致基因功能异常的DNA点突变是疾病发生发展的重要环节,那么单核苷酸多态性有什么特点呢?单核苷酸多态性(SNp)和DNA点突变如何区别呢?

1.单核苷酸多态性(SNP)的特点

SNp系高度多态的遗传标志,呈二态变异,易于自动化检测。(1)SNp通常是一种二等位基因或二态变异,作为一种碱基的替换,SNp大多数为转换,即一种嘧啶碱基转换为另一种嘧啶碱基或一种嘌呤碱基转换为另一种嘌呤碱基。SNp在CG序列上出现最为频繁,而且多为C(胞嘧啶)转换为T(胸腺嘧啶),这是由于CG序列中C常甲基化,自发脱氨后变成T之故。点突变中还有一种为颠换,即嘧啶碱基移换为嘌呤碱基,转换与颠换之比为2∶1。

二态变异的特征,易于自动化识别或检出SNp,例如应用DNA微阵列分析。(2)单个SNp尽管只有两种变异体,变异顺序不如微卫星DNA或小卫星DNA,但由于数量巨大,分布频密(有人估计每400bp就有一个碱基不同,假定1/1000的碱基是多态的话,那么人类30亿碱基中当有300万SNp位点)。因此,就整体而言,它们的多态性高于微卫星或小卫星DNA。(3)SNp构成的单体型,使基因组分型更全面、准确和精细,为致病相关基因的确定提供了更多信息。

在同一染色体上多个多态性位点存在或丧失所构成的类型称为单倍型(单体型)。研究某一单体型与某一疾病的连锁关系的方法称为单体型分析。最早应用多个多态性位点进行连锁分析的是RFLp(限制性片段长态多态性),其单体型是人群中在同一条染色体上限制性位点分布情况的随机组合的结果。显然,应用微卫星或SNp进行单体型分析更好。

SNp位点并不是独立遗传的,而是在染色体上成组遗传,即一组在DNA位置比较接近的SNp位点,在一代又一代的遗传中绝少发生重组。这样每组SNp位点所代表的序列形成一个单倍域,单倍域内全部SNp的类型称为单倍型(单体型)。单体型分析,实质上是把单倍域中全部SNp位点作为遗传最小单位,系多点SNp位点检测与某一疾病连锁关系。两条染色体多个位点都纯合的概率毕竟是很小的,因此单倍型(单倍体)有助于区分两条染色体,并追踪致病基因分离情况。

2.区别突变和DNA多样性

突变是指那些可以或可能影响基因表达水平或基因功能的DNA序列变化。但人群中还存在一种DNA序列多样性(多态性),即正常人群中各个体间的DNA序列也有很大差别,这些差别的区域一般称为多样性位点。

基因的不同序列变异有的可能是致病突变,而有的是存在于人群中多态。

点突变与DNA多样性位点的区别是突变影响基因表达水平或功能,具有病理学意义的DNA序列变化;而DNA多样性位点则无病理学意义,称之为中性的DNA多样性位点。

那么如何区别中性的DNA多样性位点和致病的基因突变(包括致病突变和与疾病相关的多样性位点)呢?其最佳途径是对基因产物进行功能分析,基因通过其表达产物发挥其生理病理作用,但目前绝大多数基因功能分析很困难,甚至根本不知道基因功能。因此通常只能够检查足够的正常人的基因序列,并与病人序列相比较,以此鉴别SNp与DNA突变。如果在病人身上发现的DNA序列变化也以相同的比例存在于正常人群,该序列变化就不太可能与疾病相关;如果正常人群中不存在相应的DNA序列变化,则该序列变化就有可能与疾病相关。

--致病基因识别与鉴定小卫星、微卫星等重复序列的变异,单核苷酸突变或多态都提供了大量遗传标记,这些多态性可以用来研究分析一个个体,也可以用以分析一个群体的遗传结构,因而在人类学中有广泛用途,包括人类进化、不同群体或民族之间关系、他们的来源与流动等等。对于医学工作者来说,当务之急是对致病基因识别与鉴定,为基因诊断与治疗提供理论基础与研究策略。致病基因识别与鉴定,目前仍是应用遗传标记进行连锁分析、关联研究,以及对复杂疾病的全基因组扫描研究,当然对某些已知基因异常的性质,并肯定该异常与疾病之间关系的一些疾病则可直接进行基因突变的检测。

下面从基因突变检测、基因连锁分析、疾病关联研究、复杂疾病的基因定位等几个方面,简述各种多态性标记在医学中的应用。  第6章基因突变检测

应用基因突变的检测技术诊断患者是否由于该基因突变所致。其应用条件是必须知道该基因片段序列结构、基因异常性质(一种基因可有不同突变类型)并肯定该异常与疾病之间有关系。然而,由于许多疾病的遗传异质性,多数遗传病的基因异常尚属未知。目前虽然能直接诊断的病种日益增多,但仍然是比较有限的。许多疾病不能采用突变检测途径,而要借助于遗传标记的遗传分析,探讨可能的致病基因。(一)为什么必须知道欲检测的基因片段序列结构,才能进行诊断呢

这是由于目前基因诊断技术虽然方法众多,但归结起来就是核酸分子杂交和聚合酶链反应(pCR)两大类。核酸分子杂交是指来源不同的两条单链核酸分子,通过碱基互补,可形成杂合双链,从而判断两者同源程度,即应用已知序列的DNA或RNA片段作为探针,来检测样品中未知核酸序列。而pCR是一种引物介导下DNA体外合成扩增技术。此寡核苷酸引物是用已知DNA序列设计的,与待扩增的DNA具有互补性的核酸。因而,这两种基本技术均必须知道待测基因序列结构。(二)根据基因异常性质,采用不同的突变检测策略

基因突变检测方法众多,选用哪种方法进行呢?则需根据突变类型。突变类型一般分为基因大片段缺失或插入、小片段缺失或插入和点突变。点突变是指单碱基置换或颠换,微小片段的碱基缺失或插入。目前认为所有遗传病都是由于基因突变所致,而点突变所造成遗传病占绝大多数。

1.较大片段缺失通常采用Southern印迹杂交分析

例如,X性连锁遗传病DMD的男性患者有某大片段缺失,用位于该片段序列的cDNA探针对Southern印迹杂交做分析时,就不能检知应有的杂交片段信号。较大片段的缺失突变也可进行pCR检测,此pCR检测是采用某目标外显子上下游序列为引物,进行pCR扩增。如该外显子序列缺失,则得到预期的扩增产物。若大片段的缺失涉及多个外显子,可采用多重pCR,即同一pCR反应中用多对引物扩增多个外显子,电泳后根据扩增产物条带分布,分析哪些外显子缺失。

2.小片段的缺失和插入及点突变

可采用等位基因特异的寡核苷酸(ASO)探针技术,单链构象多态性(SSCp)诊断法。但由于致病基因可在任何位点上产生突变,故一般应用pCRASO技术或pCRSSCp,即先将含有突变点的基因有关片段进行体外扩增,随后再与ASO探针作点杂交,或进行SSCp检测。

pCRSSCp法具有能快速、灵敏地检测有无点突变或多态性的优点,因而被广泛采用。其检测原理如下:

SSCp是指单链DNA由于碱基序列不同引起构象差异,这种差异将造成相同或相近突变序列的单链DNA电泳迁移度不同,从而可用于DNA中单个碱基替代、微小片段的缺失或插入的突变检测。用SSCp法检查基因突变时通常在疑有突变的DNA片段附近设计一对引物进行pCR扩增,然后将扩增产物用甲酰胺等变性,并在聚丙烯酰胺凝胶中电泳,突变所引起的DNA构象差异将表现为电泳带位置的差异。

3.如果点突变影响到基因的剪切位点,即可分析mRNA来证实点突变的存在。此时应用RTpCR分析其产物的大小,而得知剪切位置是否有点突变。

4.近年来发现一些遗传性疾病是由于基因内三核苷酸重复顺序增加(重复扩展突变)所引起。其特征是串联的三核苷酸的重复拷贝数(又称重复子增加)可随世代的递增而呈现累加效应,故又称动态突变。其中由CAG重复扩展导致的疾病较多。这些疾病的CAG重复扩展序列都位于各自基因编码区,病变严重程度与重复扩展CAG长度呈正相关,已有较多证据表明CAG重复扩展可能赋予基因产物(蛋白质)一种新的功能,导致神经细胞易损伤性增加,认为在正常的神经细胞基因中相对少的重复数可能与维持神经系统正常功能有关。

重复扩展突变(动态突变)一般可用pCR扩增片段长度多态性检出。  第7章基因遗传连锁分析

由于许多疾病的遗传异质性,以及多数疾病的基因尚未定位,或异常尚属未知,因此还不能根据突变的性质进行基因诊断。

连锁是一种遗传现象,是指当同一条染色体上某些位点由于相距很近,在减数分裂过程中,这些位点发生交换的概率较小,所以有较多的机会连锁在一起,从亲代传递到子代。位点间的距离越近,在减数分裂过程中发生交换的可能性越小,位点间重组的概率就越小。相反,如果两位点距离越远,则交换产生重组体的概率越大。

基因遗传连锁分析是通过家系分析,证明某一DNA标记(多态性位点或片段、常用微卫星)与致病基因连锁。这样,凡带有该标记的成员都可能带有致病基因,从而作出间接诊断。家系分析的实质是确定待诊断个体是否从亲代获得了携有致病基因的那条染色体。

鉴于致病基因及其邻近的遗传标记,在世代传承中存在共遗传共分离(在减数分裂中一对染色体的某些区域可发生重组和交换,从而使原先共同遗传的DNA突变与DNA标记分离),因而连锁分析法应用时就需要注意下述几个问题:

1.基因与DNA标记之间可能发生重组。因此,连锁分析的准确性取决于DNA与致病基因连锁的紧密程度,连锁愈紧密可靠性愈高。两者共遗传的程度,一般应用重组率表示。重组使得原先共同遗传的DNA遗传标记与致病基因分离。重组率高低作为标记距基因的遗传距离大小。重组率1%称为1个图距(cM);如果重组率为5%,即标记距基因有5cM(图距),以此作出致病基因的诊断尚有5%误差的可能。一般认为,重组率高于5%的连锁探针不宜使用。

2.被选用的遗传标记在人群中的杂合度。如果标记的杂合度在人群中很低,即多数个体为纯合子,则这种标记用处不大,因为如家系中关键人员不能提供致病基因在哪一条染色体上的信息,常使连锁分析无法进行,因此需选用人群中杂合度高的标记。

人类基因组中存在两类多态性标记:一类是限制性内切酶的酶切位点改变造成的RFIp(限制性片段长度多态性),另一类是串联重复顺序拷贝数不同形成的多态性,尤其是其中的短串联重复序列STR(微卫星)。

由于RFIp多态性信息容量低,纯合子比例过高,且不能在每个致病基因附近均具有紧密连锁的RFIp存在(RFIp的多态性只有两个等位片段,即限制性位点有或无),因而连锁分析常应用STR(短串联重复序列、微卫星)作为DNA多态标记。

STR在人基因组中广泛存在,约占真核生物基因组的5%,其基本单位是2~6bp的串联重复序列,以(CA)n及(GR)n重复最多,在基因组中散在分布着5万~10万,具有高度多态杂合性并符合孟德尔遗传定律的STR,即每30~60kbDNA就存在一个CA或GT重复序列。重复次数大约为15~60。当n>14时,重复次数呈高度多态变化。由于其重复的基本单位(又称高变区)的DNA长度变化很大,使重复基本单位的两侧限制性内切酶识别位点的固定位置随高变区的大小而发生相对位移,其多态性位点可以有两个或两个以上等位片段,而且只要设计出所需扩增DNA两侧序列的引物进行pCR扩增,能较容易地在聚丙烯酰胺凝胶电泳上分辨STR的重复次数。总之,STR本身包含的多态信息容量明显高于RFIp且易检测制成探针,因此,STR作为遗传连锁标记得到广泛运用。

3.在连锁分析时,有时只分析一个多态位点,还不能把某一家系中带有致病基因的染色体与正常染色体区分开来。这通常是由于关键成员如待诊者的父母是纯合子,不能提供必需信息,以及基因与DNA标记之间可能发生重组,造成标记与其致病基因分离。这时可同时分析更多多态位点,即作单倍型(单倍体)分析。

单倍型(单倍体)是指一条染色体上有两个或两个以上多态位点的状态组合。两条染色体多个位点都纯合的概率毕竟是很小的,因此单倍型有助于区分两条常染色体并追踪致病基因分离情况。

基因定位克隆研究策略的基础,是利用连锁分析法,此法虽不能对先证者做诊断,但在先证者已有正确诊断,并具有家系成员间准确关系时,可以分析家系中其他成员是否遗传有致病基因紧密连锁的某一遗传标记,从而确定该基因在染色体上的大体位置。在此基础上,在该染色体区域再使用覆盖密度更高的遗传标记作单倍型分析或连锁不平衡关联分析(下节详述),就可将致病相关基因确定在较小区域。在人类基因组序列已知的今天,一旦发现与致病相关基因连锁的两侧遗传标记,根据遗传标记的具体位置,我们就可以知道定位区域内所有基因,随后在该区域内选择候选基因直接进行测序,从而分析该病的致病基因。  第8章疾病的关联分析

关联分析是遗传分析中一种重要的分析方法,其研究基因定位是基于遗传标记位点等位基因与致病基因位点间存在连锁不平衡,分析时不需要家系资料,而且与连锁分析相比其基因定位克隆范围更小。现就关联分析原理、特点及存在问题分述如下:(一)疾病关联分析原理

连锁不平衡是关联分析的理论基础。

在同一条染色体上基因连锁遗传(遗传标记与致病基因连锁遗传)称为连锁平衡。这样只要鉴定遗传标记的存在,就可以判断受检者是否带有致病基因。所谓连锁不平衡,是指当某一遗传标记主要存在于正常染色体而不存在于疾病染色体或者反过来,只存在于疾病染色体的现象。通过分析正常群体和患病群体的某一DNA遗传标记的特定等位片段出现频率,比较两组间是否存在显著差异,若有显著差异,则表明此遗传标记与某一疾病表型关联。一般说来,连锁不平衡时患者中遗传标记的频率将高于正常人群。其产生和重组有关,因而连锁不平衡与连锁分析一样,是以物理距离与重组频率为依据的。

也就是说,关联研究和连锁分析的原理和假设基本是相似的,两者均以相邻近的DNA变异共分离为基础。连锁分析是通过鉴定经多代传递仍完整的单倍型为基础,检测在一个家系中等位基因(标记)与疾病的传递是否相关;而关联研究则是通过鉴定经许多代传递后仍保留完整的相邻近DNA变异之间的DNA片段,检测在一个群体中疾病和等位基因(标记)的相关性的存在与否,若有相关,则该致病基因即在此标记附近。因而,关联研究也可认为是在未观察到的、可能存在家系中进行大规模的连锁分析。(二)关联分析的特点

1.关联分析是一种病例对照研究方法,无需家系资料,在无亲缘关系的群体中随机选取疾病组和相应非疾病组,比较标记位点(遗传标记)的等位基因频率。此法与基因遗传连锁分析不同,连锁分析必须具有家系资料,因而关联分析在临床应用上更广泛。

为什么关联分析不需家系资料就可诊断呢?这是由于关联分析的基础是连锁不平衡。它是指某一个多态性位点在正常基因和等位突变基因(致病基因)中分布频率有显著差异。因此,可利用与特异等位基因(致病基因)连锁的这一多态性(标志)进行基因诊断。例如,β珠蛋白基因3′旁侧有一个BamhⅠ多态性位点(标志),因此正常人的酶切图谱有9/9、22/9和22/22kb三型,但β地中海贫血纯合子只有9/9kb型,故可不经家系分析,仅以这一多态性(遗传标志)即可作产前诊断。

2.检出率高于家系连锁分析,常用于多基因疾病的研究

在复杂病例中不但可检出主效基因,而且可检出相对风险小的次效基因,有助于弱效基因(微效基因)的发现。这也是同一位点相关分析阳性,而连锁分析阴性的原因之一。

3.检出的相关位点(遗传标志)与致病基因的距离多在1Mb(1cM)之内,而家系连锁分析阳性位点可远至2~10cM(图距),故相关分析发现的位点后进行基因定位克隆范围较小,有助于遗传病基因的精细定位。

至于为什么相关分析能检出弱效基因和有助于遗传病基因精细定位,一般认为由于连锁分析只对在世的几代人进行,重组在短短几代人中发生机会较少,因此连锁分析所鉴定的含疾病相关基因的染色体区域往往很大,甚至达几百万碱基,含上千个基因。与此相反,关联研究是以群体历史上重组为基础,任何连锁不平衡状态,是历经整个群体历史中重组的“磨损”而保存下来。随着一系列重组事件的发生,突变携带者共有的染色体片段不断缩短,以致含致病位点的染色区域亦得以大为缩小。因此通过关联研究所定位区域往往较小甚至只含一个基因或基因片段。如有人报道定位的哮喘相关区域只有133kb,为哮喘相关基因GpRA第2内含子与第5内含子之间片段。另一方面重组“磨损”而保存下来的弱效基因与遗传标志位点足够近,才能避免频繁重组所造成的标志与致病基因分离,故能发现主效基因和微效基因。

一旦在人群进化的某个阶段形成特定位置基因的连锁不平衡,由于致病基因与被研究遗传标志间紧密连锁不平衡状态可能观察到很多代。但由于遗传漂变和选择产生的不平衡在不连锁的基因座将很快消失,而紧密连锁基因座之间的连锁不平衡消失很慢,因而研究一个遗传标志与疾病相关基因座之间的连锁不平衡,将有助于疾病基因的精细定位。(三)关联分析应注意的几个问题

1.在人群中患病率低,且不易获得众多家系研究对象的疾病,可行的基因定位途径是关联分析。

2.遗传标志位点与致病基因足够近,才能避免频繁的重组。因而早期应用的限制性内切酶标志位点,已被微卫星或SNp所替代。

3.需大量样本才能有利于严格意义上具有显著结果的发现。病例对照研究方法其分析统计学指标为相对危险度(RR),系患病的风险指标,故需较大样本进行对照。

4.注意群体分层问题及TDT分析法的应用。

需考虑如何使患者组与正常对照组相匹配以及人群、地理和社会背景等,这是由于这些不同条件下等位片段的频率往往有很大差异,尤其是种群组成差异造成两组间标志位点等位基因频率及可能的致病基因频率差异而致的假阳性。

近年来,家系传递/连锁不平衡分析(TDT分析)倍受推崇。此法在家系内进行分析,同一家系中正常同胞作为对照,避免了另设对照组时样本选择对统计结果带来的影响,而且观察双亲(至少一个是杂合子),将标记位点的等位基因传递给患者频率明显提高,因而可完全消除种属分层引起的误差,还可用于分析父母在基因传递上的差异。  第9章基因表达谱--mRNA表达谱(mRNA差异显示法)

细胞基因表达差异最具代表性的一种方法是mRNA差异显示。它通过比较各类基因表达谱,了解各类细胞之间(或各种状态之间)及复杂器官的不同亚区之间基因表达差异,判别表达的有关基因,即与此疾病或某器官之间不同亚区基因表达相关。

当有差别的基因表达低丰度时,则可应用差减杂交与mRNA差异显示相结合进行mRNA表达谱研究。

mRNA表达谱本质上是一种cDNA芯片技术和转录图(表达序列标记图EST)发展基础上测量mRNA表达群的一种新技术。转录图并不能作为特定细胞或表达基因的量化分析数据,因为基因表达时有较多基因表达(人类基因估计约有2万~3万,20%选择性表达)。而基因表达谱是以一个细胞、一种组织或一个器官为单位,提供正在表达的mRNA群体,从而了解基因表达的类型和表达丰度。

本文简述此法的理论基础、技术关键、应用条件、技术路线和应用进展。(一)mRNA差异显示寻找未知表型相关基因的理论基础和研究思路

1.理论基础是细胞基因的选择性表达

人类基因组约有2万~3万个基因,但对某种细胞而言,仅一小部分表达,约占15%~20%。在正常细胞生长、分化过程中,基因选择性表达决定生命过程。如干细胞分化为各种特殊细胞,是由于基因表达差异;在病理过程中,作为疾病的原因或结果,也存在基因表达差异,即在病理(异常)与正常mRNA表达谱存在差异。故细胞基因的选择性表达,决定各种细胞分化、增殖的生理和病理过程。

2.差异显示寻找候选基因的研究思路

从表型差异着手,通过正常与异常mRNA表达谱差异,追踪到基因差异,从而克隆与表型差异高度相关的候选基因。(二)mRNA差异显示法的技术关键

mRNA差异显示是应用RTPCR(mRNA逆转录成cDNA,扩增cDNA),对比正常与异常细胞的cDNA差异,虽然克服了传统mRNA检测诺瑟思印迹杂交的应用条件苛刻、操作复杂等问题,但要同时显示上万个mRNA表达谱,则成为此技术的关键。

人类基因目前认为有2万~3万个、15%~20%表达,而且尚存在外显子的不同拼接(如CD44黏附分子,有20个外显子,产生众多CD44S、CD44V的mRNA系列),形成不同的变型mRNA。这样,细胞基因的mRNA表达谱将有上万个mRNA,如何同时显示。通过两种PCR引物设计,解决同时显示mRNA表达谱和cDNA芯片扫描检测与该疾病相关的候选基因。

1.两种引物设计即锚定引物和随机引物的不同组合,可展示1万~1.5万种mRNA的表达(1)锚定引物T12MN

T12:含有12个T(胸腺嘧啶),结合mRNA3′末端polyA(腺嘌呤)[基因转录表达时首先形成不成熟的mRNA。不成熟的mRNA要经过切除内含子和加帽(G)、加尾(polyA)才成为成熟的mRNA。A-T互配]。(2)随机引物

四种碱基寡核苷酸之一,根据AT、GC互配原则可在polyA末端不同距离的多个位置上结合。通过上述锚定引物和随机引物的不同组合,可同时测量1万~1.5万种mRNA表达。

2.cDNA芯片扫描

cDNA芯片(表达谱基因芯片)是基因芯片中一种应用较广泛的基因芯片。基因芯片技术综合了分子生物学、半导体微电子、激光、化学染料等领域的最新科学技术,进行基因扫描检测。

cDNA芯片是采用设计好的cDNA作为固定靶基因,将cDNA片段有序、高密度地(点与点之间距离一般小于500μm)排列在玻璃、硅等载体上制成基因微矩阵(Microarray)。将待测样品(需要比较来自不同表型的细胞中提取的mRNA,经RTPCR形成的相应cDNA片段)用不同颜色的萤光染料标记,制备成探针与cDNA芯片杂交。所得的萤光显示的杂交态势,经认别两种颜色的萤光扫描后,用特定的电脑分析,比较在芯片上形成杂交态势,从而判断两种来源的mRNA中所含的基因表达产物的区别。(三)mRNA差异显示应用条件和差减杂交与mRNA差异显示结合的技术路线

1.应用条件

差异显示是在对比中产生的,因而要选择有高度可比性及表型特征差别明显的两种细胞作为研究对象。可比性即严格控制遗传背景,去除无关差异,仅关注表型。如肿瘤细胞的高度转移与正常细胞有明显差异。

2.差减杂交与mRNA差异显示结合的技术路线

mRNA差异显示要求对比的两种RNA群体有明显差别,但遇到两者RNA群体差别很小,有差别的基因表达很低(低丰度)怎么办?此时则先应用差减杂交,使差异片段富集,然后再进行mRNA差异显示。

为什么差减杂交能提高低丰度的mRNA?

差减杂交即先将来自不同表型的两个群体中RNA逆转录成cDNA。欲测细胞RNA群体逆转录成cDNA(称受试者),而比较参照细胞RNA群体逆转录成cDNA(称驱动者)。用受试者与驱动者的cDNA群体相互杂交,形成双链cDNA移除(差减杂交),则剩下来的未被杂交的cDNA就代表那些只在受试者细胞表达而不在驱动者细胞表达的基因。也就是说,此法可使差异的DNA片段富集,然后再进行差异显示。(四)mRNA差异显示的应用

mRNA差异显示技术,由于其方法成熟规范,目前已有多家基因公司提供表达谱技术服务(如上海博道基因技术有限公司,他能提供表达谱基因芯片、mRNA制备、探针标记和杂交及表达谱信息分析、基因表达数据库的构建等技术服务),故已广泛应用于各研究领域,尤其在肿瘤分子病理学研究方面,能在较短时间内克隆出新基因或同源基因的突变,从而可在基因水平探讨各种生理及病理过程的机制。

1.肿瘤分子机制研究(1)差异显示获得的cDNA片段与已知基因的DNA序列同源,进一步应用单链构象多态分析(SSCP)等突变检测,发现该基因存在异常突变的激活状态。

例如,ras基因突变在肿瘤发病学中的意义。

人类许多肿瘤如肺、结肠、胰腺、乳腺、卵巢、膀胱等癌变和某些白血病等,均可发现与其相应组织存在显著差异的cDNA片段,此片段序列查阅cDNA基因文库和ras基因同源,而且SSCP检测表明该基因存在点突变。

ras基因通过其表达产物P21,促进细胞生长,一般很少表达或不表达。当其产生突变时呈激活状态。如膀胱癌系的ras癌基因与对应的原癌基因发生点突变时其表达产物P21蛋白(第12位氨基酸的甘氨酸由缬氨酸替代)发生生理功能改变。P21是细胞膜上的一种信号蛋白,当它被激活时,便会从与GDP结合的无活性状态,变为有活性的与GTP结合状态,产生刺激细胞生长信息。(2)差异显示cDNA片段在正常组织中表达而在肿瘤组织不表达或表达很低,有助于抑癌基因的发现。

抑癌基因致癌的特点是必需该基因的两个等位基因都突变或缺失,即处于纯合失活状态。细胞因正常抑制的解除而恶性转化。抑癌基因单位点的丢失或失活,因尚有另一位点基因能正常表达并不产生恶性表现,故称之为遗传倾向性。因此,抑癌基因的发现和分离都比较困难。

差异显示提供了恶性肿瘤的相应正常组织中该基因表达的差异(正常组织中存在而肿瘤组织中不存在该基因的cDNA片段),则尚须进行杂合性丢失(LOH)来证实,此cDNA片段是抑癌基因。

目前,发现人类几乎所有常见的肿瘤都伴有一种或多种抑癌基因丢失或突变,如大肠癌抑癌基因APC基因的发现与证实。APC基因位于5q21,是大肠黏膜上皮的管家基因,维持黏膜上皮的自稳定,其表达蛋白是细胞增生,转化为癌变的限速酶,是人类新发现的大肠癌负相关基因。(3)对比正常组织与恶性肿瘤基因表达差异,寻找与转移有关的基因。

应用脑癌、甲状腺癌、肝癌、前列腺癌、乳腺癌等手术切除的淋巴结转移灶与其对应的正常组织比较。如前列腺癌获得166bp的cDNA片段在转移灶区高度表达。该片段与人巨噬细胞移动抑制因子(MIF)有93%同源,而且MIF高表达,进一步在临床还有转移的前列腺癌手术标本中得到验证,故高表达的MIF有可能成为转移性前列腺癌的诊断标志之一。

又例如,肿瘤转移抑制基因nm23的发现(nm表示转移抑制,其cDNA的克隆编码为23),它在mRNA差异显示技术比较中发现与黑色素瘤、乳腺癌、胃癌、结肠癌、前列腺癌、肺癌等多种肿瘤的转移有关。nm23表达水平与转移呈负相关。

此外,差异显示在转染细胞实验性研究中正得到广泛应用,本文不详述,有兴趣的读者请参阅有关的专业书籍。

2.mRNA差异显示在其他领域的研究进展(1)比较多个处于不同发育阶段的同种细胞或组织的基因表达谱,可以鉴定与发育、分化相关基因,如比较不同育龄的胎肝与成人肝。(2)比较不同物种之间同类细胞或组织的基因表达谱,可了解种属差别的分子机制,如人肝和鼠肝。(3)复杂器官的亚区域的基因表达谱的比较研究,如人结肠黏膜基因表达谱和十二指肠等其他肠区的基因表达谱的比较研究,将有可能在分子水平上丰富我们对肠道不同区域生理功能差异的认识。  第10章复杂疾病的基因定位(一)微卫星全基因组扫描

人类疾病尤其是许多重危慢性疾病,其发病涉及众多基因,而且基因间相互作用还不清楚,因而上述单纯连锁分析、单纯连锁不平衡的相关分析,在复杂疾病相关基因的认别和定位上取得的成绩有限,这主要与遗传标记序列选择有关。随着单纯核苷酸多态性(SNp)的大量发现(微卫星位点约有8000、SNp位点约有300万)而且其变异是二态(两种变异体),因而SNp标记具有高分辨率,易于自动化批量检测,作为基因组连锁分析或关联分析的遗传标记,从而获得同时筛查众多相关基因的有关信息。最近,已有报道通过SNp关联分析,发现两个前列腺癌相关基因,也有作者以SNp为标记进行了TDT(家系传递/连锁不平衡)综合分析。但由于受到经费与设备限制,目前全基因组扫描仍以微卫星作为标记。微卫星具有种类多、分布广、呈高度多态性和杂合性、易用pCR扩增等特点,已成为最常用的遗传标记。多色荧光标记微卫星引物已经商品化,如微卫星标记引物分别标有FAM、hEX、NED3种不同的荧光标记物,在激光扫描下分别显示蓝色、绿色和黄色,并根据其所扩增片段的大小及荧光标记的不同,分成不同组,每组5~14对引物,分别进行多重pCR和聚丙烯酰胺凝胶电泳。含有荧光标记物的电泳条带经测序仪激光扫描后将数据存入电脑,应用软件进行图像及数据处理计算等位基因大小和频率。

软件图像显示及数据处理大致步骤如下:经GENESCAN3.0软件处理后转换成图像文件,再经过GENOTYpER2.1软件处理后得到每个样本不同位点的基因型结果。数据处理是将每个样本不同位点的基因型结果按其在染色体上位置依次排列,并结合其表型做成数据文件。

总之,微卫星全基因组扫描是利用特定的引物将某条染色体上特定位置的微卫星扩增出来,并进行分析。这种分析所使用的微卫星在不同个体其长度不同(核心基本单位重复次数不同),而不同长度的pCR产物则代表某一位点不同的等位基因。微卫星在各条染色体上分布密度约为10cM(图距)。检测每个微卫星是否存在与其邻近的疾病相关基因座位连锁。全基因组扫描并不能直接搜寻具体的疾病相关基因,而是通过研究均匀分布于整个基因组的微卫星标记来间接选择其相关的基因座位。在得到阳性结果后,又可在这些阳性结果位点附近利用SNp,并用同样的方法进一步确定哪一个多态性位点与疾病连锁的可能性最大。一般说在相同的多态信息量值(pIC)要求下SNp图谱的密度为微卫星图谱的2.25~2.5倍。显然SNp对基因定位的范围更精细。因而,利用SNp标记能检测出微卫星标记不能探测到的疾病相关区域。目前,已有应用于全基因组扫描的SNp芯片供应(SNp数目分别为50万个、10万个和1万个),预计随着SNp芯片的完善和成本的进一步降低,将成为未来疾病相关基因研究的主流技术。

当前,人类基因组序列已知,故一旦发现了与疾病相关基因连锁两侧的遗传标记,根据标记位点的具体位置,就可知道定位区域的所有基因。因此,当定位区域确定后,在该区域内选择候选基因直接进行测序。对所发现的突变在病人组和对照组进行分型并分析,搜寻致病基因;当然也可直接从公共数据库挑选候选基因编码区、调控区(包括内含子)中的SNp进行连锁不平衡分析确定致病基因。(二)微卫星全基因组扫描寻找家族性房颤致病基因(Science,2003)实例分析

房颤是一种十分常见的心律失常,其产生可由于遗传或高血压等心血管疾病。但对家族性房颤的致病基因知之甚少。《科学》(Science)杂志2003年报道其研究结果,认为KCNQ1基因(编码钾离子通道基因)是家族性房颤的致病基因。

该报道经家系分析和房颤金标准诊断后,对家系中有血缘关系的39人进行微卫星全基因扫描。引物5′末端标记在激光激发下可发出不同颜色的荧光素标记,进行多重pCR。每一样本的pCR产物长度通过测序仪检测,其不同长度的pCR产物则代表某一位点不同的等位基因。通过收集每一个个体的相关信息,并经对数优势记分法(LOD)进行连锁分析,结果发现在D11S4181微卫星处LOD值达4.46,明显大于3.0,表明D11S4181附近的确存在房颤的致病基因(LOD评分是分析连锁关系的统计学方法,一般认为LOD值=3.0或1/1000差异是连锁成

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载