药用植物亲缘学导论(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-17 12:50:25

点击下载

作者:郝大程、肖培根 著

出版社:化学工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

药用植物亲缘学导论

药用植物亲缘学导论试读:

绪论 药用植物亲缘学的创始与发展概况

0.1 缘起

20世纪50年代,西方对新中国实施了“禁运”,寻找国产中药材的任务便落到了一批刚走出校门的年轻人的肩上。这项艰巨的任务从何入手?最简捷的手段便是寻找和进口药材最接近的国产药材,从国产植物资源中寻找。当时治疗高血压的“利血平”十分红火,它的原植物是蛇根木(Rauvolfia serpentina),我们从产在南方的萝芙木(R. verticillata)中找到了含相似生物碱和相似疗效的资源,因此很快生产了国产降压制剂(以“降压灵”为代表),而且萝芙木属中大部分种均含相似的生物碱,具有相近的降压效果。这成功鼓舞了一些年轻人,并相继找到了国产胡黄连、安息香、阿拉伯胶、马钱子、大风子、阿魏等资源,为我国找寻和开发进口药的替代资源立下了汗马功劳。通过这项实践,使以肖培根为代表的研究人员,埋下了植物亲缘相近的种类其化学成分和疗效也相近的初步认识,以后肖培根在进行毛茛科植物和其他药用植物研究时初步总结了这方面的规律性。

0.2 进展

20世纪60年代肖培根在进行藏医藏药的研究时,有一种常用藏药叫“Tangchom Gaabo”,原植物为矮莨菪(马尿泡)(Przewalskia tangutica)。这种植物尚未有化学研究,肖培根考虑其亲缘相近的种类均含有莨菪类生物碱,因此它也很可能含有。化学分析研究表明,矮莨菪不仅含有这类生物碱,而且含量还十分高(表0-1;Xiao和He,1982,肖等,1984),可供生产原料用。这一结果发表在德国的“Planta Medica”杂志上,为当时莨菪类生物碱增加了一个新资源,受到大家的关注,化学分类学权威Heugneur在他的化学分类学专著中引证了这一发现。表0-1  莨菪类藏药的化学分析结果注:Ⅰ,莨菪醇(tropine);Ⅱ,红古豆碱(cuscohygrine);Ⅲ,山莨菪碱[(-)-6β- hydroxyhyoscyamine,654];Ⅳ,莨菪碱(hyoscyamine);Ⅴ,去水阿托品(apoatropine);Ⅵ,樟柳碱(anisodine);Ⅶ,东莨菪碱(scopolamine)。trace表示痕量。

药用植物亲缘学(pharmacophylogeny)在发展过程中特别强调学科间的渗透和交叉,因此在大黄属及其药用植物疗效的整理和分析中特别运用电子计算机及数量分类学的方法参与其中,获得了良好的效果。如在大黄的研究中,发现凡是有显著泻下作用的大黄,均含有大黄酸与番泻苷(表0-2、表0-3;肖培根,1981;肖培根等,1982),而且在形态上叶子边缘具不同程度的波状或掌状分裂,这方面所得规律性为大黄质量控制及标准化和资源利用创造了良好条件,引起大家关注。表0-2  大黄、山大黄和土大黄的区别表0-3  中国民间应用的大黄属药用植物

对传统疗效的系统分析,揭示了不同分类类群传统疗效的倾向性,为新药寻找和研究提供了可贵的资料及线索。

0.3 愿景

药用植物亲缘学具有强大生命力的一个要点,即要善于吸收新技术、新知识、新观点,从而与时俱进,不断创新。郝大程博士/副教授2008~2010年曾在药用植物研究所亲缘学中心进行博士后研究,根据迅速发展的分子生物学和组学,于2014年提出了“药用基因组亲缘学”观点(郝等,2014);肖培根团队根据迅速发展的“疗效观察通过靶点”来阐述其机理,逐步加强这方面的实验工作。总之,药用植物亲缘学需要吸取相关学科的营养不断充实发展,前景是十分光明绚烂的。

参考文献

Xiao PG,He LY. 1982. Przewalskia tangutica-A tropane alkaloid-containing plant. Planta Med,45(2):112-115.

郝大程,肖培根,刘明,等. 2014. 从药用亲缘学到药用基因组亲缘学:分子系统发育、进化与药物发现. 药学学报,49(10):1387-1394.

肖培根,何丽一,王立为. 1984. 莨菪类藏药的研究. 中国中药杂志(中药通报),9(1):10-11.

肖培根. 1981. 大黄属药用植物的资源利用. 中国中药杂志(中药通报),6(2):11-13.

肖培根,徐克学,宋晓明. 1982. 大黄属植物的外形、成分与泻下作用间联系性的多元分析. 中西医结合杂志,2(4):231-234.

第1章 药用植物亲缘学论纲——知识谱系、认识论和范式转换

1.1 概述

中药资源是我国中医药事业发展的基础,采用创新的理论和方法寻找和发现中药新资源是中药资源可持续利用研究的热点和重点。肖培根提出的药用植物亲缘学从理论上总结药用植物的生物亲缘关系、化学成分和疗效(传统疗效和药理活性)间的相关性(肖1978,1980;肖等,1982;陈等,2005),该学科的建立对开发中药植物资源具有重要指导意义(彭等,2006;杨等,2008;曹和王,2013);系统发育基因组学方法可用于药物发现和开发的相关问题研究,可在组学水平拓展药用植物亲缘学的领域,由此衍生出药用基因组亲缘学的新概念。本书作者基于药用植物亲缘学的长期研究积累,提出这一新概念。本章简述药用植物亲缘学的知识谱系、研究方法和范式转换,展望药用基因组亲缘学的理论和实践价值。选择《中国药典》2015版收录最多的毛茛科为例,可以对药用基因组亲缘学进行深入的概念验证和实证研究。结合传统药物学知识积累(包括中药药性和功效知识)和药理研究揭示的生物活性,在基因组、转录组和代谢组水平探讨毛茛科及其重要族属的系统发育和进化关系,揭示药用植物基因型和代谢表型,以及近缘种遗传多样性和化学多样性的内在关联。通过毛茛科示范研究,丰富药用植物亲缘学研究的内涵,开放地吸收有关领域的新知识和新技术,促进中药资源学科的成长。

近年随着高通量测序技术的迅猛发展,生物系统发育研究中开始采用基因组数据,因此出现一些新术语,如系统发育基因组学(phylogenomics,基因组系统学/基因组亲缘学;Eisen和Fraser,2003)、药用系统发育基因组学(pharmacophylogenomics)(Searls,2003)、转录组亲缘学(phylotranscriptomics;Kohonen等,2007)等。系统发育基因组学是进化和基因组学的交叉学科,是将基因组数据用于进化关系重建的综合分析;药用植物亲缘学研究药用生物(特别是药用植物)的生物亲缘关系、化学成分和疗效(传统疗效和药理活性)间的相关性;系统发育基因组学方法可用于药物发现和开发的相关问题研究,在组学水平拓展了药用植物亲缘学的领域(图1-1)。系统学(亲缘学)是生命科学各分支和交叉学科的根基所在,在中药资源学、中药鉴定和质量评价、中药药性、中药毒理和民族药等中药学相关领域起到提纲挈领的作用。提出药用基因组亲缘学新概念,是应学科交融的大势所趋,期望在中医药理论指导下,运用多学科新理念、新方法和创新的技术手段进行跨学科综合研究,推动中药资源学科理论建构和实践应用,更好地服务于中医药现代化事业。图1-1  可用于药用植物亲缘学亲缘关系推断的组学数据RAD—限制酶切位点相关的DNA;SNP—单核苷酸多态性;SSR—简单重复序列;EST—表达序列标签

全球现存种子植物超过300000种,约60%植物在后新石器时代的人类文明史中作为药物使用。当今人类不仅采集野生植物供药用,而且对许多重要药用植物进行栽培驯化(肖等,2007,2011;赵等,2008),这构成人类文明史不可或缺的一部分。中国有超过10000种药用植物,中药材约87%为植物药(陈等,2010)。药用植物也是许多化学药物的基本原材料,如抗疟的青蒿素和抗癌的紫杉醇等重磅药。目前超过1/3临床用药来自植物提取物和/或其衍生物。但绝大多数药用物种尚未驯化,且目前可用于改进药用植物属性使其疗效提高的工具并不多。过度采集已导致植物药供应危机,产紫杉烷的红豆杉属植物是一典型例证(Hao等,2012)。另一方面,必须对药用植物基因组进化模式有深刻理解才能更有效地驯化和改良它们。可将人工选育看作加速和靶向的自然选择。药用植物基因组进化研究对于理解植物进化和系统发育的普遍机制十分重要,也有助于植物基药物发现和开发,以及植物药资源可持续利用。本章审视药用植物亲缘学发展脉络,梳理相关知识谱系,在植物基因组进化和系统发育框架内论述药用植物亲缘学创新研究方法和研究范式变迁,指出研究空位和发展趋势,抛砖引玉,希望启迪思维,促进学科发展。

1.2 系统发育基因组学

1.2.1 物种进化和多样化机制

陆生植物进化中多倍体发生导致加速的基因组变异(图1-2),这是与其他真核生物迥异之处,也与植物进化的关键创新密切相关。基于迅速增加的基因组资源,可以将基因组改变与药用植物的植化和生理特征的起源联系起来。可推测植物家族树关键节点的祖先基因内容。集中发生于约31900万年和19200万年前的祖先WGDs(全基因组倍增)加速了调控基因的多样化,它们对种子和花的发育至关重要,并负责关键创新,导致种子植物和有花植物迅猛增加并占据优势。被子植物中广泛出现的多倍体可能是产生新基因和扩展某些基因家族的主要因素(Hofberger等,2013)。然而绝大多数基因家族以近中性过程丢失绝大多数倍增基因拷贝,并发现几个基因家族主动选择单拷贝状态。目前将基因组修饰与物种形成、多样化和植化/生理创新有机联系的研究还很少,故难以深刻阐明生物多样性和化学多样性的内在机制。蓬勃发展的进化基因组学显著改善系统发育树分辨率,使研究者找到负责特定进化创新的特定基因。更精准地理解植物进化有助于丰富植物多样性知识库,包括对人类健康至关重要的药用性状。图1-2  多倍体化对植物基因组和表型的影响(实线粗箭头:同源多倍体效应;虚线箭头:异源多倍体效应;细箭头:两类多倍体共有效应;符号:效应的方向)

案例研究对于阐明WGD和次生代谢(次代)路径多样化的关联十分重要。WGD和串联倍增促进了十字花科芥子油苷路径多样化(图1-3)。至少52个拟南芥生合和调控基因参与芥子油苷生物合成(生合)。岩芥菜属(Aethionema arabicum)位居其他十字花目物种基部,包括67个芥子油苷生合基因,绝大多数在拟南芥有直系同源基因,表明有同线型关系。拟南芥45%蛋白质编码基因有多于一个拷贝,而多达95%拟南芥和97%岩芥菜芥子油苷路径基因有多个拷贝,说明该防御路径发生了特别显著的多样化。序列联配和系统发育分析表明芥子油苷路径基因的显著倍增发生在最后一次共同的WGD事件。串联倍增和后续的亚功能化和新功能化进一步增加了芥子油苷次代物的遗传多样性和化学多样性,强化了表型塑性和适应性。更重要的,多样次代物广阔的化学空间在药物发现方面潜力巨大。倍增基因拷贝也解释了最大的植物天然产物类别——萜类的多样化过程(Hao等,2015,2016)。追踪植物萜类生合和多样化之根源揭示了双子叶和单子叶植物进化出迥异的次代路径组装的基因组机制。图1-3  硫代葡糖苷代谢产物的多样化机制倍增基因在鼠耳芥属蛋白质编码基因中占比,并与拟南芥(At)GS(芥子油苷)和阿拉伯岩芥菜(Aab)GS基因比较,根据Hofberger等(2013),倍增基因有三种情况:保留的ohnolog(基于功能模块组织的剂量敏感的基因聚类)、串联倍增(TD)和基因转位倍增(GTD)。图示各倍增类型基因占比。谱系进化中GS代谢塑性主要源于增加的ohnolog保留和TD

除了多倍化,异域歧异、基于气候波动的歧异、杂交和渐渗,以及传粉介导的隔离也是某些药用物种进化的机制,尤其在生物多样性热点地区,如青藏高原(QTP)(肖和夏,1973a~1973f)。随着QTP广泛抬升发生了规模宏大的快速物种多样化,产生了众多形态各异和植化表型迥异的新种。形态和代谢表型创新看起来都是具有生态适应性的,其潜在分子机制仍难以捉摸。系统发育基因组学是生物进化和基因组学的交叉学科,是将基因组数据用于进化关系重建的综合分析,因此需要系统发育研究方法和基因组学技术的紧密配合。系统发育研究是比较分析单个基因或少数几个基因序列(Hao等,2008a,2008b),也常结合其他类型数据,例如形态学、细胞学和植物化学(朱和肖,1991;郝等,2012)数据。系统发育基因组学基于全基因组测序时代之前的分子系统学研究,通过比较全基因组序列或至少大部分基因组序列来全面获取对进化关系重建有用的信息(郝等,2014,2015)。目前该领域研究包括以下几方面。

1.2.2 基因功能预测和进化推演

现存植物已鉴明的有307700种,估测上限45万种,提示植物多样性的潜在空间巨大。在进化史上均经历多次WGD,倍增基因拷贝在基因组中通常以保守的同线块(syntenic block)形式存在。在植物进化过程中,基因组大小变化是一种相对频繁的事件,这些变化一般并不与基因多少及顺序变化相关联。基因数量及顺序的保守性称为同线性。基因组倍增显著影响新性状起源(图1-4),近年来植物次生代谢路径多样化与WGD有关的例子越来越多。倍增基因拷贝可以解释萜类和硫代葡糖苷等多基因路径合成的次生代谢产物的多样化过程。次生代谢基因的串联倍增及随后发生的亚功能化和新基因化过程进一步增加了次生代谢产物的遗传多样性和化学多样性,增强了植物适应生态环境变迁的能力,显示了植物次生代谢产物化学空间在药物发现方面的巨大潜力。被子植物(有花植物)中已发现次生代谢产物超过20万种,可能大部分源自复杂性状的快速创新。图1-4  核心真双子叶植物系统发育和基因组倍增历史示例箭头代表六倍化;三角代表四倍化。目前未发现以下物种基因组在成种后进一步多倍化的证据:马铃薯,茄子,红辣椒,烟草,咖啡,葡萄,木瓜,可可,草莓和桃。绿茄、黏果酸浆、番茄和许多物种基因组数据很少

甾体糖生物碱(steroidal glycoalkaloid,SGA)具细胞毒活性,能抑制乙酰胆碱酯酶,破坏细胞膜功能。研究了茄属(Solanum)六个野生种和种植马铃薯SGA代谢路径五个基因的自然变异和全基因组SNP基因分型(Manrique-Carpintero等,2013)。5个基因包括属于初级代谢的3-羟基-3-甲基戊二酰辅酶A还原酶1和2(HMG1,HMG2)以及2,3-鲨烯环氧酶(SQE),属于次级代谢的茄碱半乳糖基转移酶(SGT1)和葡糖基转移酶(SGT2)。测序3.7kb DNA检测到354个变异。内含子中发现的变异多于外显子,次生代谢途径的关键酶编码基因中的变异多于初级代谢基因。dN/dS<1以及Tajima’s D检验为负值提示存在纯化选择和遗传搭车(hitchhiking,指看似对生物体适应性及进化没有贡献的搭车客突变)。比较核苷酸多样性估计值和dN/dS提示初级代谢基因经受的选择限制强于次生代谢途径的关键酶编码基因,可解释次生代谢多样性。发现SGA含量低的马铃薯和SGA含量高的S. chacoense的HMG2、SQE、SGT1和SGT2各有特定的SNP基因型。Illumina SNP芯片分型发现八个有信息SNPs,其不同组合可区分SGA含量高中低的不同代谢表型。这类研究有助于评价SGA在分离或关联作图群体中的差异分布,对道地药材研究具参考价值。

具抗癌抗菌活性的苯并嗪类防御化合物存在于禾本科(Gramineae)、毛茛目(Ranunculales)和唇形目(Lamiales)多种植物中,其生物合成涉及九个酶(Dutartre等,2012),最终形成糖基化产物存储。其中七个基因(Bx1~Bx6和Bx8)在玉米四号染色体短臂末端形成一簇(cluster),四个P450基因(Bx2~Bx5)均属于CYP71C亚家族。推测在禾本科辐射进化之前TSA(色氨酸合成酶a亚单位)基因和一个与Bx2相似的CYP71C祖先基因数次倍增,并且Bx8征募到近旁,从而形成次生代谢途径的关键酶编码基因簇。但是Bx6和Bx7的起源需要进一步研究。与Bx2相似的CYP71C祖先基因的功能与苯并嗪合成无关,基因倍增后Bx2~Bx5基因的几个位点经受正选择,发生功能歧异,形成了目前酶特定的生化性质。已测序的禾本科Bx基因区域缺乏同线性,而TSA基因区具保守的同线性,说明基因倍增后发生重排,导致Bx1和Bx2的新拷贝在禾本科共同祖先的一个染色体末端成簇。成簇有利于相关基因共分离,末端染色体的定位则便于基因重排,也便于有关合成基因的进一步征募。这些奠基事件(founding event)和延伸(elongation)事件对于后续的苯并嗪生合基因簇的进化至关重要。双子叶植物尚未发现CYP71C,很可能双子叶和单子叶植物的苯并嗪生物合成途径彼此独立进化,即属于趋同进化。生氰糖苷的生物合成途径也存在类似的进化现象(Takos等,2011)。对次生代谢产物生物合成途径的深入研究有助于育种方案的理性设计,优化药用化合物的生产,实现基于生物技术的生产方式改进。

研究多基因家族的进化时,基因树比物种树更有助于了解成员基因的进化历史和基因倍增过程。通过对基因树和物种树冲突进行解释,可推测进化机制,包括快速辐射分化、杂交/基因渐渗、不完全谱系分选、水平基因转移、旁系同源基因、基因倍增/丢失以及基因重组等。这些进化机制也可部分地解释近缘物种的化学表型多样性,有助于推测药用化合物的来源和转化路径。次生代谢产物生物合成基因家族和转录调控基因家族均可在系统发育框架内挖掘分析全基因组有关序列。

1.2.3 构建和理清物种进化关系

例如,基于桔梗科18个种叶绿体基因组的基因排列顺序构建系统树(Cosner等2004),从全新的角度阐述了桔梗科18个属间的系统发育关系。采用高通量测序平台获得天南星科32属线粒体基因组序列(Henriquez等,2014),发现线粒体系统树支持率低且与叶绿体系统树不一致。基于叶绿体全基因组序列的系统树表明水芋属(Calla)和落檐属(Schismatoglottis)在一个主枝基部聚在一起,得到形态学和细胞学证据支持。植物线粒体DNA的基因顺序可能进化较快,但是核苷酸序列的进化速率仅为动物的1%。叶绿体DNA核苷酸序列的进化速率比线粒体快3~4倍,目前在种间进化关系研究中应用最多,如对菊分支植物(asterids)、人参(Zhao等,2015)、银杏(Wu等,2013)、金壳果科(Malé等,2014)和金虎尾目(Xi等,2012)的研究。但是叶绿体全基因组数据不足以解决经历快速分化的类群,如姜目(Barrett等,2014)。结合大量核基因组数据全面分析十分必要。单拷贝基因在被子植物基因组中比较常见,肖培根研究组基于29个已测序基因组的高质量数据实现了单拷贝基因的大规模识别和进化表征(Han等,2014),发现基因组倍增区块(duplicate block)数量和单拷贝基因数量呈显著负相关。17%单拷贝基因位于细胞器基因组,GO注释属于结合(binding)和催化活性类别的较多。真双子叶植物基因组中,单拷贝基因比非单拷贝基因具有更强的密码子偏性。RNA-Seq数据证实了部分单拷贝基因相对高的表达水平。与其他植物不同,禾本科基因组中单拷贝基因的密码子有效数量(N)c与密码子第三位G+C含量(GC3)呈显著负相关。K和K值提示进化as上单拷贝基因比非单拷贝基因更保守。对可变剪接的选择约束(selective constraint),单拷贝基因弱于低拷贝数基因家族(1~10旁系同源基因)成员,但是强于高拷贝数基因家族(>10旁系同源基因)成员。联用各基因组共有的单拷贝基因序列得到分辨力佳的系统树。加上内含子序列提高了分支支持率,但是得到的系统树与未加时不一致。建树时包括内含子序列可能更适合较低的分类学水平。单拷贝基因和非单拷贝基因经受的进化约束明显不同,有些表现出物种特异性,尤其在真双子叶和单子叶植物间。

药用植物多样性是药用植物与环境形成的生态复合体以及与此相关的各种生态过程的总和,有遗传多样性、化学多样性、居群多样性、药用物种多样性、根际微生物多样性和生态系统多样性等多个层次。对于物种不均匀分化程度较强的地区,在解释气候生态因子与药用植物多样性之间的关联时,要充分考虑进化过程的影响。如中国西南地区的“天空之岛”(何和蒋,2014),在第四纪形成了丰富的药用植物资源,许多药用族属仍处于激烈分化过程中,如毛茛科铁线莲属、乌头属和翠雀属等。全叶绿体基因组数据是细胞器尺度的超级条形码,可用其研究分布于不同地理位置的同一物种(如道地药材)的种内变异和地理亲缘学。但叶绿体基因组只相当于一个基因座,叶绿体基因组和核基因组在居群水平的应用可为研究道地药材起源、种内分化时间和分化强度提供线索。种内谱系关系的确立可重现居群的进化历史,是更细致的系统发育重建。

1.2.4 预测和追溯侧向基因转移

侧向(水平)基因转移在微生物进化中广泛存在的事实从根本上动摇了生命之树的假定形态。已发现很多原核和真核生物间的侧向基因转移,相当多药用植物和其内生细菌/真菌具有相似的次代物生物合成路径,其隐含的系统发育基因组学规律有待揭示,这将有助于药用植物和其内生菌互作的研究,为开发植物药资源提供参考。

1.3 转录组亲缘学及其他

全基因组测序花费高,对于重复序列占比大、杂合度高和非二倍体基因组,序列正确拼接组装十分困难(陈等,2010)。显然大规模比较转录组研究更具可行性。转录组测序(RNA-Seq)数据基于表达的mRNA,不包括内含子信息,没有重复序列和倍性的干扰。初始的转录组亲缘学概念指多物种的基因共表达分析(Kohonen等,2007),物种间进化距离分析可基于转录组信息。显然转录组亲缘学也可应用于药用植物研究,例如,从19种植物(包括虎杖、红豆杉、银杏和人参等药用植物)转录组数据中提取50个单拷贝直系同源基因(郝等,2012),可用于系统树构建和进化分析。从紫菜属(P. umbilicalis)和P. purpurea的454焦磷酸测序获得482个编码红藻植物门头发菜纲紫菜属(Porphyra)膜转运蛋白的EST序列(Chan等,2012),发现存在内共生和与原生藻菌有关的水平基因转移。此研究提供了海洋藻类钠偶联的转运系统的分子特征和共调控机制。重建陆生植物和藻类的起源和进化过程是植物系统发育的基本课题,对理解关键适应性性状的产生十分重要。由于物种快速多样化导致一些进化关系分辨不清,少数几个分子标志明显不够,基因组尺度的数据显著增加了有信息位点数量。中药资源和中药鉴定是应用性很强的领域,尽管考虑的是中药材,但应避免一叶障目不见泰山的尴尬,全面挖掘中药资源和物种的准确界定都离不开其所在族属完全物种取样的分子系统学研究(黄等,2014)。转录组代表能表达的那部分在功能上活跃的基因组,测序费用的大幅降低和生信分析方法的改进使得密集物种取样的转录组亲缘学研究成为可能。例如,从92种streptophyte绿藻转录组数据和11种陆生植物基因组序列中提取共有的直系同源基因(Wickett等,2014),用其中852个核基因(1701170个序列联配位点)构建系统进化树,发现陆生植物和绿藻Zygnematophyceae为姊妹关系(图1-5),地钱(liverwort)和地衣(moss)组成的分支与维管植物分支为姊妹关系,而角苔(hornwort)与所有非角苔陆生植物为姊妹关系,从而证伪了之前关于早期陆生植物进化的假说。转录组亲缘学加深对基本植物性状进化的认识,包括药用植物化学多样性和相关生合路径的进化。图1-5  获支持证据最多的陆生植物系统发育假说

尽管只被应用了极短的时间尺度,人工选择已经极大地改变了驯化植物的形态、生理、植化和生活史。比较RNA-Seq数据可用于解析种植番茄和五个近缘野生物种间基因序列和基因表达差异(Koenig等,2013)。基于序列差异发现>50个基因经受正选择,数千个基因的表达水平有显著差异,许多是由于选择压力所导致。许多快速进化基因与环境应答和应激耐受有关。野生和种植品系间光反应共表达网络的大规模变化进一步强调了环境输入量对于基因表达进化的重要性。人工定向杂交和间接有利于非同义替换的驯化和改良过程已经极大地改变了番茄转录组。比较转录组有助于深入了解人工选择和自然选择对野生和种植品系的普遍效应,基于转录组的亲缘树构建有助于定量研究各近缘物种的起源时间和进化历程,这对药用物种研究的重要性是不言而喻的。

类似地,基于蛋白质组数据进行系统发育分析,有蛋白质组亲缘学(phyloproteomics)(Villar等,2013),但尚未用于植物研究。表观基因组亲缘学(phyloepigenomics)(Martin等,2011)在表观遗传修饰层面考察物种亲缘关系,用于药用植物研究将有新颖发现。宏基因组亲缘学(phylometagenomics)(Brindefalk等,2011)可用于研究药用植物根际微生物和植物内生菌等。例如,对中国西南地区7种石斛植物的内生真菌进行抗菌活性筛选,考察活性菌株之间的遗传关系(崔等,2012)。采用组织块法分离真菌,琼脂扩散法进行抑菌活性筛选,通过rDNA的ITS序列鉴定真菌,用邻接法(NJ)和最大简约法(MP)考察遗传关系。从7种石斛属植物分离到98株真菌,它们对Escherichia coli、Bacillus subtilis、Staphylococcus aureus、Candida albicans、Cryptococcus neoformans和Aspergillus fumigatus的抑制率分别是1.02%、10.2%、18.4%、1.02%、1.02%、10.2%,其中DL-3、DL-18、DL-21、DM-2、DG-10和DN-1对B. subtilis、S. aureus和A. fumigatus有较强的生长抑制。24株活性真菌隶属于7个目、11个属、14个种,NJ和MP系统树阐明活性菌之间的亲缘关系。本研究有助于考察珍稀濒危石斛属植物的内生真菌的生物活性以及它们之间的遗传关系和生态价值,为石斛根茎部活性真菌的研究提供参考。比较分析来自南京和大连红豆杉根际的15个16S rRNA和15个ITS MiSeq测序文库(Hao等,2016),并从根际分离高产漆酶真菌和多环芳烃(PAH)高效降解真菌菌株,研究红豆杉根际微生物群落的物种变异性和潜在的环境/化工制药应用。高通测序得到的读序分属31个细菌门的2141个操作分类单位(OTUs),以及至少7个真菌门的2904个OTUs。构建所有细菌/真菌OTUs的16S rRNA/ITS亲缘树,明确各根际样品微生物群落的亲缘关系(图1-6)。矮紫杉和曼迪亚红豆杉根际浮霉菌(Planctomycetes)、放线菌(Actinobacteria)和绿弯菌(Chloroflexi)丰度高于南方红豆杉根际(NF),而酸杆菌(Acidobacteria)、变形杆菌(Proteobacteria)、硝化螺菌(Nitrospirae)和未分类菌在后者丰度更高(图1-7)。NF富含子囊菌门(Ascomycota)和接合菌门(Zygomycota),而两种温带红豆杉根际富含未分类真菌担子菌门(Basidiomycota)和壶菌门(Chytridiomycota)。NF的细菌/真菌群落富裕度和多样性低于其他种红豆杉根际。红豆杉根际分离的3株高产漆酶真菌可以高效脱色3类活性染料,而2株PAH降解真菌能转化难降解的致癌物苯并芘。该研究拓展了根际微生物多样性的知识谱系,例证了资源植物根际研发的范式转变。图1-6  来自不同红豆杉根际微生物群落对比基于β-多样性距离矩阵的层次聚类分析显示不同红豆杉根际微生物群体间的关系。用Qiime和Bray-Curtis算法计算β-多样性距离矩阵;用UPGMA(非加权配对算术平均法)算法建树。枝长代表样品间距离。(a)细菌(XJ),(b)真菌(Z);ZS,矮紫杉,MD,曼迪亚红豆杉,NF,南方红豆杉图1-7  红豆杉根际不同微生物纲的相对组成丰度

图1-7(a)~(c),细菌。鞘脂杆菌纲(Sphingobacteria)、纤维黏网菌(Cytophagia)和黄杆菌纲(Flavobacteria)属于拟杆菌门(Bacteroidetes);Phycisphaerae属于浮霉菌门(Planctomycetes);厌氧绳菌纲(Anaerolineae)属于绿弯菌门(Chloroflexi);Spartobacteria属于疣微菌门(Verrucomicrobia)。(d)~(f),真菌。座囊菌纲(Dothideomycetes)、散囊菌纲(Eurotiomycetes)、锤舌菌纲(Leotiomycetes)和粪壳菌纲(Sordariomycetes)属于子囊菌门(Ascomycota);银耳纲(Tremellomycetes)、微球黑粉菌纲(Microbotryomycetes)和伞菌纲(Agaricomycetes)属于担子菌门(Basidiomycota)。

系统发育基因组学对计算能力和分析方法提出了新的挑战,故有计算基因组系统学。

1.4 药用基因组亲缘学:缘起

直系同源基因是在物种形成过程中由共同祖先基因演变来的分布于不同物种的基因,在药物发现过程中有助于动物模型的选择和分析流程的建立。葛兰素公司的遗传学家David B. Searls(2003)认为充分利用基因组数据有助于挖掘直系同源基因,更好地预测基因功能。比较实验动物和人的基因组,不仅可找到保守功能元件,包括蛋白编码基因和非编码序列,而且能发现基因功能的迁移,从而使研究者充分认识物种间遗传差异,避免选用不适当的动物模型和药物筛选方案。

构建直系同源关系依赖于可靠的系统发育重建。系统发育分析也提供一个估算选择压力和基因功能迁移的框架。可基于计算非同义核苷酸替换与同义核苷酸替换的比值(dN/dS)来估计自然选择的特征和范围(Hao等,2009,2011)。选择性清除(selective sweep)是由于近期较强的正向自然选择,一个突变位点相邻DNA上的核苷酸之间的差异下降或消除,引起核苷酸多态性模式的显著改变。在群体水平,可用选择性清除评价自然选择的特征和范围。

旁系同源基因是由基因倍增产生的同一物种内的同源基因,其对药物发现也有重要作用。旁系同源基因的产物可作为候选的药物靶点,通过结构预测、分子对接、虚拟筛选和实验手段从中获得依从性好的药靶,也有助于充分考虑候选先导化合物的选择性问题。多效性(pleiotropy)即多功能性,指基因或其产物具有多种表型效应或有多种功能。在药物发现过程中需要充分了解旁系同源基因与药靶基因的多效性和功能冗余之间的进化关系,因为多效性和功能冗余是评价蛋白质成药性(druggability)时必须考虑的因素。

与多效性和功能冗余相关的概念是基因对话(crosstalk)和异价同作用基因(heteromery)。对话是指不同信号路径或调控路径组成成分的相互作用使得一条路径的输入信号影响到另一路径的输出信号。异价同作用是指相似但是不同的大分子形成了物理联系,例如,一对蛋白质亚单位形成异二聚体行使特定功能,此概念相对于同价同作用(homomery)概念而言。对话和异价同作用在药物研发中已受到关注,它们和基因转录的可变剪接都被用来解释源于基因组的功能的组合多样性。以上多种基因到功能的投射都能以路径和网络的进化观念来解读,系统发育基因组学方法可检测路径和网络的组成成员的共进化(协同进化)模式,从而有助于功能解析。

系统发育基因组学方法可用于研究可能药靶的进化性质,包括进化速率、选择压力、旁系同源的程度和特征,以及反映基因多效性的因素,包括蛋白质尺寸(高保守蛋白质通常较大)、基因表达的广度以及互作潜力等。基于上述思考,Searls提出了药用基因组亲缘学(pharmacophylogenomics)概念。研究与亚细胞定位有关的药靶蛋白的进化特征(Wang等,2013),比较人、猕猴、小鼠和大鼠可成药的基因组,找到1362个直系同源基因,发现位于细胞核的8.4%在进化上比位于细胞膜(33%)和细胞外(10.5%)的药靶基因更保守。对于进化上不太保守的候选靶点,可利用人源化的动物模型开发药物或疫苗。严重的毒性反应或副作用会导致药物撤出市场,意味着药物开发失败,原因主要是脱靶(off-target)和多靶点等。值得注意的是,撤出市场药物的靶点多位于细胞膜和细胞外。与靶点位于细胞核的药物相比,开发这类药物的难度稍小。今后应加强药物透膜机制研究,发展新的药物传递策略。预测50个进化水平迥异的生物基因组中包含的泛素酶(UBE)和去泛素酶(DUB)(Hutchins等,2013),找到91个UBE/DUB直系同源基因。由于所涉及物种数量较大,直系/旁系同源基因的预测较可靠。UBE/DUB抑制剂组成的化合物库可以用靶蛋白进行筛选,故该研究预测的各物种UBE/DUB可成为药用基因组亲缘学分析的工具箱。预测结果能帮助识别直系同源基因的功能迁移,帮助深入分析互作分子的共进化、基因多效性和功能冗余,这些问题在药物开发流程中推断物种差异,选择适合的药靶和疾病动物模型时必须考虑到。药用基因组亲缘学认为分析进化速率可帮助识别候选药靶。理想的抗生素药靶在进化上受限(Gladki等,2013),经受严格的纯化选择,即药靶蛋白的突变通常因为有害而被选择作用移除,这样便不易产生细菌耐药性。此点已被药靶进化速度的分析所证实。pN代表物种内某基因的非同义(碱基变化引起相应氨基酸替换)多态性,pS代表物种内同义(碱基变化未导致氨基酸替换)多态性,pN/pS是通过种内多样性比较考查纯化选择的指标。发现八种致病菌药靶基因的pN/pS显著低于各自基因组平均值,也低于由实验方法识别的基本基因(essential gene,与非基本基因比较,进化速度明显较慢;图1-8)的pN/pS。用dN/dS可比较来自不同种菌的直系同源基因,结果有类似pN/pS的发现,提示药靶进化较慢,而且进化速率比基本性(essentiality)能更好地预测蛋白质成药性(druggability)。慢进化基因中不仅包含熟知的抗生素药靶,如核糖体蛋白、拓扑异构酶、RNA聚合酶和旋转酶,也包括尚未作为药靶的蛋白,如琥珀酸脱氢酶和金属结合蛋白等,值得深入研究。图1-8  抗生素药靶基因在8个病原菌基因组中的分布抗菌药包括环丝氨酸、三氯沙、三甲氧苄二氨嘧啶、磺胺、夫西地酸、莫匹罗星、喹诺酮类、利福平、大环内酯类、四环素、glacycyline、瑞他莫林、氨基糖苷类、β-内酰胺类抗生素和磷霉素(Gladki等,2013)。ω=dN/dS。

1.5 药用植物亲缘学:传统药物学和生物勘探的路由器

被子植物的化石在白垩纪(1.36亿~0.9亿年前)爆发性地大量出现,当前多数学者认为被子植物起源于白垩纪或晚侏罗纪。在漫长的进化过程中,植物演化出化学防御的复杂技巧,产生多种特化代谢物,它们具有多样的程度不一的生物学效应。系统发育和生合路径的相关性研究可提供预测信息,有助于更有效地选择替代性/补充性植物物种,以保证临床药物供应和新药发现研究。尝试定量检查此种相关性和预测能力(Rønsted等,2012)。基于石蒜亚科(Amaryllidoideae)(石蒜科Amaryllidaceae)超过100种植物核,叶绿体和线粒体DNA序列的简约法和贝叶斯法分析提出系统发育假说。生物碱多样性和其中枢神经系统生物活性是否与分子系统发育显著相关?定量检验发现这些化学表型(文殊兰碱,加兰他敏,石蒜碱,高石蒜碱,网球花碱)和疗效特点(抑制乙酰胆碱酯酶/5-羟色胺再摄取转运蛋白)具有统计学显著的系统发育信号,尽管定量指标D>0,提示相关性与基于逐步趋异进化的Brownian运动模型的预测不完全相符。有几个基于形态分类的属非单系,说明需要用分子系统发育理解特征分布。当然特化代谢和分子系统发育间缺乏一致性并非罕见(Hao等,2013a~2013c,2015a;He等,2014),一般用趋同进化解释。这类药用亲缘分析提示,分子系统发育对从多角度解释化学表型和生合路径进化十分有用,有助于选择分类单元进行先导化合物挖掘,辅助临床治疗药物选择和多样性保护政策制定。

计算对应于个别皂苷/生物碱类型和生物活性类型的系统发育信号,每个皂苷/生物碱类型在每个物种存在(编码为1)或缺乏(0)。类似地,各受试物种提取物具有(编码为1)或缺乏(0)抗肿瘤活性,具有(编码为1)或缺乏(0)CYP抑制/底物/诱导活性。若只有一个物种具有皂苷/生物碱特性,计算系统发育信号无意义,这样的特性在此不予考虑。度量值D用于处理离散二进制特性。

式中,S是超度量系统发育空间内观察到的二进制特性(此处obs可指一种化学成分/生物活性)的改变数量;是系统树末端物种值的1000次随机置换产生的改变的平均数量;是从1000次character进化模拟产生的改变的平均数量,采用进化的布朗运动模型,指定改变的似然性,以此似然性模拟产生同样数量的末端物种,每个character状态与观察到的模式相同。D值为1(S=)提示二进obs制特性的进化方式与随机进化无异(即无系统发育信号,遗传亲缘与化学成分/生物活性无关联),D值为0(S=)提示二进制特性obs的进化方式与遗传亲缘高度关联。用R语言软件包caper和ape计算D值和统计学显著性(P < 0.05)。

植物分子系统发育和其代谢物疗效具有相关性(Saslis-Lagoudakis等,2012;Leonti等,2013;Grace等,2015)。例如,百合目芦荟科(Aloeaceae)药用物种多汁的肉质叶起源于约1000万年前最近一次科属扩展,与分子系统发育显著关联,与某一物种能否用于治疗也有相关性(Grace等,2015)。定量检验发现芦荟的治疗应用具有统计学显著的系统发育信号,尽管定量指标D>0,提示其药学性质在进化树各支并非随机出现。本研究取样芦荟物种的48%有药学用途。81种药用芦荟中,98%具有多汁的肉质叶,而15个多汁叶肉几乎完全消失物种的87%,没有已记录的药用历史,包括在芦荟起源地南非,其传统药用芦荟记载十分详细。土著药典收录的分类学演化支物种确实与一定的疾病类别关联,也与生态适应和被子植物系统发育关联,可作为化学分类和趋同进化的替代/补充说明,在一定范围内解释了治疗用物种的选择。例如,新西兰、尼泊尔和南非开普省的进化相关物种用于抗击同一治疗空间的疾病(Saslis-Lagoudakis等,2012),有力地说明了植物药用价值的自决式发现。显著更多的有治疗应用记载的药用植物存在于某些系统发育类群,而非任意的样品中,提示先导化合物筛选应聚焦于有传统用途的亚群,它们往往富含药用分子。遗传亲缘/基因组亲缘关系的跨文化估价将加强传统药物知识在生物勘探中的应用。

降低的化学药物生产效率使得天然产物重新受到关注。天然衍生药主要由特定物种群的特定次代物基因簇产生的数十个分子骨架组成。推测类药结构分布于特定物种群。比较939个获批的和369个处于临床试验阶段的药物的来源物种,以及119个临床前药物和19721个有生物活性的天然产物(Zhu等,2011)。生物活性天然产物分散分布,而药物聚集于6763个已知科的144个,其中80%获批药和67%临床试验药分别集中于17和30个丰产药物的科。4方面证据,即历史药物数据、13548海洋天然产物、767药用植物和19721生物活性天然产物,提示绝大多数药物衍生自既存的产药科。传统技术缓慢地扩展了产药集群。产药科之外缺少药物不一定是因为用传统技术较少探索或者勘探较晚。新技术探索了隐藏的基因簇、路径、种间串扰和高通量发酵,由此发现新颖的天然产物。新技术对药物生产效率和产药科分布模式的影响需要进一步揭示。由于已经进行了广泛的生物勘探以及技术因素的限制,从未开发物种中发现新药的可能性受到质疑。分析衍生自以前未开发物种的获批药的近期发展态势,发现未开发的产药物种远未绝迹,还有很大可能从传统产药物种的科和分类群开发出新药(Zhu等,2012)。近期获批药的案例研究揭示了有用的策略,可以从那些未开发物种的天然产物先导化合物的骨架和药效团衍生出新药。探索隐藏的次代物生合基因簇等新技术可能产出新颖的天然产物。

传统药物学的历史遗产及其与药物发现的相关性毋庸置疑。将影响人类文化中选择植物用药的参数与进化概念联系起来,可获得更深刻的洞见。比较全球数据和当地数据试图回答:在多大范围内当地药典记录的演化支物种与一定的疾病类别关联,在多大程度上生态学和亲缘关系能解释观察到的偏性(Leonti等,2013)。用近似卡方检验和聚类分析考查12个民族药应用类别和15个分类群之间的关联。比较67个产药植物科(Zhu等,2011)、墨西哥Popoluca的药用植物群和APG植物系统发育数据库,对比本研究结果和系统发育靶类别(Zhu等,2011)。比较Popoluca玛雅文化的药用植物群和世界草本植物,探讨人类学视野中的植物选择原理。拒绝按比例选择的无效假设,从演化支的聚类树状图可见药用植物使用模式在一定范围内与被子植物系统发育关联。67个产药植物科中的53个盛产于Popoluca植物群。与这些科所占份额相比,它们的药用重要性更为突出,约占被调查者提到的药用植物的70%。整体系统发育使用模式受到内在药理性质和感官性状的文化特异的认知影响,而内在药理性质取决于系统发育、生物地理、生态和最终的化感作用。传统药典和植物药主要基于广布的富含物种的分类群。植物科的大小不是唯一决定因素。作为进化的函数,广布分类群比局地出现分类群含有更广泛的累积的生态信息和应激反应信息,它们的基因编码此类信息。合成的宽生态半径的化感物质表达出此类信息,显示广谱的生物区系特异的互作,包括对哺乳类(尤其灵长类)蛋白质的靶向作用。对中国药用植物传统疗效进行统计分析,特别是木兰亚纲(Magnoliidae)(肖等,1986)、金缕梅亚纲(Hamamelidae)和石竹亚纲(Caryophyllidae)(Xiao等,1989)。这些近于失传的宝贵知识是在数次全国中药资源普查(陈等,2005)中收集的,对药用植物研发利用起到指导作用。

1.6 药用植物亲缘学与药用基因组亲缘学

直系同源基因是在物种形成过程中由共同祖先基因演变来的分布于不同物种的基因,在药物发现过程中有助于动物模型的选择和分析流程的建立。葛兰素公司的Searls首次使用pharmacophylogenomics一词,认为充分利用基因组数据挖掘直系同源基因,能更好地预测药靶基因功能。比较实验动物和人的基因组,不仅可找到保守功能元件,包括蛋白编码基因和非编码序列,而且能发现基因功能的迁移,从而使研究者充分认识物种间遗传差异,避免选用不适当的动物模型和药物筛选方案(郝等,2014)。

Searls提出的pharmacophylogenomics是针对药靶的研究,而笔者提出药用基因组亲缘学,是在基因组及其相关的转录组和代谢组水平系统研究药用植物的植物亲缘关系-化学成分-疗效(传统疗效及药理活性)间的相关性的新兴边缘学科。药用基因组亲缘学在药用植物领域可以有多方面的应用:① 基于基因组信息构建不同尺度的生命之树,明确药用植物类群间的系统发育和亲缘关系;② 利用基因组数据估算分化时间并重建地理分布区,推测现存药用植物/道地药材的起源和空间分布格局及其形成机制;③ 基于时间树,结合生态、环境因素及代谢创新性状,探讨药用植物的多样化进程和成因;④ 揭示药用植物多样性的来源和格局,基于生物多样性探讨药用化合物(如次级代谢产物)多样性,促进生合途径解析和创新药物发现;⑤ 预测药用植物多样性动态变化,提出相应的保护性开发策略,促进人工栽培和分子育种。可见针对药用植物的基因组亲缘研究的内容完全不同于Searls原初的概念,只是暂借用pharmacophylogenomics作为药用基因组亲缘学英译。

笔者拟整合形态分类数据、代谢组和化学分类数据、基因组和转录组数据、药理活性数据和传统药物学知识,探索以毛茛科药用植物科属为重点的药用植物亲缘学。毛茛科药用植物在中药学中的应用源远流长,我国42属约720种毛茛科植物中,有30属约220种可供作药用(《中国植物志》27卷24页)。黄连、附子、乌头、升麻、川木通等的原植物均属毛茛科。民间广泛使用的麻布七、水黄连、铁破锣、虎掌草、月下参、驴蹄草、星果草、白头翁等草药也属于毛茛科。据笔者统计,在《中国药典》2010年版正文收录10个法定种,附录收录另10种,另外在可见的地方标准中至少收录了另外的20种,共计40种,高于菊科、豆科等大科的收录数量,居所有植物科中的第一位。毛茛科大部分族属在我国均有悠久的药用历史,其防治疾病的科学价值经历了时间的考验。但目前对毛茛科的组学研究,尤其是基因组和转录组研究十分稀缺,对毛茛亚科多物种属的近缘种间亲缘关系了解较为粗浅,对唐松草亚科的一些多物种属,如唐松草属(朱和肖,1991a;郝等,2015b)、人字果属(肖和王,1964;朱和肖,1991b),了解更少。这一现状也为进行药用基因组亲缘学的实证研究提供了很多课题。

人字果属约16种,分布于亚洲东部和喜马拉雅山区。我国9种,分布于秦岭以南的亚热带地区,均由肖培根和王文采在20世纪60年代正式命名(1979《中国植物志》27卷472页)。据不完全调查,本属至少7种在分布地区的民间用作草药,具有确切的功效(陈等,2001)。例如,耳状人字果全草止咳化痰、消炎,蕨叶人字果根状茎消肿解毒,纵肋人字果全草健脾化湿、清热明目,人字果根状茎清热解毒、消肿。但是此属在毛茛科中是研究较少的,其药用价值值得深入挖掘。基于4个分子标记和形态特征得到的系统树提示,人字果属与扁果草属和拟扁果草属聚为一支,而与耧斗菜属、天葵属和拟耧斗菜属进化距离较远(Hao等,2015b)。从预实验结果看,人字果属的化学成分独具特色(参见第4章)。拟选择耳状人字果、蕨叶人字果、纵肋人字果和人字果4种,进行酶切位点相关DNA测序(RAD-Seq)。只有分别带有接头1和接头2的酶切位点周边的DNA片段会得到有意义的扩增,即为RAD标签(图1-9)(岳等,2012)。将所有RAD标签序列连起来即代表物种的简化基因组,可用于同属物种或同种各居群的基因组亲缘关系推断(图1-10)。在进化史近期发生快速辐射分化的同属物种,往往由于有限几个分子标记的系统发育信号不足和/或基因树冲突,使得其亲缘关系难以辨清。人字果属和铁线莲属以及毛茛目其他多属均有此问题。以RAD-Seq为代表的简化基因组测序能提供关于物种基因组进化和杂交的全局观点,且无需事先知晓物种基因组的完整序列。基于此探索的科学问题:四种人字果的基因组亲缘关系是什么?粉背叶人字果(进行转录组测序)与这4种人字果的亲缘关系?化学分类与分子分类是否一致?如何从起源和进化角度解释?本属与唐松草亚科其他属的药用亲缘关系?

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载