消化科病例分析——入门与提高(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-27 09:01:29

点击下载

作者:辛永宁、柏愚

出版社:人民卫生出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

消化科病例分析——入门与提高

消化科病例分析——入门与提高试读:

版权页

图书在版编目(CIP)数据

消化科病例分析:入门与提高/辛永宁,柏愚主编.—北京:人民卫生出版社,2015

ISBN 978-7-117-20262-6

Ⅰ.①消… Ⅱ.①辛…②柏… Ⅲ.①消化系统疾病-病案-分析 Ⅳ.①R57

中国版本图书馆CIP数据核字(2015)第041554号人卫社官网 www.pmph.com 出版物查询,在线购书人卫医学网 www.ipmph.com 医学考试辅导,医学数据库服务,医学教育资源,大众健康资讯

版权所有,侵权必究!消化科病例分析——入门与提高

主  编:辛永宁 柏 愚

出版发行:人民卫生出版社有限公司

     人民卫生电子音像出版社有限公司

地  址:北京市朝阳区潘家园南里19号

邮  编:100021

E - mail:ipmph@pmph.com

制作单位:人民卫生电子音像出版社有限公司

排  版:人民卫生电子音像出版社有限公司

制作时间:2018年1月

版 本 号:V1.0

格  式:mobi

标准书号:ISBN 978-7-117-20262-6

策划编辑:张令宇

责任编辑:卢冬娅打击盗版举报电话:010-59787491 E-mail:WQ@pmph.com注:本电子书不包含增值服务内容,如需阅览,可购买正版纸质图书。序

消化系统疾病是世界范围内的常见疾病,在中国,消化系统疾病的发病率也一直居高不下。随着我国公共卫生事业的迅速发展,一些传统的消化系统疾病,如乙肝的发病率有所下降;但是随之而来的是,由于生活方式和饮食习惯的逐渐西化,现在我国的消化疾病谱与以往有了较大区别,原来一些发病率较低的疾病,如反流性食管炎、功能性胃肠病、脂肪肝、结肠癌等却呈现发病率逐年上升的趋势。

作为与消化系统疾病诊疗密不可分的消化内镜技术,在过去的数十年中有了突飞猛进的提高,已经由单纯的诊断工具发展为诊断与治疗相结合的利器,胶囊内镜、小肠镜的问世消灭了消化道最后的盲区,使得内镜医师诊断和治疗小肠疾病成为了可能。NBI、放大内镜等新技术的出现将我们对消化道早期癌的认识提高到了一个新的境界。近年来,消化系统的影像学检查技术也有了长足的发展,MRCP可以清楚显示胆管和胰管的形态,肠道三维CT可以协助小肠病变的诊断;而ERCP、ESD等内镜治疗技术的成熟让胆胰管结石、消化道早癌的患者最大程度避免了外科手术所带来的创伤。

在消化内镜和影像学技术高速发展的同时,有一种令人担忧的情况正有蔓延的趋势,那就是临床医生过度依赖辅助检查技术对患者作出诊断,而忽视了临床基本功。在临床工作中,由于过度相信辅助检查而最终导致患者误诊误治的情况时有发生;实际上,无论技术的发展如何迅速,临床医生只有认真地收集临床资料,包括采集病史、仔细地进行体格检查、完善常规化验及其他有关的辅助检查,最后对所获取的信息进行全面的综合分析,才能得到正确的诊断。

我经常参加各种学术会议,在我与国内的同行交流时,常常可以学习到一些非常有临床价值的病例,我想,为何不把这些同行的临床经验总结起来,以书籍的形式向消化专业医生介绍这些宝贵的经验和心得呢?因缘际会之下,人民卫生出版社邀请了丁香园网站的资深战友——第二军医大学长海医院的柏愚副教授和青岛市市立医院的辛永宁副教授牵头,组织一批丁香园的活跃战友,通过网络平台,将大家的临床经验编写成了一本具有教育意义也兼具临床参考价值的《消化科病例分析——入门与提高》。我相信这本凝聚了丁香园战友经验与教训的心血之作能够为各位在临床一线奋战的消化科医生助上一臂之力!

当然,本书中所涉及的临床病例的诊断并不是百分之百毫无瑕疵,如果您发现其中有些疾病的诊断不够准确,或者您有更独到的见解,非常欢迎您通过各种方式与我们进行交流与讨论。第二军医大学长海医院消化内科主任2015年3月前 言

消化系统疾病是影响我国人民身体健康的高发疾病,其中功能性胃肠道疾病严重影响患者的生活质量,而食管癌、胃癌、结肠癌、肝癌等消化系统肿瘤则更是严重影响人们的生命健康。近年来随着各种影像技术和内镜技术的提高,消化系统疾病的病理、病因、发病机制、诊治等方面均取得了很大的突破,目前的消化病学已经是临床医学中一门日臻成熟完善的分支学科。

消化系统疾病作为内科学常见和多发的疾病,其非特异性临床表现繁多,临床工作者尤其是消化科实习医生,初级消化专业医师和基层医师对此类疾病的诊断和治疗常会产生一些疑难问题。尽管对于消化系统常见病和多发病的临床诊治已经日益规范,但是在临床实践中,临床医生常常会发现,很多常见病的表现不典型,一些少见病、罕见病却会表现为常见病而误导临床诊治,为了减少误诊误治,提高消化疾病的诊治水平,在结合全国多家医院消化科同道多年的工作经验、体会,翻阅、查找大量的国内外文献资料的基础上,我们汇集众多临床经验丰富的医务工作者在临床上遇到的一些典型或疑难病例编写了《消化科病例分析——入门与提高》一书。望与同行们共同探讨交流,以期提高临床综合诊治水平。

本书作者们以自己的切实经历,科学的诊疗思维,主要从入院情况、初步诊断、鉴别诊断、诊疗经过、最终诊断及文献复习六大方面全面介绍诊治过程,系统分享疾病诊疗中的经验教训。本书分为基础知识、基础病例和提高病例三大模块,由浅入深、由理论到实践依次分享消化内科疾病诊疗思维及方法、基础病例及疑难病例的诊疗经过,总结经验教训,重在诊疗经过与文献回顾,内容充实,分析逻辑性强,具有很好的可读性与参考价值。本书以临床工作中所遇到的实际病例为重点,讲述患者的诊治经过和作者的经验教训,并附有大量的彩色、黑白图片,力求实用、简明。由于近年分子生物学技术的飞速发展,每年均有大量的新资料和新技术出现,故本书对一些新出现的技术和方法也进行了一定的介绍。

在本书编写过程中,得到国内著名消化病学家、中华消化内镜学会主任委员李兆申教授的指导、审定和严格把关,李兆申教授还特地为本书作序。感谢各位编者花费大量时间精心收集整理临床疑难病例和少见病例,在此一并表示衷心的感谢。

由于学科和专业所限,编写时间仓促,许多内容难以达到尽善尽美,难免挂一漏万,还望各位读者及同道批评指正。辛永宁 柏愚2015年3月基础知识一、循证医学在消化疾病诊疗中的作用1.循证医学

循证医学(evidence-based medicine,EBM)的出现,在过去的30多年里对临床医学带来巨大的影响。在二十世纪初期,各种临床诊疗方案的理论依据基本都源于科学推理和动物实验,很少在人体上或者人群中进行试验以证实其有效性。有些广为应用的治疗方案最终被证实不仅无效,甚至是对人体有害的,例如胃冰冻疗法治疗消化性溃疡、青霉素治疗原发性胆汁性肝硬化等。可见,不经过临床验证就对患者进行治疗很可能背离治疗前的良好愿望。因此,严格评估临床疗效的手段应运而生,这就是随机对照试验(randomized controlled trial,RCT),目前公认的第一项在人体进行的RCT是1948年由Richard Doll和Bradford Hill教授在英国医学研究委员会的监督下进行的,这项研究链霉素对肺结核疗效的临床试验的结论直到今天仍然具有重要的临床价值,充分显示了高质量临床研究结论的可信性。RCT通过随机分组来控制混杂因素、减少研究偏倚,这极大地提高了临床研究的质量,使研究的结论更为可信。从此RCT成为评估药物和手术疗效的金标准,临床研究也进入了一个全新的时代。胃肠病专家在其中也起到了重要的作用:在1955年,Sidney Truelove教授进行了胃肠病领域第一项RCT,证明了在溃疡性结肠炎的治疗中,糖皮质激素比安慰剂更为有效,这项研究的结论经过了时间的考验,直到现在糖皮质激素也是溃疡性结肠炎治疗方案中不可或缺的成分。随着RCT的开展,临床医学界也开始提倡临床实践中应更讲求科学证据,越来越多的临床医师强烈支持应该将流行病学的原理应用到对患者的诊疗中。

不过,随着RCT数量逐渐增多,学者们发现研究的结论有时却并不一致,因此有学者建议应该将这些研究证据进行总结,以供那些忙于临床工作,而没有时间去浏览原始文献的临床医师参考,认为这样临床医师就可以根据临床证据对患者进行合理的诊疗。但Liberati等发现,这种方法导致很多乳腺癌患者未能得到最合理的诊疗措施。Antman和Mulrow的研究也证实,传统的教科书以及杂志综述不够全面,而且常常带有偏倚。Jefferson在一项针对霍乱疫苗的调查中也发现许多作者在撰写述评、综述时采用“desk drawer”的方法,即只对自己熟悉的研究进行描述,而并没有系统的将研究证据进行整理和总结。

英国流行病学家Archie Cochrane在1979年呼吁医学界需要将所有RCT的结果进行整理并不断更新,他首次提出应该用科学的方法系统的查找、评估并总结某项干预性医疗措施的文献,目前以他名字命名的Cochrane协作组织管理着电子数据库Cochrane Library并定期出版Cochrane系统评价,Cochrane系统评价也被临床医师广泛的应用于临床实践。除了Archie Cochrane外,还有几位临床流行病学家在EBM的发展中也起到重要的作用:加拿大的David Sackett教授在1970年就鼓励临床医师去熟悉和了解如何对临床研究证据进行严格评价,他和同事制定的评价诊断、治疗、预后研究的标准在世界范围内广为传播。美国的Alvin Feinstein教授强调要重视观察性研究的设计和解读,并对诊断试验(diagnostic test)的科学原理进行了探索。Thomas Chalmers是胃肠病领域中较早提倡进行RCT研究,并将RCT及荟萃分析、系统评价的重要性和必要性介绍给其他胃肠病领域同行的专家。

此后的数十年中,虽然有零星反对的声音,EBM仍然受到临床医师的高度认可,因为临床医师已经认识到患者应该接受由最佳研究证据支持的诊疗方案,而非单纯依靠医师的主观经验。2.循证胃肠病学

循证胃肠病学是指将最确切有效的临床研究证据应用到消化疾病患者的诊疗中,为患者进行最合适的诊断试验、告知患者最准确的预后信息、给予最安全有效的治疗方案。为了达到这个目标,消化科医师必须了解并学会评估临床证据;有专家认为临床医师一直以来都是如此开展临床工作的,但有很多研究表明这种观点其实并不正确;在已经有高质量的RCT和专家推荐指南的情况下,临床医师诊疗方案的差异和变化仍然很大,例如在1998年Scholefield等对英国的外科医师进行结肠镜筛查结肠癌的调查,当时已经有高质量的RCT显示对一般风险患者进行筛查是有益的,但是调查结果发现很多医师并没有给患者合适的筛查意见。那么是什么原因导致了这种差异呢?很可能是因为临床医师更多地依靠他们的同事、上级医师的经验,或者阅读传统综述和参考教科书的观点,而没有按照EBM的原则进行临床实践。

EBM十分重要,但是要注意,首先,EBM并不能完全取代传统的临床诊疗经验,但EBM可以成为临床工作的有益补充和得力助手;无论什么情况下,临床医师都需要对患者病情进行仔细的观察、做出合理的判断。其次,虽然RCT是判断药物或手术干预效果的金标准,但是其他类型的研究证据也是临床工作所需要的。例如,在病因研究中,基本是不可能进行RCT研究的,因此高质量的观察性研究极为重要。例如,几项研究都发现乙肝病毒携带者发生肝细胞癌的概率要远远高于未携带乙肝病毒者,虽然这些研究都是观察性研究,但是两者之间具有极强的关联性,因此对于乙肝病毒携带者而言,由于其他原因导致肝细胞癌的可能性微乎其微。病例对照研究(case control studies)适用于研究罕见疾病,可以为推导病因提出科学假说。非甾体消炎药(non-steroidal anti-inflammatory drugs,NSAIDs)在消化性溃疡发病中的作用就是通过病例对照研究发现的。如果所研究疾病的预后极差,那么在没有RCT的情况下,病例系列研究(case series)也可以为疗效提供足够的证据,比如肝移植在晚期肝病中的治疗作用。

临床研究的设计不同,其产生的证据力度也不同,因此我们一般将临床证据进行分级(表1-1-1)。表1-1-1 临床证据的分级3.消化道疾病的循证诊断

当消化科医师在临床工作中遇到就诊的患者时,根据患者的主诉、病史、体格检查等情况,会做出初步的诊断和鉴别诊断,然后对患者进行诊断试验,即实验室检查或者影像学检查,以排除或证实某个疾病。但是,临床上某些检查技术并没有经过严格的临床验证,这样就会导致诊断出现误差。因此需要对诊断试验进行系统、严格的评价,这样才能帮助医师进行准确的鉴别诊断,得出正确的临床诊断。下面以一个临床病例来说明对诊断试验进行严格评估的重要性。

病例经过1

一位28岁的女性,妊娠18周,因为近1周内多次发作剧烈右上腹痛及恶心、呕吐,至急诊就诊,查体发现患者的生命体征稳定,右上腹有压痛和肌紧张,其他的心肺查体未见明显异常。实验室检查提示血淀粉酶和脂肪酶正常、丙氨酸转氨酶(alanine aminotransferase,ALT) 243U/L(正常0~40U/L),碱性磷酸酶278U/L(正常35~125U/L),总胆红素55.2mmol/L(正常0~17mmol/L),白细胞总数8400/ml,其他各项化验均未见明显异常。腹部B超显示胆囊多发结石,胆总管略扩张(直径9mm)。目前患者初步诊断为胆囊结石,但不能完全排除胆总管结石的可能。妇产科医师和外科医师、消化科医师经过会诊,认为患者的症状反复发作,而且症状较为严重,应该尽快进行胆囊切除术。不过患者的ALT、碱性磷酸酶、总胆红素入院5天后仍未下降,复查后各项指标均持续升高,高度提示胆总管结石嵌顿的可能。如果要治疗胆总管结石,可以采取内镜下逆行胰胆管造影(endoscopic retrograde cholangiopancreatography,ERCP),进行乳头括约肌切开取石或放置支架;也可以采取开腹手术胆管造影+胆总管探查,但是这些治疗手段一般都要将孕妇暴露于X线中,显然对腹中的胎儿不利。ERCP下乳头括约肌切开取石或放置支架虽然可以在不需要X线辅助的情况下完成,但操作难度大大增加。由于使胎儿受X线辐射影响和在不要X线辅助的情况下进行ERCP都有很大风险,我们在进行下一步治疗前,必须要搞清楚到底患者有没有胆总管结石。

消化科医师知道磁共振胰胆管成像术(magnetic resonance cholangio-pancreatography,MRCP)对诊断胆总管结石很有帮助,医院目前也已经在开展MRCP的检查工作。不过,在我们决定是否要对患者进行MRCP这项诊断试验前,首先要回答两个问题:第一,在有腹痛等症状的胆囊结石患者中,发现胆总管结石的可能性(概率)有多大?第二,MRCP诊断胆总管结石的准确性到底多高?要回答第一个问题,我们先在Pubmed上进行文献检索,检索关键词包括“common bile duct stone,choledocholithiasis,differential diagnosis”等等,通过仔细阅读检索到文献的摘要后,我们找到一篇符合要求的文献。3.1 什么时候需要进行诊断试验?

临床医师在询问患者的病史,完成体格检查后,对患者最有可能的诊断就有了初步的考虑。当某个诊断的验前概率(pre-test probability)极高或者极低时,诊断试验对指导临床诊疗的意义极小。例如,一名有十二指肠溃疡病史的年轻男性患者,在多日连续工作、不规律饮食后突然出现中上腹部疼痛,查体发现板状腹,那么医师首先考虑的是十二指肠溃疡穿孔的可能性;如果是一名既往体健,近期内出现无痛性黄疸并逐渐升高的老年男性,那么医师考虑胆道或者胰腺恶性肿瘤的可能性最大。少数情况下,根据患者的主诉、发病情况和查体的结果就已经可以得出诊断而不需要进行下一步的检查了。另一种极端情况是,某个诊断的可能性太小,这时也不需要再做针对这个诊断的检查。大多数情况下,明确或排除某个诊断的可能性介于其中,这时我们就需要再做检查。医师对就诊患者可能所患疾病初步印象的量化指标,就称为验前概率,验前概率在总体上应该符合该病的患病率,因此在进行计算时,验前概率等于该病的患病率;结合诊断试验的结果,得出就诊者患病可能性大小的估计称之为验后概率(post-test probability),也称为预测值。3.2 医师如何估计验前概率?

验前概率的估计要根据患者的病史、体格检查,以及医师诊治该疾病的经验来综合判定,由于患者的病史和体格检查结果有时并不能准确预测病变,因此医师估计的验前概率并不一定准确。这时,用患病率(某个特定时间内总人口中某病的新旧病例所占比例)来估计验前概率更为准确。

有以下一些方法帮助判断临床研究所报道疾病的发病率是否真实。第一,该研究中为诊断某种疾病所采用的确诊手段应该是可靠的,最好是公认的金标准。比如探讨胰腺炎患者中合并胆总管结石比例的研究,ERCP就是用于确诊胆总管结石的较好手段,而腹部超声对诊断胆总管结石的价值就极为有限,不能用作确诊的标准。第二,研究者是否将该诊断试验连续应用于来就诊的患者。第三,研究中的患者特征是否与我们所接触的患者人群相似,比如胰腺炎患者中有多少比例合并胆总管结石的研究,当纳入的患者大部分为酒精性胰腺炎时,这项研究的结果就不一定能推广到以胆源性胰腺炎为主的患者人群。

病例经过2

在这项检索到的研究中,研究者探讨了有腹痛等症状的胆囊结石患者合并胆总管结石的可能性。采用的诊断试验是ERCP,研究中连续纳入有胆绞痛症状的胆囊结石患者,在进行腹腔镜胆囊切除术前进行ERCP检查;最终研究者发现47%的患者合并有胆总管结石。如果这个比例很低(<5%~10%),那么我们基本可以不用再对孕妇做检查而排除胆总管结石的可能;而如果这个比例很高(>80%~90%),我们也不用再做检查而直接进行ERCP治疗了。而目前47%这个数据介于其中,为了明确到底有无胆总管结石,我们还是需要进行进一步的诊断试验。在申请MRCP检查之前,我们还需要回答一个问题: MRCP诊断胆总管结石的准确性到底多高?要回答这个问题,我们还是在Pubmed上进行文献检索,检索关键词包括“common bile duct stone,choledocholithiasis,MRCP,diagnosis”等等,通过阅读检索到的文献,我们发现有一篇文献专门研究MRCP诊断胆总管结石的准确性,非常符合我们的要求。3.3 评估研究设计

在评价一篇关于诊断试验的文献时,首先要评估研究的设计,换句话说就是这项研究的结果能让我们相信吗?如果新的诊断试验是和传统的金标准进行比较,研究者连续纳入诊断存疑的患者进行诊断试验,那这项研究的结果就比较可信。

第一,将新的诊断试验与传统的金标准进行比较,才可以真正知道新诊断试验的准确性。金标准指的是可以明确诊断或者排除某个疾病的检查手段,一般都较为昂贵、有一定风险、有创伤性,比如外科手术的病理结果。因为ERCP是公认的诊断胆总管结石的金标准,只有把MRCP与ERCP进行比较才能知道MRCP的诊断准确性。

第二,在比较MRCP与ERCP时,应该将两者分开进行独立的比较,这在检查结果需要主观判断时极为重要。在这项研究MRCP对胆总管结石诊断准确性的研究中,负责出诊断报告的医师不知道另外一项检查的结果,即负责报告MRCP的影像科医师不知道ERCP的最终结果,同样做ERCP的内镜医师不知道MRCP的结果,这样就做到了盲法比较。如果负责MRCP结果的影像科医师提前知道ERCP的结果,那他所出的报告将很有可能出现偏倚,会更多地诊断出胆总管结石。需要注意的是,目前超过一半的诊断试验研究没有做到盲法比较,对这种研究的结果我们要谨慎对待。

不过有时我们很难找到一个公认的金标准,如果使用准确性低的诊断试验作为金标准,那么新诊断试验的准确性就无法得到准确的评估。比如,以前评估胆囊B超的诊断试验是用口服胆囊成像术作为金标准,口服胆囊成像术阳性的患者进行手术治疗以确诊胆囊结石,但是5例胆囊B超阳性的患者其口服胆囊成像术结果为阴性,没有进行胆囊切除术,按照该研究的分析,这5例胆囊B超阳性的结果为假阳性结果(即试验结果阳性,但患者无此病)。但随后2例胆囊B超阳性而口服胆囊成像术阴性的患者由于胆绞痛症状反复发作而最终进行胆囊切除术,确诊了胆囊结石,这说明胆囊B超比口服胆囊成像术更为准确。因此,如果没有一个公认的金标准,可将多个诊断试验、随访、手术病理等结果联合起来作为诊断金标准,比如对于难以在术前获得病理诊断的肝门部胆管癌就可以把CT 或MRI、超声内镜(endoscopic ultrasonography,EUS)、ERCP下细胞刷检的结果联合起来作为金标准。不过需要注意在这种情况时,不能将被评估的诊断试验包括在金标准里面。比如一项胰腺炎的研究将血/尿淀粉酶比值作为金标准的一部分,这样由于非胰腺原因导致的血、尿淀粉酶明显升高也成为金标准之一,这使得血、尿淀粉酶的特异性和敏感性升高,从而导致误诊急性胰腺炎。3.4 新诊断试验的结果是否都经过金标准的验证?

医师常常认为新诊断试验总是好于老的诊断试验,新诊断试验的极度异常结果可以完全确诊或者排除某个诊断,而无须经过金标准的验证,这种验证偏倚(verification bias)在超过一半的诊断试验研究中都存在,这样会高估新诊断试验的准确性。以铁蛋白水平诊断缺铁性贫血为例,早期的研究都采用骨髓穿刺抽吸为金标准,但骨穿操作有创伤,有研究者就单纯以铁蛋白水平来诊断缺铁性贫血,认为极高/极低水平的铁蛋白就可以排除/诊断缺铁性贫血,使得铁蛋白在诊断缺铁性贫血中的价值被高估。随后的一项研究以骨髓穿刺抽吸为金标准,结果发现一些患者的铁蛋白水平非常低,但是没有缺铁性贫血;而另外一些患者的铁蛋白水平非常高却患有缺铁性贫血。3.5 研究者是否纳入诊断存疑的患者以验证诊断试验?

处于疾病晚期的患者,其诊断试验大多数有明显异常,而健康志愿者的结果基本都是正常的。但实际上,在临床工作中遇到的患者其病情大多不属于终末期,如果患者已经进入终末期我们也不需要再做进一步的检查了。因此,将晚期患者与健康志愿者的结果相比较,会让诊断试验的效果看起来非常好。比如,早期研究癌胚抗原(carcino-embryonic antigen,CEA)的诊断价值时,是在晚期结肠癌患者和正常人中进行比较,几乎所有晚期结肠癌患者的CEA水平均明显升高,而几乎全部对照组的CEA水平均在正常范围,因此CEA被认为可以高度准确诊断结肠癌。可是后来在更大范围的患者人群中进行验证,患者包括早期结肠癌或其他消化系统疾病,这时CEA就无法准确区分早期结肠癌与其他消化系统疾病了。

病例经过3

回到我们的病例中,这项评估MRCP诊断胆总管结石准确性的研究采用ERCP作为金标准,评估MRCP的放射科医师对ERCP的结果不知情,研究者连续纳入有症状的胆总管结石患者,47例患者中仅有2例没能完成ERCP,其中1例患者经过经皮胆管造影证实有胆总管结石,而另外一例患者经过长期随访并未排除胆总管结石的可能。总之,这项研究采用的方案设计非常合理。3.6 解读结果

当研究方案设计合理时,研究的结果也就更加可信。诊断试验的准确性可用多种统计学指标进行描述,包括敏感性、特异性、阳性预测值、阴性预测值,不过似然比可能更有临床意义,因为似然比可以帮助我们将验前概率转化为验后概率。

什么是敏感性和特异性?

敏感性指通过金标准确诊患某病的病例组中,被评价的诊断试验判断为阳性(有病)的比例。敏感性只与病例组有关,反映了待评价的诊断试验能正确检出某病患者的能力,其值越高,漏诊机会越低。例如,一项幽门螺杆菌(Helicobacter pylori,Hp)的诊断试验发现胃镜活检结果为慢性胃炎对Hp感染的诊断敏感性为100%,表1-1-2中可以清楚看出,某些慢性胃炎并没有Hp感染(假阳性结果),但是所有的Hp感染患者都有慢性胃炎(假阴性结果为0),因此没有慢性胃炎就可以排除Hp的感染。表1-1-2 慢性胃炎与Hp感染关系Sensitivity(敏感性)= TP/(TP+ FN)= 100%Specificity(特异性)= TN/(FP+ TN)= 66%

特异性是指用金标准确诊未患某病的对照组中,被待评价的诊断试验判断为阴性(无病)的比例。特异性只与对照组有关,反映了待评价的诊断试验能正确排除研究对象未患某病的能力,其值越高,误诊机会越小。

与敏感性不同的是,特异性极高的诊断试验在没有患病的患者中几乎都是阴性的,但是在某些患病的患者中也可能是阴性的。因此特异性极高的诊断试验在结果是阳性时最有意义,因为结果是阳性时基本就可以确诊疾病。还是在这项关于Hp的诊断试验中,研究者发现快速尿素酶测试的特异性为100%,表1-1-3中可以看出,某些Hp感染患者的快速尿素酶测试结果是阴性的,但是所有快速尿素酶阳性的患者都是有Hp感染的(假阳性结果为0)。

最后,需要指出的是,无论是敏感性还是特异性,都是在已经知道最终的结果后,倒过来判断诊断试验的准确性;而非根据诊断试验的异常来预测可能的最终结果,与我们日常的临床工作的逻辑顺序正好相反,作为临床医师,我们更想知道,如果一项诊断试验是正常或者异常时,患者有或没有得病的可能是多大。表1-1-3 快速尿素酶测试与Hp感染的关系Sensitivity(敏感性)= TP/(TP+ FN)= 90%Specificity(特异性)= TN/(FP+ TN)= 100%

什么是阳性预测值(positive predictive value,PPV)和阴性预测值(negative predictive value,NPV)?

由诊断试验检测为阳性的样本中,真正患病者所占的比例为PPV。由诊断试验检测为阴性的样本中,真正无病者所占的比例为NPV,这两者可以用于预测患者患病的可能。不过PPV和NPV都受患病率的影响,如表1-1-4所示,在敏感性和特异性一致的情况下,患病率越高,PPV越高、NPV越低;患病率越低,PPV越低、NPV越高。因此使用似然比更加可靠。表1-1-4 敏感性99%、特异性95%时不同患病率的PPV值

似然比(likelihood ratios,LRs):验后概率与验前概率的符合程度和变化方向取决于诊断试验的特性,而这种特性的量化指标称为LR。LR分为阳性似然比(positive likelihood ratio,PLR)和阴性似然比(negative likelihood ratio,NLR)。LR值= 1说明验后概率与验前概率相同。LR值>1说明验后概率增加,>2说明轻度增加,>5说明中度增加,>10提示明显增加;而LR值<1说明验后概率降低,<0.5说明轻度降低,<0.2说明中度降低,<0.1提示明显降低。在临床研究中,常常以LR>10和LR<0.1作为诊断和排除某个疾病的标准。大多数情况下,LR是用诊断试验测定连续样本计算出来的,而且不受患病率的影响,因此是具体量化患病可能性、对疾病进行确切诊断的一个很有用的指标。在知道了发病率和LR值后,临床上常用下面这个简图来计算验后概率(图1-1-1)。图1-1-1 验前概率、LR、验后概率

病例经过4

MRCP诊断胆总管结石的PLR值为6.2,NLR值为0.06;之前我们已经知道患者患有胆总管结石的验前概率为47%,因此阳性MRCP诊断胆总管结石的可能性为86%,而阴性MRCP结果说明患者有胆总管结石的可能性只有4%。

在将研究结果运用到患者的诊疗之前,临床医师需要知道这项诊断试验的结果能否在自己所处的环境条件下重复出相似的结果,而且自己所管理患者的情况是否与这项诊断试验中所研究患者的情况相似。3.7 诊断试验的结果能否重复?

许多诊断试验需要检查者对试验或检查的结果进行主观的解读(比如超声内镜),这样就会出现观察者之间的差异(inter-observer variation),如果经验丰富的检查者和没有经验的新手都可以得出相似且准确的结论,那么这项诊断试验的结果就很有可能在我们自己的工作环境中得到重复。常用于评估观察者之间的差异的指标为加权κ指数(κ=-1说明观察者之间完全不一致,而κ= 1说明观察者之间完全一致;一般来说,κ<0.4说明一致性较差; 0.4~0.6说明一致性一般; 0.6~0.8说明一致性较好;>0.8说明一致性极好)。比如超声内镜对纵隔淋巴结病变的判断中,由于十分依赖操作者的经验和技巧,导致观察者之间的差异非常大:经验丰富的超声内镜医师诊断纵隔淋巴结病变的κ值为0.33~0.77,说明一致性尚可;而经验不足的超声内镜医师的κ值为-0.99~0.33,说明一致性极差。而有一项研究评估了MRCP诊断胆总管结石和胆管异常的准确性,3名影像科医师独立阅读MRCP片子,其中2名医师对MRCP经验丰富,而另外1名医师不熟悉MRCP,但是熟悉MRI。结果发现,3人诊断胆总管结石的κ值为0.86,诊断胆管异常的κ值为0.96,说明观察者对MRCP结果的解读几乎一致,这提示如果影像科医师熟悉MRI的话,应该可以准确的解释MRCP的结果,也就是说,之前研究的结果可以得到重复。3.8 自己的患者是否与诊断试验中患者的情况相似?

如果研究设计合理,那么这项研究的内部真实性(internal validity)应该没有问题,但是这项研究的结果并不一定能推广到其他患者身上,因为诊断试验中所纳入的患者与我们自己管理的患者之间可能存在很大的差异。比如说,MRCP在诊断西方国家酒精性胰腺炎患者合并胆总管结石的结果与在亚洲国家胆源性胰腺炎患者中得到的结果很可能差别很大。有时我们并不知道诊断试验在某些特殊人群中的表现,这时临床医师需要利用临床经验综合判断能否将研究的结果应用于自己的患者。例如,MRCP可用于诊断或排除重症胰腺炎患者是否合并胆总管结石。虽然已经有研究表明,MRCP可准确诊断有明显胆绞痛症状患者是否合并胆总管结石,并没有研究专门探讨MRCP诊断重症胰腺炎患者合并胆总管结石的准确性。胆源性胰腺炎患者的胆总管结石可能较小或者结石位于壶腹部周围,与有明显胆绞痛的患者相比,MRCP的准确性可能略有下降,因此临床医师必须根据自己的经验判断MRCP在胆源性胰腺炎患者是否能得到与有胆绞痛症状的患者相似的结果。

病例经过5

主管孕妇的消化科医师认为自己医院的影像科医师可以得出相似的MRCP结果,因为κ值为0.86说明MRCP这项检查对胆总管结石的诊断准确性很高,而且观察者间的差异很小。消化科医师决定为这位孕妇进行MRCP检查,结果显示胆总管正常。随后外科医师进行了胆囊切除术,无须做术前ERCP或术中胆总管探查,短期随访后患者的肝功能异常指标恢复正常。

这个病例体现了循证医学在消化系统疾病诊断中的过程,首先,通过严格的文献筛选,我们了解到胆总管结石在有症状的胆绞痛患者中的发病率约为47%,这为我们估计患者合并有胆总管结石的可能性提供了参考,不过47%的发病率并不能让我们立即进行ERCP治疗,因此我们继续查询有无可以诊断胆总管结石的其他手段,于是找到了MRCP对胆总管结石诊断准确性的报告,通过评估研究设计,我们知道这项研究的结论是可靠的,计算LR值得出阳性MRCP诊断胆总管结石的可能性为86%,而阴性MRCP结果说明胆总管结石的可能性只有4%。如果没有这些详细的数据,消化科医师可能会进行ERCP和括约肌切开术或者放置支架。现在根据翔实可靠的数据,孕妇就无须接受ERCP治疗,让胎儿免受放射线辐射影响。

总之,循证医学并不能解决所有的临床问题,但是运用循证医学知识有助于更加合理的处理临床难题。4.消化道疾病的循证治疗

在每天的临床工作中,我们总会对患者的治疗方案不断产生新的疑问:比如患者是否需要接受治疗、应该用什么治疗方案、何时应该停药或者换药、怎样进行随访等等。而这些问题的答案常来自病理生理学知识、自己以往处理类似患者的经验、上级医师的经验和教科书。多数情况下这些知识足够我们应付日常的工作,但是这些临床经验却很少考虑到最新的临床研究结果。比如在1992年版的《西氏内科学》(Cecil’s Textbook of Medicine)上,仅仅提到“Hp与胃窦胃炎有关,但是还需更多的研究证实Hp是胃、十二指肠溃疡的重要病因”。而在1994年的一项调查发现,虽然美国国立卫生院(National Institutes of Health,NIH)根据最佳的研究证据推荐十二指肠溃疡患者应该进行Hp根除治疗,但只有30%的家庭医师和75%的消化科医师会对十二指肠溃疡患者进行正规的Hp根除治疗。

循证医学为我们提供了有力的工具用于系统的收集、评估文献,并将分析的结果应用于患者的临床治疗中,不过临床医师一方面要努力寻找、获取、评估最佳的临床研究证据,另一方面更要结合个人的专业知识,包括疾病发生、发展的病理生理学知识以及个人多年的临床工作经验,并考虑他人(包括相关专业的专家、同事)的意见;既要遵循医疗实践的规律和需要,又要尊重患者的个人意愿和实际可操作性,最终作出最合理的诊疗决策。下面我们用一个患者的临床治疗经过说明如何在临床工作中实践循证医学。

病例经过1

一名60岁的男性患者,因为上消化道大出血收入重症监护病房(intensive care unit,ICU),患者既往有长期大量酗酒史,合并有肝硬化(Child分级B级),因为怀疑有食管静脉曲张,主管医师给予患者静注奥曲肽,并联系消化科医师会诊进行急诊内镜检查。急诊内镜显示食管下段有3条明显曲张的静脉,红色征(+),术中立即进行了套扎治疗。内镜检查后,ICU医师向消化科医师请教继续静注奥曲肽能否预防再次出血并延长患者的生存期。消化科医师虽然以前看过几项关于奥曲肽在静脉曲张性上消化道出血的报道,不过对于内镜止血后继续使用奥曲肽对患者是否有益并不清楚。于是他在Pubmed对这个问题进行了检索,随后他找到了一篇关联性非常好的RCT。4.1 评估研究设计

和诊断试验性研究一样,治疗性研究,尤其是RCT,其结论的可信度首先要看这项研究的设计是否合理。总的来说,如果一项RCT的随机方法正确、采用盲法评估、分析时采用意向治疗分析,那么这项RCT的结果就非常可信了。

随机序列的产生:很多医师认为产生随机序列非常简单,我们常常在文献中看到诸如“根据患者入院日期”“根据患者住院号最后一位是单数或双数”进行随机的描述,实际上,这种随机方法是错误的,因为研究者可以非常容易的根据规则猜出下一个患者会入选到哪一组。而随机的实质是研究者无法预测下一个患者的入组情况,因为入组情况是完全随机的。另外一些研究采取的是半随机的方法,即第1个患者入选A组,第2个患者入选B组,第3个患者又入选A组,第4个患者入选B组,如此往复;同样,这也不是真正的随机。其实在大多数统计学教材的附录部分都会附有随机表,或者使用常见的统计软件,如SPSS、SAS,甚至办公软件Excel都可产生符合临床试验要求的随机序列。

随机序列的隐藏和分层:除了治疗措施以外,患者的预后(曲张静脉再出血)还会受到其他很多因素的影响,比如患者本身的病情以及合并的疾病。理想状态下,在一项RCT中,这些与预后相关的因素应该在治疗组和对照组患者之间均衡分布,患者接受何种治疗的几率是随机的。而在观察性研究中,患者是进入治疗组还是对照组是由研究者决定的。绝大多数情况下,预后较好的患者会进入治疗组,因为这些患者基础情况较好,无论接受何种治疗,其预后都会相对较佳。因此与RCT相比,非随机对照试验多为阳性结果,而且治疗效果也更好。比如在1960年前后,研究显示采用充满冷冻剂的球囊对胃进行冰冻治疗可以减少胃酸分泌,以此作为理论基础,许多消化性溃疡患者接受了这种胃冰冻治疗,临床报道与对照组患者相比,这些患者的症状明显缓解,影像学上溃疡得到治愈的比例也显著提高。在这项研究发表之后,更多的消化性溃疡患者进行了胃冰冻治疗。不过,一项随机对照研究比较了胃冰冻治疗与假冰冻治疗(sham procedure),最终发现两者在手术率、溃疡并发症发生率、住院率等方面均无明显差异,从而彻底否定了胃冰冻治疗的有效性。

有时即使对患者进行了随机分组,但某些重要的预后因素仍然在两组患者间不平衡分布,这种情况在小样本量研究中较为常见。为了削弱这种不利影响,研究者可以采用分层随机的方法,即根据某个重要的预后因素首先将患者分为不同的组别,例如Child A、B、C级肝功能。然后在各自的组别内再进行随机。我们知道Child C级肝功能的肝硬化患者发生静脉曲张出血的概率要远高于Child A级的患者,以前有一项RCT研究比较了内镜下硬化剂注射+奥曲肽与单用硬化剂在预防静脉曲张再出血中的效果,由于这项研究没有分层,60%的Child A级患者随机到了硬化剂+奥曲肽组,而64%的Child C级患者在单用硬化剂组,由于这项研究的样本量相对较小,因此我们无法确定硬化剂+奥曲肽组显著下降的再出血率到底是因为治疗的效果,还是因为患者病情较轻的缘故。

最后,研究者应该不知道随机序列,以保证预后因素的平衡分布,这也称为随机隐藏,简单地说,就是研究者不知道下一个入组的患者是接受治疗还是安慰剂。当随机未能做到隐藏时(比如把随机方案写在大家都可以看见的黑板、信封上等),研究者会根据患者的预后情况而下意识地决定是否应该将患者纳入研究。有研究表明,与做到随机隐藏的RCT比较,没有随机隐藏的研究多将预后较好的患者入组到新治疗方案组,从而使得治疗的效果夸大。值得注意的是,很多研究者常常将随机隐藏和双盲这两个概念混淆,实际上,由于治疗的措施不同,不是每项研究都能做到双盲(如外科手术),但是每项研究都可以做到将随机序列隐藏。

盲法:一般来说,单盲是指患者不知道自己接受的是安慰剂还是治疗,而双盲是指患者和医师(有时也可以是研究者)都不知道。如果患者或医师知道患者接受的治疗方案,就可能对某些主观指标(如临床症状)的解释出现偏倚。比如一项RCT比较两种质子泵抑制剂(proton pump inhibitors,PPI)治疗反流性食管炎的疗效情况,由于对内镜下的病变需要内镜医师的主观判断,而这种判断存在一定的观察者间差异。如果内镜医师知道患者最初接受的是何种治疗,那内镜医师潜意识中对哪种治疗方式更为有效的印象就会影响研究的结果。为保证盲法的实施,可以将内镜操作过程录像,交与第三方医师进行判断;更简单的方法就是不让内镜医师知道患者接受了何种治疗,这样得出的结果才不会有偏倚。对RCT的分析发现,不采用盲法的研究其治疗效果要远好于使用盲法的研究。当然,有些研究的观察指标是客观指标,比如5年生存率、死亡率等,这时盲法的重要性会相对减弱。

治疗组与安慰剂组的其他干预措施应该相同:在RCT中,治疗组与安慰剂组患者的唯一区别应该就是他们所接受的治疗。但是由于种种原因,参加研究的患者可能会接受其他的干预措施,这对研究结果的影响不可小视。比如,PPI和H受体拮抗剂(histamine receptor 2antagonists,H RA)可以用于消化性溃疡的治疗,如果一项没有使用2盲法的RCT,比较PPI和安慰剂预防内镜下黏膜剥离术(endoscopic submucosal dissection,ESD)后创面出血的效果,医师很可能会想给分到安慰剂组的患者使用H RA。如果两组患者都不使用其他干预措2施,研究的方法学质量会提高,但是这种不给患者有效治疗的做法是不符合伦理的。因此,在设计研究的时候就应该注明何时使用其他干预措施,并尽可能减少其他干预措施,如果的确使用了,应记录下来以便最后统计分析。

患者的完整随访:由于多种原因,最初入选研究的患者不一定能完成整个研究。患者的症状也许得到了改善,但也可能因为药物不良反应而退出研究,甚至已经死亡。因此如果患者的随访资料不完整就会影响研究的结论。有种方法可以帮助我们知道失访的患者对研究结果是否有重要影响:如果研究的结果是阳性的,假设治疗组失访患者均为阴性结果而安慰剂组失访患者均为阳性结果,重新计算,如果仍然显示治疗是有效的,那么失访患者对研究的影响比较小。但是一般来说,当超过20%的患者失访时,重新计算没有必要,因为这种情况下几乎是不可能再显示治疗有显著效果了。

使用意向治疗分析(intention-to-treat analysis,ITT):患者在入选研究后,常常会因为各种原因而没有按照当初随机分配的方案接受治疗,比如随机在治疗组的患者因为药物不良反应而退出研究,而随机到安慰剂组的患者因为病情加重而必须接受积极的治疗。意向治疗分析指按照患者当初随机的方案对这些患者进行统计分析,而不论这些患者实际接受的治疗方案。比如一项RCT比较了外科手术和内镜下微创治疗重症胰腺炎合并胰腺脓肿的效果,一些随机分配到外科手术组的患者因为病情太重或者拒绝开刀,没有进行手术治疗。把没有接受手术治疗的患者和接受了手术治疗的患者放在一起进行分析,初看会觉得不合理,但是这些病情危重或者依从性差的患者,无论是否接受治疗,他们的预后都较差,如果我们把这些预后差的患者从外科手术组排除出去,那么与内镜微创治疗相比,即使外科手术实际上无效,看上去也会变得很有效。当我们把这些依从性差的患者都包括到最终分析时,虽然对治疗的效果会有低估,但是这保证了随机对照研究的质量,因为预后差的患者并没有被系统的剔除出某个组。因此,意向治疗分析对疗效的估计是偏保守的。

而另外一种统计分析模式,即符合方案分析(per-protocol analysis)只纳入完成其随机方案的患者,而把那些由于依从性差、发生并发症而没有完成研究的患者剔除。符合方案分析是对顺利完成研究患者其疗效的最佳估计。但是,因为预后差的患者很可能被不均衡的从治疗组和安慰剂组剔除,研究的结果会产生偏倚。因此,一项RCT最好同时进行意向治疗分析和符合方案分析,这样可以让读者自己来判断结果的可信度以及评估治疗的疗效。

病例经过2

消化科医师对检索到的这篇RCT进行了系统的评估:这项随机研究使用意向治疗分析,96%的入选患者都有随访结果,不过不清楚是否进行了随机隐藏,患者和研究者知道治疗方案,即没有使用盲法,患者没有根据肝功能进行分层,不过Child A、B、C级肝功能的患者在两组中分布均衡,在文章的方法部分没有提到其他的干预措施。总之,这项研究符合高质量研究的某些标准,不过因为没有使用盲法,对静脉曲张再出血的主观判断会带来影响,可能会高估治疗效果。因此这项研究需要进一步的分析,但对研究的结果要谨慎对待。4.2 解释研究结果

如果研究的设计方案是合理的,那么研究的结果应该也是可信的。不过,对治疗的效果可以用多种统计学指标表达。如果研究的样本量足够大,报告了绝对危险度减少(absolute risk reductions,ARRs)和相对危险度减少(relative risk reductions,RRRs)及其95%可信区间(confidence intervals,CIs),那么这些结果对读者的帮助就比较大。

确定治疗效果(RRR和ARR): RRR是将安慰剂组与治疗组发生的不良预后事件发生率相减后与安慰剂组不良预后事件发生率进行比较。比如,一项采用意向治疗分析的双盲RCT探讨β受体阻滞剂预防尚未出血的曲张静脉发生首次出血的效果,22%的安慰剂组患者在17个月的随访中发生曲张静脉出血,而治疗组为4%。那么RRR=(安慰剂组出血率-治疗组出血率)/安慰剂组出血率=(22%-4%)/22%= 82%。也就是说,与不使用β受体阻滞剂的患者相比,接受β受体阻滞剂的患者发生出血的概率降低82%,说明治疗很有效。但是如果这种不良预后事件在服用安慰剂或者不进行治疗的患者中发生率极低,那么极大的RRR值可能会误导临床医师。下面我们会将RRR和ARR进行对比以说明这个问题。

RRR是比较安慰剂组与治疗组的不良预后事件发生率,而ARR是指治疗组不良预后事件发生率的实际减少。在上述这项研究中,ARR=(安慰剂组出血率-治疗组出血率)= 22%-4%= 18%。因此,静脉曲张患者服用β受体阻滞剂后发生出血的概率实际下降了18%。因此ARR在指导临床治疗方案时可能更有帮助。

不过RRR也是一项有用的指标,它可以用于不同亚组的患者,而这些患者发生不良预后事件的风险是不一样的。比如,静脉曲张出血的风险与肝功能有关,在上述研究中,肝功能为Child A级的患者在17个月内发生出血的比例是4%,根据82%的RRR,接受治疗的患者的出血风险会从4%下降到1%,这时ARR值只有3%。但是肝功能为Child B级的患者出血风险为38%,接受治疗的患者的出血风险会从38%下降到9%,这时的ARR值就达到29%了。这为不同出血风险的患者采取不同的治疗措施提供了参考:虽然RRR 为82%看上去疗效很好,但是Child A级的患者的实际出血风险只下降了3%,再考虑到长期使用β受体阻滞剂的不良反应,医师和患者不一定会使用β受体阻滞剂来预防出血; 而Child B级的患者的实际出血风险可以下降29%,治疗的好处可能就要大于药物的不良反应。因此,论文应该把ARR和RRR值都报道出来,以供临床医师参考。

结果的准确性——95% CI的范围:通常P值小于0.05表示有统计学意义,也表示假设检验(治疗组和安慰剂组在疗效上没有差异)是几乎不可能发生的。换句话说,我们观察到治疗组和安慰剂组在疗效上的差异只有<5%的可能是随机发生的。但是P值并不能告诉我们更多关于疗效估计的准确性方面的信息,而CI可以。CI一般都以95% CI的形式来表达,表示疗效的真正效果有95%的可能位于这一区间内。在前面所提到的一项研究中,内镜套扎+奥曲肽预防再出血的RRR值为76%,其95% CI为43%~92%,这表示真实的RRR值有95%的可能性在43%~92%之间,76%只是最佳的估计。

样本量越大的研究,其95% CI范围就越小,这样对RRR的估计就更为精确。有一项包括77例患者的研究比较了内镜套扎或硬化剂治疗食管静脉出血后的再出血率,结果发现与硬化剂治疗相比,内镜套扎治疗的RRR值为48%,但是因为样本量小,其95% CI为-15%~68%。与硬化剂治疗相比,内镜套扎治疗可能减少68%的再出血率,但也可能增加15%的再出血率。如果研究的样本量增加,其95% CI范围会缩小,到底内镜套扎治疗是否优于硬化剂治疗才能明确。一项荟萃分析纳入总共547例患者,随着样本量的增加,最终发现与硬化剂治疗相比,内镜套扎治疗预防再出血率的RRR为42%(95% CI 16%~60%)。这样95% CI的范围缩窄,并排除了套扎治疗增加再出血率的可能性;另外,RRR值不包括0,表示内镜套扎预防再出血有统计学意义。

纳入足够样本量的患者:当一项研究显示治疗组与安慰剂组之间没有统计学差异时,一种可能是治疗的确无效,另一种可能是治疗有效,但是由于纳入的患者数量太少,导致疗效无法检出,这也称为Ⅱ类错误。统计发现,许多阴性试验甚至没有纳入使RRR值达到25%,甚至50%的样本量。研究者在最初设计一项研究时,可以根据多个预后事件来计算样本量,但是一般情况下研究者应该根据最主要的预后指标,也就是主要观察终点来计算样本量,在上述研究中,研究者估计内镜套扎组再出血率为35%,而内镜套扎+奥曲肽联合组为10%,因此研究者纳入足够的患者以检出再出血率RRR值达到70%[即(35%-10%)/35%= 70%],最终研究显示联合治疗的再出血率RRR值为76%。同时这项研究还发现联合治疗组的30天死亡率RRR值为55%,不过没有统计学意义(95% CI-21%~83%)。但是这项研究在估算样本量的时候,是根据再出血率估计的,而由于死亡率的发生率较低,如果需要检出明显的统计学差异,那就需要更大的样本量,因此不能根据目前的结果就认为联合治疗对降低死亡率是无效的。一般来说,如果疗效的95% CI范围很大,但不包括0,那么治疗很可能是有效的,只是入选的患者数不够;但如果95% CI的上限和下限范围很窄,与0(即治疗无效)距离相当,那么治疗基本上不会优于安慰剂。

病例经过3

这项比较内镜套扎+奥曲肽与单用内镜套扎的研究发现再出血率的RRR为76% (95% CI 43%~92%),住院死亡率的RRR为56%(95% CI-34%~85%),30天死亡率的RRR为55%(95% CI-21%~83%)。死亡率下降的趋势没有统计学意义,但可能是因为样本量不够导致的。综合考虑这些因素,在这项研究中,内镜套扎+奥曲肽比单用内镜套扎对患者更为有益。4.3 将研究结果应用到患者

合理的研究设计、有统计学意义的疗效并不一定意味着我们可以不加思考地把研究的结果应用到自己的患者。临床医师必须综合考虑自己的患者是否与研究中的患者情况相似,治疗的风险是否大于益处。

如果患者满足研究中的入选标准和排除标准,那么研究的结果应该适用于该患者。但是,实际上很多患者难以达到临床研究中所要求的苛刻标准,临床工作中遇到的患者常常年龄较大、伴随其他的慢性疾病;在某些国家进行的研究中,患者的文化/基因差异会导致患者对治疗的反应不同。因此,一项内部真实性良好的临床研究(研究设计合理,结果真实可信)并不一定能把其研究结果推广到所有患有该疾病的患者。因此临床医师在完全相信该研究的结果之前,常常希望看到在不同国家、不同医疗背景、不同患者人群条件下进行的相似研究,以确保该研究的结论可以普遍应用到其他的人群中。例如非静脉曲张性上消化道出血患者在内镜检查前使用PPI的效果经过至少5项RCT和1项荟萃分析的验证,所有的研究都一致的显示内镜检查前使用PPI可以降低溃疡分级和减少内镜治疗率,在不同环境条件下进行的这一系列研究使得研究的结论可以推广应用到绝大多数由于消化性溃疡导致出血的患者。虽然单独一项研究的普遍适用性有限,但是有时这项研究很可能是针对某个临床问题的最佳临床证据,如果没有其他的补充研究,医师在做出临床决定的时候就需要在最佳的临床证据和临床判断之间找到平衡。

当我们决定是否要对患者进行一种新的治疗措施时,常常要判断治疗的副作用、费用等是否要大于给患者带来的好处。需要治疗的病例数(number needed to treat,NNT)是一个有用的参考指标,NNT是ARR的倒数(1/ARR),表示需要多少患者接受治疗才能预防一例不良预后事件的发生。在前面提到的研究中,内镜套扎+奥曲肽联合治疗

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载