AI+医疗健康:智能化医疗健康的应用与未来(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-20 04:32:43

点击下载

作者:闵栋,王豫,徐岩,方林

出版社:机械工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

AI+医疗健康:智能化医疗健康的应用与未来

AI+医疗健康:智能化医疗健康的应用与未来试读:

前言

随着数据资源、计算能力、算法模型等基础条件的日臻成熟,人工智能成了传统行业变革发展的重要力量。近年来,人工智能技术开始应用于医疗健康的多个领域,包括医学影像辅助诊断、临床决策支持、基因测序、智能健康管理、医用机器人、新药研发等,能够帮助医生有效减少误诊漏诊,极大提高了诊断效率,提升了基层医疗服务的能力,促进了医疗健康行业的变革发展。

无论在中国还是在世界范围内,医疗健康服务能力无法满足人民群众日益增长的服务需求都是医疗健康行业的核心痛点。一方面,由于人口老龄化加剧、慢性病蔓延,带来了医疗健康需求的激增,另一方面,优质医疗资源紧缺且分布不平衡的问题持续存在。而大力推进人工智能+医疗健康,给予医疗健康行业新的机遇和新的方向,将有效促进医疗健康服务的创新供给和信息资源的开放共享,大幅提升医疗健康服务能力和普惠水平,助力“健康中国”建设。

本书围绕人工智能如何赋能医疗健康行业,介绍了人工智能在医疗健康领域的主要应用场景,分析了人工智能+医疗健康的技术体系、产业生态,并从医学图像辅助诊断、临床决策支持系统、基因测序、智能健康管理、医用机器人、新药研发等方面深入阐述了人工智能的具体应用。最后,本书从政策标准、技术创新、商业模式、人才资源、法规伦理等角度对中国人工智能+医疗健康的发展进行了展望。本书编写组2018年10月第一章 人工智能赋能医疗健康行业1.1 人工智能+医疗健康发展背景

人工智能+医疗健康是医药卫生行业与信息通信技术融合创新的产物,将成为医疗健康行业发展与转型升级的重要方向。人口老龄化、医疗资源配置结构性失衡、人工智能技术的快速发展等宏观环境有力推动人工智能+医疗健康迈向广阔的发展空间,并且正处于发展的关键时期。未来,随着人工智能技术的快速发展、新产品开发的加快和企业经营实力与创新能力的不断增强,人工智能+医疗健康将向纵深方向发展。1.1.1 行业痛点激发新需求

医疗健康是人民群众最根本的民生需求之一。健康服务行业以维护和促进人民群众身心健康为目标,主要包括医疗服务、健康管理与促进、健康保险以及相关服务,涉及药品、医疗器械、保健用品、保健食品、健身产品等支撑产业,覆盖面广,产业链长。医疗服务行业是指对患者进行诊断、治疗、防疫、接生、计划生育方面的服务,以及与之相关的提供药品、医疗用具、病房住宿和伙食等业务,是健康服务业的重要组成部分。当前,我国医疗健康行业的核心痛点在于医疗健康服务能力无法满足人民群众日益增长的服务需求。

在需求侧方面,医疗健康服务需求持续快速增长。一是人口老龄化加速。国际上通常的看法是,当一个国家或地区60岁及以上老年人口占人口总数的10%,或65岁及以上老年人口占人口总数的7%,就意味着这个国家或地区进入老龄化社会。根据世界银行统计数据显示,我国2002年65岁及以上人口占比7.01%,已进入老龄化社会,2010年进入深度老龄化阶段,即65岁及以上人口超过总人口14%。预计2035年后,我国将和英国等欧洲国家一起进入超级老龄化社会,即65岁及以上人口超过总人口的20%。二是慢性病蔓延,亚健康常态化。心脏病、高血压、糖尿病等慢性病呈每年递增态势,据国家卫生健康委员会最新统计数据显示,我国现有慢性病患者已经超过2.6亿,由慢性病导致的疾病负担占到总疾病负担的近70%,慢性病导致的死亡人数占到了所有人数死亡人数的85%左右。

在供给侧方面,一是医疗资源总量不足。我国医疗资源总量匮乏而人口众多,形成巨大资源缺口。据世界银行最新数据统计,我国每千人口医生和护士数量均为1.9人,低于同等收入水平的国家,与高收入国家差距更大(每千人口医生数量低1人、护士数量低6.7人)。《2016中国卫生和计划生育统计年鉴》显示,全国有超过76亿人次进行门诊寻医,人均就诊5.6次,包括各类医院、基础保健机构等。二是资源不均。优质的医疗资源向大城市倾斜,据《2015中国卫生和计划生育统计年鉴》数据显示,我国46%的三甲医院位于东部地区,西部地区的三甲医院数量仅占23%。《中国医院竞争力报告(2016)》显示,我国优质医院集中于东部沿海,顶级医院集中在北京、上海和广州,其中北京以17家的保有量居首位。大量患者涌入一线城市求医问诊,核心医院人满为患、医生超负荷工作,加大了医患紧张关系。三是供需失衡。医疗资源向综合型医院集中,供需矛盾不断激化。原本定位于“收治急危病症、疑难杂症和人才培养”的大医院却大小疾病皆收,而普通医院及基层医疗机构却有大量资源被闲置浪费。数据显示,只有8%的患者首诊会选择社区医院,53%的患者就医首选知名公立医院,43%的患者首诊时会直接选择特需门诊或专家号。据测算,全国有近6成闲置的基层医疗设备和95万张利用不充分的床位资源有待激活,优质医疗机构和非核心医疗机构供需不均衡的局面还在加剧。

当前形势下,大力推进人工智能+医疗健康,给予医疗健康行业新的机遇和新的方向,人工智能的应用将有效促进医疗健康服务的创新供给和信息资源的开放共享,大幅提升医疗健康服务能力和普惠水平。1.1.2 技术突破提供新手段

人工智能的概念虽然在20世纪已经出现,但由于彼时软硬件条件不成熟,数据资源短缺,人工智能并未得到广泛的应用。如今,随着计算能力、算法模型、数据资源等基础技术条件的日渐成熟,人工智能开始应用在各个领域。

在计算能力方面,图形处理器(GPU)显著提升了计算性能,拥有远超中央处理器(CPU)的并行计算能力。由于处理器的计算方式不同,CPU擅长处理面向操作系统和应用程序的通用计算任务,而GPU擅长完成与显示相关的数据处理。CPU计算使用基于X86指令集的串行架构,适合快速完成计算任务。GPU拥有多内核处理并行计算,适合处理3D图像中上百万的图像像素。此外,现场可编程的陈列(FPGA Field Programmable Gate Array)也在越来越多地应用在AI领域。FPGA是在PAL、GAL、CPLD等可编程逻辑器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。一方面,FPGA是可编程重构的硬件,相比GPU有更强大的可调控能力;另一方面,与日增长的门电路资源和内存带宽使得它有更大的设计空间。由于深层神经网络包含多个隐藏层,大量神经元之间的联系计算具有高并行性的特点,具备支撑大规模并行计算的FPGA和GPU架构已成为了现阶段深度学习的主流硬件平台。FPGA和GPU架构能够根据应用的特点定制计算和存储的结构,方便算法进行微调和优化,实现硬件与算法的最佳匹配,获得较高的性能功耗比。

在算法模型方面,深度学习是当前研究和应用的热点算法,也是人工智能的重要领域。深度学习通过构建多隐层模型和学习海量训练数据,可以获取到数据有用的特征。通过数据挖掘进行海量数据处理,自动学习数据特征,尤其适用于包含少量未标识数据的大数据集。深度学习采用层次网络结构进行逐层特征变换,将样本的特征表示变换到一个新的特征空间,从而使分类或预测更加容易。深度学习驱动图像识别精度大幅度提升。2012年,深度学习模型首次被应用在图像识别大赛(ImageNet),将错误率降至16.4%,一举夺冠。2015年,微软公司通过152层的深度网络,将图像识别错误率降至3.57%,而人眼的辨识错误率约在5.1%,深度学习模型的识别能力已经超过了人眼。自Hinton提出DBN(深度置信网络)以来,深度学习的发展经历了一个快速迭代的周期,其中卷积神经网络(CNN,Convolutional Neural Network)目前已成为图像识别领域应用最广泛的算法模型。在利用卷积神经网络(CNN)进行图像理解的过程中,图像以像素矩阵形式作为原始输入,第一层神经网络的学习功能通常是检测特定方向和形状的边缘存在与否,以及这些边缘在图像中的位置;第二层往往会检测多种边缘的特定布局,同时忽略边缘位置的微小变化;第三层可以把特定的边缘布局组合成为实际物体的某个部分;后续的层次将会通过全连接层来把这些部分组合起来,实现物体的识别。目前,CNN已广泛应用于医疗健康行业特别是医疗影像辅助诊断,用以实现病变检测和特定疾病的早期筛查。

在数据资源方面,医疗和健康养老数据产生的场景较多,主要可以分为四大类:一是医疗机构数据。医疗机构每年都会产生海量的数据,一般医疗机构每年会产生1~20TB的相关数据,个别大规模医院的年医疗数据甚至达到了PB级别。从数据种类上来看,医疗机构数据不仅涉及服务结算数据、行政管理数据,还涉及大量复杂的门诊数据,包括门诊记录、住院记录、影像学记录、用药记录、手术记录、医保数据等;二是基因及临床试验数据。大量基因数据、临床试验数据的积累促进人类对疾病与基因之间映射关系的认识加深,针对患者个体的精准医疗和远程医疗成为可能;三是患者数据。患者自身的、在院外的行为和感官产生的数据,主要包括可穿戴设备、各类网上轻医疗平台采集的数据、体征类健康管理数据、网络行为数据(例如挂号问诊、网络购药、健康管理、医患病友交流等)等;四是医保及支付数据。一切与付费方相关的审核/报销记录,主要包括患者的支付记录、报销记录、医药流通记录等。各种医疗健康数据的互通共享形成了个人完整生命周期的医疗健康大数据,为人工智能技术在医疗健康行业的应用提供了有力的支撑。1.1.3 政策出台营造新环境

近年来,人工智能在全球范围内的关注度日渐升高,发展速度迅猛,已经成为世界各国的战略布局重点。中国、美国、日本、英国等国家和欧盟陆续出台了与人工智能有关的战略、政策和计划,来应对当前白热化的人工智能浪潮。美国于2016年发布了《为人工智能的未来做好准备》《国家人工智能研究与发展策略计划》和《人工智能、自动化与经济报告》3大报告,人工智能在美国国家发展中的战略地位正不断提升。在欧盟,2013年提出了人脑计划,项目为期10年,经费高达12亿欧元。人脑计划某种程度上决定着计算机技术的发展方向,为物联网和人工智能领域带来更多的可能性,对欧盟的经济和社会产生巨大影响。

近年来,中国各相关政府部门陆续颁布了多项政策,从人才培养、技术创新、标准监管、行业融合、产品落地等方面做出了相关指导。2016年,国务院办公厅发布了《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,明确指出“支持研发健康医疗相关的人工智能技术、生物三维(3D)打印技术、医用机器人、大型医疗设备、健康和康复辅助器械、可穿戴设备以及相关微型传感器件”。2016年,国家发展改革委、科技部、工业和信息化部、中央网信办联合发布《“互联网+”人工智能三年行动实施方案》,明确指出“支持在制造、教育、环境、交通、商业、健康医疗、网络安全、社会治理等重要领域开展人工智能应用试点示范”。2017年,工业和信息化部发布《促进新一代人工智能产业发展三年行动计划(2018-2020年)》,指出重点发展“医疗影像辅助诊断系统。推动医学影像数据采集标准化与规范化,支持脑、肺、眼、骨、心脑血管、乳腺等典型疾病领域的医学影像辅助诊断技术研发,加快医疗影像辅助诊断系统的产品化及临床辅助应用。”1.2 人工智能+医疗健康能做什么1.2.1 医疗健康信息化的技术进化史

医疗健康信息化的技术进化史可以分为三个阶段(见图1-1)。第一个阶段是医疗信息化阶段,通过计算机、宽带网络等技术实现医院信息共享和区域医疗信息共享;第二个阶段是互联网医疗阶段,借助可穿戴设备、4G网络、云计算、大数据等技术,实现以在线导流、问诊为主要模式的互联网医疗以及医院内部融合医保的全流程移动;第三个阶段是智能医疗阶段,人工智能技术全面融入医疗健康全环节,借助医疗机器人、虚拟现实、增强现实、5G网络、人工智能等技术,实现人工智能辅助诊断、远程手术等业务模式,实现医疗健康全流程智能化。当前,医疗信息化正处在从互联网医疗向智能医疗过渡的阶段,智能医疗时代的曙光已经到来。图1-1 医疗健康信息化的技术进化史

在智能医疗阶段,人工智能技术融入诊前、诊中、诊后的医疗健康全流程:在诊前阶段,主要应用于疾病预防与健康管理;在诊中阶段,主要应用于辅助诊断、临床辅助决策、辅助治疗等;在诊后阶段,主要应用于康复辅助等。同时,人工智能技术也与生物医药智能制造深度结合,应用于生物医药增材制造(3D打印)、医用设备全生命周期管理、药物研发等领域。1.2.2 诊前:疾病预防与健康管理

多数疾病都是可以预防的,但是由于疾病通常在发病前期表征并不明显,到病况加重之际才会被发现。虽然医生可以借助工具进行疾病辅助预测,但人体的复杂性、疾病的多样性会影响预测的准确程度。人工智能技术与医疗健康可穿戴设备的结合可以支撑慢性病与健康管理,实现疾病的风险预测和实际干预。通过收集和分析数据,医生可以更好地判断病人病情,可实现计算机远程监护,对慢性病进行管理。通过对远程监控系统产生的数据的分析,可以帮助患者寻找病因,发现潜在风险,实现预防病和早期治疗。例如心血管疾病,在发病之前,都伴随高脂血症、肥胖、高血压、糖尿病等症状,如果能及时检测到相关症状并改变不良生活习惯(比如减肥、戒烟),就可以达到很好地控制心血管疾病的目的。同时,许多疾病在彻底康复之前会出现情况反复,患者出院再入院的情况普遍存在,通过可穿戴智能医疗设备可以持续跟踪患者的后续情况,医生可以动态评估药物的疗效,及时跟踪患者的康复进展情况,发现潜在的风险因素。1.2.3 诊前:基因测序

基因测序是一种新型基因检测技术,它通过分析测定基因序列,可用于临床的遗传病诊断、产前筛查、罹患肿瘤预测与治疗等领域。单个人类基因组拥有30亿个碱基对,编码约2.3万个含有功能性的基因,基因检测就是通过解码从海量数据中挖掘有效信息。目前高通量测序技术的运算主要为解码和记录,较难以实现基因解读,所以从基因序列中挖掘出的有效信息十分有限。大数据与人工智能技术的介入可突破目前的瓶颈。通过建立初始数学模型,将健康人的全基因组序列和RNA序列导入模型进行训练,让模型学习到健康人的RNA剪切模式。之后通过其他分子生物学方法对训练后的模型进行修正,最后对照病例数据检验模型的准确性。1.2.4 诊中:医学影像辅助诊断

医疗影像数据是医疗数据的重要组成部分,从数量上看超过90%以上的医疗数据都是影像数据,从产生数据的设备来看包括CT、X光、MRI、PET等医疗影像数据,但是对医学影像的诊断主要依赖于人工的主观分析。人工分析只能凭借经验去判断,容易发生误判。据中华医学会数据资料显示,中国临床医疗每年的误诊人数约为5700万人,总误诊率为27.8%,器官异位误诊率为60%,恶性肿瘤平均误诊率为40%。对于放射科医生而言,患者拍片过程会产生几百甚至几千张片子,繁重的任务量加之疲劳的工作状态,容易导致漏诊;对于病理医生而言,依靠经验从众多细胞中找到癌变细胞难度较大,误诊现象时有发生。

人工智能技术与医疗影像数据的结合有望缓解此类问题。医学影像辅助诊断应用主要指通过计算机视觉技术对医疗影像进行快速读片和智能诊断。人工智能在医学影像中的应用主要分为两部分:一是感知数据,即通过图像识别技术对医学影像进行分析,获取有效信息;二是数据学习、训练环节,通过深度学习海量的影像数据和临床诊断数据,不断对模型进行训练,促使其掌握诊断能力。目前,大数据及人工智能技术与医疗影像诊断的结合场景包括肺癌检查、糖网眼底检查、食管癌检查以及部分疾病的核医学检查和病理检查等。1.2.5 诊中:临床辅助决策

临床中遇到的疑难杂症,有时即便专家也缺乏经验,做出正确的诊断和治疗更加困难。临床决策支持系统可以通过海量文献的学习和不断的错误修正,给出最准确的诊断和最佳治疗。大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据的分析能力的日益加强。比如挖掘医疗文献数据建立医疗专家数据库,从而给医生提出诊疗建议。此外,临床决策支持系统还可以使医疗流程中大部分的工作流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。以IBM Watson 为代表的临床决策系统在开发之初只是用来进行分诊的工作。而如今,通过建立医疗文献及专家数据库,Watson 已经可以依据与疗效相关的临床、病理及基因等特征,为医生提出规范化临床路径及个体化治疗建议,不仅可以提高医生的工作效率和诊疗质量,还可以减少不良反应和治疗差错。在美国Metropolitan 儿科重症病房的研究中,临床决策支持系统就避免了40%的药品不良反应事件。世界各地的很多医疗机构(如英国的NICE,德国IQWiG 等) 已经开始了比较效果研究(CER) 项目并取得了初步成功。1.2.6 诊中:医用机器人

近年来,机器人不仅用于工业领域,在医疗系统也已得到推广应用。目前,医用机器人主要包括外科手术机器人、康复机器人、护理机器人、配药机器人等。其中,外科手术机器人是目前应用范围最广且最具前景的医用机器人。结合高精度空间定位能力、快速计算能力、3D数字化医疗影像技术,外科手术机器人能够克服传统外科手术中精确度差、手术时间过长、医生疲劳、缺乏三维精度视野等问题,已经在普外科(胃部分切除术、阑尾切除术、胃造口术、乳房切除术等)、肝胆外科(胆囊切除术、肝门空肠吻合术、胆总管造口术等)、妇产科(子宫切除术、卵巢错位、子宫肌瘤切除术等)、泌尿外科(前列腺切除术、肾切除术、输尿管成形术等)、胸心外科等领域广泛应用。目前,应用最广泛的da Vinci手术机器人已经在全球销售3000多台,医用机器人手术数量从2005年的2.5万例增加到2016年的65万例。1.2.7 诊后:康复辅助

康复辅助器具是指改善、补偿、替代人体功能和辅助性治疗以及预防残疾的产品,包括矫形器、假肢、个人移动辅助器具、外骨骼康复机器人等,适用人群主要包括残疾人、老年人、伤病人等。康复辅助器具结合虚拟现实/增强现实、柔性控制、多信息融合、运动信息解码、外部环境感知等人工智能新技术,将极大推动智能假肢、智能矫形器、外固定矫正系统、新型电子喉、智能护理机器人、外骨骼助行机器人、智能喂食系统、多模态康复轮椅、智能康复机器人、虚拟现实康复系统、肢体协调动作系统、智能体外精准反搏等新型康复辅具发展。1.2.8 生物医药

药物研发需要经历靶点筛选、药物挖掘、临床试验、药物优化等阶段。利用传统手段研发药物需要进行大量的模拟测试,导致药物研发过程周期长、成本高。制药公司平均成功研发一款新药需要10亿美元及10年左右的时间。目前业界已尝试利用人工智能开发虚拟筛选技术,发现靶点、筛选药物,以取代或增强传统的高通量筛选(HTS)过程,提高潜在药物的筛选速度和成功率。通过机器学习和自然语言处理技术可以分析医学文献、论文、专利、基因组数据中的信息,从中找出相应的候选药物,并筛选出针对特定疾病有效的化合物,从而大幅缩减研发时间与成本。1.3 人工智能+医疗健康技术产业体系1.3.1 人工智能+医疗健康技术体系

人工智能+医疗健康技术可以分为基础层和关键技术层。基础层以计算能力、数据资源、算法模型支撑人工智能+医疗健康深度发展,其中:计算能力包括云计算及AI芯片(GPU、FPGA、ASIC、类脑芯片)等,负责运算;数据资源包括各种来源的医疗和健康养老数据,用于人工智能的训练学习;算法模型主要包括深度学习等算法,用于支撑各种人工智能+医疗健康应用。关键技术层主要可以分为感知环节、思考环节和行动环节(见图1-2)。图1-2 人工智能+医疗健康技术体系

感知环节主要包括计算机视觉、自然语言处理、生物体征感知等关键技术。计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类的提取、处理、理解和分析图像以及图像序列的能力,在医学影像识别、病理辅助诊断、心电辅助诊断等方面具有广泛应用;自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读理解和问答系统等,主要应用于智能分诊、智能导诊、虚拟助手等领域的患者信息采集分析;生物体征感知技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术,生物体征感知技术涉及的内容十分广泛,主要应用于健康医疗可穿戴设备、慢性病管理、疾病预测等领域。

思考环节是使计算机具备足够的计算能力模拟人的某些思维过程和行为对分析收集来的数据信息做出判断,即对感知的信息进行自我学习、信息检索、逻辑判断、决策。临床知识库、训练资源库等是思考环节的核心,通过引导医疗机构合理开放行业数据,整合医学文献资料、医学影像、数字病理等数据,构建医疗人工智能训练资源库和标准测试数据集,为人工智能+医疗健康产品提供算法训练、产品优化、标准验证、测试认证等支撑。

行动环节是将前期处理和判断的结果转译为肢体运动与媒介信息传输给人机交互界面或外部设备,实现人机、机物的信息交流和物理互动。行动环节是人工智能最直观的表现形式,其表达能力展现了系统整体的智能水平,在医疗健康领域具体体现为健康管理、辅助诊断、辅助手术、辅助康复等。行动环节与机械技术、控制技术、感知技术等密切相关。1.3.2 人工智能+医疗健康产业生态

人工智能+医疗健康产业生态总体可以分为三部分,包括传统医疗卫生行业生态、人工智能+医疗健康服务生态、人工智能+医疗健康技术产品生态(见图1-3)。图1-3 人工智能+医疗健康产业生态

传统医疗卫生行业是人工智能+医疗健康的需求方和使用方,同时也是医疗健康数据的主要提供方,主要包括医疗机构、基层卫生服务机构、医疗健康保险机构、生物医药企业等相关主体。一方面,医疗卫生行业的需求和痛点引领人工智能+医疗健康的服务发展和技术产品创新;另一方面,医疗卫生行业数据也是人工智能+医疗健康企业进行技术产品创新的基础。

人工智能+医疗健康服务生态主要包括各类人工智能服务提供商,例如医学影像辅助诊断、病理辅助诊断、临床决策支持、智能健康管理、新药研发等,能够帮助医生有效减少误诊、漏诊,极大提高诊断效率,提升基层医疗服务能力,提高新药研发速度,促进医疗健康行业的变革与发展。

人工智能+医疗健康技术产品生态主要包括医疗健康终端企业、云计算企业、芯片制造企业、算法研发企业、数据运营企业、解决方案提供商等,其中解决方案提供商是技术产品生态的核心。解决方案提供商通过整合人工智能+医疗健康相关技术、产品、数据,形成可直接交付的解决方案,提供给服务提供商或直接提供给医疗机构、医药企业、医疗保险机构等。1.3.3 人工智能+医疗健康产业格局

据统计,到 2025 年人工智能应用市场总值将达到 1270 亿美元,其中医疗行业将占市场规模的五分之一。投资方面,根据国外著名咨询机构 IDC公司发布的报告显示,2017 年全球对人工智能和认知计算领域的投资迅猛增长 60%,达到125亿美元,在2020年将进一步增加到 460 亿美元。其中,针对人工智能+医疗行业的投资也呈现逐年增长的趋势。2016 年总交易额为 7.48 亿美元,总交易数为 90 起,均达到历史最高值。

国内外科技巨头均重视人工智能技术在医疗领域的布局与应用。IBM公司在2006年启动了Watson项目,于2014年投资10亿美元成立Watson事业集团。Watson 是一个通过自然语言处理和机器学习,从非结构化数据中洞察数据规律的技术平台。Watson 将散落在各处的知识片段连接起来,进行推理、分析、对比、归纳、总结和论证,获取深入的洞察以及决策的证据。2015 年,沃森健康(Watson Health)成立,专注于利用认知计算系统为医疗健康行业提供解决方案。Watson 通过和癌症中心合作,对大量临床知识、基因组数据、病历信息、医学文献进行深度学习,建立了基于证据的临床辅助决策支持系统。目前该系统已应用于肿瘤、心血管疾病、糖尿病等领域的诊断和治疗,并于 2016 年进入中国市场,在国内众多医院进行了推广。Watson 在医疗行业的成功应用标志着认知型医疗时代的到来,该解决方案不仅可以提高诊断的准确率和效率,还可以提供个性化的癌症治疗方案。此外,谷歌公司、微软公司等也都纷纷布局人工智能+医疗。2014 年谷歌公司收购DeepMind公司,后开发了知名的人工智能程序 AlphaGo。在基础技术层面,谷歌公司的开源平台 TensorFlow 是当今应用最广泛的深度学习框架。在医疗健康领域,谷歌公司旗下的 DeepMind Health 和英国国家医疗服务体系 NHS(National Health Service)展开合作,DeepMind Health可以访问 NHS 的患者数据进行深度学习,训练有关脑部癌症的识别模型。公司微软将人工智能技术用于医疗健康计划“Hanover”,寻找最有效的药物和治疗方案。此外,微软研究院有多个关于医疗健康的研究项目。Biomedical Natural Language Processing 利用机器学习从医学文献和电子病历中挖掘有效信息,结合患者基因信息研发用于辅助医生进行诊疗的推荐决策系统。

国内科技巨头也纷纷开始在医疗人工智能领域布局,各家公司均投入大量资金与资源,但各自的发展重点与发展策略并不相同。例如,阿里健康以云平台为依托,结合自主机器学习平台 PAI2.0 构建了坚实而完善的基础技术支撑。同时,阿里健康与浙江大学医学院附属第一医院、浙江大学医学院附属第二医院、上海交通大学医学院附属新华医院等医院以及第三方医学影像中心建立了合作伙伴关系,重点打造医学影像智能诊断平台,提供三维影像重建、远程智能诊断等服务。此外,阿里云联合英特尔、零氪科技举办了天池医疗 AI 大赛。该大赛面向全球第一高发恶性肿瘤——肺癌,以肺部小结节病变的智能识别、诊断为课题,开展大数据与人工智能技术在肺癌早期影像诊断上的应用探索。腾讯在人工智能领域的布局涵盖基础研究、产品研发、投资与孵化等多个方面。腾讯在 2016 年建立了人工智能实验室 AI Lab,专注于 AI 技术的基础研究和应用探索。2017 年 11 月,在“2017 腾讯全球合作伙伴大会”上腾讯宣布了自己的“AI 生态计划”,旨在开放AI 技术,并结合资本机构孵化医疗 AI 创业项目。2017 年 4 月,腾讯向碳云智能投资 1.5 亿美元。碳云智能由原华大基因 CEO 王俊牵头组建,致力于建立人工智能的内核模型,并对健康风险进行预警、精准诊疗和个性化医疗。在产品研发方面,腾讯在 2017 年 8 月推出了自己首个应用在医学领域的 AI 产品——腾讯觅影。腾讯觅影把图像识别、深度学习等领先的技术与医学跨界融合,可以辅助医生对食管癌进行筛查,有效提高筛查的准确度,促进了准确治疗。除了食管癌,腾讯觅影未来也将支持早期肺癌、糖尿病性视网膜病变、乳腺癌等病种的早期筛查。

在国际上权威的肺结节检测比赛 LUNA 中,中国企业参赛队伍阿里云 ET 和科大讯飞均取得了优异的成绩。科大讯飞医学影像团队以92.3%的召回率刷新了世界纪录。召回率是指成功发现的结节数在样本数据中总节结数的占比。召回率是评测诊断准确率的重要指标,召回率低代表遗漏了患者的关键病灶信息,因此科大讯飞团队采用了多尺度、多模型集成学习的方法显著提升了召回率,同时针对假阳性导致的医生重复检测问题,创新性地使用结节分割和特征图融合的策略进行改善。在诊断效率方面,科大讯飞团队采用 3D CNN 模型来计算特征图,并在特征图上进行检测,并通过预训练大幅提升了检测效率,实现了薄层 CT 的秒级别处理。第二章 医学图像识别,计算机辅助医生“阅片”2.1 应用场景2.1.1 发展背景

医学影像是指针对人体或人体某部分,以非侵入方式取得内部组织影像的技术与处理过程。在临床上,超过70%的诊断都依赖于医学影像。随着技术发展,医学影像检查手段逐渐多样化,包括超声、病理、内窥镜、CT(计算机断层成像)、CR(计算机X线摄影)、MRI(磁共振成像)、核素显像、PET-CT(正电子发射计算机断层显像)、DSA(血管造影)等(见图2-1)。

人工智能应用于医学影像,主要是通过深度学习,实现机器对医学影像的分析判断,是协助医生完成诊断、治疗工作的一种辅助工具,帮助医生更快地获取影像信息,进行定性定量分析,提升医生看图/读图的效率,协助发现隐藏病灶。人工智能通过影像分类、目标检测、图像分割、图像检索等方式,完成病灶识别与标注、三维重建、靶区自动勾画与自适应放疗等功能,应用在疾病的筛查、诊断和治疗阶段。图2-1 主要医学影像种类

当前,医学影像辅助诊断被认为是人工智能最重要的潜在创新应用之一,主要原因在于:

首先,医学影像医生缺口大。以我国为例,医学影像数据年增长率约为30%,而放射科医师数量年增长率仅为4%,影像科医师数量增长远不及影像数据增长,且医师从业需要较长时间的培训和学习,这意味着影像科医师在未来处理影像数据的压力会越来越大,难以承担巨大的负荷。同时,随着分级诊疗政策的推进和基层医疗需求的释放,医学影像数据会更快增长,随之带来的放疗科/病理科医生缺乏的问题将更加严峻。

其次,医学影像诊断误诊率高、效率低。医学影像数据基本全部需要专业人员人工分析,而人工分析的缺点也显而易见:一是大量的脑力劳动和长时间的工作,容易视力疲劳及人为产生视觉误差;二是海量影像信息容易漏诊;三是全凭医生经验去鉴定,缺乏量化的标准,误诊率高,极容易出现不同医生判读结果不一致的情况。据统计,美国每年的误诊人数达到了 1200 万,中国每年误诊人数高达 5700 万。根据中华医学会的一份误诊数据资料显示,中国临床医疗总误诊率为 27.8%,其中恶性肿瘤平均误诊率为 40%,器官异位误诊率为 60%,肝结核、胃结核等肺外结核的平均误诊率也在 40%以上,这些误诊主要发生在基层医疗机构。

最后,医学影像信息化程度偏低。据中国医院协会信息管理专业委员会出据的数据显示,2015 年我国医院PACS系统(医学影像存档与通信系统)建设水平 50%~60%,同时由于我国信息化建设较晚,医学影像数据共享度仍较低。

综上所述,人工智能技术发展加快了医学影像诊断速度,提升了影像诊断的精准度,并给影像科医生的“阅片”方式带来改变,其主要表现在:(1)阅片方式改变。人工智能应用直接实现机器自动对片子进行初筛、判断、病灶勾选等,医生只需要最后负责判断即可。(2)阅片速度改变。人工智能自动快速初筛,并勾选病灶,医生只负责关键部位的复判,为医生节省大量烦琐的初筛过程。时间大为缩短,效率提高。(3)精准度改变。人工智能具备稳定性和全面性双面特点,不受工作时间长短影响,且能够做到片子全域完整观察无遗漏,快速稳定地完成初筛、判断,最后由专业医生对关键部位进行复判。因此,阅片的精准度得到双重保障。2.1.2 主要应用场景

目前人工智能在医学影像领域的应用方向主要有两类,即图像病例分类、目标或病灶检测分割。(1)图像病例分类

病例分类主要是对一套典型多张图片进行分析,从而得出相应的病例的分类结果。在这一类问题中,通常存在着相应任务的病例图像数据量较少的问题,这也导致处理该类问题时通常会采用计算机视觉中的迁移学习算法。迁移学习算法大多会使用经过自然图像预训练好的网络模型,通常有把预训练模型作为特征提取器和在预训练模型中对医学图像数据进行微调两种用法。这两种用法都非常有效并且得到了广泛的应用,然而在部分分类问题上,存在着模型难以收敛、准确率不高的情况,甚至精度都无法超越古典的人工分析算法。其根本原因还是由于数据量不够充分,在迁移学习算法过程中出现过拟合现象。但是随着不同深度学习网络算法迭代更新,尤其是美国InceptionV3网络架构的出现,使得皮肤癌分类检测问题取得了超越人类专家的成绩。模型难以收敛、准确率不高等弊端逐渐得到了解决。

新一代人工智能技术在早期萌发阶段就已经被应用到了医学图像的病例分类中。早在2013年日本学者就发表了关于DBNs网络和SAEs网络应用于脑部的核磁共振图像分类。在卷积神经网络(CNNs)普遍应用于计算机视觉之后,图像分类问题的标配便成了卷积神经网络及其各类变种。在2015年至2017年间47篇关于医疗图像病例的文章中,有36篇是采用卷积神经网络模型、5篇是采用AEs模型、6篇采用RBMs模型,这些文章应用的医学图像领域非常广,从脑部核磁共振MRI到肺部CT扫描都有应用。总而言之,卷积神经网络是医疗图像中一个标准的模型算法,尤其是预训练模型迁移学习算法的技巧已经展示出了其强大的能力。(2)目标或病灶检测分割

目标或病变分类与上述的图像、病例分类不同,其更加注重于图像的某一部分或细小的组织、病变等局部区别的分类,例如常见的肺结节检测与分类。对于很多任务来说,局部病变区域与全局的概念信息对这类分类结果起着非常重要的作用。很多学者采用了新型的多信息新融合架构进行网络拓扑(例如残差网络结构),以及不同尺度的信息结合,有针对性地对医疗图像做模型输入以及运算调整。

在医疗图像中,各类扫描图像、物理成像图像数据通常是以数据流的形式存在的,比如MRI大脑图像实际上是核磁共振多层扫描结果的图像,由50到70张不等的大脑横向切面图像从上到下表示大脑每一层的信息情况。这种类型图像信息在人工智能爆发之前通常是2D平面图像。对其一张一张地进行分析计算,不论是计算机还是人工,都无法直观地分析3D立体图像信息;而在深度学习算法中,起先是以分析视频流的方式,采用CNNs+RNNs模型算法进行分类。在2015年美国多名学者采用3D-CNNs网络对肺结节进行分类,并且单独选取候选结节,通过全连接层获得最终分类结果。同样在2016年3D-CNNs网络在脑部MRI图像中取得了较高的准确率。

基本上大多数的医学图像,都采用端对端的CNNs网络,但也存在一部分案例中,多次使用诸如RBMs、SAEs、CSAE等无监督网络模型的情况。另一个很有意思的进展是,由于很多图像目标的标记中,数据标记非常昂贵,因此多实例学习(MIL)的思想成了很多处理医学图像学者的常用手段之一。目前利用深度学习分类+检测算法的应用主要有以下几个方面。

早期肺癌筛查:肺癌是我国发病率和死亡率最高的恶性肿瘤,早期诊断和早期治疗能让患者的五年生存率提高到80%以上。基本步骤为,使用图像分割算法对肺部扫描序列进行处理,生成肺部区域图,然后根据肺部区域图生成肺部图像。利用肺部分割生成的肺部区域图像,加上结节标注信息生成结节区域图像,训练基于卷积神经网络的肺结节分割器,对图像做肺结节分割,得到疑似肺结节区域。找到疑似肺结节后,使用 3D 卷积神经网络对肺结节进行分类,得到真正肺结节的位置和置信度。目前腾讯觅影、图玛深维、依图科技、推想科技、阿里健康、汇医慧影等公司已经在临床上取得应用。

乳腺癌早期筛查:我国乳腺癌发病率、死亡率位居女性五大恶性肿瘤之首,且呈年轻化趋势。乳腺癌早期筛查可对乳腺癌进行早诊断早治疗,提高患者的生存周期。钼靶检查是乳腺癌早期筛查最有效的手段之一。目前人工智能对钼靶图像进行乳腺钙化检测、肿块检测和良恶性鉴别等功能提供辅助诊断工具。腾讯觅影该产品已经进入临床预试验。

靶区勾画:放射治疗、手术、化疗是目前肿瘤治疗的三大主要手段。利用医学图像引导,放疗病人不需要开刀,住院时间短,恢复快。在放疗前,每个病人需要拍摄医学影像(CT、MRI等)几十甚至上百张,放疗医生凭借经验勾画每个患者的放疗靶区需要半小时至几个小时,耗时耗力,导致治疗病人有限,勾画的精确度不理想。受医生经验、情绪、耐心等因素的影响,不同医生勾画同一个病人的医学影像靶区会产生不同的勾画效果。靶区勾画与治疗方案设计具有一定的技术含量并需要医生的经验,但是其中包含了大量的重复工作,这些劳动密集型的工作是人工智能的专长,利用人工智能做这些事情将节约肿瘤医生大量的时间。将人工智能技术应用在放疗领域,是很多人工智能+医疗公司的一大主要研发方向。目前,连心医疗、医诺科技、全域医疗、普润医疗、慧软科技等公司都在开发相关的产品。2.2 关键技术2.2.1 技术发展现状

医学影像识别可以分为影像链与临床应用链两部分,而人工智能应用具体而言就是用人工智能去解决影像链与临床应用链的问题。其中,影像链是指影像医学的技术支撑,包括图像采集与图像后处理、数据挖掘;临床应用链是指影像信息在临床的应用,包括了疾病筛查与早期诊断、预测、治疗、疗效评估与监测。(1)学术研究现状

影像组学、深度学习、迁移学习等人工智能算法已经在医学影像数据上进行了开发和测试,形成了病灶检出、病灶分割、病灶性质判断、治疗规划、预后预测等多种应用模式。2017年RSNA学术交流中使用机器学习进行影像诊断的研究几乎涵盖所有影像诊断亚专业,近年来已有不少类似的文献报道,如乳腺疾病、肺部疾病、神经系统疾病、骨关节系统疾病、心血管系统疾病、消化道病变和体部疾病等。近年来,多个国家的放射学会对人工智能医学影像的发展给予充分关注与支持,其中美国放射学院成立专门为 AI 服务的数据科学研究所;加拿大放射医师协会发布医学影像 AI 白皮书;我国放射学界也成立相关的 AI 医学影像工作小组和联盟。(2)产品开发现状

国内外已有许多大型企业及初创公司投入到AI 医学影像产品开发。国内,腾讯觅影利用腾讯优图在大数据运算、图像识别与深度学习方面的先进技术,提高对于肺结节的检测敏感性与准确度:根据测算,其对早期肺癌的敏感度(识别正确率)达到85%以上,对良性肺结节的特异性(识别正确率)超过84%,对于直径大于3mm小于10mm的微小结节检出率超过95%,可帮助放射医生大幅提升肺部CT的早癌筛查能力;据美国FDA官网显示,2017年1月10日其首次批准了一款心脏核磁共振影像AI分析的软件Cardio DL,这款软件将深入学习用于医学图像分析,并为传统的心脏MRI扫描影像数据提供自动心室分割的分析,这一步骤与传统上放射科医生需要手动完成的结果一样精准。深睿医疗针对多模态多病种影像分析推出了 Dr.Wise AI 辅助诊断平台和 AI 智能问诊平台;国内还有许多公司正致力于将人工智能与医学影像结合来服务于影像识别与诊断。如健培科技、医渡云、智影医疗、睿佳医影RayPlus、迪英加、拉克森等。国际上,Google与Verily公司开发用来诊断乳腺癌的病理人工智能,在与病理学家基于灵敏性和假阳性和乳腺癌病例的分析竞争中,人工智能的准确度达到88.5%,而顶级病理学家的准确率为73.3%;IBM Watson与MSKCC(纪念斯隆-凯特琳癌症中心)合作,推出肿瘤解决方案Watson for Oncology。2014年和2015年,Watson for Oncology先后进驻泰国康民医院和印度第三大医院系统 Manipal Hospitals。2016年8月,IBM与我国21家医院签署Watson for Oncology的合作意向协议,并于同年12月成立联合会诊中心。(3)临床应用现状

虽然当前我们开发的产品不断涌现,但由于人工智能效能的临床验证尚不充分,适合人工智能研究标准数据库和场景的缺乏以及临床的伦理和法规问题尚待解决,导致真正临床实践规范应用的产品较为缺乏。国内较多临床单位开展了 AI 医学影像学术规模研究以及初期产品的小规模验证应用。国际上,美国 FDA 自 2017 年成立了AI与数字医疗审评部,致力于认证一些产品,如 Viz.Ai的脑梗塞早期诊断产品、Imagen 骨折检测产品等。

医学影像诊断系统构建的核心技术包括模型设计、模型构建、算法选择、服务建立四个环节。2.2.2 模型设计

临床问题的选择,即 AI 模型设计至关重要。第一,该模型解决的问题必须是临床医师及影像医师普遍关切的,其解决效率或准确性的提升是可以使得患者普遍受益的。第二,模型设计需要参考相关领域最新的临床指南规范,并在现有医疗流程上对疾病诊断治疗做出贡献。第三,必须使用足够量的数据及数据标注来进行学习,如应把学习的重点放在常见肿瘤的鉴别,而非罕见肿瘤的诊断上。因此模型设计的关键在于选择最有利于医师决策和患者受益的问题,并且所选择解决的问题还必须有大量易于获取和标注的学习数据。2.2.3 模型构建

模型的建立包括学习数据的结构化构建,使用学习算法建立模型,最后进行模型的验证。高质量的结构化数据是学习任务的基础。第一,数据的收集。影像数据采集设备机型繁多、参数各异、质控不同,这些都将影响 AI 的最终应用,故影像数据采集时应首先规划 AI 模型对数据参数及质量的要求,如肺结节检出使用薄层高分辨 CT 而不是厚层数据。在AI 具有应用潜力的基础上,尽可能覆盖不同厂家、参数、图像质量及疾病种类。第二,数据标注。数据的学习标签标注应直接面向需学习的目标问题,如肺结节检出任务标注结节坐标轮廓,良恶性鉴别任务标注结节病理类型。在标注任务中尽量使用“金标准”标签,如病理、基因型、生存期等;采用影像科医师的量化知识,如病变位置、范围、良恶性评分等。数据集的质量控制非常重要,提高数据集的标注准确性可有效提高模型的准确性和鲁棒性。所以高质量结构化数据构建的关键点在于影像数据采集的质量和广泛代表性,以及数据标注的准确性。2.2.4 算法选择

不同于传统计算机辅助诊断使用的机器视觉算法和机器学习算法,新一代AI 算法可应用更大样本数据量突破准确率的瓶颈限制,使得模型可以在临床真正高效使用。不同建模方式的选择应根据学习数据的数据量和复杂度来规划,包括:第一,针对大量学习数据,推荐使用包括各种神经网络的深度学习作为学习器建模;第二,针对中等量学习数据可以尝试使用深度学习建模,效果不佳时可以考虑采用神经网络提取特征,使用机器学习方法建立模型的折中方式;第三,针对少量学习数据,推荐使用影像组学方法先进行高通量检验,提取病变范围内的影像特征,使用机器学习方法建立模型;第四,虽然只具有中等量学习数据,但有大量面对其他问题的相似模态数据,可以尝试使用迁移学习方式,将大样本数据经验应用到小样本数据学习中。无论使用哪一种模型建立算法,对模型准确性、鲁棒性、泛化性的验证均必不可少。在训练数据集内可使用交叉验证法验证模型的稳定性;此外还需要独立的数据集验证模型的鲁棒性和泛化性,最后在临床使用中的证据将为模型在真实世界中的表现提供评估。

所以 AI 算法选择和模型建立的关键点在于面向数据和问题的算法选择和模型验证。斯坦福大学提出的 CheXNet 深度卷积神经网络模型,在利用胸部 X 线片对肺炎患者的患病情况进行判断的基础上,考虑了模型的可解释性。该模型利用 Dense Net 深度神经网络模型对图像特征进行分析,不仅在利用胸部 X 线片作为诊断依据的情况下,精度超过人类医生的平均水平,还通过计算模型每个像素点上的各类图像特征的权值之和,衡量图像各位置在分类决策中的重要性,解释决策过程,帮助人类医生对患者病情进行理解。卡耐基梅隆大学邢波教授近期提出一个多任务协同框架,通过引入协同注意力机制,来对异常区域进行准确定位和概括。不仅通过标签对图像内容进行描述,还利用层级长短期记忆(LSTM)模型生成长文本形式的医学影像分析报告,通过文字描述对分析结果进行描述和解释。2.2.5 服务建立

结合模型设计时的应用特点、临床需求和医师的工作习惯,建立合理的服务模式。第一,当前云影像技术发展迅猛,其与 AI 技术的结合可以更好地为医疗机构、特别是基层医院提供图像传输、储存、辅助诊断的一揽子解决方案,有利于提高医疗机构的运转效率及诊断准确性。第二,在与现有工作流程结合方面,可以与 RIS 系统结合提供 AI 结构化报告,同时与 PACS 系统结合将 AI 综合分析报告使用DICOM 格式提交给PACS 系统,并在医师浏览图像时进行病变标注提示。总体上,虽然一项 AI 医学影像具体技术的优劣取决于多个环节,但当前阶段应关注的主要问题体现在AI 技术产品的应用对象设置、服务模式以及准确性方面。良好的检查敏感性及诊断准确性是服务建立的基础。为达到此目的,除了优秀的图像分割、识别算法以及 AI 分类算法外,更应重视构建包括数据库和知识库的高质量结构化数据集。此外,还要注重具有临床诊断应用价值且符合临床规范的 AI 技术的目的设置、符合临床医师应用习惯。2.3 业务模式2.3.1 产业发展模式

医学影像产业主要分为两个部分,上游是医学影像设备,最终服务对象是医院及影像科医生,以机器或系统的销售收入作为统计口径,壁垒是包括研发积累、精密制造水平及配套服务。下游为医学影像诊断服务,最终服务对象是患者,以诊断服务收入作为统计口径,在影像设备产出图像的基础上附加医生的劳动成本,诊断服务环节最

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载