工业人工智能(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-24 06:19:26

点击下载

作者:李杰

出版社:上海交通大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

工业人工智能

工业人工智能试读:

前言

过去的十多年,从互联网+、大数据、工业大数据、人工智能、区块链,到工业互联网和工业人工智能,每一两年都会出现一个新名词或新概念,但是这些概念代表什么,具体应该怎么应用却不是很清晰。人工智能在美国经历了超过60年的发展,在某些领域应用得很成功,在某些领域却有相当大的困难。因此我很希望看到人工智能扎实地在工业系统展示出它的能力,加强工业基础,并帮助工业系统成长。我本人在美国近40年从事智能制造以及工业大数据的产学研工作,深深地体会到企业从精益到智能制造的转型过程中,人才、技术管理和执行上的挑战。我写这本书的动机是希望大家可以真正了解什么是工业人工智能以及如何使用工业人工智能。

我于2000年建立了NSF智能维护系统中心IMS,一直从事在工业大数据PHM预测性维护的研究和推广,在这项工作中,我们把人工智能和机器学习当成基础科学和工具来赋能企业,因此也成功地吸引了全球100多家企业,包括宝洁、丰田、通用电气(GE)等,并取得显著的成效。在2018年,我们在美国成立了工业人工智能中心,希望以工业为出发点,运用人工智能形成可以快速验证与可传承的智能工业系统。

人工智能是一门认知科学,主要包括了六大领域:自然语言处理,计算机视觉,认知与推理,博弈与伦理,机器学习和机器人学,可以应用在社交、医疗、商业等众多领域。但是在工业应用中往往发现的问题是,两个工程师用不同的人工智能算法可以有两个不同的答案,这在工业领域里很难被接受,因为在工业领域中需要的是系统性、快速性以及可传承性这三个特点。不同于人工智能,工业人工智能是一个系统工程,更强调如何建立从数据技术(DT)到分析技术(AT)到平台技术(PT)以及有效运营技术(OT)的结合,目的是为了使两个工程师解决问题的答案一致。传统的人工智能专家具有很强的算法能力,但是在缺乏专业知识的情况下很难解决工业系统问题,即使解决了也是个例,很难持续重复。工业人工智能的最大挑战是将以个人为中心的算法思维,转化为系统工程。这是一个去中心化的过程,让每位行业专家的智慧可以通过系统的方法得以传承。

为了让读者更加了解工业人工智能对工业发展的价值,我们分为四个章节阐述:主要为我们为什么需要工业人工智能,工业人工智能的定义与意义,工业人工智能的杀手级应用与赋能系统案例,如何建立工业人工智能的技术与能力。其中,我们把过去在美国工业大数据挑战中所参与的实际案例列出来,让大家可以通过这些案例了解如何用算法去解决工业系统问题,更重要的是读者可以重新找到这些数据,将自己的算法进行验证,也可以把个人的经验分享给其他读者。

为了配合本书的发布,我们会建立一个有关工业人工智能的公众号,每一位读者可以反馈他的经验供大家分享,同时也在这个公众号里给我们提出建议和可以改进的地方。我们希望可以在大家共同的努力下将工业人工智能推广到更广的层面。工业人工智能是由我首先提出的,我衷心希望这个理念、这个新的领域能够系统式地推广,让智能工业能够永续发展。李杰(Jay Lee)2019年4月引言 人工智能的技术发展与应用现状

2017年可称为人工智能(AI)元年,在此之后仿佛一切都在加速,人工智能领域的突破层出不穷,比如根据医学影像诊断疾病、自动驾驶的汽车、刷脸支付和无人超市等。人工智能技术“横冲直撞”,闯入甚至颠覆了许多商业领域,也成为企业的新“军备竞赛”场地。2017年在人工智能领域的并购和投资就高达220亿美元,是2015年人机大战发生前的26倍。谷歌的CEO皮查伊将AI对于人类的影响放在了高于火和电的位置上:前者标志着人类文明的起源,而后者将人类带入了工业时代。麦肯锡全球研究院则给出了一个更具体的价值:将人工智能仅仅运用在营销、供应链管理和新销售方式的利润和效率提升上,就能够在未来20年创造2.7万亿美元的经济价值。

人工智能发展所取得的举世瞩目成就并非一蹴而就,它的应用其实早已开始改变我们的工作和生活方式。1988年我在美国邮政工作时,主导了第一个使用机器视觉和手写辨识技术来自动分拣包裹的项目,并登上了《AI Magazine》的封面。再往前追溯5年,我也曾经在汽车生产线上开发机器人,探究如何使用传感技术让机械臂的定位和动作执行更加精确。那个年代的人工智能还只能完成在一定范围内规定好的任务,受工作条件、对象和环境的限制非常多,并不像现在这样能够完成更复杂的任务,并且可以通过泛化学习和认知能力管理很多不确定性。人工智能技术在近几年爆发式的发展主要得益于许多基础设施技术的不断完善,比如大型的运算中心为我们提供了更强的计算能力,传感器变得更加多样和廉价,信息通信技术(ICT)技术的发展为数据的流通提供了更高速的管道,互联网中每分钟数以亿计的活动产生的大量数据为算法的训练提供了丰富的样本,而更加强大的芯片使得这些智能算法可以在任何边缘硬件中实时处理和分析数据,再通过丰富的交互入口传递信息,从而完成各种活动。这些基础设施的不断完善正在使AI的使用成本大幅下降,就好像电力基础设施的完善使得现在的照明成本比两百年前降低了数百倍,这使得人工智能能够以更加低的门槛被更广泛的场景所接纳。

事实上,人工智能对人们生活方式和生产方式的影响已经超过了我们的想象。在生活中,无处不在的摄像头记录着我们的一举一动,当我们进入一家商店时,素未谋面的售货员就可以通过人脸识别迅速获得我们的各类信息,进而有针对性地推荐我们可能感兴趣的商品。在工作场所,亚马逊(Amazon)的一款可穿戴式传感器可以追踪仓库工人的手部动作,识别他们的工作效率并通过振动提醒那些潜在的偷懒者。在中国的某半导体制造工厂内,管理者可以通过员工的工牌定位到他们的移动路径,并自动识别那些有异常活动的员工,对于保密性要求极高的半导体生产商而言,这无疑是防止技术泄露的重要保障。美国职场目前最受雇主青睐的“即时通信和协同工具(Slack)”可以帮助管理者评估员工的效率和与团队互动的有效性,这个软件的全称就很能很形象地体现它的作用——“所有对话和知识的可搜索日志”(searchable log of all conversation and knowledge),对这些工作过程中所产生的数据进行分析,就可以判断哪些员工的效率更高,而哪些员工可能有离职的倾向。

在商业活动中,人工智能帮助商家更加了解他们的客户,进而做出更加准确的营销决策。中国平安采用人脸识别技术,让用户在申请贷款时在视频中回答有关收入和还款计划的问题,通过监测其面部的微表情判断他们是否在说真话,以此筛选出需要进一步审核的客户。中国平安之所以有底气这么做,是因为他们掌握了世界顶尖的人脸识别技术——截至2018年5月9日,户外脸部检测数据库(labeled faces in the wild,LFW)最新公布的测试结果显示,中国平安旗下平安科技的人脸识别技术以99.8%的识别精度和最低的波动幅度领先国内外知名公司,位居世界第一。英国领先的网购公司Ocado将每天收到的超过1万封客户邮件,利用人工智能技术进行情绪分析,之后对应答的优先级进行排序,并进一步将客户所投诉的问题进行自动分类,然后分发给具有相关领域知识的服务人员。著名的赌场集团恺撒娱乐(Caesars)通过在酒店内提供虚拟礼宾员Ivy来自动回答客户的询问,将打给人工服务台的电话减少了30%。美国的一家创业公司为保险公司的电话客服提供情绪引导服务,通过识别客户的语速、语调和用词特征来识别客服的情绪是否恰当,并提醒他们在适当的时候表现出更多的同情心。法国家居装饰零售商乐华梅兰(Leroy Merlin)通过分析历史销售数据与各种影响因素(如天气)之间的关系,为订货策略和供应链管理提供建议,帮助节省了8%的库存,同时增长了2%的销售额。将人工智能与大数据分析技术应用到需求预测和库存改善可以释放存储空间和改善企业的现金流,这对于利润率已经被挤压到生存边界的零售商而言无疑是一个福音。对零售业而言,供应链成本降低的3%可能使净利润翻倍。IHL Group的数据显示,2015年全球零售业因为库存积压而造成的损失高达4 700亿美元,而库存不足或周转造成的损失达6 300亿美元。人工智能在供应链优化方面的应用或许也是一个万亿级的市场。

人工智能的发展历程中也曾经历过数次起伏,从1956年达特茅斯会议后直到2000年,人工智能曾经历过两次寒冬。第一次寒冬开始于1973年,以《莱特希尔报告》的推出为代表,由于在人工智能方向的研究投入没有取得预期的进展和回报,美国政府决定大幅削减支持人工智能领域研究的资金,象征着人工智能正式进入寒冬。之后的十年间,人工智能鲜有提起。进入20世纪80年代,由于专家系统和贝叶斯定理在人工智能领域中崭露头角,人工智能再次迎来新的高潮,然而随后人们开始意识到人工智能的问题不仅是硬件问题,而更是软件以及算法层面的挑战没有突破。随着1987年基于通用计算的Lisp机器在商业应用上的失败,人工智能再次进入了低迷期。到了20世纪90年代后期,由于计算机运算能力的不断提高,人工智能开始再次进入大家的视野,代表性事件包括IBM深蓝计算机击败人类国际象棋冠军,以及以数据挖掘和推荐系统为主要代表的商务智能应用开始真正为企业创造价值。而这一次的人工智能高潮来临相当一部分应该归功于深度学习神经网络的突破性进展和成功应用。2012年,Geoffrey Hinton团队在ImageNet竞赛上首次使用深度学习技术,从而完胜其他团队,让人们意识到深度学习相比于传统机器学习的长处,让深度学习重新回到主流技术舞台。与此同时,以图形计算为代表的GPU在计算机视觉训练中替代原来的CPU,大大提升了计算性能,让原来需要几个月才能完成的训练缩短到几天甚至几个小时,加快了计算机视觉前期训练和推理的迭代周期,带来效率上的成倍提升。当硬件、算法、大数据这三个因素在各个领域的突破达到一定程度时,自然就带来了人工智能的大爆发。2016年3月,谷歌AlphoGo机器人以4:1击败韩国围棋冠军李世石就是三者结合的典型代表,让人工智能不再是高高在上和遥不可及,从此进入大众的视野。

与过去两次人工智能所经历的高潮不同,这次我们看到人工智能技术已广泛应用于智慧安防、智慧金融、智慧零售等新的行业形态,并为人们的生活带来很大的便利。最重要的是,人工智能在某一些领域中已经验证了其商业价值可行性,形成了标准化和可大规模应用的产品,甚至已经开始盈利。这与过去两次人工智能技术所经历的起伏有本质上的不同。我们有理由相信,新一轮人工智能正处于增长的黄金年代,以深度学习为代表的高级算法在行业的应用趋于成熟,为解决工业问题提供了很好的工具。

人工智能从以学术为驱动转变为以商业应用为驱动的发展模式,既能为进一步解决城市和社会问题、生态保护、经济财政、金融风险等宏观系统提供指导,也能为工业制造、能源电力、健康医疗和交通运营等微观领域提供解决方案。新一代人工智能技术在近几年取得快速发展和应用主要受益于以下4个要素:(1)人机物互联使数据量呈现爆炸性增长,形成了真正的大数据环境。(2)云计算、边缘计算和专有芯片技术加速演进实现计算能力大幅提升。(3)深度学习领域的技术突破带动算法模型的持续优化。(4)资本与技术深度耦合助推行业应用和技术产业化快速兴起。

在数据、运算能力、算法模型、多元应用的共同驱动下,人工智能的应用范围逐渐从执行特定工作的“狭义”人工智能,向胜任某一场景下开放性问题(如人机对话)的“广义”人工智能演进。人工智能技术能更为密切地融入人类生产生活,与人的关系从辅助性工具进化为协同互动的助手和伙伴。在这一轮技术热潮中,我们能够观察到人工智能技术的演进方式,包括:①从CPU架构的独立运算到GPU架构的并行运算,再到基于TPU的面向特定算法进行优化运算架构的出现;②从依赖算法突破的驱动转变为数据、运算力、算法、商业化应用场景复合驱动;③从封闭的单机系统转变为快捷灵活的开源框架(以往的专家系统基于本地化专业知识进行设计开发,以知识库和推理机为中心而展开,其中,推理机的设计由不同的专家系统应用环境决定,单独设定模型函数与运算机制,一般不具备通用性;知识库是开发者手动录入的专家分析模型与案例的资源合集,只能够在单机系统环境下使用并且无法连接网络);④从学术研究探索导向转变为快速迭代的商业化应用导向。

我们很欣喜地看到人工智能技术正在实现“场景—数据—技术—产品—商业”的正向循环。在人工智能技术发展的早期,由于数据获取的成本较高,算法缺少快速演进的环境。而一旦进入应用期,大量的优质样本数据和更快速的反馈有助于技术弊端分析,通过对相关技术进行改进升级,进而提升了产品的应用水平;而用户在得到更好的产品体验后,继续为应用平台创造更大规模的后台数据,用来进行下一步的技术升级与产品改良,由此进入大规模应用阶段。如今的我们究竟是站在变革的序曲还是高潮中,很难有清晰的判断,不过有一点是明确的——人工智能已经在切实改变着我们的生活,而与此同时也面临许多无法忽视的挑战。我们看到如今人工智能在社交、行为、活动、商业等领域的应用已经产生了直观的影响和切实的价值,这些应用为人工智能在工业领域的落地所建立的基础,正在成为未来实现工业人工智能的潜力。当前工业处于向工业4.0阶段的转型期,以价值创造为目标和驱动力,为人工智能的发展与行业应用提供了合适的土壤。智能制造和工业互联网技术的发展让我们看到了工业系统的“本地的智能化”和“连接的智能化”方向齐头并进的趋势,向着横向与纵向智能化应用体系的整合演进。一方面,我们看到设备的智能化、传感技术、通信技术、信息与控制技术等方面的快速发展正在为工业系统提供大数据环境和强大计算能力的基础;另一方面,工业互联网的发展正在推动设备、人与服务的连接,产生更多具有商业价值的新场景。这些要素的逐渐成熟让我们有理由期待工业将成为人工智能技术发展和商业应用的新蓝海!第1章 我们为什么需要工业人工智能1.1 工业系统为人工智能带来的新视角

在人工智能技术(AI)的发展浪潮之下,世界各主要国家纷纷将发展人工智能上升至国家战略的高度。国务院印发的《新一代人工智能发展规划》明确了中国新一代人工智能发展的战略目标,到2020年,人工智能总体技术和应用要比肩世界先进水平,使人工智能产业成为新的经济增长点,为社会和产业的发展提供新的动能。2018年6月,中国第一本面向高中生的《人工智能基础(高中版)》教材发布,同时全国40多所学校引入该教材作为选修课或校本课程,成为首批“人工智能教育实验基地学校”,这是国内中等教育体系首次引入人工智能(AI)教材,人工智能教育在中国开始迈入基础教育阶段。除了面向初高中的AI教育外,机器学习和数据分析课程也成了职场中最热门的在职培训,许多人认为掌握AI技术就像互联网时代熟练使用电脑一样会成为必备技能。2018年11月,一则AI应届博士年薪80万元的新闻再次成为社会关注的焦点,除了引起人们的惊呼和羡慕外,也有一些质疑的声音,AI的应届博士生真的能够创造这么多的价值吗?这其中有多少泡沫的成分?硅谷的人才争夺战其实在2016年就已经拉开序幕了,刚毕业的深度学习方向的博士可以拿到50万美元以上年薪,有项目经验的博士可以拿到百万美元年薪,以谷歌(Google)、脸书(Facebook)和微软(Microsoft)为代表的科技巨头们都在用不合理的价格挖掘人才。我在2018年7月份与富士康科技集团郭台铭董事长到斯坦福大学演讲,来参会的有许多硅谷互联网公司的人工智能科学家,其中一位说他觉得很恐慌,因为每天所做的工作好像并没有那么大的价值,与他的收入明显不匹配,如果有一天泡沫破灭了他该怎么办?这使我意识到对AI人才泡沫的忧虑可能在世界各个国家都差不多,这背后的原因是人们对AI能够解决的问题和创造的价值充满期望,市场其实是在为期望买单,而不是为一个确切的价值买单。因此,人工智能技术在经历了较长时期的技术积累并在某些领域取得巨大商业价值后,面临的最大挑战是需要快速找到更多应用场景来满足市场和资本对它与日俱增的期望。

毋庸置疑的是,AI技术已经在许多领域解决了一些难题并开始创造商业价值,这些领域包括电子商务、金融科技、安防和移动支付等,有些领域甚至已经开始出现整合的趋势,未来会有新的巨头诞生;但是AI在工业系统中的应用还十分有限,人工智能科学家们可能会将原因归结于人工智能技术应用的基础条件还不成熟,数据、计算能力和算法这三个核心要素在工业系统中还不具备。我们接触过许多对工业场景感兴趣的人工智能公司,我发现他们都有一个共同的特点,就是会首先问我们有哪些数据,而不是问有哪些问题要解决。我想这是因为双方的视角不同,过去的人工智能应用更关注从数据的视角出发,寻找数据中隐藏的关系和应用机会;而工业更需要从问题出发,是以解决问题为导向的价值创造。

除了思考问题的视角不同以外,AI技术的应用目前还存在明显的限制和瓶颈,我们需要弄清楚AI技术能够胜任什么和还不能做什么,这样才能建立合理的期望,让AI技术去做它擅长的事情,同时对其他的基础和传统技术保持坚持和尊重的心态。

AI技术的第一个限制

AI技术无法帮助我们去突破现有的认知。我们更需要清醒认识的是,AI技术目前还不能帮助人们在基础知识方面取得突破,这些基础知识包括但不限于科学原理、工艺水平、设计与制造能力、系统工程、基础材料和试验验证。而这些基础知识才是决定工业能力的根基,因此我们可以期待AI技术能够在现有的基础上去优化效率、提升商业价值、通过建模分析预测和避免一些问题、降低人力等,但是无法期待AI技术能帮助我们去突破现有的认知。AI技术可以在现有工业系统的基础之上持续优化效率,但并不能帮助我们实现“弯道超车”,更不能取代基础研究的投入。人工智能与工业相结合,还需要探索更加明确的应用场景,设计体系化的技术架构,制定与工业系统相匹配的技术标准,明确与既有的运营流程相结合的实施方式。

AI技术的另一个限制是“机会性”,而非“确定性”

AI技术的另一个限制是更多面向解决问题的“机会性(possibility)”而非“确定性(deterministic)”,这也限制了AI的应用目前更多是以机会为导向,而非以问题为导向(problem solving)的思维方式,所以人工智能科学家(或数据科学家)在工厂会首先关心有哪些数据,而非要解决哪些问题。当工厂的管理者问他们能够给工厂带来什么价值的时候,他们更希望首先建立大数据环境和强大计算力的基础设施,然后再从数据中寻找创造价值的机会。AI技术在互联网和电子商务中以“机会性”为导向的应用确实带来了一些商业上的成功,比如基于对客户历史消费的行为分析,判断客户可能会对某一些产品感兴趣,短视频播放平台就会直接把主页面、分类和搜索等功能全部省掉,只推荐客户可能感兴趣的视频,如果不感兴趣就直接播放下一条;交友网站推荐可能感兴趣的人,喜欢的向左滑,不喜欢的向右滑;Facebook和Google分析人群的偏好,以便更加精准地投放广告。这一些应用都是以机会为导向的,追求的是快速反应和对情绪的影响,准确度和确定性并不重要,重要的是不要错过任何可以产生商业价值的机会。人工智能应用的最大挑战并不在于技术,而是在于如何产生应用的价值,过去更加关注社会问题、商业问题和社交问题,这些都是处在比较发散和机会导向的视角。如果把技术当作工具来看待,更加重要的是如何利用工具。就像现在很多人都会用Excel,但是未必懂得如何做财务统计,也未必会分析股票行情,更不见得会企业的经营管理。AI算法就如同Excel一样,虽可以掌握算法并不代表能够解决问题。现在的AI教育大多是在教理论和工具,却并没有教会如何解决问题。

工业场景中问题域是有限的,问题是可以收敛的,比如在一个工厂中不可能会存在几万种质量问题,这时可用AI进行质量问题的识别和预测,当把某个质量问题的核心解决掉时就能够带来突破。现在对人工智能初创企业的投资失败案例中,有40%是找不到可以应用的场景,有30%是因为资金问题,有20%是因为创始团队分歧,而只有10%是因为能力和技术不足。因此,成功与否的最关键因素是能不能找到合适的应用场景;在判断一家公司的技术是否有价值的时候,更倾向从他们要解决的问题中判断是否存在过去没有被解决的问题,要解决的痛点到底有多痛。比如有公司开发用AI技术在烘焙坊的收银台实现自动结算和收款功能,可是给面包结算和收款并不是急需解决的问题,食品安全、食物口味和食品营养才是更需优化的问题。许多AI技术目前还在关注的都是显性的问题,或者说是已经解决的问题,只是用AI技术去替代原有的解决途径。

我们也发现AI技术的应用场景在国内部分企业中存在一些误导,甚至一些应用从美国借鉴过来后发生了偏差。比如亚马逊公司(Amazon)推出了“Just Walkout超市”,提出的理念是无感支付,而到了中国就被曲解成了无人超市,认为这项应用的价值在于“无人”。试想,如果无人了,那么顾客在超市中打破东西该谁来清理?难道售货员的服务不是有价值的吗?无人之后带来数以百万计的就业流失该怎么办?无人超市虽然看起来很酷炫,但是否符合基本的逻辑和社会价值?还是说这个概念更多是一种噱头?

工业场景的应用目标最明确,场景也最多。提质、增效、降本、减存是普遍存在的需求,如电动车电池效率不稳和人员驾驶行为的分析;风电的发电效能如何优化;我国高铁虽然运营公里数为全球最长,但轴承还需要进口的问题亟待解决;中国大陆还无法生产10 nm以下的半导体产品,而中国台湾和韩国已经在努力生产7 nm以下的产品。有这么多的需求和机会,为什么不换一个视角将AI技术应用于工业呢?

总结而言,工业场景为AI技术提供的新机会和新视角包括:(1)工业为AI技术提供了新的价值视角,从过去以机会为导向的发散型应用,转变为以问题为导向的收敛型应用。(2)AI技术的应用需要更多聚焦在解决过去还没有解决的问题上,而不是创造新的需求或者换种途径解决已知的问题。(3)工业场景中的问题更加具象,有更加明确的价值标准,解决工业场景中的问题将为AI技术提供一片新的应用蓝海。1.2 什么是工业的基础问题

工业系统中需要解决许多确切的问题,比如设备健康、产品质量、系统效率(OEE)、工艺参数、综合成本等,需要有可被量化和确切的价值回报,而不会只为一种可能性买单,这也是AI技术和大数据落地于工业的最大挑战。与设备的升级和工艺方法的改进相比,甚至是与精益管理带来的组织文化和效率改善相比,AI技术还没有确切的价值主张,即便美国通用电气公司(GE)提出了“1%的力量”来宣扬工业互联网的价值,本质上也只是一种可能性,当实际的价值没有达到期望时,即便是GE公司也会跌落神坛。因此,AI技术不能以价值的“机会性”为出发点,更应该关注解决问题的“确定性”。

工业人工智能给中国制造带来的机会

中国制造需完成一场品质革命,如果对品质革命进行更深入地分解,我们认为品质革命应该要解决三方面的问题,分别是制造的素质、体质和本质问题,如图1-1所示。素质问题涉及人的能力、组织文化和管理能力。这方面全球做得最好的是日本,他们靠的是工匠,传承方式是组织文化。体质问题涉及设备、系统和流程,也就是德国一直保持的优势领域,靠的是器匠,传承方式是工艺标准和装备的设计制造能力。本质问题涉及创造客户价值,这是美国企业最看重的地方,靠的是技匠,传承方式是以技术授权为基础的协同创新、使用场景中的数据和连续的服务创新。工业人工智能给中国制造带来的机会,应该在于迅速提升制造的素质、体质和本质。例如通过数据标准化人的工作流程,用数据建立更好的参考性和关系性,使人的经验能够迅速积累和传承;利用数据使制造系统中隐性的问题显性化,使设备的健康状态透明化管理、过程参数更加稳定以及综合效率更加协同和优化;以数据为媒介提升用户使用端的价值,帮助用户提升产品(或装备)的功能性和可靠性,优化用户的使用成本,提升用户的运营效率,在产品的全生命周期中创造新的服务模式,提升企业的可持续盈利能力。这些才是中国制造需要AI技术解决的问题。图1-1 制造品质的三个维度与内涵

AI技术在工业系统中的落地需要满足五个原则(principles),我们称之为5S原则:

Systematic(系统性):将各类相关技术进行整合的系统性架构,系统内与系统间的标准接口,以及将工业人工智能和工业系统相互融合的系统体系(system of system,SOS)。

Speed(敏捷性):迅速完成系统搭建、建模、验证和部署,解决碎片化问题和满足客制化需求的快速响应能力。

Sustainable(持续性):具备可重复达成的能力(repeatable success),不同开发者构建的模型和在同类对象的不同个体上的表现具备一致性(consistency)和管理不确定性的强韧性(resilience)。

Streamline(流程性):注重以解决问题为导向的收敛性流程和以保障结果确定性的过程管理,还要注重与现有工业系统流程的融合。

Standard(标准性):在现有工业系统的标准上,建立数据的标准、分析的标准、对分析结果认知的标准和反馈操作的标准。

因此,工业人工智能是一个系统工程,需要多个技术元素的整合,这些技术元素可囊括为“ABCDEF”6个方面:

Analytics(建模分析):既包括算法,也包括算法在特定场景和目标中的应用建模。

Big Data(大数据):与关注互联网大数据的“4V”特性不同,[1]工业大数据技术需要管理“3B”挑战,即Broken(数据完整性)、Bad Quality(数据质量差)和Background(数据场景性)。

Computational Platform(计算平台):既包括云计算(Cloud),也包括基于嵌入式智能的边缘计算和雾计算,需要整合“端”到“云”,“分布式”到“集中式”的灵活可重构的计算平台架构。

Domain Knowledge(领域知识):需要对应用对象的机理、工艺流程、系统工程和优化目标具备基本的知识和工程经验。

Evidence(事实依据):反映系统当前状态的依据,以及能够支持决策的洞察能力。

Feedback(反馈闭环):与控制系统或标准作业流程(SOP)的整合,实现决策到操作运营(OT)的闭环。

在以上六个技术要素中,“ABC”同时也是AI技术的三个要素(数据、计算能力和算法),但是与工业人工智能有所区别。在分析建模方面,前者以算法为核心,后者以场景和问题为核心;在数据技术方面,前者围绕解决“4V”挑战,后者则是管理“3B”特性;在计算平台方面,前者以云计算和集中式的运算能力为主,后者以“端”到“云”的融合架构为主。“DEF”则是带有鲜明的工业特质的技术要素,也是人工智能与工业系统相融合的接口。

人工智能技术对于工业系统而言,应该是融入和赋能的姿态,而非颠覆者。未来工业智能系统的目标,是创造无忧的工业环境,实现零意外、零污染、零浪费、零次品和零宕机。1.3 人工智能解决问题的基本方法

在开始探讨工业人工智能前,我们首先要对人工智能技术有一个大概清晰的认识,例如它是如何解决问题的,它认知世界的方式又是怎样的。

在图1-2中,人工智能思考问题的方式大概可以分为七个大类,包括检测(辨识)问题、聚类问题、分类问题、预测问题、规划问题、泛化学习问题以及具备常识和创作能力。前面的五大类问题是2006年以前经典机器学习的研究范畴,在深度学习技术开始兴起后,开始逐步出现具备后两者能力的应用,被认为是进入强人工智能的开端。人工智能所要解决的七类问题可以按照如图1-2所示的顺序进行排列,前一个问题的实现往往是后者的前提。例如,规划问题的可达性往往建立在良好的预测模型基础上,这样才能够在不断调整决策变量时预测目标方程,并逐渐收敛到最优目标。几乎所有解决规划问题(或优化问题)的算法,其最大的不同是向最优目标方程收敛的路径或搜索方式,其表现很大程度上取决于预测模型(或数学模型)的准确度。图1-2 人工智能的7大类问题

检测问题:基于先验知识和分析目标对数据进行处理和特征辨识的过程。检测问题也是对分析对象的抽象过程,即提取最关键有效的少量信息来代表全局。这与人类看世界的方式是一样的,我们的视力会有一个焦点,焦点所在的位置是信息采集效率最高的地方,而对它的判断往往也不需要全量信息,可能只是几个关键特征就可以完成判断。这是大脑经过数十万年进化后所认为的最高效处理信息的方式。又例如工业场景中的设备故障检测,当要判断轴承外圈是否发生故障时,需要将注意力放在提取轴承外圈故障特征频率的能量上,而其他的频谱成分就并不那么重要。而当要分析内圈故障时,看的又是另外的频率特征了。换句话说,完成检测问题需要有一个特定的对象和目的,以及定义这个对象和目的的先验知识。对这种知识的依赖是检测模型训练过程中绕不过去的坎,英文有句谚语叫作“You know what you know,you don't know what you don't know”,这个问题其实人类自己还没有解决。

聚类问题:在特定范围样本中使某个指标最优的归集方式。我们最常用的指标是距离和似然值,目的是使在同一个归集内的样本相似性最高,而不同归集内的样本之间的差异性最大。聚类问题是最典型的非监督式学习,或者说是一个比较开放性的问题,选择的变量不同、指标定义的不同、归集数量的不同,甚至是初始条件的不同都会影响聚类的结果。聚类也是大数据挖掘中最常用的工具,在许多的商业智能(business intelligence)的应用中,分析师利用各种维度的特征将客户进行归集,然后去寻找各个集合中共性的特征,进而制定更适合与更有针对性的商业策略。

分类问题:与聚类问题相反,如果已经对样本有了一个先入为主的归集(或称标签),那么去学习这种归集方式的最佳规则就是分类算法所要解决的问题。分类问题是典型的监督式学习,也是收敛性的聚类问题——在所有聚类方式中寻找对已知样本归集最友好的那个规则。

预测问题:建立一组显性变量到一组隐性变量的映射关系,或者说是利用可测量对象预测不可测量对象,以及利用对当前的观测预测未来状态的过程。当隐性变量是离散的状态时,预测问题约等于模式识别和分类问题;而当隐形变量是连续数字时,则预测问题可以当作拟合(regression)来看待。

规划问题:在一定的限制条件下通过调节决策变量使目标最优的过程。规划问题又分为数学建模和求解两个过程,数学建模包括对目标的量化定义,对限制条件的数学表达,以及从决策变量到目标的映射关系。也正因如此,可被预测是可以规划的前提,而预测的准确度是找到最优解的保障。求解过程可以理解成为一个搜索框架,即决策变量逐步收敛到最优目标的过程。

我们用一些现实中常见的人工智能场景来进一步理解这些问题的本质。首先是人脸辨识技术,其完成流程包括了如图1-3所示的人脸检测与校准、人脸特征提取、人脸聚类、人脸比对、人脸搜索等过程。图1-3 人脸检测、校准和特征提取的过程(1)人脸检测与校准:检测出图像中人脸所在的位置。人脸检测算法的输入是一张图片,输出是人脸框坐标序列(0个人脸框或1个人脸框或多个人脸框)。一般情况下,输出的人脸坐标框为一个正朝上的正方形,但也有一些人脸检测技术输出的是正朝上的矩形,或者是带旋转方向的矩形。常见的人脸检测算法基本是一个“扫描”加“判别”的过程,即算法在图像范围内扫描,再逐个判定候选区域是否为人脸的过程。因此人脸检测算法的计算速度会与图像尺寸和图像内容相关。开发过程中,我们可以通过设置“输入图像尺寸”“最小脸尺寸限制”或“人脸数量上限”的方式来加速算法。

检测出人脸所在的位置后,需要进一步地配准来定位出人脸上五官关键点坐标。人脸配准算法的输入是“一张人脸图片”加“人脸坐标框”,输出五官关键点的坐标序列。五官关键点的数量是预先设定好的一个固定数值,可以根据不同的语义来定义(常见的有5点、68点、90点等)。(2)人脸特征提取:将一张人脸图像转化为一串固定长度的数值的过程。这个数值串称为“人脸特征(face feature)”,具有表征这个人脸特点的能力。人脸特征提取过程的输入也是“一张人脸图”和“人脸五官关键点坐标”,输出是人脸相应的一个数值串(特征)。人脸特征提取算法会根据人脸五官关键点坐标将人脸对齐预定模式,然后计算特征。早前的人脸特征提取模型都较大,速度慢,仅适用于后台服务;但最新的一些研究,例如面向特定算法对运算架构进行改良的专有芯片,可以在基本保证算法效果的前提下,将模型大小和运算速度优化到移动端可用的状态。

人脸聚类(face cluster):将一个集合内的人脸根据身份进行分组的算法。人脸聚类也通过将集合内所有的人脸两两之间做特征比对,再根据这些相似度值进行分析,将属于同一个身份的人划分到一个组里。在没有进行人工身份标注前,只知道分到一个组的人脸是属于同一个身份,但不知道确切身份。

人脸识别(face recognition):从人脸数据库中搜索与输入的人脸特征相似的序列,并识别出输入人脸图对应身份的算法。它输入一个人脸特征,通过与注册在库中的N个身份对应的特征进行逐个比对,找出一个与输入特征相似度最高的特征。将这个最高相似度值和预设的阈值相比较,如果大于阈值,则返回该特征对应的身份,否则返回“不在库中”。

理解机器学习需要解决哪些问题,以及是如何解决这些问题的,对我们认知机器学习的能力边界,以及正确地去理解和定义所要解决的问题,并将其转变成为一个建模目标,有非常重要的意义。在工业人工智能的应用中,我们也面临许多十分相似的问题,许多的算法也因此是相通的。1.4 什么样的人工智能技术更适合工业

在人工智能的发展历史上,逐渐分成了数个研究流派或者分支学科,这些不同的流派在方法论、对任务的理解、对技术工具的使用,甚至是对智能的理解哲学上存在巨大的分歧。而每一个学派都希望自己能够在智能算法方面有所突破,验证各自的理论在解决所有问题上的通用性。在这些不同的技术流派中,哪一些会更加适用于解决工业系统中的问题?不同技术流派在解决这些问题中有哪些优势和瓶颈?在本节中我们提出一些开放性的探讨,也为技术的选型和各类算法的优化方向提供一些参考。

神经网络——最接近人类思考的方式,最具备解决复杂问题的潜力

许多仿生学派的学者们通过由进化论、神经科学、动物行为等得到的一系列启发创造了很多不可思议的算法。2000年4月,麻省理工学院的神经系统科学家团队在《自然》杂志上发布的一项实验成果引起了广泛关注。他们对雪貂的大脑进行重新布线,改变了雪貂从眼睛到听觉皮层以及从耳朵到视觉皮层之间的连接。不可思议的是,这并没有影响雪貂的视觉和听觉,而是听觉皮层学会了看,视觉皮层学会了听,雪貂的行动并没有受到影响。这证明大脑的功能皮层可能并非仅能胜任一种工作,而是可以按照需求进行重新组织和训练获取新的能力。大脑中的所有信息都以神经元电信号的方式存在,记忆通过加强集群放电神经元之间的连接得以形成,这涉及一个被称为长时程增

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载