工业4.0下的企业大数据——重新发现宝藏(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-05 14:45:52

点击下载

作者:刘士军

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

工业4.0下的企业大数据——重新发现宝藏

工业4.0下的企业大数据——重新发现宝藏试读:

作者简介

刘士军

山东大学教授

计算机软件与理论专业工学博士

自2000年以来,专注于制造业信息化领域15年,主要从事服务计算、协同计算、企业计算、云制造、CIMS等方面的理论研究与科研开发工作,积累了丰富的理论和实践经验;曾荣获国家科技进步二等奖、山东省科技进步一等奖,发表学术论文100余篇。

王兴山

浪潮集团执行总裁

国务院政府特殊津贴专家

泰山学者特聘专家

财政部管理会计咨询专家

拥有超过20年的IT行业运营和管理经验,始终致力于推动ERP技术与管理创新,在国内首先提出“集中式集团财务”和“分行业ERP”理念,为中国ERP产业发展做出重要贡献。

王腾江

浪潮通用软件有限公司工程技术研究

中心主任

山东大学管理科学与工程硕士

长期从事企业管理软件领域的相关工作,拥有丰富实践经验,对供应链管理和集成化物流系统有深入了解;目前主要研究领域为企业大数据、移动互联网等,作为骨干参与了国家和省部级课题10余项。序FOREWORD

进入2012年,大数据(big data)一词已经成为热得不能再热的“热词”,至今没有冷却的迹象。从美国大选到电影票房,从淘宝网商品推荐到高考押题,互联网上的大数据应用案例不断搅动着人们对大数据威力的想象。然而,与互联网上热闹的故事相比,企业界的管理者似乎对大数据还有些迟疑。企业家们既热切地期盼着大数据将会带来新的市场机会,又感到大数据应用玄之又玄,无从下手,而且,他们更担心大数据真的像市场宣传的那样,可能毫无征兆地颠覆自己的传统优势。

实际上,企业才是大数据时代真正的主角。工业是国家的命脉,产业是繁荣的基础。贯穿制造业完整的价值链、产品的整个生命周期,都涉及大量的数据,从产品设计到企业管理,从制造过程到售后服务,浩如烟海的数据沉淀在企业的图纸柜、经营报表、磁带机和硬盘里。而且,从工业革命时代开始,企业界就已经在积累数据,很多产业数据、工艺规程、设计图纸已经成为企业宝贵的财富。发展到数字化的今天,制造业已处于一个数据爆炸的时代,随着制造技术的进步和现代化管理理念的普及,制造企业的运营越来越依赖信息技术;互联网、物联网、云计算等新一代信息技术与通信技术向企业渗透的过程中,企业数据量也呈现暴涨的态势,以超过摩尔定律的速度在快速增长。企业大数据已经开启新的机会之门,成为许多行业弯道超越的宝贵机遇。《大数据时代》作者,现任牛津大学网络学院互联网治理与监管专业教授维克托·迈尔·舍恩伯格说:“数据已经变为了一种资源,就像黄金和能源一样宝贵,但大数据可以进行重复利用,成为经济发展的动力,刺激经济增长。”数据,是企业真正有待发掘的宝藏。

今天的企业开始拥抱互联网,开启了“互联网+制造”的创新模式,企业获取数据的能力、数据的深度与广度都大大拓展了。用国家“863计划”先进制造领域专家、清华大学王建民教授的话说:“工业大数据就是在工业领域相关信息化应用中所产生的海量数据。”注意这里的“相关信息化应用”意味着不仅包括企业内和产业链,还包括客户、用户和互联网上的数据。工业数据的采集,将催生出新的商业模式,逐渐打破工厂的边界,促进资产的流动,在全社会范围内优化资源配置。

正如麦肯锡研究报告所称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”对于企业而言,大数据不仅仅指海量数据的积累,更主要的是“价值发现”,是一种以数据创造价值的新观念、新方法和新模式。

而大数据处理技术就是那根“发现”的金手指,随着大数据处理成本的降低,大数据处理技术的日渐成熟将会进一步加速企业大数据应用的进程,成为助力制造转型的有力工具。企业通过检视自身积累的或者正在产生的数据,发掘其中蕴藏的宝贵价值,用好大数据处理和分析技术,就可以做到“点数成金”,创造出新的业务模式,发现新的业务机会。清华大学自动化系范玉顺前言PREFACE

这是一个“数据为王”的时代,从Google公司成功预测冬季流感到大数据助力奥巴马大选连任成功,无数成功的案例不断地提升着大数据的热度。而实际上,企业才是大数据应用的主角。从工业革命时代开始,企业界就已经积累了大量的数据,从设计到经营,从制造过程到售后服务,浩如烟海的数据沉淀在企业的图纸柜、经营报表和硬盘里……在“工业4.0”时代,制造企业的数据将会呈现爆炸式增长态势。工业企业中,生产线处于高速运转,由工业设备所产生、采集和处理的数据量远大于企业中计算机和人工产生的数据,企业数据也像互联网数据一样,以超过摩尔定律的速度在快速增长,这,才是真正的宝藏。

大数据技术正在带来一场革命。大数据意味着海量、多样、迅捷的处理需求,实时、多元、深入的分析,企业需要面对挑战,积极应对。大数据并非仅仅是指数据体量“大”,更重要的体现是数据当中的巨大价值,是一种新的思维方式。大数据时代的企业需要数据思维,数据是资产,是生产要素,就像原料、电力一样重要。大数据更是一种创新资源,它从产业结构转变、传统制造业升级、商业组织变革、“互联网+”和“大众创业,万众创新”等方方面面影响着经济增长方式,助推创新,驱动发展。

数据就在那里,生生不息;你用了,就能获得洞察与先知;你不用,别的企业,竞争对手也许会去用;人未动,而胜负已分。

本书全面论述了企业大数据的内涵、模式和相关技术,从企业大数据的基本技术形态讲起,展现了蕴藏在企业内部的大量企业数据的构成,特点,采集、处理和分析方法等,较为全面地介绍了企业大数据从认知到实践环节涉及的基本问题、实现技术、参考架构等,并通过300多个翔实的应用案例介绍了企业大数据的成功应用。

全书共分三部分十六章,第一部分,企业大数据宝藏,介绍了蕴含在企业设计、生产、管理、供应链、营销、服务等环节的大数据,以及与企业相关的外部大数据,帮助企业认知自身的大数据资源。第二部分,发掘大数据的价值,从唤醒沉睡的数据、构建统一的企业数据平台、引入企业大数据处理技术和利用大数据重构企业智慧等方面描述了企业应用大数据技术、挖掘大数据价值的方方面面,并通过精细管控、营销、采购、质量、售后、生产和人力资源管理中的大数据应用案例,进一步描述了大数据技术应用于企业的途径和成效。第三部分,大数据时代的企业,展示了服务型制造、社交商务、个性化定制等大数据时代的企业业务新模式,以及大数据催生的数据服务新业态。

本书作者来自高校和软件企业,在长期从事制造业信息化应用研发和推广中,对企业大数据的内涵与应用有着深刻的理解,积累了丰富的实践经验和案例。全文由刘士军、王腾江执笔,王兴山统稿。山东大学崔立真、潘丽、武蕾老师及魏艺、王立强和嵇存三位同学和浪潮通软公司王相成、薛雨萌等承担了大量的材料组织、校对、排版等工作。

在本书编写过程中,作者曾以各种方式向清华大学王建民教授、美国佐治亚理工学院Calton Pu教授等专家咨询和请教。在此,向所有对本书提供过帮助的诸位专家学者一并致谢。同时,我们也对电子工业出版社为本书出版给予的大力支持,对策划编辑李洁所付出的耐心和辛勤的工作表示真挚的 谢意。

本书得到了科技部创新方法工作专项(2015IM010200)课题的支持。

本书参考与借鉴了来自互联网和众多咨询公司的研究报告,这些内容大部分已经在书后的参考文献中列出,但仍难免有所遗漏,在此对所有这些文献的相关作者表示衷心感谢。编著者2015年11月工业4.0+大数据=重新布局的机会

改革开放以来,我国制造业取得了举世瞩目的成就。2012年,我国制造业增加值为2.0793万亿美元,而美国为1.9121万亿美元,我国成为实实在在的全球制造大国。在我国22个工业产品大类中,有7大类产量位列世界第一,其中220种工业品产量居世界第一。

与此同时,全球化竞争的态势也发生着变化,2008年国际金融危机后,制造业再次成为国际竞争的焦点。德国提出了以“智能工厂”为核心的“工业4.0” 计划,通过互联互通达到持续占据制造业技术及价值链高端的目的。美国通过《2010制造业促进法》、《国家先进制造伙伴计划》(2011年)、《国家制造创新网络(NNMI):初步设计》(2013年)等,努力实现“本土发明、本土制造”,希望将最先进制造行业的研发和生产都留在美国,使美国制造业在全球经济布局和新一轮产业革命中抢占制高点。2009—2013年,美国制造业大约增长了20%;同时,依靠先进的制造技术,美国制造业成本显著降低,与我国的差距快速缩小。

如果要问现在工业界最关注、最热门的关键词是什么,那一定是“工业4.0”,这是德国为应对新国际竞争趋势提出的战略。为了在新一轮工业革命中占领先机,在德国工程院、弗劳恩霍夫协会、西门子公司等德国学术界和产业界的建议和推动下,“工业4.0”项目在2013年4月的汉诺威工业博览会上被正式推出。这一研究项目是2010年7月德国政府颁布的《高技术战略2020》中确定的十大未来项目之[1]一,旨在支持工业领域新一代革命性技术的研发与创新。

前三次工业革命源于机械化、电力和信息技术。现在,将物联网和服务应用到制造业正在引发第四次工业革命。将来,企业将建立全球网络,把它们的机器、存储系统和生产设施融入到虚拟网络-实体物理系统(信息物理系统,CPS)中。在制造系统中,这些虚拟网络-实体物理系统包括智能机器、存储系统和生产设施,能够相互独立地自动交换信息、触发动作和控制。这有利于从根本上改善包括制造、工程、材料使用、供应链和生命周期管理的工业过程。

在工业4.0趋势下,工业的信息化水平进一步提升,尤其是“互联化”和“智能化”的提升。以制造业为例,在其转型升级中,渗透着“互联”和“智能”两个关键词,可以概括为几个方面:第一,产品智能化;第二,流程的智能化升级;第三,制造业的互联网化。随着信息物理系统的推广、智能装备和终端的普及以及各种各样传感器的使用,将会带来无所不在的感知和无所不在的连接,所有的生产装备、感知设备、联网终端,包括生产者本身都在源源不断地产生数据,这些数据将会渗透到企业运营、价值链乃至产品的整个生命周期,是工业4.0的新资源、新燃料。数据是区别于传统工业生产体系的本质特征,是工业4.0的核心。

在工业4.0时代,制造企业的数据将会呈现爆炸式增长态势。工业企业中生产线处于高速运转,由工业设备所产生、采集和处理的数据量远大于企业中计算机和人工产生的数据,数据类型也多是非结构化数据。生产线的高速运转对数据的实时性要求也更高。因此,工业大数据应用所面临的问题和挑战并不比互联网行业的大数据应用少,某些情况下甚至更为复杂。

在IBM公司看来,所谓工业4.0,其实就是大数据驱动的智能工业。IBM公司大中华区副总裁冯国华认为,这是一场由首席执行客户(CEC)推动的,以“D世代企业”(大数据分析驱动型企业)的诞生与发展为标志的,以大数据、云计算、移动、社交等技术为主要驱动手段的工业革命。这里所谓的“D世代企业”,是指那些为了更好地适应消费者的转变,需要借助大数据、云计算、社交、移动等新技术推动企业转型,从而帮助企业更好地满足消费者需求的企业。其中大数据分析的重要性尤为突出。

几乎与此同时,2011年,美国通用电气公司(GE)在加州硅谷建立全球软件研发中心,开发工业互联网,研发内容包括工业互联网平台、应用以及数据分析,目前研发团队已经达到上千人。在GE公司2012年11月发布的报告《工业互联网——打破智慧与机器的边界》中预测:在美国,如果工业互联网能够使生产率每年提高1%~1.5%,使其重回互联网革命时期的峰值水平,那么未来20年,它将使美国人的平均收入比当前水平提高25%~40%;随着创新意识在全球范围的扩散,如果世界其他地区能确保实现美国生产率增长的一半,那么工业互联网在此期间会为全球GDP增加10~15万亿美元——几乎是当今美国经济的规模。在当今富有挑战性的经济环境中,即使确保实现一小部分生产力提高,也能在个人层面和整个经济层面带来极大的益处。2013年,GE公司宣布将在未来3年投入15亿美元开发工业互联网。2014年,更大范围的参与者,包括AT&T、思科(Cisco)、通用电气(GE)、IBM和英特尔(intel)等公司在美国波士顿宣布成立工业互联网联盟(IIC),以期打破技术壁垒,为工业互联网确定和建立新基础、共同框架和标准,促进物理世界和数字世界的融合。作为一个开放性的会员组织,工业互联网联盟致力于为更好地访问大数据提供支持,有助于机构更便利地连接和优化资产、操作及数据,提高灵活性,以释放所有工业领域的商业价值,共同组成工业互联网的生态系统。

工业互联网汇集了两大革命的进步,将工业革命带来的无数机器、设备组、设施和系统网络,以及互联网革命中涌现出的计算、信息与通信系统更强大的进步结合起来。这些革命性的进步汇集发展了三大元素:智能机器、高效分析和工作中的人,这也正是工业互联网的精髓。

●智能机器:将世界上各种机器、设备组、设施和系统网络与先进的传感器、控制和软件应用程序相连接的新方式。

●高级分析:利用物理分析、预测算法、自动化以及材料科学、电气工程和其他了解机器及更大系统运转方式所需的重点学科的深厚专业知识。

●工作中的人:在任何时候将人相连,无论他们在工业设施、办公室、医院工作,还是在行进中,以支持更加智能的设计、运营、维护以及更高质量的服务和安全性。“工业互联网是以信息化手段作为支撑,落脚点在资产优化和运营优化,进而带来成本降低、效率提升和产能转型。”GE公司中国软件业务总经理杨涛解释道:“工业4.0关注的是生产制造领域,而工业互联网更关注制造企业的整体生态链。”她极力强调了二者的不同。因此,连接是基础,优化才是工业互联网的根本,这恰恰需要依靠工业互联网概念中反复强调的“数据”与“数据分析”。

GE公司在2012年率先明确提出了“工业大数据”的概念。在其名为《工业大数据的兴起》的白皮书中指出:“伴随着日益增加的先进装置和设备,大量在线的操作数据汹涌而来。有远见的企业正在利用这些数据进行卓越运营和预测分析,以创造竞争优势,加速企业的增长。”但是,对于构建分散处理型系统应用环境的制造业来说,无论在复杂性还是在所需的专业技术方面,企业所面临的许多情况都超出了传统制造业的对应能力。也就是说,要让企业真正用好工业大数据,并不是一件容易的事情,需要技术的进步与推动。

与此同时,其他工业化国家也不甘示弱,2014年2月24日,日本国土交通省成立了由信息系统公司和日本汽车工业协会等业界团体、学术专家构成的委员会,确定实现大数据实用化的课题和对策,系统构建所需经费将纳入2015年度预算概算要求基准。规定在2020年之前,日本政府和汽车厂商拥有的汽车相关数据集中上传至互联网,政府授予访问权限的运营商将有权阅览。2014年,日本船舶技术研究协会也开始进行关于“应用船舶大数据,提高海洋产业国际经济力”的研发项目。

面对德国、美国、日本等制造强国雄心勃勃的新工业革命战略,一份中国版的工业发展战略——“中国制造2025行动计划”也已经重磅推出,并在2015年“两会”期间得到广泛的讨论。实际上,2013年1月中国工程院联合工信部、国家质检总局牵头实施的“制造强国战略研究”重大项目,到2014年1月升格为由工信部牵头,会同国家发改委、科技部、财政部、质检总局、工程院等20多个国务院有关部门,组织50多名院士、100多位专家来编制《中国制造2025》规划。短短1年时间内,在国家战略需求的驱动下,中国在从制造大国向制造强国的迈进之路上陡然加速。在本书接近完稿之时,《中国制造2025》于2015年5月8日正式发布,从这份承载着中国制造转型升级和跨越发展的希望,作为我国实施制造强国战略第一个十年的行动纲领的重要文件中,我们可以看到一条清晰的未来数字化企业的发展脉络——以加快新一代信息技术与制造业深度融合为主线,以推进智能制造为主攻方向。

将《中国制造2025》上升为国家战略高度后,制造业技术创新将在以下几方面进行:传统工业在信息化创新环境中,不断优化创新流程、创新手段和创新模式,在既有的技术路线上不断演进;新型传感器、集成电路、人工智能、移动互联、大数据在信息技术创新体系中不断演进创新,并为新技术在其他行业的不断融合渗透奠定技术基础;传统工业与信息技术的融合发展,既包括CPS、智能工厂整体解决方案等一系列综合集成技术,也包括集成工业软硬件的各种嵌入式系统、虚拟制造、工业应用电子等单项技术突破。

实际上,中国与德国、美国所处的工业化阶段有很大差别,客观地讲,在技术和管理理念上还有很大的差距。但是,中国制造也有其独特之处:第一,中国是全世界唯一拥有联合国产业分类中全部工业门类的国家,在多个现代经济支柱性产业当中,规模也是名列世界前茅的,但发展水平不均衡;第二,中国有世界上最大、增长最快的消费市场;第三,中国已经初步形成了发达的移动互联经济。中国移动互联网产业的快速崛起是过去10年来世界经济中发生的一个现象级事件。SAP全球研发网络总裁柯曼认为:“相比于印度、越南、印尼,中国的劳动力成本优势正在丧失,但我认为智能制造和智能设备的物联网应用却能为中国重新赢得竞争力。”基于庞大的制造业基础,中国拥有全球最大的机器、设备市场,在制造过程中可以产生海量的大数据;与此同时,中国的智能设备应用也必定是全球之最,这些设备将不间断地产生海量的数据。柯曼强调:“破解这些大数据就是中国在新一轮制造革命中赢得竞争力的钥匙。”

中国经济转型就是要抓住这三个特色,在发达的互联网经济的基础上,以大数据、云计算、移动和社交等新一代IT技术为突破口,驱动大规模、活跃的市场创新、应用创新和业务模式创新,这才是中国经济转型的关键路线,才是有中国特色的新工业革命之路。

因此,在《中国制造2025》战略指导下,国家通过推进智能化制造的基础条件提升,比如工业机器人等智能装备研制和产品研发的数字化等。更重要的是推动企业的系统化能力,而大数据驱动的企业强调的是“系统的系统”,是通过全程、全链条的数据化而获得更智能、更高效的系统化能力。这其中,“数据”是关键,产品因为有了“数据”的特征而拥有更高的附加值,生产制造过程因为数据化而实现制造流程最优化,从而变得更精益化、柔性化、智能化,企业因为拥有从用户到制造全生命周期的数据而实现效益的最大化。“天下同归而殊途,一致而百虑。”德国政府不遗余力地推进“工业4.0”战略,“工业互联网”也被认为是美国制造业发展颇具代表性的战略,而“中国制造2025”已上升为国家战略高度。“工业互联网”、“工业4.0”、“中国制造2025”是制造强国的三张王牌,将引领世界经济走上新工业革命之路,引领未来制造业在更高层次的竞争和发展。不难看出,数据技术和信息技术在其中起到核心作用。

麦肯锡也指出,大数据正在成为下一代企业竞争力、生产力以及创新的前沿,它必将为企业发展带来巨大的价值。那些“D世代企业”,以数据作为竞争的制胜法宝,能够运用基于云计算的多种移动社交和大数据分析工具了解市场状况,预测客户未来需求;并根据数据洞察指导企业内部运作和市场销售的行动目标。这样的企业,方能从洞若观火到达运筹帷幄而至决胜千里之外的境界。

概括而言,大数据正深刻地改变着企业的生产和决策。大数据驱动的工业,正带来重新布局的机会。新工业革命浪潮中的企业领导者,需要重新审视数据资源的重要价值,掌握挖掘数据的手段,通过数据分析增加企业收入,提升竞争力。第一部分企业大数据宝藏

设想一个午后,你正在网上浏览、采购,几件心仪的物品已经放进购物车里,“click”!一键搞定。几分钟后,你家门铃响起,门口一位快递小哥正拿着你包裹——再熟悉不过的场景,这就是作为一个80后的你再正常不过的生活。正要签收,你恍然感觉好像哪里不对——这正是我几分钟前刚下的订单啊!你会慢慢习惯的,这就是大数据时代的物流。

2013年12月24日,亚马逊获得一项名为“预测性物流”的专利授权,这项专利可以让亚马逊根据海量用户数据去预判用户的购买行为,提前将这些商品运出仓库,放到托运中心寄存,等用户真正下单了,立即装车送往用户家里。目标只有一个:大幅缩减商品到达时间。[74]图0.1 亚马逊“预测性物流”专利示意图

这个方法的一个要点是将物品打包以便最终运送到投递地址,但首先向目的地所在的地理区域投送,最大化地靠近指定送货地址,而在包裹的运输途中,再最终指定完整的收货地址。当你在网上点击一些产品后,你不一定下单,有可能买也有可能不买,系统基于大数据分析判断你可能需要这些产品,在你没有下单之前就把这些产品调拨到离你较近的仓库,即“订单未下,货已在途”。

数据,仿佛是企业的“神经”,贯穿于它的各个运营环节。基于大数据分析,企业能够准确了解消费者的消费行为,通过记录、分析、整合、运算海量数据,能够对特定区域的货物仓储进行自动分析,从而为仓储提供有效、精准的调拨计划,根据用户的需求,基于销售前端的预测,在后台进行备货,将货物预先放在离用户最近的物流中心,时刻准备接收用户订单进行配送。很难想象一个没有“神经”的企业如何参与市场竞争。

英国《经济学人》杂志的创新编辑保罗·麦基里(Paul Markillie)说:“随着制造业步入数字化时代,整个领域将焕然一新。”

历经了近半个世纪的信息化过程,信息(数据)成为独立的生产要素,信息技术的超常规速度发展,促成了信息(数据)量和处理能力的爆炸性增长,人类经济社会也进入了“大数据时代”。

基于大数据的应用正快速地改变着人们的工作和生活方式。今天的世界,各行各业每时每刻都在生成海量的数据,欧洲核子研究中心的大型强子对撞机每运行1s,就可以产生40TB的数据;每天有5亿条Twitter消息发布(2014年数据)。据权威预测,未来每隔18个月,整个世界的数据总量就会翻倍。IBM公司的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。大数据到底达到了什么程度?为了论述方便,我们先给出一个数据度量的单位体系(图0.2)。

举一个形象的例子,一部《红楼梦》含标点约87万字,按照每个汉字占2个字节计算,大概包含1.7MB数据。也就是说:

●1GB 约等于617部《红楼梦》。

●1TB 约等于63万部《红楼梦》。

●1PB 约等于6.5亿部《红楼梦》。图0.2 数据度量单位关系图

美国国会图书馆藏书量约为1.5亿册,收录数据235TB(2011年4月)。那么,1EB约等于 4000个美国国会图书馆存储的信息量。地球上所有海滩上的沙粒大概有700500000000000000000(即7万零5亿亿)颗,这个庞大的数字(大约0.6ZB)其实还不到1ZB。IDC于2012年12月发布了研究报告《2020年的数字宇宙:大数据、更大的数字阴影以及远东地区实现最快增长》,所说的数字宇宙是对1年内全世界产生、复制及利用的所有数字化数据的度量。该报告指出,从2013年到2020年,数字宇宙的规模每两年将翻一番,预计到2020年,数字世界将拥有40ZB的容量。40ZB是个什么概念呢?仅就数量而言,相当于地球上所有沙粒数量的57倍。更大的数据已经没有比较的意义了,因为已经很难用现实中的事物去类比了。

然而,目前只有3%的数据是潜在有效的大数据,其中得到分析的数据量则更少。随着数字宇宙的增长,有效的数据量也在不断地膨胀。如果能对数据加以标记和分析,到2020年,33%的数字宇宙(即13000EB)将具有大数据价值。图0.3描绘了来自不同领域的大数据。[2]图0.3 来自不同领域的大数据

与近年来风生水起的网络大数据相比,企业对数据的积累其实更为久远,有些甚至可以追溯到20世纪60年代,开始于信息技术在企业广泛应用的进程中。经过几十年的积累,企业积累的数据体量也颇为庞大,从IDC关于美国各行业2009年数据存储量的数据统计(图0.4)中,我们可以看到,各行业中保有数据量最大的是离散制造业(Discrete Manufacturing),有多达966PB数据,超过了政府(Government)数据的848PB;另外,流程制造业(Process manufacturing)也有多达694PB数据,居第4位。麦肯锡全球研究院[3]的报告《大数据:创新、竞争和生产力的下一个前沿领域》显示,在美国的17个业务领域中,有15个领域的公司的数据存储量比美国国会图书馆还多,这些大数据主要来自于全球数十亿笔交易。沃尔玛公司就是一个典型实例。这一零售业巨擘每小时要处理超过100万笔客户交易,其数据库估计包含超过2.5PB数据,相当于美国国会图书馆全部书籍所含信息的167倍。另外,诸如英特尔公司等企业每天记录的有关其客户、供应商和业务运营的信息也非常庞大。大数据正从原来的存储难题,转变为新的战略性资产,成为可以为业务各方面提供重要信息的金矿。

企业大数据从哪里来?制造过程首先是大数据的源头,数据分布于产品整个生命周期的各个环节,从市场分析、产品策划到设计,再到制造、供应链和售后服务、再利用,每个环节都会有大量数据,“全”生命周期汇合起来的数据更大(图0.5)。此外,企业外、产业链外的“跨界”数据也是企业大数据不可忽视的重要来源。一旦制造业进一步数字化,生产流程中产生的数据将成为另一个巨大的数据来源,从IT角度来看,其数据量、产生频度、类型都极具挑战性和吸引力。一个半导体生产机台一天产生的数据量可以轻松达到TB量级,这样几年积累下来的数据很快就达到PB级了。产品运维中的数据也颇为可观,波音喷气引擎每运行30min就可产生10TB运行信息,一架四引擎巨型喷气式飞机单程飞越大西洋可生成640TB数据,将该数字乘以每天飞行的2万5千多架飞机,不难得出这是多么庞大的一个数字。据统计,制造业存储了超过其他工业部门的数据,自2010年以来的新产品数据已接近2EB。对这些数据的分析,是个实实在在的大数据处理问题。图0.4 美国各行业2009年数据存储量(来源:IDC;美国劳工统计局;麦肯锡全球分析研究)[4]图0.5 制造过程中的各种数据

企业大数据不仅数量巨大,而且种类繁杂,涉及大量结构化数据和非结构化数据(图0.6)。(1)产品数据:设计、建模、工艺、加工、测试、维护数据、产品结构、零部件配置关系、变更记录等。(2)运营数据:组织结构、业务管理、生产设备、市场营销、质量控制、生产、采购、库存、目标计划、电子商务等。(3)价值链数据:客户、供应商、合作伙伴等。(4)外部数据:经济运行数据、行业数据、市场数据、竞争对手数据等。图0.6 制造业大数据的类型

这些数据都藏在哪儿呢?

第一类存储于各类企业应用系统中,主要是产品数据和业务数据。传统企业信息化的“四大件”:广义PLM系统(包括CAX)主要支持产品开发,ERP系统负责“人财物、产供销”,SCM系统协调供应链,CRM系统关照企业客户和用户,其中的数据是我们通常所说的传统企业数据范畴。这些系统最大的特点是通常架构于关系数据库之上,所以其中的数据也被称为SQL数据。这些数据准确度高、结构严谨、价值密度很高(这一点不太符合大数据所谓价值稀疏的特征)。

第二类存储在各种设备和前置机中,主要是指那些机器和传感器数据,又称机器产生的数据/传感数据,包括智能仪表数据、工业设备传感数据、设备日志、交易数据、呼叫记录等。

随着制造物联网和传感网的发展,传感器、RFID、二维码、NFC等技术已经在企业中得到初步应用,机器数据也开始逐渐得到积累。这些数据的特点是数量极大,实时产生且数据类型多样,符合真正的大数据特点。过去由于受到存储和处理能力的限制,这些数据有的在经过加工后仅保存摘要,有的干脆在使用后就被丢弃了。处理这类机器产生数据所面临的问题和挑战很多,比如在制造领域中,压力、温度等数据的特点是需要语境才能理解的,燃气轮机排气装置上的温度读数与机车的内部温度具有完全不同的含义,燃气轮机改善热敷需要使用非常复杂的算法运行模型。所以通用电气公司副总裁兼全球技术总监William Ruh认为,相对于工业大数据来说,工业互联网(Industrial Internet)才是当前急需的,因为大数据本身并没有让信息的提取更加智能,业务比数据本身更加重要。

第三类数据存储于企业之外,包括企业伙伴间的业务往来数据、产品售后服务数据等。随着规模化定制和网络协同的发展,企业需要实时从网上接受众多消费者的个性化定制数据,并通过网络协同配置各方资源,组织生产,管理更多各类有关数据。另外,Twitter、Facebook这样的社交媒体平台上的社交数据,有很多也是与企业业务紧密相关的,如用户行为记录、反馈数据等。这些数据也符合大数据的特征。

还有一类数据,仅仅存在于历史中。出于存储成本的考虑或者处理能力的限制,还有很多企业数据实际上得不到处理,也无法存储,随时生成,随时丢弃。

由此可见,企业大数据不仅种类繁多,而且存储方式和存储地点也千差万别(图0.7),这对于想利用这些数据的企业而言,不能不说是一个严峻的挑战。仔细分析一下,这些数据典型地符合20/80法则,存储于各类企业应用系统中的业务数据只占总量20%,数量少,但是价值密度高,易于处理,易于分析;而另外80%的机器数据和社交数据等数量巨大,但是价值密度稀疏,对于这些数据,长期以来企业要么望“数”兴叹,要么干脆弃之不理。图0.7 分散存储的各类企业大数据第1章 设计大数据“如果我问人们,他们想要什么,他们会说更快的马。”——亨利·福特的名言。

设计的目标是使产品更有价值、生产成本更低以及对顾客更具吸引力。现代工业,无不将设计置于生产的最重要环节。1.1 当成吨的图纸变成数据

设计一直是最能体现企业创新活力的环节。随着技术的发展,现代制造产品越来越复杂,很多制造产品是集软件、电子、机械、液压和控制等模块于一体的典型多技术系统。比如,一架美国波音747大型客机的零件数量多达600万件,其中连接件为300万个,风洞吹风测试达15000h,电缆总长274km。这样的产品设计对制造企业而言是一个巨大的挑战。

1961年,我国开始仿制苏联的米格-21飞机,同年8月,苏联提供的飞机图纸和技术资料陆续运抵当时技术实力最强的沈阳飞机制造厂(112 厂)。这批技术资料重达13t之多;仅翻译、复制、校对这批图纸和技术资料,国家就协同相关单位花了1年多时间才完成。

40年后的2001年,我国在“枭龙”战斗机研发中首次全线采用三维数字化设计技术,结束了制图、晒图的历史,节省了大量烦琐的劳动与时间,大大缩短了设计、研制时间;这架飞机的结构更为复杂,承载设计的不再是成吨的图纸,而是多达9万张的数字图纸。

事实上,复杂的产品还表现在客户需求复杂、产品组成复杂、产品技术复杂、制造过程复杂、项目管理复杂,其设计过程是机械、电子、控制、信息等多领域一体化协同的过程。一种新的汽车车型,需要开发2万~2万5千个零件,想要更快地开发出更好的汽车,就需要更好的设计数据管理和处理技术。在企业数据基础上,设计工程师和制造工程师们可以使用产品全生命管理系统(PLM)等工具共享数据;通过快速、低成本的仿真来测试不同的设计选择、不同的零件和供应商的选择,并测算这些选择各自相关的制造成本。这种数据协同非常有价值,因为设计阶段的决策通常会决定制造成本的80%。业界领先的一些企业已经开始协同使用数据和协同控制试验,通过数据分析和模拟及早地获得一些设计决策。

现代新药研制也是一个常见的“计算对象”。以前,开发一种新药要经过原理研究、动物试验、志愿者试验等步骤,很多内容需要在现实中大量地、反复地试验,整个研制周期往往长达十余年,其耗费的时间与精力可能不亚于登月工程。如今,很多基础性的试验和计算工作可以通过在超级计算机上完成模拟,研制周期可以大大缩减,一种新药3~5年就能研制出来。对于今天的制药企业来说,采集和拥有一致、可靠、关联完整的数据反而成了新药研发面临的最大挑战之一。1.2 巨型风洞和工程分析数据

在我国川西北大山深处,坐落着亚洲最大的风洞群,这里有低速风洞和亚声速、跨声速、超声速和高超声速风洞52座,拥有8座世界级风洞设备,能够进行从低速到24倍声速,从水下、地面到94km高空范围,覆盖气动力、气动热、气动物理、气动光学等领域的空气动力试验。从“歼-10”、“枭龙”战机和“神舟”系列飞船,到磁悬浮、“和谐号”高速列车;从高达300多米的东方明珠塔,到横跨30多千米海面的杭州湾跨海大桥设计,都在这里进行过风洞试验。

而据德国亥姆霍兹大研究中心联合会网站消息,研究人员在哥廷根建成的62m长巨型风洞,可把空气加速到超过25000km/h。此风洞可帮助科学家模拟飞船和超音速飞行器穿过大气层飞行时的极端条件。

为什么要建造这些庞然大物呢?这是因为风洞试验是产品研制过程中一个不可缺少的组成部分。它不仅在航空和航天工程的研究和发展中起着重要作用,随着工业空气动力学的发展,在交通运输、房屋建筑、风能利用和环境保护等领域的设计中也得到越来越广泛的应用。比如,汽车时速达到110km/h时,风的阻力就占总阻力的70%,大部分燃油消耗被用在了克服风阻上,因此通过风洞试验模拟汽车在行驶中的情况,优化汽车外形设计,减少风阻、节约燃油、降低噪声,是汽车风洞试验的主要目的。通用汽车公司研发庞蒂亚克火鸟I概念车(1953年)时就已开始使用风洞试验室,之后使用过美国航空航天局艾姆斯(NASA Ames)研究中心的风洞,并与加州理工大学有过深入合作。直到20世纪70年代末期,由于市场对于汽车燃油经济性、舒适性的广泛需求,通用汽车公司决定建造自己的空气动力学试验室,1980年8月,该试验室正式在通用汽车技术中心落成。

为了达到各种模拟试验条件和极端条件,风洞需要高超的设计和巨大的空间。而在风洞试验中,为了创造出试验条件,所需的能源也是非常巨大的。前述德国哥廷根那座62m长的风洞中,活塞像一个巨大的空气泵压缩燃气,在钢膜破裂之后,一股强烈的冲击波对空气进行压缩和加热,然后以最快的速度喷到模型上(工作原理属于激波风洞)。试验中的极端气流能引起类似太阳表面的温度,但只持续0.001s。这么短的时间内,风洞试验中的材料甚至还来不及融化。汽车风洞中用来产生强大气流的风扇是很大的,比如奔驰公司的汽车风洞,其风扇直径就达8.5m,驱动风扇的电动功率高达4000kW,风洞内用来进行实车试验段的空气流速达270km/h。通用沃伦风洞采用的风扇为6片结构,每扇叶片约长3.6m,重约1t,转动时由4500马力变速直流电动机驱动,测试区最大风速可达222km/h。建造一个这样规模的汽车风洞往往需要耗资数亿美元,甚至10多亿,而且每做一次汽车风洞试验的费用也是相当高的。与现实状态不同,风洞试验中不是物体在空中移动,而是空气冲击固定安装的模型。通常情况下,工程师会先对1:3模型进行测试,之后再对实物或1:1模型进行测试,最终得出结论和后续研发的数据依据。

通过风洞试验仅仅是获取数据,数据采集完成后,必须对数据进行分析,以从中提取相应信息。因此,大型的风洞试验中心同时要配套建设大型的计算中心和高性能计算机系统,以完成大量的数据计算。

汽车的安全碰撞分析是检验汽车安全性的重要手段,这个试验不是在风洞中完成,而是在专门建设的碰撞试验场中实现,丰田公司位于东富士研究所的碰撞试验场长280m,宽190m,占地面积约238740m,俯瞰整个试验场,是一个方形与扇形组合而成的巨型试验场地,可以进行障碍物碰撞试验、车与车对擅以及各种翻滚试验,以满足全世界各种最严格的碰撞法规。全年可进行大约1600次碰撞测试,也就是说平均每天这里会有至少4次的碰撞试验。除了碰撞设备和被检测的汽车,汽车公司还要研制作为碰撞试验中获取驾乘人员重要数据的假人,包括各种体型、年龄、性别的假人。假人要有极为精确的模拟生理结构,甚至还有孕妇模拟假人以准确还原碰撞中孕妇和腹中胎儿所受伤害的情况,以用于更加有针对性的开发安全装备。这些假人价值不菲,且都是一次性使用的。在以往的汽车研发中,要研究一种新车的安全碰撞情况,可能需要制造近百台真车,再进行碰撞试验并收集数据。

噪声、振动与声振粗糙度NVH(Noise、VibrATion、Harshness),是一个衡量汽车制造质量的综合性问题,它给汽车用户的感受是最直接和最表面的;它是国际汽车业各大整车制造企业和零部件企业关注的问题之一。有统计资料显示,整车约有1/3的故障问题和车辆的NVH问题有关系,而各大公司有近20%的研发费用消耗在解决车辆的NVH问题上,这也需要大量的分析工作。

现在,借助超级计算机和计算机辅助工程(Computer Aided Engineering),企业可以进行模拟分析、验证和改善设计,从而节省大量成本。汽车研发人员可以通过数字样车实现汽车碰撞和数据收集,然后再通过真车碰撞对设计进行实践检验,因此实际用车可能几台就够了。通用汽车运用数字化试验后,汽车开发周期由48个月缩短到12个月以下;菲亚特、丰田和日产公司都将新型号的研发时间缩减了30%~50%;丰田宣称在构建产品的第一个原型系统之前,已经可以通过数据应用消除80%的潜在缺陷。类似的,运用超级计算机的模拟试验和数据运算,飞机制造也不需要进行复杂的风洞试验,波音777飞机的研制周期也从8年缩短至5年,工程返工量减少了50%。

随着试验技术的发展和计算能力的提升,产品设计中可以搜集到更多的数据,从而给出更好的设计。图1.1、图1.2分别是波音公司在设计767机型和787机型时应用计算流体力学(CFD)的情况,从中可以看到,在两代机型设计中数据分析所做贡献的巨大变化。[5]图1.1 CFD对波音767的贡献(1979年)图1.2 CFD对波音787的贡献(2005年)1.3 从数据中发现设计知识

产品设计和工程分析中蕴藏着大量的数据。计算机辅助技术(CAD、CAE、CAM、CAPP等)的广泛普及使得这些数据规范、精确,可以采用传统的方式处理。

2003年初,山东大学曾经为济南一家装备制造企业研发了一款软件。这家企业始建于1937年,是世界最大的机械压力机制造商之一。在漫长的发展过程中,这家企业研发了数百种产品、几千个型号、数万台机床设备,积累了大量的设计资料,这些资料要么是图纸,要么是纸质表格,只有少量是电子文档。当时,这家企业已经意识到这些设计资料的重要价值,因为随着老一代设计人员逐渐退休,新的设计师们无从了解过去产品设计中的重要经验和决策依据。这项工作目标很明确,就是要把企业积累的这些设计资料数字化、知识化、工具化,在此基础上,开发一款供设计人员使用的设计计算工具软件。山东大学师生们用了一个寒假的时间,从这些设计文档、设计图表入手,分析资料中的数据关系,导出数据计算公式或查表方法,开发相关的交互界面。最终,这些设计数据得以重新规范和整理,其中蕴含的价值得以重生,使潜藏在数据中的设计知识可以方便地应用于新产品的设计。

今天看来,这项工作其实还是很初步的,只能算是设计数据的简单加工和再现,无论从规模还是数据形式上,都还只是“小数据”的常规处理,跟今天的大数据不是一个概念。但是,从对数据的加工和分析过程看,当年这项工作的目标和成果又与今天大数据处理的思路不谋而合。

十几年后的今天,为了满足虚拟展示、可视分析、协同设计的需要,以及新兴交互技术、显示技术、分析技术的引入,产品设计和工程分析数据的规模、类型和分布也开始迅速增长,需要借助大数据的分析和处理能力。基于大数据的关联分析能力,设计人员可以深入挖掘以前开发中没有注意的现象与规律,从中发现设计知识。(1)分析用户需求数据,找到用户对产品的真实需求,用于改进产品设计。

通过广泛收集数据,特别是捕获用户与产品功能界面的交互数据,一定程度上可以还原用户在一段时间内的行为,它们是用户行为轨迹的真实反映,这样就有了用户的真实的主观需求,这种需求甚至连用户自己都不清楚,只是单纯地觉得什么东西用起来不顺手,我想要什么功能、我想修改什么功能。通过分析,可以找到这些需求背后深层次的原因,而这也许正是解决问题的关键点。举个例子,用户在手机触屏虚拟键盘上输入拼音时总是感觉按钮有偏差,不是点不中就是老点错;研究者通过在线收集用户的触控交互数据,最终发现,用户的点击都有些向下偏移的倾向;进一步分析可以了解到,人的手指肚形状是一个中间凸起、前部微翘的形状,这就造成了用户点击的偏差,这个知识可以用来改进触屏界面交互设计。(2)利用加工过程中的数据反馈和产品使用中的行为数据,也可以帮助制造商探索最佳的设计和工艺,改进设计,甚至帮助改变其业务模式。

汽车上大量传感器的使用,使得采集汽车运行行为数据可以很方便地进行,而且不会对顾客造成干扰。汽车行业的巨头们已经纷纷开始利用汽车行为数据改进设计,这将从根本上改善汽车的设计。福特研究实验室的测试车每小时会从高分辨率照相机和传感器阵列中收集约250GB数据,他们正在试图找出其中哪些数据是最有用的,以及如何将这些数据回馈给公司的生产过程。鉴于福特公司年销售200万辆汽车的市场规模,从汽车运行中采集的数据量之大可想而知,这其中蕴含着巨大设计价值。企业利用这些数据,可以为消费者打造出更为简单、直接、便捷的汽车生活体验。数据甚至改变了汽车的销售方式,沃尔沃公司正在积极售卖其基于大数据推出的“公路列车”,在车流时速低于50km/h时,尤其是在堵车的情况下,汽车可以自动跟随前方车辆行进,车辆之间保持适当车距,同时保持对转向的控制,这时的驾驶员就可双手脱离方向盘干点别的了。这是其基于庞大的道路数据库、汽车互联数据库打造的一套系统。(3)社交媒体的数据同样可以用于改进设计。

福特公司从分析许多社交媒体和外部订单数据中发现了一些有价值的线索。汽车顾客们在社交媒体上都说了啥,与其他厂家的车对比如何,以及他们遇到了什么问题,等等,这些都是福特关心的数据。福特公司使用社交媒体帮助弄清楚了为什么美国的Fiesta车主和欧洲的车主一样,都不喜欢three-blink转向信号(行车线变化时转向灯闪烁三次)。“一些有three-blink功能美国车的人,看来并不像我们预期的那样满意。”这让福特公司的市场营销团队很困惑,他们非常想了解关于这个设计,用户是怎么想的。通过对社会媒体进行一些深入的数据挖掘后,福特公司的分析团队发现,其实用户不满意的是方向盘的问题,而不是车辆的转向信号。这样,销售团队向顾客认真地解释后,人们就不再抱怨转向信号的问题了。1.4 数据驱动的设计

新产品开发是一件高风险的事,每年进入市场的新产品中都有大批以惨败收场。在设计初期的创意阶段,要通过市场信息去制定产品的设计开发计划,了解市场流行趋势及科技发展趋势,消费者在乎的是什么。传统市场调查得到的讯息,不外乎价格、外观、性能等,却无法从这些信息看到全面性、情感性及前瞻性,容易使设计上的创新性和需求性受到局限,且增加了新产品进入市场惨遭挫败的风险。而从大数据的角度去驱动产品创新,就会在信息的广度(如搜索引擎、社交网站、行业信息)、深度(如情感分析)和前瞻性(如新能源、新技术、新材料)方面,达到传统市场调查无法达到的程度,这也会直接影响产品创新设计的水平及未来上市后的成败。

最易见效的方法是通过客户分析——公司密切关注社群网站的信息、讨论区消息及其他在线信息,了解人们的所思所想。用户对产品的情绪分析成为互联网世界产品概念设计和概念测试的依据,这种信息可以让产品设计者在各种问题和想法完全被意识到之前,及早发现它们。大数据是说公司可以挖掘分析大量各种信息,以改善下一代产品和服务。社会和经济活动的不断网络化,数据收集、传输、存储和分析成本的下降,共同导致了一个有助于培育新的产业、工业和产品的大数据时代的出现。

数据驱动的设计能够在制造任何实物产品之前预告设计过程,从而降低成本,并确保最终产品更加符合客户偏好。例如,欧特克(Autodesk)的计算机辅助设计软件AutoCAD已经流行了几十年,而现在该公司正在开发一种更加基于数据驱动的方式。这项研究是在其建立的算法生成设计(Algorithmically Generated Design)研究项目“追梦计划”中,最终目的是将其与公司的其他产品整合,使设计者能够根据一系列材料和性能要求生成设计,然后将这些设计用于进行高精度的增材制造。

数据驱动的设计在其他领域(如网页设计)已经成为标准做法,制造商若将其更全面地应用于自己的产品,将会受益匪浅。汽车制造商,如沃尔沃(Volvo)公司和迈凯轮(McLaren)公司都采取了基于模拟的方式来驱动设计。迈凯轮公司在制造实体原型之前,先要对其设计进行性能分析;沃尔沃公司则通过整合客户数据来预测一个特定设计或功能是否能够吸引客户。

在电动汽车领域,电池系统、电动机系统是两个最核心的技术领域。美国Tesla(特斯拉)电动车公司的充电桩代表了世界上最发达的充电技术。为了让电动汽车更实用,特斯拉公司正在拼命缩短充电时间,使得充电速度越来越快,现在充满一半电量只需20min,是普通电动车充电速度的20倍;而一辆60kW·h电池组版本的Tesla Model S充满电可以续航368km。特斯拉首席技术官施特劳贝尔(Straubel)甚至宣布可以将充满电池的时间缩短到5min——这已经跟加满一箱油的时间差不多了。这实际上是特斯拉公司取得市场竞争优势的法宝。[6]

而取得这样的设计结果,特斯拉公司依靠的是来自JMP的高级DOE (Design of Experiments,试验设计)平台及数据分析套件。JMP是全球最顶尖的统计学软件集团SAS公司的重要事业部,致力于帮助全球企业客户提升质量管理、优化业务流程和改进产品研发,通过JMP提供的高级试验设计、数据分析套件及数据挖掘方法。特斯拉公司找到了电动车充电技术的窍门,成功解决了电池温度与快速充电问题,并且实现了对单个电池的温度与工作环境监控,成功解决了困扰电动车界的高效能充、放电,电池可靠、安全工作,以及电池容量等几大难题。

而一些本身就个性十足的产品正在充分利用来自用户的数据完善设计。2015年2月23日,在美国密尔沃基,哈雷·戴维森在全球启动了[7]2015年LiveWire项目体验活动,全球骑手都有机会参与体验。哈雷·戴维森将倾听、收集骑手们的反馈意见,与骑手们一同打造哈雷·戴维森首款电动摩托车的未来。

哈雷·戴维森邀请了亚洲、欧洲、加拿大及美国的客户参加体验活动,收集骑手们的试驾感受,旨在推出一款真正能满足客户全方位需求的电动摩托车。[8]图1.3 哈雷·戴维森新款电动摩托车的设计

Live Wire这款摩托车是专为收集骑手们的试驾感受所设计的,以了解骑手们对于首款哈雷·戴维森电动摩托车的全方位需求和期待。Live Wire项目体验活动邀请众多潜在客户参与体验,使消费者更进一步地了解哈雷·戴维森品牌,收集他们真实的体验感受。对于不会驾™驶摩托车的客户,他们可以通过Jumpstart装置感受Live Wire的引擎动力,同样将得到非凡的试驾体验。

这已经不是哈雷·戴维森第一次举办这样的活动了。2014年,哈雷·戴维森在美国举行了LiveWire项目体验活动,一路骑行途经30个拥有哈雷·戴维森经销店的城市,并在迈阿密举办了一场专门针对拉丁美洲客户的体验活动。活动总共收集了超过15000位客户的体验感受,其中有超过6800位客户参与了Jumpstart装置体验。哈雷·戴维森将根据在LiveWire项目体验活动中所收集到的客户反馈,制定针对这款摩托车零售可行性的长期规划。

这项活动体现了以客户需求为导向的设计原则,电动车技术的发展日新月异,哈雷正是希望从LiveWire项目体验活动中尽可能地收集来自客户的数据,从而明确这款新车型正确的设计方向。

而在产品上市以后,仍然可以获取数据,驱动设计。随着流动性数据不断地产生,通过智能感应设备对数据进行收集、传送,可以对可能出现的零部件故障、隐患进行及时的处理。一方面有利于解决产品安全隐患,另一方面将帮助产品的更新换代,提升产品的设计和构造水平。第2章 生产大数据2.1 机器生成的数据

所谓机器生成的数据,是指那些从计算机过程、应用软件或者机器上自动地、没有人为干预创建的信息。莫纳什研究院的柯特·莫纳什是这样定义的:“机器生成的数据是完全由机器产生的数据,或者观察人类行为而不是记录人类决策的数据。” 耶鲁大学教授丹尼尔·阿巴迪给出了一个狭义的定义:“机器生成的数据是一种独立计算代理决策的结果,或者是对一个非人类行为事件的测量。”这些定义上尽管有些差异,但它们都排除了数据由人类手动输入的情况。

工业4.0时代,机器所产生的工业物联网数据,将远远超过目前消费互联网所产生的数据量。Gartner在2009年发布报告称,数据将在接下来的5年内将增长650%。大部分的增长源自机器生成的数据。IDC预计到2020年,联网的物体将是人的互联数量的26倍。Wikibon预测到2020年,将会有5140亿美元投资于工业互联网。

数据的量变会产生质变,大量的机器数据将会催生新的商业模式,并在全社会范围内优化资源配置:更自动化的生产设备,更灵活的流程管理,让工厂能够基于市场预测快速地装配调度,智能地生产,从而以最快的速度匹配消费者需求。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载