第二次机器革命(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-19 03:05:37

点击下载

作者:[美]埃里克·布莱恩约弗森(Erik,Brynjolfsson),[美]安德鲁麦卡菲(Andrew,McAfee)

出版社:中信出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

第二次机器革命

第二次机器革命试读:

专家、学者、企业家热评

这是一本比《世界是平的》更给人以震撼和启迪的书。

以蒸汽机为标志的第一次机器革命让人类拥有了力大无比的帮手。“1.0版”的机器是“四肢”远比人类发达但脑力为零的“大力士”,它们高效而可控地“外包”着人类的体力。而以机器人、3D打印机、超级计算机为雏形的新机器导致了人类脑力的大幅度外包。这种“灵长类机器”是一个全新的“物种”,其真正的特性不仅在于它们具有脑力,更在于它们的脑力能够以巨大的加速度持续进化。

新机器大爆炸、大裂变式的脑力增长将不断释放令人震惊的生产力,在诸多方面将不断地让人类自叹弗如,人类以往对生产力的计量体系将面临穷尽和崩溃。

新机器既是人类的帮手,也是人类的对手。人类将日益面临与新机器的残酷竞争。

凭借劳动力成本优势而赢得比较优势的国家(比如中国和印度)可能很快会陷入相对的劣势之中。个人和国家获取竞争优势的唯一途径,是如何以“四两拨千斤”的太极手法赢得竞争——做只有人能做的事、干机器自叹力不胜任的活儿,找到“最不易被机器夺掉饭碗的职业”。这是这个“美丽新世界”里国家、企业、个人竞争战略的基点。——吴伯凡《21世纪商业评论》发行人、“冬吴相对论”主持人“如何打造、使用并适应数字化产品和技术将决定我们在21世纪里能否获得成功。我们的新技术是一种促使社会发展的力量,还是一种阻逆社会进步的力量?《第二次机器革命》这本书将会告诉你,成功能否实现,又将如何实现。”——加里·卡斯帕罗夫(Garry Kasparov)第十三位国际象棋世界冠军“埃里克和安迪走在了时代的最前沿,现在,通过这本书,他也引领我们跟上了他们的脚步。这是一本深入观察未来技术将给我们的经济和社会带来重大变革的书。如果你和你的孩子们想在未来有所准备,那么就阅读《第二次机器革命》吧。”——佐伊·贝尔德(Zoë Baird)马克尔基金会主席“《第二次机器革命》对数字技术是如何改变经济的——这一刚刚开始的社会进程,给我们提供了极其重要的视角。埃里克和安德鲁的理论基点是:当大规模科技创新深刻地重塑我们这个世界时,我们需要创造一种新的商业模式,需要新的科学技术以及新的政策体制来扩展、强化我们人类的能力,只有这样,我们每个人在这个逐步走向自动化的时代里才能获得充分的经济自主。”——里德·霍夫曼(Reid Hoffman)LinkedIn(领英)联合创始人兼执行主席、《纽约时报》畅销书《至关重要的关系》(The Start-up of You)合著者“虽然我阅读过很多同类的书,但《第二次机器革命》真的帮助我看清了明天的世界将以指数级增长而不是以算术级增长——不论是宏观世界还是在微观领域。这也就意味着不论是教育者还是学习者,都要赶上这一社会发展的潮流。这本书真的给我们描绘了一个极其兴奋的未来。”——克莱顿·克里斯坦森(Clayton M.Christensen)哈佛商学院教授、《创新者的窘境》(The Innovator’s Dilemma)作者“布莱恩约弗森和麦卡菲是对的:这是一个技术促动社会重大变革的时代。在这个时代里,我们处于浪潮之巅。任何人如果想获得长远的繁荣与进步,就一定要读一读《第二次机器革命》这本书。我将鼓励我们所有的企业家阅读这本书,同时希望他们的竞争对手不要读到这本书。”——马克·安德森(Marc Andreessen)Netscape(网景公司)和安德森·霍洛维茨基金联合创始人“在这本充满积极和智慧力量的书中,布莱恩约弗森和麦卡菲极其鲜明地阐述了智能机器人将给我们的社会带来哪些红利。但他们讨论认为,要想获得这些红利,依靠的是找到与机器协作而不是与机器对抗的方式。这也就意味着,像我这样的人,需要生产更容易操控和使用的机器。最终,那些钟情于新技术的人们将会成为受益最多的群体。”——罗德尼·布鲁克斯(Rodney Brooks)Rethink Robotics(新型机器人制造公司)董事长兼首席技术官“毋庸置疑,新技术可能会给我们的经济和人类的福祉带来翻天覆地的变化。布莱恩约弗森和麦卡菲撰写了一本探讨我们未来10年都要面对的由技术驱动带来的机会和挑战的书。任何人如果想了解新技术将如何改变我们的经济社会,都要从这本书开始。”——奥斯坦·古尔斯比(Austan Goolsbee)芝加哥大学布斯商学院经济学教授、美国经济顾问委员会前主席“《第二次机器革命》非常有助于我们更好地了解我们正在进入的这个新世纪。在这个世纪里,我们人类只有同机器合作才能发挥最大的潜能。凭借其可行性的经济分析,这本令人激动不已的书更加具有前瞻性,也很适合大众读者阅读——它的确是一本必读书。”——约翰·希利·布朗(John Seely Brown)Xerox(施乐公司)前首席经济学家“布莱恩约弗森和麦卡菲做了一件让人非常吃惊的事情,他们阐述了技术的发展进程,描绘了未来的发展前景,探讨了技术进步给经济社会带来的革命性影响,并提供了切实可行的政策建议。这绝对是一本必读书。”——维维克·瓦德华(Vivek Wadhwa)杜克大学普拉特工程学院研究主管序与机器竞赛——如果我有一把锤子托马斯·弗里德曼

在埃里克·布莱恩约弗森和安德鲁·麦卡菲令人着迷的新书《第二次机器革命》中,我最喜欢的一个故事是,当荷兰国际象棋大师扬·海恩·多纳尔被问到与一台计算机[像IBM(国际商用机器公司)制造的“深蓝”(擅长国际象棋的计算机)]对弈前如何准备时,他回答道:“我会带一把锤子。”

幻想着要把软件和自动化领域最新技术进步击碎的人,并不仅仅只是多纳尔一个。想一想自动驾驶汽车、机器人工厂和人工智能预订员,它们不仅仅在以飞快的速度替代蓝领工人的工作,现在也在替代白领阶层的工作,甚至连大师级的人物也不放过!

在过去的10年时间里,发生了一些很大很大的事情。每一种工作、每一座工厂、每一所学校,都能感受到这种剧变。我自己的总结是,这个世界已经从连接转变到超级连接,结果是,一般化已经终结了,因为雇主现在可以轻而易举地从国外获得高于一般水平的软件、自动化设备和低劳动力成本的人才。麻省理工学院的布莱恩约弗森和麦卡菲对此提供了一个非常详尽的解释:第二次机器革命时代的序幕拉开了。

他们讨论认为,第一次机器革命时代是18世纪末期伴随着蒸汽机诞生的工业革命。这一时期“几乎所有的动力系统都在延展人类的肌肉力量”,麦卡菲在一次接受采访时说:“在那个时代,每一种后续的发明都在释放越来越强大的动力。但它们的动力都需要人类做出决定和发出指令。”因此,这个时代的创造实际上是由人类控制的,劳动力也因此显得“更有价值、更重要”。人类劳动力和机器是互补的关系。

然而,在第二次机器革命时代,布莱恩约弗森认为:“我们正在开始对更多认知性的工作,以及更多的动力控制系统进行自动化。”在很多情况下,今天的人工智能机器能够发出比人类“更优化”的指令。因此,人类和受软件驱动的机器可能正在日益变成替代关系,而不是互补关系。两位作者认为,促使这一切成为可能的是三个刚好达到引爆点的巨大技术进步,他们把这些技术进步描述为“指数级的增长、数字化的进步和组合式的创新”。

在阐释“指数级的增长”时,他们复述了国王和国际象棋发明者的故事:国王对这位发明者的印象非常深刻,决定给予他任何想要的奖赏。发明者说,为了养活全家,他只要大米就行了。他请求国王在国际象棋棋盘的第一个方格里放一粒米,之后每一个方格里所放的米粒数量都是前一格的两倍。国王同意了——直到他意识到63次加倍的数量将会生成一个让人难以想象的大数字,因为即使在开始的时候只放一粒米,一旦要填满棋盘的另一半,那么将需要百万的三次方再乘以18倍的数量。

两位作者把棋盘的另一半和数字化计算能力每两年疯狂成倍增长的摩尔定律进行了对比。不像蒸汽机,它是实体的且每隔70年其性能才会翻一番,而计算机的“性能和运算速度超越了以往的任何东西”,布莱恩约弗森说。现在我们正处于棋盘的另一半,你可以看到行驶中的无人驾驶汽车、在《危险边缘》游戏中赢得比赛的超级机器人、灵活的工厂机器人和小巧玲珑但性能完全可以媲美二三十年前超级计算机的智能手机。

现在,随着互联网和物联网的延展,很快全球每个人都会拥有一部智能手机,而且每一台收银机、飞机发动机、学生用的iPad(一款苹果公司的平板电脑)、恒温器都可以通过互联网发布电子数据。所有这些数据意味着我们瞬间就可以发现和分析某个生产和操作模式,瞬间就可以复制全球规模的某条生产线,并且瞬间就可以提升某项生产和操作技能——不论是眼部外科手术、教学分数或者在3万英尺(1英尺=0.3048米)高空操控一台通用公司的发动机。突然之间,两位作者讨论认为,技术提升的速度和幅度变得异常急速和剧烈。

组合式创新意味着你可以把Google(谷歌)地图和像Waze这样的智能手机应用程序组合在一起,通过这种组合式技术,驾驶员只需要把他们的手机放在车里就可以自动地接收交通路况信息,而且把这两者的组合融入一个GPS(全球定位系统)中,不仅可以告诉你到达目的地的最佳路线,还能告诉你哪条路线现在是最佳的——因为这个系统能看到所有的交通状况。瞬间,你就会成为某个城市里最聪明的驾驶员。

把所有的这些进步整合在一起,两位作者说,你就能看到我们这一代人,将能够依靠更少的人和更多的技术,前所未有地拥有更多提升(或摧毁)这个世界的能量。

但这也意味着我们需要深刻反思我们这个社会的契约,因为劳动对一个人的身份和尊严,对一个社会的稳定是非常重要的。他们建议我们要对人类劳动力减少征税,以使其与数字化劳动力相比使用成本更低;而且我们要对教育进行变革,以使更多的人能够“与机器竞赛”,而不是与它们对抗;我们还要做很多提升创业精神的事情,因为它能创造新的行业和就业机会;甚至我们还可以考虑给予每个美国人基本收入保证。

两位作者认为,我们还需要进行深入的再思考,因为我们不仅正处在经济衰退、就业下滑的状况中,还处在重塑工作间、办公室的技术风暴之中——而且这种风暴还在加倍增长。托马斯·弗里德曼《纽约时报》专栏作家、《世界是平的》作者2014年1月13日

推荐序

超越极限

席卷全球的金融和经济危机,逼迫人们于痛定思痛之际,重新审视传统的生产与生活方式,思考未来社会变革的动力与方向。

然而,一个令人颇为难堪的反省结果是,当今社会发展似乎已经抵达这样一个临界点:经济增长的福祉正为与之相伴的负面影响所抵消,人类为实现增长而付出的环境、资源、社会乃至精神等成本,正在超过从经济增长中获取的正收益。换言之,所谓“经济”的增长,开始变得“不经济”。

否极泰来。要推进人类文明的持续进步与发展,让更多人分享发展成果而不是承受经济增长的代价,就必须超越既往发展模式,开辟一条全新的发展路径。

在《第二次机器革命》一书中,埃里克·布莱恩约弗森和安德鲁·麦卡菲分析研究了自工业革命以来,特别是20世纪中后期数字化以来的技术经济演绎脉络,预示了一个令人耳目一新的大趋势。如果说,肇始于18世纪的以蒸汽机技术为标志的工业革命,开启了突破人类和动物肌肉极限的“第一次机器革命”时代,实现了生产力的极大飞跃,“使得整个世界早期发展历史的所有剧本都显得拙劣无比”。那么,发端于20世纪中叶的以数字技术为代表的新一轮科技和产业变革,则意味着“第二次机器革命”时代的来临。在这个全新的时代里,人类将不再满足于肌肉力量的突破与超越,而是要进一步致力于大脑智慧的拓展与延伸,以创意和创新的力量,取代以往发展和增长的基本动能,进而实现“指数级增长、数字化进步和组合式创新”。

两位研究者的论断,乃是基于这样的现实:随着计算机硬件、软件、互联网、大数据等技术的迅猛发展和广泛应用,亦即数字化技术框架的基本成型,一个全新的基础环境和技术经济生态圈正在形成。在此背景下展开的包括3D打印、新能源、新材料、生物技术、环境保护等在内的产业革命,将不仅仅是单纯的科技、产业或者经济意义上的变革,也将对人们的思想观念、生产形态、生活方式、社会结构、人文心理甚至政治治理等产生广泛而深刻的影响。

从这个意义上说,从“第一次机器革命”到“第二次机器革命”,既是两个前后相继的历史阶段的接续,更是人类社会发展史上一次划时代的超越。

如果说,“第二次机器革命”为人类社会走出危机的阴影昭示了光明的前景,那么,与此同时,它也对“第一次机器革命”的种种极限提出了挑战。对于处在艰难转型期的中国来说,没有什么比抓住机遇、迎接挑战更为迫切的了。

挑战之一,就是要超越“消耗资源+牺牲环境”的增长极限。

人类身处不同的发展阶段时,依赖的主要资源也不相同。农业文明时期,人类主要依赖土地、水、生物、气候等自然资源。工业文明时期,化石能源、矿产资源和生物质资源等成为生产生活的主要对象和来源。而随着建立在现代科学技术基础上的工业化的不断深入,人类对自然资源索取的规模越来越大,效率越来越高,同时对自然生态环境的“祸害”也越来越重。久而久之,经济发展成为资源环境难以承受之重。进入21世纪,经济发展与资源环境承载能力之间的矛盾越演越烈,全球共同面临着资源能源、粮食与食品安全、人口健康、生态环境、气候变化等一系列严峻的挑战。

在此背景下,“第二次机器革命”的意义愈加显现:以对信息和智能的开发,代替对大自然的攫取,寻求创新、绿色、包容、可持续的发展。在这崭新的文明形态下,知识和信息将成为经济社会赖以发展的主要资源。知识和信息资源克服了自然物质资源的排他性和消耗性,能够为不同人群分享和使用,并且能够引导自然物质资源的永续利用。只有这样,方能够突破“第一次机器革命”的资源约束与增长极限,进入“天高任鸟飞,海阔凭鱼跃”的发展新天地。

挑战之二,就是要超越在“自然物质+传统大机器”生产方式下形成的思维与发展定式。

存在决定意识。由蒸汽机、钢铁、石油、电气化、重化工等一路走来的人们,难免会形成对“金属力量”的崇拜。在经济社会发展中,其具体表现就是重视工程项目、偏好规模经济、以外延式扩张寻求发展、惟GDP马首是瞻等。

然而,种种迹象显示,传统生产方式在尽享昔日风光后,已经步入“边际效益递减”的强弩之末。有学者研究推算出,2010~2013年,我国每增加1万元的GDP,就需要增加投放分别为1.67万元、2.57万元、2.65万元和3.25万元的广义货币。单位GDP增量所需增加投入的广义货币供应量越来越多。

进入“第二次机器革命”时代,“智慧力量”将更多地支配甚至取代“金属力量”。人脑智慧的开发延展,知识信息的聚合处理,新创意的融汇运用,数字技术与大规模机器生产的深度结合,正在给传统生产方式带来颠覆性的变化。在一些现代制造业和服务业公司,我们看到,通过整合应用硬件、软件、数据、网络、感应器等技术,实时采集、监控生产与服务过程中产生的海量数据,进行智能分析和决策优化,实现个性化设计、柔性化制造、网络化生产与服务……

我们习以为常的“存在”已变,与之相应的“意识”则亟待更新。新时代要求我们以全新的思维和眼光,重新审视和定义诸如“要素”、“生产”、“发展”、“GDP”等传统经济学概念。超越之后是坦途。当新的力量推动新的进步时,新的发展“红利”必将由此产生。

挑战之三,就是要超越一个个“利益中人”——现实中的你、我、他。

假如你是一个雄心勃勃、一心想建功立业的地方执政者,当你在大力开发矿藏以实现任内经济腾飞和留得“青山”给子孙后代的两难抉择中,你将怎样取舍?

假如你是一个手握重金的实业投资者,一边是可望在近期获取巨额利润却可能使青山绿水黯然失色的重工业项目,一边是投资回报期较长、生态与社会效益显著的环保工程,资本的天平将倾向何方?

假如你是一个具有一定经济实力且讲求生活品质的消费者,对诸如“为了减少碳足迹,请适度节制消费”之类的说教,能否听得进去并身体力行?

假如你是一个正在选择学业乃至就业方向的年轻人,你知道什么是“第二次机器革命”时代的“朝阳产业”和“夕阳产业”吗?

……

诸如此类的拷问,无异于向我们每一个人提出了这样的问题:面临“第二次机器革命”和由此开创的新纪元,你准备好了吗?如果还没准备好,推荐你读一读这本可能帮助你超越视野局限的书。它虽然是一部宏大叙事之作,但真的离我们很近。杜跃进《经济参考报》总编辑

中文版序

我们非常荣幸,也很高兴这本书能在中国出版。最近一些年,我们多次到访中国。像大部分到访者一样,我们对中国在众多领域变化的规模和速度惊叹不已。这个国家所完成的两大目标给人留下了深刻的印象。一是,在仅仅几十年时间里,中国已经从一个几乎不发达的国家转变成全球经济的引擎。中国的公司呈现出让人吃惊的增长速度,且正在主导越来越多的行业。二是,中国已经大幅度提升了国民的生活水平。数亿中国人已经摆脱了贫困,中产阶层也在增长,创新者和企业人士在一代人的时间里就实现了让人难以想象的成功。

我们把中国看作第一次机器革命时代一个最近成功的伟大典范。正像我们在这本书的第一章里所讨论的,第一次机器革命时代开始于以蒸汽机为特征的18世纪末期。紧接着,电动机、内燃机以及很多其他创新技术的出现,使人们克服了肌肉力量的限制。很多国家在中国之前掌握了第一次机器革命时代的工具和技术,但没有哪个国家能像中国一样,如此迅速地从中获得巨大的利益。

现在,我们又面临着一个非常重要的、让人深思的问题:哪些国家能够在第二次机器革命时代力拔头筹?正像我们所阐述的,这个时代不是以增强肌肉力量的机器为特征的,相反,它是以增强人类思维能力为特征的。人工智能、大数据、创新网络、高能机器人、3D打印机和基因技术已经在使工作岗位、公司和整个行业发生巨大的变化。而以上这些仅仅是第二次机器革命时代的最初产物,我们非常自信地认为,更多的新生事物将会纷纷到来。

我们也自信地认为,世界每个角落里的人们都会从第二次机器革命时代获益良多,因为在这个时代里,人们可以以更高的质量和更低的价格消费更大体量和更多种类的产品。事实上,在很多情况下,第二次机器革命时代的新产品和服务都是免费的。我们把“技术进步”这种幸福、美妙的现象称为“红利”,从娱乐到教育,再到健康护理……在任何方面,我们对这种红利都能感同身受。中国以及全世界的人们都可以从这种红利中获得充裕和富足。

然而,人们不仅仅是消费者,他们中的大多数也是劳动者。他们通过自己的劳动获得报酬。但正像我们所描述的,第二次机器革命时代给各行各业的很多劳动者都带来了挑战,因为现在数字化的机器已经掌握了很多过去只有人类才能掌握的技能。计算机和软件对知识类的工作已经做到驾轻就熟:倾听、理解、演讲、推理、写作以及模式识别等。而且机器人正在迅速掌握直立行走、操作目标对象和掌控人造环境的能力。

但我们讨论认为,这种进步所带来的重要影响不仅仅是使红利增加,同时也带来了各种分化:在高技能和低技能的劳动者之间,在资本和劳动力的回报之间,以及在超级明星和其他劳动者之间。这种分化在全球范围内都在增长:越来越多国家中产阶级的财富都在大幅缩水,社会的可流动性也越来越凝固,最富有的阶层和社会的其他阶层差距越拉越大。技术进步是带来这些变化的最大动力之一,而且未来这种动力会越来越强大。

可以说,第二次机器革命时代给我们带来了巨大的收益,但也给我们带来了巨大的挑战。在这个时代,最繁盛的国家将会是那些能够促进红利增长并能够使分化最小化的国家。在这本书的最后章节里,我们对如何做到最好提供了建议。

孔子教导我们“工欲善其事,必先利其器”。在好几个世纪里,中国人民都是创造强大的新工具和新技术的佼佼者。但在第一次机器革命时代,中国却没有成为领头羊。在第二次机器革命时代,中国能否重返霸主地位?中国有超过10亿的潜在创新者,这将是无与堪比的无价资源。中国正在提供巨大的教育机会,并且用数字化将他们连接在一起。

我们不知道这些努力将带来多大的成功,但我们知道一件事情:在第一次机器革命时代运转良好的策略,在第二次机器革命时代并不一定能够带来繁荣。在未来的技术竞赛中,最成功的国家将是那些积极变革并且能够跟上技术进步的国家。在这本书中,我们讨论了成功的国家将如何进行教育变革、培育企业家精神,如何在税务、管理制度、社会政策和文化规范以及很多其他根本性的方面进行变革。

在最近几十年里,中国已经展现出进行自身变革的令人艳羡的决心和意志,通向成功彼岸的道路已经铺就。我们希望这本书能够鼓舞并激励更多第二次机器革命时代所需要的变革。埃里克·布莱恩约弗森安德鲁·麦卡菲

第1章 最伟大的故事:时代的大画面

“技术是上帝的礼物——除了生命之外,它可能是上帝赐予人类最伟大的礼物。它是文明、艺术和科学之母。”——弗里曼·戴森(Freeman Dyson)美籍英裔数学物理学家、普林斯顿高等研究院教授

迄今为止,人类历史上最重要的发展和进步是什么?

任何对这一问题进行调查的人都知道,这是一个很难回答的问题。其中一个原因是,我们要考证“人类历史”究竟是什么时候开始的。早在大约6万年前,身体结构和行为举止接近现代人类并且拥有语言能力的智人就已经广泛分布在非洲大陆了。到公元前25000年,智人已经席卷尼安德特人和其他原始人类,在那之后,就没有大脑发达、能够直立行走的人种同智人竞争了。

我们可能会认为公元前25000年是一个开启人类足迹的合理时间点——如果不是冰川世纪的来临阻断了这一进程。人类历史学家伊恩·莫里斯(Ian Morris)在他的书《西方将主宰多久》(Why the West Rules-for Now)中,开始追踪公元前14000年以来的人类足迹——那时的世界已经明显地开始变暖了。

这一问题难以回答的另一个原因是,我们不清楚应该使用什么样的标准:一个真正重要的发展进程是如何构成的?从某种意义上讲,我们大多数人都会认为,一件大事或者某种增长、进步会大大改变世界的运行轨迹——是那种使人类历史的发展进程发生“转折”的事件。很多人认为,动物的驯养就是这类的事件,因为它是我们人类早期最重要的成就之一。

狗可能早在公元前14000年的时候就已经被驯养了,但马不是;8 000多年后人类才开始驯养马,并把它们关在畜栏里。牛也是在那个时候开始被驯养的(大约公元前6000年),并开始被套住犁地。役畜从单纯的驯养到用于农业劳作与生产,早在公元前8000年就已经开始了。

农业确保了充裕和可靠的食物来源,反过来又促进了人类的群居生活,最终,城市出现了。城市反过来又成为掠夺和统治的目标。因此,人类重要的发展进程应该包含伟大的战争行为和发动战争的帝国。蒙古帝国、罗马帝国、阿拉伯帝国和奥斯曼帝国——举这4个帝国就已经足矣,它们都极大地改变了世界;它们在一个广袤的区域内影响了帝国的臣民和商业的发展。

当然,一些重要的发展进程与动物、植物或者战争中的人们无关。哲学家卡尔·雅斯贝尔斯(Karl Jaspers)注意到,佛祖释迦牟尼(乔达摩·悉达多,公元前563—前483年)、孔子(公元前551—前479年)和苏格拉底(公元前469—前399年)所生活的年代都非常接近(但生活的地方不同)。雅斯贝尔斯分析认为,释迦牟尼、孔子和苏格拉底都是公元前800~前200年“轴心时代”(Axial Age)的核心思想家。雅斯贝尔斯把这个时代称作“一次深呼吸带来了最清醒的意识和观念”,他同时认为,在那个时代的思想家的熏陶下,三大主体文明——印度文明、中国文明和欧洲文明,也兴盛了起来。

就像释迦牟尼开创了世界最主要的宗教之一——佛教一样,人类共通的理念也推动了人类社会的主要发展进程,这包括印度教、犹太教、基督教和伊斯兰教这些主体信仰的产生。每一种宗教信仰都影响了数以亿计民众的生活福祉与人生信仰。

很多宗教思想和启示是以书面文字的形式传播的,这种书面文字本身就是人类历史的根本性创新。实际上,与其激烈地争辩文字书写是在什么时候、在哪里以及如何发明的,还不如保险一点地说,文字书写的历史起源于公元前3200年的美索不达米亚平原地区。书写符号又促进了那时计数方法的出现——但这不包括“零”的概念;我们现今的计数方法就是以那时的计数方法为基础的。现代计数系统,也就是我们称为阿拉伯数字的计数系统,起源于830年前后。

就这样,重要的社会发展进程不断出现。雅典人于公元前500年开始了民主进程。在14世纪四五十年代,黑死病使欧洲的人口锐减了至少30%,哥伦布则在1492年扬帆蓝色的大海,开始了沟通并改变新世界与旧世界的探险之旅。

一张图表的人类历史

那么,我们如何清晰地判断这些社会发展进程中,哪些是最重要的呢?可以说,上面所列的所有发展进程都有坚定的支持者——人们都习惯于以强有力的理由去证明一种社会发展进程的重要性要远远高于其他进程。在《西方将主宰多久》一书中,一个基本性的讨论摆在了伊恩·莫里斯的面前:任何对人类事件和社会发展进程的排列或者比较都是有意义的或者是合理的吗?很多人类学家和一些社会学家持否定的观点。但莫里斯却不赞同这些观点,他的书《西方将主宰多久》大胆地尝试量化人类的发展进程。正如他所写的:“把浩如烟海的史实证据缩减为简单的数字得分有其缺点,但也有一个很大的优点,就是可以让所有人面对相同的证据,并得出惊人的结果。”换句话说,如果我们想要知道哪些社会发展进程大大改变了人类历史的发展曲线,就要把这一发展曲线描绘出来。

在对“社会发展”(指的是一种掌控物质和知识环境的群体能力)这个词语进行数量化界定时,莫里斯做了很多认真而细致的工作。正像莫里斯所想象的,结果是令人吃惊的——事实上是让人大吃一惊。莫里斯研究的结果是,到此为止所有讨论过的发展进程都是无关紧要的,大大改变人类历史发展曲线的因素跟以前的研究结果大相径庭。这个图表(图1–1)如下。在这个图表上,全世界人口总数随着社会发展进程而变化的趋势也展现了出来。正像你所看到的,这两条线几乎是完全重合的。图1–1 从数据上看,人类历史的大部分时期都是让人乏味的

数千年以来,人类发展曲线一直呈现出平缓向上的趋势。社会的发展与进步极其缓慢,以至于几乎无法辨清。牲畜和农业、战争和帝国、哲学和宗教都没有发挥更大的影响力。但正好是在200多年以前的时候,剧变发生了,人口和社会发展使得人类历史的发展曲线几乎弯曲了90度。

进步的机器

到现在,你可能已经猜中了那是什么。摆在你面前的这本书是一本探讨技术发展对社会产生影响的书,因此,我们以这种方式开篇来阐述技术的重要性是一种颇具说服力的方式。图1–2中18世纪末期的突然转折,也与我们耳熟能详的社会大发展契合:工业革命开始了,它几乎集聚了机械工程、化学工业、冶金术以及其他行业所有的社会发展刺激因素。在这里,你很有可能会做出判断,这些技术发展推动了人类社会发展突然、快速而持续性的进步。图1–2 是什么大大改变了人类历史发展曲线?答案是工业革命

如果你这样认为的话,你的答案几乎就是对的了。而且我们甚至还可以更准确地判断出,哪一种技术是最重要的。这种技术就是蒸汽机,或者更准确地说,是18世纪后半叶,詹姆斯·瓦特以及他的伙伴们发明和改造的蒸汽机。

在瓦特之前,蒸汽机是非常低效的,它只能利用燃烧煤炭所产生的1%的能量。瓦特在1765~1776年发明的分离冷凝器把蒸汽机的热效率提高了3倍。正如莫里斯写道的,这是一项截然不同的发明:“虽然蒸汽革命用了几十年的时间才展现了出来……但它毫无疑问是整个人类历史上最大且最快的改变。”

当然,工业革命不仅仅只有蒸汽机,但是蒸汽机开启了工业革命的所有进程。它超越了所有的技术进步,克服了人类和动物肌肉力量的限制,让人类可以随心所欲地使用能源产生的动能。这一进程催生了工厂和大规模生产,铁路和大规模运输时代到来了。或者可以说,它开启了人类现代意义上的生产与生活。工业革命引领了人类第一次机器革命——我们的社会发展进程第一次主要由技术创新驱动,这一次机器革命堪称是我们整个世界最深刻的社会大转折。源源不断产生的机械动力如此重要,借用莫里斯的话说,它“使得整个世界早期发展历史的所有剧本都显得拙劣无比”。

现在,第二次机器革命时代到来了。就像蒸汽机及其他后来的技术发展克服并延展了肌肉力量一样,计算机和其他数字技术——那种用我们的大脑理解和塑造环境的能力,正在对金属力量做着同样的事情。这些新技术正在帮助我们突破以前的种种能力限制,并引领我们进入新的领域。这种变革的力量究竟是如何发挥出来的还是个未知数,但这场新的机器革命能否大大改变人类历史发展进程的曲线——就像瓦特发明的蒸汽机所做的那样,则是一件极其重要的大事情。这本书将会为你解释人类历史的发展进程是如何被大大改变的,以及这一切又为什么会发生。

到目前为止,一个非常简短且简单的答案是:金属力量。因为它能掌控我们的物质和知识环境,并且具备达成某些结果的能力,所以它对于社会发展和进步的重要性至少不低于我们的身体力量。因此,很多人对金属力量重要性的吹捧也达到了史无前例的程度,就像早前人们对身体力量的吹捧一样。

和数字技术握个手

我们之所以写作这本书,是因为我们非常迷惑。多年以来,我们一起在研究像计算机、软件和通信网络这样的数字技术对社会发展的影响力,并且认为,我们已经非常好地理解了数字技术所发挥的能量以及所限之处。但在过去的几年时间里,这些数字技术却开始让我们吃惊了。计算机开始诊断疾病,和人类进行听说交流,还能创作高水平的散文和诗歌,而机器人也开始围着仓储货柜忙个不停,自动驾驶汽车也可以在几乎不用导航的情况下畅行无阻。长期以来很多人一直忽略不计的数字技术,好像突然之间成为新的宠儿。这一切是如何发生的?这种发展与进步(既突如其来,又堪称一个社会发展进程)的意义是什么?

我们决定联合起来进行研究,看一看我们究竟能否回答这些问题。我们的研究与普通的商业、学术研究没有什么差别:阅读大量的论文和书籍,查找各类数据,详细讨论各种思想和假设。我们所做的这些都是必要的、有价值的,但真正的研究、真正有趣的事情,却是从我们真正进入这个数字技术的现实世界开始的。在这些过程中,我们与发明者、投资者、企业家、工程师、科学家以及很多从事技术研发和生产的各类人员不断地进行交流。

感谢他们的慷慨和大度,我们才得以在当前这个让人不可思议的数字创新环境中体验未来的技术成果。我们尝试了乘坐无人驾驶汽车,观看计算机在竞猜节目《危险边缘》中大胜哈佛大学和麻省理工学院的学生团队,抓住一台工业机器人的手腕并引领它行走,亲手感触一只用3D打印机打印出来的金属碗,当然还与各类技术进行了无数思维与心灵的交融。

我们在哪里

这些体验使我们得出三个结论。

第一个结论是,我们正生活在数字技术突飞猛进、让人目不暇接的时代——计算机硬件、软件和网络是其核心。实际上,这些技术并不是新生事物;计算机早在半个多世纪以前就已经应用于商业领域,《时代》杂志也早就宣称个人计算机是1982年的“年度机器”。但正像需要花费数代人的努力才能把蒸汽机提升到推动工业革命的程度一样,我们也需要花费很长时间去改造我们的数字机器。

我们将以生动的案例来阐释这些技术的强大动力为什么会实现以及是如何实现的。当然,这里所说的强大动力并不意味着这就是一种完美、成熟的动力。计算机的性能还将持续不断地提升,未来还将能做更多新的、前所未有的事情。我们在这里使用“强大动力”这个词语只是为了说明,数字技术的整个框架已经搭建完成,它将像蒸汽机一样对经济和社会产生重大而深远的影响。简而言之,因为计算机的出现,我们正处于一个重大变化的转折点上——人类历史发展进程的曲线得以发生急剧变化的转折点。我们正在进入第二次机器革命时代。

第二个结论是,由数字技术引领的这种变革将会给社会带来巨大的收益。我们正在进入一个截然不同的时代;这个时代将会更加绚烂多姿,因为我们能够消费的种类和体量都会大大增加。当我们以干巴巴的经济术语这样描述时,听起来好像没有多大的吸引力——毕竟谁想要一直消费个不停呢?但要知道,我们不仅仅消费卡路里和汽油,我们也从书籍和朋友中消费信息,从超级明星和业余爱好者那里获得娱乐消费,从教师和医生那里获取知识和技能,以及获得其他数不胜数的非原子世界的事物。技术能够给我们带来更多的选择,甚至是自由。

当这些事物被数字化的时候——它们可以被转化成比特储存在计算机里并被传送到网上时,它们就会获得一些奇异、让人吃惊不已的特性。你会发现,这些经过数字化的事物完全属于一种不同的经济学范畴,在这种经济学里,资源的充裕比稀缺还要正常。这里也正像我们将要阐述的,数字产品和物质产品是不同的,这种不同的特性非常重要。

当然,物质产品仍然重要,我们大多数人都希望在物质世界里拥有更多的种类、更好的质量以及更大的体量。比如,无论如何,我们都希望能够吃得更多、更好或者更丰富。无论如何,我们都想要燃烧更多的化石能源,都想要轻松愉快地到更多的地方旅行。计算机正在帮助我们实现这些目标——当然还有其他很多目标。数字化正在提升我们这个物质世界的运转特性,而且这些提升正在变得越来越重要。以上这些观点已经在经济历史学家那里形成了广泛的共识,正如哈佛大学经济学教授、知名经济学家马丁·韦茨曼(Martin Weitzman)所描述的:“一种成熟经济的长期增长是受技术进步与否支配的。”而正像我们将要展现的,当前的技术进步正在以指数级的方式发生。

第三个结论显得更悲观一些:数字化将给我们带来一些棘手的挑战。但这种挑战本身并不会让人太吃惊;即使对未来发展最有益处的技术进步也会给人带来不利的后果,这种后果也是可以有效应对的。工业革命也会同时伴随着伦敦上空弥漫的煤烟以及对童工令人发指的压榨。那么,这种技术进步后果的现代版本是什么呢?迅速发展的数字化可能带来的是经济的大分化而不是环境的大破坏,这一切源于一个事实,即计算机的性能和数字化技术会变得更加强大,公司对各类劳动者的需求将会大幅缩减。技术进步会把一些人抛在身后,而随着技术的不断进步,还会有更多的人被抛在后面。正像我们所要阐述的,拥有特殊技能的劳动者,或者接受过符合社会发展需求教育的人,将会迎来一个绝佳的机遇期,因为这些人能够利用手中所掌握的技术去创造和获取更多的价值。然而,对于那些仅仅掌握了“普通”技能而且各种能力平平的劳动者来说,这将是一个非常糟糕的时代,因为计算机、机器人和其他数字技术也正在以一种可怕的速度获取这些技能。

随着时间的推移,英国以及其他国家的人们总结道,工业革命的一些让人无法接受的后果经过一系列修复过程最终都消除了(民主政府和技术进步都有助于此)。童工在英国已经不复存在,伦敦空气中的烟尘和二氧化硫也比自16世纪末期以来的任何时候都更少了。数字化革命的挑战也可以被抹平,但首先我们应该清楚地知道这些挑战是什么。重要的是,我们要对第二次机器革命的消极后果进行探讨,并对如何削减这些后果进行对话。我们非常有信心地认为,这些消极后果并不是无法逾越的,但也是不会自我修复的。在接下来的章节里,我们会对这一重要议题提出我们的看法。

因此,这是一部展现第二次机器革命大画面的书——我们的经济和社会将会因为数字化的出现而发生重大转折。这是一个有着正确目标和方向的大转折——富足而不是稀缺,自由而不是束缚;当然也是会面临很多困难、挑战和选择的大转折。

这本书共分为三个部分。第一部分,跨度从第1~6章,描述了第二次机器革命的基本特征。这些章节提供了很多精彩的例子,用以阐明最新的技术进步——就像科幻小说所描述的那样,并且还解释了为什么它们现在会发生(毕竟,我们在几十年前就拥有了计算机),揭示了为什么我们对计算机、机器人和其他数字化工具给未来社会所带来的创新的规模和速度如此有信心。

第二部分,跨度从第7~11章,分析了数字化进程的两大经济后果,即红利和收入分化。红利指的是现代技术进步所提供事物体量的增大、种类的增长、质量的提升以及成本的下降。它是我们今天这个世界最令人振奋的经济新闻。然而收入分化并不是如此令人鼓舞;它所带来的经济成功将会制造很大的差异——涵盖财富、收入、灵活性以及其他衡量指标。技术进步的分化效应在最近一些年里一直在增长。并且出于很多原因,这是一个让人感到非常棘手的发展过程,如果我们不在第二次机器革命时期加以干预,这个过程还会加速发展。

最后一部分,跨度从第12~15章,探讨的是在这个时代里,什么样的干预是合适而且有效的。我们的经济目标应该是最大化地获得红利,削减收入分化所带来的负面效应。对于如何完成这些目标,我们将会提供一些建议——不论针对的是短期还是更长远的将来。未来,你会发现技术进步真的会把科幻小说所描绘的样子变成现实。正如我们在最后章节里所强调的那样,我们现在所做的选择将会决定我们的世界是什么样子的。

第2章 新机器时代的技能:技术超越一切

“任何足够先进的技术都称得上是魔力之源。”——阿瑟·C·克拉克(Arthur C.Clarke)英国科幻作家、发明家和未来学家

2012年夏,我们搭乘了一辆无人驾驶汽车。

那是在位于硅谷的Google总部做研究访问期间,我们搭上了其中一辆自动驾驶汽车——这辆汽车也是Google“私人司机”开发项目(Chauffeur Project)的一部分。开始时我们都坐在车后排,观察这辆无人驾驶汽车自动巡航,但Google的研发人员是不可能草率地就把驾驶座上明显没有驾驶员的车辆开上公路的。因为这样做有可能会让行人以及其他司机产生某种幻觉,或者会吸引警察的注意力。因此,只有我们坐在了后排座椅上,而Google项目组中的人坐在前排。

这时其中一位项目组人员按下了汽车上的一个按钮,把车辆转换成完全自动驾驶模式,于是,汽车开始在101国道上奔驰。而我们的好奇心也随之而来,当然也夹杂着些许的担惊受怕,因为101国道并不总是宁静平和、一路通畅的。虽然这条国道很平直,而且路况良好,但在大部分时间段里仍是拥挤不堪的,交通流量也毫无规律或规则可言。可以想象,在这种公路上行驶如果操作不当,带来的后果也是相当严重的。而且,由于我们当时的自动驾驶体验也属于“私人司机”开发项目实验的一部分,所以我们对这些后果的考虑突然之间超出了我们对智能技术的兴趣。

然而,车辆行驶得相当平顺。事实上,它让我们的驾驶行程乏味得很。车辆没有在其他车辆中间加速或穿插,整个驾驶过程就像我们在驾校里所接受的规范驾驶课程一样。在车辆行驶过程中,车里的一台笔记本计算机能够实时提供Google汽车所看到的一切——包括所有附近的物体和目标都能被车上的感应器察觉到。车辆能够察觉到其周围所有的车辆——不仅仅是距离最近的车辆,而且也能察觉到这些车辆的行驶轨迹。实际上,这是一辆没有任何视觉盲点的汽车。然而,汽车自动驾驶软件却能够辨识出由人驾驶的汽车有哪些盲点,车里的计算机屏幕上能够清晰地显示出这些盲点在哪里,并且能够有效地避开这些盲点。

在我们前面的车流完全停止时,我们只是盯着计算机屏幕——完全忽视了实际的路况。自动驾驶汽车这时根据前面的车辆行驶状况进行了平顺的制动,然后在与前车保持安全距离的地方停了下来。而在其他车辆开始行进时,它也随之跟进。在整个行驶过程中,坐在前排的Google项目开发人员始终谈笑风生,没有任何紧张气氛,或者说,事实上他们更感兴趣的是101国道上的实际路况。实际上,Google“私人司机”项目开发人员已经在这样的汽车里乘坐过数百个小时,他们完全有信心自动驾驶汽车能够有效地应对这种频繁启动的驾驶状况。等到我们的车开回停车场时,我们也和他们一样有信心了。

新新劳动分工

对于我们来说,那天在101国道上的乘坐体验尤其让我们感觉奇妙无比,因为就在几年前,我们还认为计算机技术根本无法实现汽车自动驾驶。那时,我们一些值得尊敬的同事(也是一流专家)所做的分析和研究报告都认为,在可以预见的未来,汽车驾驶这项技术还是必须由人类完成的。他们这些专家是如何做出这种结论的,以及像Google“私人司机”这类的技术项目是如何在几年之内就把这种结论推翻的,给我们在数字技术领域的进步提供了重要参考。

在2004年,弗兰克·列维(Frank Levy)和理查德·莫尼恩(Richard Murnane)出版了他们的书《新劳动分工》(The New Division of Labor)。他们所指的劳动分工存在于人类和数字劳动力之间。在任何理性的经济体系中,人们都应该专注于从事和计算机相比有相对优势的任务和工作,而让计算机从事更合适的工作。在他们的书中,列维和莫尼恩给我们提供了一种思考如何对工作进行分类的思路。

在100年前,我们前面所提到的图表没有任何意义——社会发展进程极其缓慢。因为那时,计算完全是靠人力的。实际上,“computer”这个词最初指的就是一种工作职务,并不是指一种机器。在20世纪初期,“computer”开始指代人,尤其是女性,她们整天不是计算就是列表。又过了几十年的时间,创新者们所设计出来的机器可以做更多的工作;它们一开始是机械的,后来是电子机械的,最终变成数字的。今天,已经极少有人再从事与计算和记录结果相关的工作了。即使是在最低工资水平的国家,也没有人力计算设备了,因为非人力的计算机运算速度更快,也更便宜,还更精确。

如果你查看或研究一下计算机的内部工作系统,你会发现,计算机不仅仅是数字计算器,它们还是数字和符号处理器。它们的电路系统能够识别和处理“0”和“1”所组成的语言体系,但同样对于“对”和“错”、“是”和“否”,或者其他数字系统,也是有效的。一般情况下,计算机能够做所有与符号相关的工作,从数学到逻辑,再到语言。但小说创作却无法数字化,因此所有排在小说畅销榜上的书还都是由人撰写的。当然,企业家和首席执行官们的工作,科学家、护士、饭店杂工的工作,以及很多其他种类的工作也是无法计算机化的。那么为什么不能呢?这种很难数字化的工作与以前的人力计算设备又有什么不同呢?

知识性工作的自动化

这些问题就是列维和莫尼恩在《新劳动分工》一书中试图回答的,最终,他们想出的答案意义非凡。两位作者把计算机的信息处理工作——所有知识性工作的基本框架,放在一个图谱中。在图谱的一端是类似于计算这类规则性的应用。由于计算机要按照一定的规则进行计算,它比较擅长做计算以及类似的工作。

列维和莫尼恩一直强调,其他类的知识性工作也可以规则化。比如,一个人的信贷评分是这个人能否偿还抵押贷款的重要衡量指标,而抵押贷款的金额与这个人的财富、收入和其他债务也关系密切。因此,是否能给一个人提供抵押贷款也可以被有效地归结为一种规则。

也就是说,抵押贷款的一条规则可以用文字这样表达:“如果一个人需要申请数额为‘M’的抵押贷款,就需要有‘V’或更高等级的信贷评分,其年收入也要超过‘I’这一数额或者其总的财富要超过‘W’,而且总的债务不能高于‘D’,如果这样,他的抵押贷款申请就能批准了。”当我们用计算机编码表示时,我们可以把这条抵押贷款规则称为计算程序。当然,这些计算程序是一种简化的程序,它们不可能也不会把任何东西都考虑进去。然而,计算程序可以涵盖最普通和最重要的任务,它们一般对预判投资回报率这类的任务非常擅长。因此,计算机能够用于对抵押贷款申请的批准。

模式识别:计算机与人的大脑有什么不同

在列维和莫尼恩图谱的另一端,是并不能简单地归结为信息处理任务的规则或计算程序。根据他们的想法,这些任务只有借助人的能力才能进行模式识别。我们的大脑非常擅长接收通过感知而获取的信息,而且还能够对信息进行检索以利于模式识别,但我们却极不擅长描述或计算我们是如何这样做的,尤其是当大量快速变化的信息以一种非常快的速度出现时。正如著名哲学家迈克尔·波兰尼(Michael Polanyi)所观察到的:“我们知道的总是比告诉别人的要多。”如果以上说法成立,那么根据列维和莫尼恩的说法,这类任务是不能够计算机化的,必须由人类来完成。他们举了一个驾驶员驾驶汽车的例子来说明这个问题。正像他们写道的:当驾驶员左转要违反信号灯时,他会面对一个由各种目标和声音组成的难以逾越的壁垒,包括迎面而来的车辆、交通信号灯、商店、广告牌、树木,以及交通警察。凭着他的驾驶知识,他必须准确地判断每一个目标的大小和位置,以及哪一个目标是危险的……卡车司机对自己所面临的情况要有一个整体的判断。但如果准确地把这种驾驶常识表述出来,并且以一种高度规则性的方式嵌入软件之中,从目前来看,是非常困难的……计算机是不能轻易代替人类的(尤其是像驾驶车辆这类的行为)。

人脑与计算机的区别不过如此

在2004年我们读到《新劳动分工》这本书的时候,我们对列维和莫尼恩的观点极其信服。那一年,我们对美国国防部高级研究局主办的无人驾驶汽车挑战赛的初步成就更为信服。

美国国防部高级研究局成立于1958年(与苏联的人造地球卫星计划遥相呼应),其主要任务是推进军事应用领域的科技进步。2002年,研究局宣布,它将举办第一届无人驾驶汽车挑战赛,这场比赛将在加利福尼亚州的莫哈维沙漠举办,届时所有完全无人驾驶的车辆都要完成150英里(1英里≈1.6千米)的赛程。15名在预赛中取得良好成绩的参赛选手将参加最后的角逐,赛事被安排在2004年3月13日。

但这次挑战赛的结果很让人气馁。有两辆汽车并没有到达赛车起跑区,其中一辆在起跑区就翻车了,3个小时过去了,只有4辆车还在参赛。最终的“获胜者”是卡内基–梅隆大学的代号为“沙漠风暴”的赛车,它跑了7.4英里(还不到总赛程的5%),最后由于急转弯撞在了一段路堤上而退出了比赛。最终比赛设立的100万奖金无人认领,《科技新时代》(Popular Science)杂志则把这次比赛戏称为“美国国防部高级研究局的沙漠大崩溃”。

然而,几年过去了,“沙漠大崩溃”却变成了“101国道上的乐趣”——我们之前体验过的。2010年10月,Google在其博客上公告称,它们的无人驾驶汽车可以在美国公路,甚至是高速公路上的车流中,做短暂行驶了。到我们2012年夏天亲身体验无人驾驶汽车行进时,Google“私人司机”研究项目已经拥有了一支小规模的车队,并且保持了数十万英里无人驾驶的行驶纪录——这期间只发生了两次交通事故。其中一次事故发生在一位驾驶员驾驶Google“私人司机”项目的车辆时,另一起事故则是该项目的一辆汽车在等红灯时被一辆由真人司机驾驶的汽车追尾了。当然,可以肯定地说,仍然有很多情况是Google汽车无法操控的,尤其是在复杂的城市交通环境中或者越野行驶的环境下,当然还有在Google地图上都无法精确标示的地点。但根据我们在101国道上的体验经历,我们相信Google汽车是能够轻松应对车辆日渐增多的日常行驶环境的。

可以说,仅仅在几年时间里,自动驾驶汽车就从科幻小说里的题材跃到了实际路况行驶之中。一边是一流的研究成果还在解释为什么自动驾驶技术不可能在这么短的时间内就能实现,而另一边是一流的科技手段却能在短短几年的时间里把这一切都变成了现实。这种科学和技术的飞跃式发展,仅仅在六七年的时间里就从“溃败”转向了“成功”。

自动驾驶汽车技术的飞速提升使我们想到了海明威对一个人走向破产的描述:“逐渐地,然后就是突然地。”然而,自动驾驶汽车并不是一种奇怪的事物,它们属于大规模爆发的新技术模式的一部分。实际上,一些技术进步缓慢发生很长时间了,这些技术进步覆盖了一些与计算机、机器人及其他数字化工具相关的挑战——是那些最久远、最难以逾越的挑战。然后在过去的几年里,突然出现了爆发,数字化工具开始突飞猛进,它们不仅可以驾轻就熟地完成各项以前无法胜任的任务,还能展示在一般人眼里任何时候都不会获得的技能。让我们一起看一下最近的让人吃惊的技术进步。

Siri:做最好的倾听者及说话者

除了模式识别,列维和莫尼恩还强调,在新劳动分工中,复杂沟通(complex communication)只能在人类中存在。他们写道:“一些重要的能够产生良好效果的沟通和交流,比如在教学、管理、销售和其他职业活动中,需要对大量的信息进行说明,并进行沟通和交流。在这些情况下,与一台计算机交流信息,而不是与另一个人交流信息,有一段很长的路要走。”

在2011年秋,苹果公司推介了其手机产品iPhone 4S独具特色的Siri(iPhone 4S的语音个人助理服务)语音控制功能,该功能由一个智能、私人助手通过自然语言使用界面来实现。也就是说,人们对这位“助手”讲话就像对另一个人讲话一样。基于Siri语音控制功能的软件,实际上来源于加利福尼亚研究机构斯坦福国际研究所,只是在2010年,苹果公司购买了这项技术。这种技术的使用者只要对着iPhone说话,手机听到后就会辨别出使用者想要做什么,然后采取行动,并以一种模拟的声音把结果反馈给使用者。

在Siri语音控制功能出现之后8个月,技术博客Gizmodo的凯尔·瓦格纳(Kyle Wagner)罗列出了Siri最有用的功能:“你可以问它现场比赛的得分——巨人队在比赛中得了多少分,或者关于每个参赛队员的得分情况。你可以通过OpenTable平台订餐,在Yelp网站上获得评分,询问当地剧院的电影放映信息并观看预告片。如果你很忙,无法接听电话,你可以让Siri提醒你随后把电话打过去。这些事情可能是我们每天都要碰到的,你会发现Siri的语音功能非常有用。”

Gizmodo的博客文章以提醒式的口吻结尾:“这些功能听起来非常酷,但你别忘了Siri的信条是:但愿它能真的有用。”在这一功能正式发布后,很多人发现苹果手机的智能私人助手并没有那么灵验。它有时候不理解使用者的问话,会提示使用者重复问话,有时向使用者提供的答案很奇怪或者不准确,有时它的回答就像:“真的很抱歉,我现在无法回答你的问题。请稍候再试。”分析师基恩·蒙斯特(Gene Munster)把Siri很难回答的问题归结了一下:1. 埃尔维斯埋葬在哪里?Siri的回应是:“我无法回答你的问题。”

因为其智能系统把这个人的名字理解为“埃尔维斯·埋葬”(Elvis Buried)。2. 电影《灰姑娘》什么时候放映?Siri的回应是在Yelp网站搜索到

一个同名的电影院。3. 哈雷彗星下一次什么时候出现?Siri的回应是:“你没有与哈雷的

约会安排。”4. 我想去苏必利尔湖。Siri则直接给你说出“苏必利尔湖X射线”(Lake Superior X-Ray)这家公司的名字。

Siri有时既离奇又让人困惑不解的回应已经众人皆知,但这项技术的发达程度也是不可否认的。有时候,它的确能给你精准的帮助。也是在那次自动驾驶体验的旅行过程中,我们很直观地看到了一点。当时是在旧金山的一次会议之后,我们驾驶着租来的汽车开往位于山景城的Google总部。我们的车上有一个便携式的GPS导航装置,但并没有插上接口、打开开关,因为我们认为能够顺利地抵达目的地。

但结果,我们失算了。出现在我们面前的是迷宫般的高架路、出口匝道以及城市街道,我们甚至连其中一条路的入口匝道都找不到。正当我们异常紧张、一筹莫展的时候,埃里克拿出了他的手机询问Siri:“101国道向南的行驶路径。”而手机的回应既迅捷又精确:手机屏幕指示的地图清晰地标示出我们的位置,同时说出了如何才能找到那个难找的匝道入口。

我们本来可以靠边停车,打开便携式GPS导航仪以追踪目的地,但我们并没有打算按照那种方式获取线路信息。我们想要的是说出问题,随后能够听见和看见(因为需要用到地图)回复。Siri能够提供我们一直在寻找的准确的自然语言界面。记得在2004年的时候,还有一篇对持续半个世纪的自动语音识别(自然语言处理系统的核心部分)研究进行的评论,这篇评论认为:“人类水平的语音识别被证明是一个难以达到的目标。”然而在不到10年的时间里,这个目标就已经基本实现了。苹果公司以及其他公司所开发的自然语言处理技术在数百万手机用户那里得到应用了。正像卡内基–梅隆大学机器学习系的主任汤姆·米切尔(Tom Mitchell)所说的:“我们正处在一个10年期的起点,在这10年时间里,我们的研究将从计算机不能理解语言过渡到计算机对语言驾轻就熟。”

流利的数字化:巴别鱼也能做翻译了

到现在为止,自然语言处理软件距离完美还很遥远,计算机还是不能够像人一样轻松应对复杂性沟通和交流,但它们一直在不断提升。在一些诸如两种语言之间的翻译任务中,都出现了很大的进展:虽然计算机的沟通和交流能力的深度要远远低于人类,但它们的广度要大得多。

一个能够讲一种语言以上的人通常可以在这两种语言之间进行精确地翻译。然而,虽然自动翻译服务很引人注目,却经常出错。即使你的法语很生疏,在翻译下面的句子时也可能要比Google翻译得更好:Monty Python’s ‘Dirty Hungarian Phrasebook’ sketch is one of their funniest ones(蒙提·派森的喜剧小品《肮脏的匈牙利常用语》是最搞笑的喜剧小品之一)。对于这一句,Google提供的法语翻译是:“Sketch des Monty Python ‘Phrasebook sale hongrois’ est l’un des plus drôles les leurs。”这句话的基本意思被翻译了出来,但存在着严重的语法错误。

对于一般人来讲,很少能有机会把一个句子翻译成匈牙利语、阿拉伯语、汉语、俄语、挪威语、马来语、依地语、斯瓦西里语、世界语,或者其他60多种语言。但Google翻译系统就可以瞬间免费地把翻译结果呈现在网页上。智能手机上的应用翻译软件可以轻松接收使用者说出的至少15种语言,然后经过合成,翻译出来这15种语言的一大半。我们可以非常自信地说,即使世界上最富有语言天赋的人也无法与之匹敌。

多年以来,即时翻译系统还一直是科幻小说描述的对象[给人印象深刻的是《银河系漫游指南》(The Hitchhiker's Guide to the Galaxy)中的“万能翻译器”巴别鱼(Babel Fish),这个奇怪的小生灵一旦被放入人的耳朵里就能让人听懂任何语言]。但在今天,类似Google这样的翻译系统就已经把这一切变成了现实。事实上,莱博智翻译服务公司已经与IBM合作,开发出了GeoFluent(一款机械翻译软件)机器翻译系统,这种翻译系统采用在线应用模式,能够实时翻译不同语言环境下客户和客服人员之间的对话。在初始体验中,约有90%的GeoFluent机器翻译系统用户反映该系统能够有效应对商业需求。

超级计算机与人的对决

现在,在人类自己发明的游戏比赛中,计算机通过模式匹配与复杂沟通的整合可以很容易地就能击败人类。在2011年2月14日和15日的智力竞猜电视游戏节目《危险边缘》中就有一个非人类的参赛选手。这名参赛选手就是一台名叫“沃森”的超级计算机,它是由IBM专门研发出来用于游戏比赛的(其名字“沃森”即是为了纪念IBM的传奇人物、首席执行官托马斯·沃森先生而命名的)。《危险边缘》首次登场是在1964年。在2012年,这档节目在美国综合性的电视节目中排名第5。在那一天,大约有700万人观看了那期节目。在节目中,主持人亚历克斯·特雷贝克(Alex Trebek)针对各种话题提出了问题,参赛选手则进行了抢答。

这个节目之所以备受欢迎且经久不衰主要是因为,它的问题很好理解,但很难回答好。在一些既定的场景中,几乎每个人都知道问题的答案,但很少有人能够知道所有的答案。问题涵盖的话题非常广泛,而且在开始之前不会有人告诉参赛者比赛的话题。在节目进行中,参赛选手必须同时做到迅速、大胆和精确。迅速是因为他们必须相互竞争以获得回答每一个问题的机会;大胆是因为他们必须努力回答许多问题,尤其是比较难的问题,这样才有可能积攒足够多的金钱以赢得比赛;精确是因为对于每一个错误的答案,都要从中扣减金钱。《危险边缘》节目的制作人会使用双关语、押韵词以及其他文字游戏来挑战参赛者。例如,一个问题的提示语可能会问道:“一个与NBA国王队所在的城市押韵的词,并且能使你想起过去。”如果想正确地回答出这个问题,参赛选手就要明白缩写字母“NBA”代表的是什么[在这个问题中,它指的是“National Basketball Association”(美国篮球职业联赛),而不是“National Bank Act”(国家银行法),更不是化学复合物“n-Butylamine”(正丁胺)],而NBA国王队是萨克拉门托市(Sacremento)的一支球队,提示语提示要与“Sacremento”押韵,还能让人想起过去,那么这一问题的答案应该是:“What is a Sacramento memento?”(萨克拉门托市的纪念品是什么),而不是“Sacramento souvenir”,更不是其他答案。要想正确地回答这些问题就需要熟练地掌握模式匹配和复杂沟通,而要赢得《危险边缘》的比赛就需要反复地、精确地并且几乎是同时去做这两件事。

在2011年的这场比赛中,与“沃森”展开竞争的是肯·詹宁斯(Ken Jennings)和布拉德·鲁特(Brad Rutter),而他们两位都是这种比赛中最出色的选手。詹宁斯在2004年的《危险边缘》游戏比赛中曾经创纪录地连赢74场,将317万美元的奖金收入囊中,并成为名噪一时的民间英雄人物。实际上,正是由于詹宁斯才催生了“沃森”。根据一则在IBM广为流传的故事,2004年秋日的一天晚上,IBM一位专注于推动人工智能研发的研究部经理查尔斯·利克尔(Charles Lickel)正在纽约州的费西基尔一间牛排餐厅吃晚饭。刚到晚上7点钟的时候,他就注意到,与他一起吃晚饭的同事都起身去了附近的一家酒吧。随后,他也紧跟着过去想一探究竟,他看到的场景是,他的同事们都围坐在酒吧的电视机前观看詹宁斯在《危险边缘》游戏中突破55场连胜纪录的比赛。利克尔想,如果詹宁斯和超级计算机在比赛中一决高下肯定会备受关注,同时也可以验证计算机的模式匹配和复杂沟通能力。《危险边缘》是一场三方的比赛,布拉德·鲁特则是另一个天才般的选手,他在2005年的联赛中击败了詹宁斯,从而赢取了超过340万美元的奖金。鲁特和詹宁斯两个人能够掌握各个领域的各类信息,并且对游戏的特点和过程非常熟悉,也能够从容应对压力。

可以说,布拉德和鲁特是那种任何机器都很难打败的选手,因此第一代“沃森”远远不是他们的对手。“沃森”要么被程序设计人员调整得在回答问题时过于积极(因此,它的很多回答都是错误的),要么被调整得太过于保守、太精确。2006年12月,这项设计工程开始后不久,当“沃森”被调整到在70%的时间里都要回答问题时(这种调整方式是相当激进的),它回答正确的比例仅仅占到全部时间的15%。詹宁斯则形成了鲜明的对比,当他有70%的时间按下抢答器进行抢答时,他的答案90%都是正确的。

但“沃森”毕竟是个快速的“学习型”选手——超级计算机在积极性和精确性这两个方面的平衡迅速提升。到2010年10月的时候,“沃森”就能积极地抢答70%的模拟比赛题了,而且其回答正确率也提高到了80%。这种提升是很明显的,但它还是无法与人类最出色的选手相抗衡。“沃森”团队一直研发到2011年1月中旬,因为2月就要录制电视比赛了,但这时也没有人知道,他们创造的这个机器在对抗詹宁斯和鲁特时表现如何。

最终的结果是,“沃森”完胜了他们。它回答正确的问题所涉及的话题从“奥林匹克怪事”(Olympic Oddities,即在1976年举行的蒙特利尔冬季奥运会的“五项全能”比赛中,因一名运动员用金属线连接重剑上的一个隐秘按钮,致使没有击中对手就能得分)到“教堂和国家”[Church and State,要意识到答案必须包含这两个词中的其中一个,当提出的问题是“它意味着思维的慢慢发展或者怀孕”,计算机的回答是“孕育”(gestate,这个词里包含“state”这个词)]。虽然超级计算机并不完美[例如,当被问到关于“时尚优雅”或者“在同一年全部毕业的学生们”作为“分类”的“另一层意思”的一部分时,它的回答是“时髦”(chic),而不是“班级”(class,这个词也有“分类”、“出色”之意)],但它仍是很优秀的。“沃森”的行动也是非常迅速的,它能够在詹宁斯和鲁特之前不断地进行抢答,以获得回答问题的机会。例如,在两场比赛的第一回合中,“沃森”首先就得到了43次抢答机会,而它答对的次数是38次。而在同一场比赛中,詹宁斯和鲁特两个人加在一起仅仅抢答了33次。

在为期两天的比赛结束的时候,“沃森”已经积攒了77147美元,是鲁特的3倍还多。詹宁斯紧随鲁特之后,他给最后比赛问题的答案还增加了一个个人声明:“我个人热烈欢迎新一代计算机来到我们这个世界。”他后来解释说:“正如20世纪工厂里的工作机会被新的机器人产品线代替一样,布拉德和我作为知识领域的工人也被新一代 ‘思考’的机器代替了。‘猜谜游戏节目参赛者’可能是‘沃森’替代的第一批工作者,但我敢确定这不是要替代的最后的工作者。”

机器人进步的悖论

数字化技术进步最新的一个重要发展阶段集中在机器人领域——制造穿梭于工厂、仓库、战场和办公室这些物质世界里,并能同这个物质世界融合在一起的机器人。在这里我们所看到的进步也是逐渐地,然后就是突然爆发。“robot” (机器人)这个词进入英语语言是通过1921年捷克作家卡雷尔·恰佩克(Karel Capek)的戏剧《R.U.R.》(Rossum’s Universal Robots,即《罗素姆万能机器人》),在那之后,机器人就成为人类迷恋的对象。在大萧条期间,杂志和报纸的故事都在渲染机器人能够发动战争、引发犯罪、让工人失业,甚至能够击败拳击手杰克·登普西(Jack Dempsey)。艾萨克·阿西莫夫(Isaac Asimov)在1941年造出了“robotics”这个词,并且在第二年制定了“机器人学三法则”以规范机器人的基本规则:1.机器人不得伤害人,也不得见人受到伤害而袖手旁观。2.机器人应服从人的一切命令,但不得违反第一定律。3.机器人应保护自身的安全,但不得违反第一、第二定律。

阿西莫夫对科幻小说和现实世界的机器人制造所产生的巨大影响力持续了70年,但科幻小说要比现实世界中的机器人走得更远。科幻小说给我们塑造了健谈而忠诚的R2–D2和C–3PO;还有《太空堡垒卡拉狄加》(Battlestar Galactica’s)中邪恶的机器人Cylons,《终结者》(Terminator)中可怕的机器人,以及各种机器人偶、电子人、复制杀人魔等。对比一下,在现实世界中,数十年的机器人研究也催生了日本本田公司的阿西莫。阿西莫是类人型机器人,但在其中一次演示中它却破坏了阿西莫夫的机器人第三法则。在2006年对现场观众的一次演示中,阿西莫尝试着走上在舞台中搭设的飞机梯架。当它走到第三步的时候,阿西莫的膝盖发生了弯曲,向后摔了下去,面板着地,重重地跌落在地面上。

之后,阿西莫恢复了状态,可以演示像上下楼梯、踢足球以及跳舞这样的活动了,但它的缺陷也说明了一个基本的事实:在物质世界中,人类能做的很多容易而自然的事情对机器人来说是很难完成的。正像机器人研究专家汉斯·莫拉维克(Hans Moravec)所观察到的:“如果让计算机展示成人水平的智力测验或者玩跳棋是一件相对容易的事情,但当涉及知觉和机动性时,即使让计算机完成一岁幼儿的某些技能也是非常困难或者不可能的。”

这种情形所描绘的就是被人们熟知的莫拉维克悖论,维基百科对此进行了恰当的总结:“莫拉维克悖论,是人工智能和机器人研究领域有别于传统假设的重要发现,其含义是高层次的推理几乎不需要计算,但低层次的感觉运动技能则需要大量的计算。”莫拉维克的洞察极其准确,且意义重大。正像认知科学家史蒂芬·平克(Steven Pinker)所评论的:“对人工智能35年的研究所得到的一个主要教训是,难的问题很容易,容易的问题很难……当新一代的智能设备出现的时候,股票分析师、石油工程师和假释委员会成员的工作机会将最有可能被机器代替。但园艺师、接待员以及厨师在未来的几十年里丝毫不用为自己的工作机会操心。”

平克的观点是,即使是机器人研究专家也很难设计和制造出在技能方面能与笨拙的手工工人相提并论的机器,例如,机器人吸尘器就无法完成一位女佣的所有工作——它只会用真空吸尘器清扫地板。机器人吸尘器的销售已经超过了1 000万台,但没有任何一台能够把咖啡桌上的杂志整理好。

在实际的物质世界工作时,和机器相比,人类也拥有巨大的灵活性优势。一些单一的自动操作工作,比如把金属丝焊接到电路板上或者用螺丝钉把两个零件固定在一起,是非常容易的事情,但这种工作必须保持时间的持续性,并且要在一定“规则”的环境中完成。例如,电路板的排列方向每次必须保持同一方向。公司购买专业化机器来完成这些工作,必须让工程师给它们设计程序,并进行相关测试,然后才能把它们配置在装配线上工作。每次的任务变化——比如螺丝孔每次移动变化,生产流程就必须停下来直到完成程序的重新设定。今天的工厂,尤其是高工资国家的大型工厂,都已经是高度自动化了,但这些工厂里多种用途的机器人也不是很多。这些工厂里更多的是价格昂贵且装配及改装成本都不菲的专业化机器。

工厂自动化的再思考

iRobot(机器人产品与技术专业研发公司)公司的合伙创办人罗德尼·布鲁克斯(Rodney Brooks)注意到了在高度自动化的现代工厂车间里所发生的事情:工人很少,但也不是找不到。这些工人所做的很多工作都是重复的且无意识的。例如,在一条封装软糖糖罐的产品流水线上,机器把一定量的软糖装进每个糖罐里,然后旋上罐盖,再贴上标签,但这需要工人把空的糖罐放置到传送带上才能开始整个封装流程。为什么这一步骤不能自动化呢?因为在这种情况下,糖罐是用纸板箱装着,每次12个放置到传送带上的,在这一过程中,所放糖罐的位置并不需要完全固定不变。这种不需要“太精准”的操作模式对工人来说是没有任何问题的(工人只需要看到箱子里的糖罐,然后把它们拿起来,扔到传送带上就可以了),但传统的工业自动化对于操作像糖罐这类不需要每次都放在同一位置上的产品流程是有着很大困难的。

2008年,布鲁克斯创建了一家新公司——Rethink Robotics公司,以开拓和研发非传统性的工业自动化设备:就像能够封装软糖糖罐的机器人,用以完成今天工厂里由人工完成的不需要准确操作的工作和任务。他的理想是,在这一领域对莫拉维克悖论有所突破。布鲁克斯预想的是,创造出不需要高额报酬工程师调试程序的机器人。这样的机器人在工厂车间工人的“教导”下就能完成某种任务(或者再“教导”一次又能完成新的任务)——每一名工人在不到一个小时的时间里就能学会如何教导他们的机器人“同事”完成任务。布鲁克斯的机器也很廉价,大约两万美元就能买到一台,其花费仅相当于现在工业机器人的一小部分。在Rethink Robotics公司宣布其第一条机器人(Baxter)产品线下线之前,我们有幸抢先目睹了这个庞然大物。布鲁克斯邀请我们去其公司位于波士顿的总部参观这种自动化机器人,并且观看它们能够做些什么。

Baxter是那种很容易辨识的人形机器人。它有两只结实的手臂,每只手臂都有关节相连,手的形状则像爪子一样;然后就是躯干部分;而头部则有一张液晶显示屏的脸,整个头部也能转向观察到离它最近的人。虽然Baxter没有腿,但Rethink Robotics公司还是跨越了自由移动所带来的巨大挑战,在Baxter上装配了轮子,这样在工人的帮助下它就能从一个地方移动到另一个地方。公司的分析报告声称,即使Baxter依靠自己的力量无法移动,也不会妨碍它能做很多有用的工作。

指导Baxter工作时,你需要抓住它的手腕,操纵它的手臂,引导它按照你想要的方向移动。当你做这些的时候,它的手臂好像没有任何重量,那是因为它的动力系统已经开始运转,你不需要费多大力气。Baxter的安全性还是很可靠的,它的两只手臂不会碰撞在一起(如果你硬要这样做,它的动力系统会抵制你),而且如果它能感觉到有人在其周边附近,就会自动地把步调慢下来。Baxter的这些以及其他设计特征,使得人们与这种机器人一起工作时会始终处于一种直觉、自然而且没有任何威胁的体验状态之中。当我们第一次接触Baxter时,我们对于机器人能够触摸到我们的脸也感到相当紧张,但这种恐惧心理很快就消失得无影无踪了,取而代之的是极大的好奇心。

在公司的演示区,布鲁克斯向我们演示了几台Baxter是如何工作的。这些机器人正在让莫拉维克悖论完全失效——它们能感知并且能够用“手”操纵从手柄到吸着杯等各种不同的零部件。机器人虽然不像一位熟练、全速操作的工人那样快速与流畅,但机器人未必需要这样做。因为工厂里的大部分传送带和装配线并不需要总是全速运转,如果这样,即使是工人也会疲惫不堪。

相比人工,Baxter有一些明显的优势。它能全天工作,并不需要睡眠、午餐或者喝咖啡的时间。它也不需要让雇主给它提供健康体检,更不会给雇主带来额外的工资税负担。而且Baxter还可以同时做两件根本不相关的事情,因为它的两只手臂是可以分别完成操作的。

你身边的装配线、仓储地、走廊:机器人很快就要到来了

在参观Rethink Robotics公司并观看Baxter操作演示之后,我们理解了为什么得州仪器公司的副总裁雷米·艾尔–库赞(Remi El-Ouazzane)在2012年年初说:“我们非常坚定地认为,机器人市场爆发的节点马上就要到来了。”实际上,已经有很多证据支持他的观点了。有不少公司所使用的机器人的数量和种类都在迅速增长,创新者和企业家们最近也一直在冲破莫拉维克悖论的羁绊。

波士顿地区的另一家公司Kiva(自动化物流公司),也在使用机器人在仓库里安全、快捷、高效地搬运货品。Kiva公司的机器人看起来像金属的脚凳或者像压扁的R2–D2。这些只有大约齐膝高的机器人穿梭于各个建筑物之间,巧妙地搬运货品,并能灵活地避开工人以及彼此的碰撞。由于它们体型较小,能贴地而行,所以很容易钻到货架下面,然后把货架举起,搬运到工人那里。在工人们把所需的货品取走之后,机器人就会把货架迅速移开,另一台承载着货架的机器人则随后而至。计算机软件系统能够跟踪仓储地所有的产品、货架、机器人和工人,它可以高效地协调Kiva公司的机器人不断地灵活运转。2012年3月,Kiva公司被业内领先的仓储物流公司——亚马逊公司,以7.5亿美元的价格收购。

波士顿动力公司也是一家以美国新英格兰地区为基地的创业公司,它也抓住了莫拉维克悖论的致命弱点。这家公司所制造的机器人主要是为美国军方服务的,因此,这些机器人能够在不平坦的地面上载重而行。这家公司的大狗机器人看上去就像一只长着细长腿的金属大驯犬,它能够攀爬陡峭的山岭,在冰上滑倒也能再次站立,当然还能像狗一样做其他的事情。大狗机器人能够利用四个支点平衡载重,而且还能在颠簸不平的地面上走动,这的确是机械制造领域的一个大难题,但波士顿动力公司却在这方面取得了巨大的进步。

我们要举的最后一个最近机器人进步的例子是Double机器人,它与大狗机器人有着很大的不同。Double机器人并不是要在敌人的阵地上奔跑,它是可以在卧室地毯上和医院走廊里来回溜达并且安装了一部iPad的机器人。它就像一只底下安装了移动轮子的倒转过来的钟摆,还像一块用一根一米多长的支架支撑起来的写字板。Double机器人支持远程操控,它能够帮助操作者“步行”至很远的楼层里“看一看”、“听一听”那里发生了什么事。摄像头、麦克风和iPad的屏幕就像是操作者的眼睛、耳朵和脸,iPad能看到、听到的一切,操作者也能看到和听到。Double机器人本身能够行走,所以它能够遵照操作者的指令有效地传达各种信息。Double机器人公司把它称作“你并不需要飞到世界的哪个地方,就可以依靠它以最简单的、最优雅的方式把那个地方的事情呈现出来”。第一批Double机器人的价格是2 499美元,在2012年秋季这项技术被宣布之后,很快就被抢购一空。

我们预测,下一轮的机器人创新可能会给莫拉维克悖论带来最致命的打击。2012年,美国国防部高级研究局宣布了另一项挑战赛,这一次不是自动驾驶汽车,而是自动机器人。美国国防部高级研究局机器人挑战赛集聚了工具使用、机动性、感知、远程操控以及其他一些机器人领域长期就有的挑战活动。挑战赛代理机构战术科技办公室的网站公布了挑战赛的一些情况:美国国防部高级研究局机器人挑战赛首要的技术目标是,研发能够在危险、恶劣、人与机械工程共存的环境中执行复杂任务的地面机器人。机器人挑战赛的参赛者应该聚焦于能够使用标准化工具和设备的机器人——这些标准化工具和设备都是在人工环境下普遍使用的。参赛的机器人使用的工具范围包括从手动工具到车辆,而且还要能使用不同规格的工具。

通过机器人挑战赛,美国国防部高级研究局希望机器人研发机构能够在2014年年底制造并演示具备高级功能的人形机器人。根据战术科学办公室开始时的详细阐述,机器人将不仅能够驾驶可移动的车辆、清除阻塞在路口的废料残骸,还要能攀爬梯架、关闭阀门以及更换水泵。这些要求看起来是很难完成的,但我们对研发人员有着百倍的信心,相信他们能够巧妙地应对机器人挑战赛中的各种挑战。实际上,很多人已经看到,2004年的挑战赛就已经推动了自动驾驶汽车领域的技术进步。同时,机器人挑战赛也将是一次让我们摆脱莫拉维克悖论困扰的绝佳机会。

我们正处在一个重大转折点上

在过去的几年时间里,自动驾驶汽车、在《危险边缘》游戏节目获胜的超级计算机以及很多用途广泛的机器人都进入了人们的视野。这些创新的技术绝不仅仅是实验室里的演示品,它们在这个真实世界中已经展现出了技能和能力。它们的出现也预示着我们正在进入一个转折点——发展曲线就将出现重大弯曲的转折点。在这个转折点上,以前我们只能在科幻小说里才能看到的技术已经变成了现实。随着更多科技产品的问世,我们对技术进步的印记会越来越深刻。

在《星际迷航》(Star Trek)电视系列节目中,有个叫“三录仪”的设备被用于浏览和记录三种数据:地形数据、气象数据、医疗数据。而实际上,今天我们手中的智能手机就已经具备了这些功能;它们能像测震仪、实时天气雷达地图以及心脏和呼吸记录仪一样发挥功能和作用。当然,智能手机不仅限于这些功能,它们还可以充当多媒体播放机、游戏平台、工具书、照相机和GPS设备。在《星际迷航》中,三录仪和私人通信设备是分开的,但在现实世界中,这两大功能已经在智能手机里融为一体。即使我们处于移动状态,智能手机也能够同时接收和发送大量的数据信息。这种技术的进步给我们提供了大量的创新机会,正像风险投资家约翰·杜尔(John Doerr)所说的“SoLoMo”[社交(social)+本地化(local)+移动(mobile)]。

我们知道,有史以来,计算机都写不出什么像样的文章。虽然最近计算机能够写出一些符合语法习惯的句子,但这些句子都是没有任何意义的——不过这种事情免不了会被恶作剧者大肆借用一番。比如在2008年,计算机科学与软件工程国际大会接收了一篇名为“电子商务模拟研究”(Towards the Simulation of E-commerce)的论文之后,决定邀请这篇论文的作者参会。而实际这篇论文的作者是“SCIgen”,来源于麻省理工学院计算机科学与人工智能实验室的“随机生成计算机科学研究论文”项目。SCIgen的发明者写道:“我们的目的是达到最大的娱乐效果,而不在于写出连贯的文章。”但在读了《电子商务模拟研究》这篇文章的摘要之后,你就发现难以与他们争辩了:最近在合作技术和传统交流方式上的进步完全基于互联网和主动网络与面向对象的语言是不冲突的这种假设。事实上,很少有信息理论人士会赞同可视化的分布式哈希表,虽然它能够改善并可能模拟实际的8位架构——体现了电子工程引人注目的原则。

虽然最近的研究显示,并不是所有由计算机生成的文章都是毫无意义的。Forbes(福布斯)网站与Narrative Science公司(一家智能软件写作公司)合作,让这家公司负责撰写公司收益预览,Forbes网站会把这些预览放在网站上。预览所使用的数据和材料都由一定的运算法则计算得出,人不会参与其中,不过,最后形成的预览与人的分析几乎是毫无差别的:福布斯收益预览:亨氏公司第一季度收益报告的发布把亨氏公司的股价推高到52周新高,这一价格仅比亨氏公司2012年8月29日星期三收益发布的具有里程碑意义的股价低49美分。华尔街收益评估网预测的收益是每股80美分,比上一年提高了2.6%——亨氏公司当时所公布的收益是每股78美分。华尔街收益评估网评估认为,亨氏公司的收益在过去的数月里一直没有变化,但它已经比三个月之前有所下跌,当时的收益是每股82美分。分析人士预测,亨氏公司这个财政年度的收益能够达到每股3.52美元。而分析报告显示,亨氏公司去年一季度收益是28.5亿美元,今年是28.4亿美元,同比下降了约0.3%。对于今年来说,其全年收益预计能达到118.2亿美元。

即使是计算机外围的设备,比如打印机,也正在取得巨大的技术进步——那些在科幻小说里才能看到的一切都变成了现实。和把墨直接喷在打印纸上的传统打印方法不同,现在的3D打印机可以用塑料、金属和其他材料进行复杂的3D打印。3D打印也被称为“增材制造”,它利用了计算机打印原理:打印机要把一层很薄的材料(传统上是打印墨)喷洒在打印介质(比如纸张)上,然后通过计算机的打印模式进行打印。

技术创新者推理认为,打印机打印时完全可以把一层打印材料叠加在另一层上。和传统的打印墨不同,3D打印机可以使用像液体塑胶一样的材料——要使用紫外光进行固化。每一层材料都很薄——大约是1/10毫米,但经过多层打印,一个3D物品就成形了。使用这种打印成形技术,有的形状的打印是很复杂的,因为一些形状中间会有孔洞,甚至各个部件还是彼此分离的。在业界领先的设计软件公司欧特克公司位于旧金山的总部,我们亲自操作了一个可调式扳钳的打印过程,当然是整体打印,不需要组装。

这个扳钳是由塑料打印而成的演示产品——但3D打印机也可以使用金属进行打印。欧特克公司的首席执行官卡尔·巴斯(Carl Bass)是增材制造这个迅速发展领域的爱好者和实践者。我们在他的公司展厅进行参观时,看到了陈列柜里展示的各种各样的产品和项目,他还向我们展示了一只由他在计算机上设计并用3D打印机打印出来的漂亮的金属碗。这只碗的边上还有精心绘制的格子图案。巴斯说,他问过参与过金属加工生产的一些朋友——有雕刻师、钢铁厂工人和焊接工等,这只碗是如何制作出来的。他们之中没有人能够说出这种格子是如何做出来的。答案是,通过激光技术熔化金属粉末,然后喷洒在每一层上就成形了。

今天的3D打印技术并不仅仅用于制造像巴斯的金属碗这样的东西。现在,3D打印已经被无数公司用于打印原型产品和模型部件。它还被用于很多终端零部件——从塑料排气孔到美国航空航天局下一代月球车,再到83岁妇女的人造金属下颌骨。在不远的将来,3D打印机甚至可以现场实时为有缺陷的发动机打印可替换的零部件——而不是让零部件堆放在仓库里。甚至一些实验性项目也表明,未来的3D打印技术将会被用于打印混凝土房屋。

我们在这一章里所描述的大部分技术创新都发生在最近这几年的时间里。这些创新都发生在长期以来一直缓慢发展和提升的领域,在这些领域,最出色的研究思想总是认为,技术的发展不可能突飞猛进。但数字技术却在长时期缓慢发展之后突然出现了迸发,而且这种迸发出现在多个领域,从人工智能到自动驾驶汽车,再到机器人的崛起。

这一切是如何发生的?这是一次侥幸的成功吗?难道是诸多幸运的机遇汇合在一起,然后在同一个时间内瞬时爆发?很显然,情况并不是这样的。我们最近所看到的数字技术的进步确实令人印象深刻,但它仅仅是接下来将要发生的技术变革的一小部分。这是第二次机器革命时代的黎明。要想了解现在的这一切是如何发生的,我们需要了解在数字硬件、软件和网络领域技术进步的性质。尤其是,我们需要了解数字技术进步的三个主要特征:指数化、数字化和组合化。在接下来的三个章节里,我们将依次分别探讨这些内容。

第3章 摩尔定律和棋盘的另一半

“人类最大的缺点是无法理解指数函数。”——阿尔伯特·A·巴特利特(Albert A.Bartlett)美国科罗拉多大学物理学荣誉教授

虽然戈登·摩尔(Gordon Moore)是英特尔公司的共同创始人、最慷慨的慈善家以及总统自由勋章获得者,但他最为人熟知的是他在1965年所做的一个几乎是题外话的预测。摩尔当时是仙童半导体公司的工程师,他应《电子学》杂志的邀请,写了一篇名为“让集成电路填满更多元件”(Cramming More Components onto Integrated Circuits)的文章。在那时,这种形式的集成电路——在一个主要由硅元素构成的单块芯片上集合了各种各样的电子元件,出现还不到10年时间,但摩尔却看到了这种发展的潜力。他写道:“集成电路将会创造像家用计算机——或者是与中央计算机相连的终端设备,以及自动驾驶汽车的自动控制系统、个人便携式通信设备这样的奇迹。”

这篇文章最出名的预测,也就是让摩尔这个名字变得家喻户晓的,是关于“填满元件”的阐述:在保持元件成本价格最低的情况下,其结构复杂程度每年大约增加两倍……可以确信,短期内虽然这一增长率不一定会加快,但肯定还会继续保持。而从长期来看,这一增长率会略有波动,但我们有充分的理由相信,这一增长率至少还能持续10年。

这就是摩尔定律原始的阐述,它的深刻含义值得你认真琢磨。“在保持元件成本价格最低的情况下,其结构复杂程度每年大约增加两倍”,这句话的基本含义是,你仅仅用一美元就可以买到集成电路的计算能力。摩尔研究观察到,这种计算能力的大小每年都要翻倍地增加:你在1963年用一美元买到的计算能力将会是1962年的两倍,1964年的则是1963年的两倍,而1965年的又是1964年的两倍。

摩尔预测,这种发展速度将会一直持续下去,虽然随着时间的推移一些改变会发生,但至少还会持续10年。这一大胆的预测也就预示着,1975年集成电路的计算能力将是1965年的500多倍。

然而,正像事情所发展的那样,摩尔的最大错误是太保守了。他的定律竟然持续了40多年,而不仅仅是10年,而且除了集成电路,数字化领域也在突飞猛进。值得注意的是,计算能力成倍增加所需要的时间也一直存在争议。在1975年,摩尔把他成倍增长的预测从一年修正为约两年,即今天人们普遍采用每18个月综合计算能力提高一倍的说法。可以毫无争议地说,摩尔定律将会一直持续大约半个世纪。

摩尔定律:不仅仅是定律,而是更多好的思想

摩尔定律和热力学定律或者牛顿机械定律等物理学定律截然不同。那些定律所描述的是宇宙是如何运转的;不论我们做什么,它们都是真实存在的。相比较来说,摩尔定律所描述的是计算机行业工程师和科学家所做的工作;它评估的是,工程师和科学家们所付出的努力带来了多么持久和成功的进步。我们在其他行业是看不到这种持续进步的。

拿汽车行业来说,我们是看不到在低油耗的情况下,汽车的速度每隔一两年就能提升一两倍的,而且还是一直持续50年。当然,飞机和火车也没有能力在短时间内把它们的速度提高一倍。奥运会赛跑选手和游泳选手即使在一代人的时间里也无法把他们的比赛时间缩短一半,更别说是在几年时间里。

那么,计算机行业是如何保持这种惊人的发展速度的?

这里有两个原因。第一,虽然晶体管和其他计算要素被物质世界的定律所限制,正像汽车、飞机和游泳者一样,但在数字世界里,这些限制就变得异常松散了。这些限制只是与每秒钟有多少电子在集成电路里移动有关,或者与光束在光缆中穿梭的速度有多快有关。而有时候在某个转折点上,数字技术的进步会突然冲破限制——虽然摩尔定律发生的速度一定会降下来,但这还需要一定的时间。半导体制造商博通公司的首席技术官亨利·萨缪里(Henry Samueli)在2013年预测:“摩尔定律将会走向终结——在接下来的10年时间里会渐渐终结,因此我们还有15年左右的时间。”

不过,尽管一些智慧人士一直在预测摩尔定律即将走向终点,但后来的事实证明,他们总是在反反复复地预测一个错误的结论。这并不是因为他们没有理解物质世界对数字世界的制约,而是因为他们低估了在计算机行业里那些努力开拓的人们。第二个原因是,摩尔定律长期以来一直“运转良好”,我们甚至可以称它是“最出色的修补工”——它在数字工程领域找到了避开物质世界障碍的捷径。比如,当填充集成电路变得困难时,芯片制造商就采取多层叠加的方式去解决——这又开发出了一块新天地。当通信流量超出了光缆可以承受的限度时,工程师们开发了波分多路复用技术,这项技术能够同时在同一根玻璃纤维光纤中传输不同波长的光束。可以说,我们“最出色的修补工”一次又一次地找到了各种解决方案,避开了物质世界的限制。正像英特尔公司的研究主管迈克·梅伯里(Mike Mayberry)所阐述的:“如果你仅仅使用同一种技术,那么原则上你很快就会走到尽头。实际上,40年来,每隔5~7年的时间,我们一直在提升和修补我们的技术,而且这样的做法没有尽头。”这种持续不断的修补使得摩尔定律成为我们这个计算机时代核心的思想和奇迹。而且在整个经济大背景下,它也是一个出色的亮点。

指数增长的魅力

一旦这种双倍增长的趋势持续一段时间,后面的数字就会推翻前面的,前面的数字也就变得毫无相关了。为了想清楚这一点,让我们看一个假设的例子。想象一下,埃里克给了安迪一只毛球——也就是在《星际迷航》中那个长着绒毛且有着很高繁殖能力的毛球Tribble。每天,每只毛球会繁殖一只毛球,因此安迪的小动物园的规模每天都会增长一倍。这时候一般人都会说,毛球家族呈现的是指数增长。那是因为,在经过x天之后,如果用数学公式来表达的话,毛x–1球的数量将是2,这里的x–1就是一个指数。像这样的指数增长是一种非常快的增长模式,在两周之后,安迪就会拥有1.6万只毛球了。下面这张图(图3–1)所描绘的就是毛球家族随着时间而增长的趋势。图3–1 随时间增长的毛球:持续双倍增长的力量

这张图是非常准确的,但会给人一种误导。它看起来就好像是,所有的增长都发生在最后那些天里,而在第一周时间没有任何事情发生。但同样的奇迹——每天成倍增长的毛球,一直在所有时间里发生,并没有加速或突然爆发。这种稳定的指数增长是埃里克给安迪的“礼物”中真正有趣的事情。为了阐述得更明白点,我们必须要修改这张图表中的数量间隔。

前面我们绘制的这张图(图3–1)所使用的是标准的线性间隔,也就是说竖轴的每段分割指示的都是2 000多只毛球。正如我们看到的,这样绘制的图非常清晰明了,但它却不利于充分说明指数增长。为了更好地强调这一点,我们将把线性间隔修改为对数间隔,也就是说竖轴的每一段分隔都代表的是毛球数量10倍的增长:第一次增长从1~10,然后从10~100,再之后从100~1 000,依次类推。也就是说,我们在竖轴上用10倍的间隔标示数量级的增长(图3–2)。图3–2 随时间增长的毛球:持续双倍增长的力量

对数图有一个非常出色的特征:它们可以把指数增长显示为一条完美的直线。图3–2就是用对数标尺标示的安迪毛球家族的增长趋势。

对数图强调的是随着时间的增长双倍增长的稳定性,而不是最后时间的大规模增长。正因为此,我们经常使用对数标尺来绘制双倍增长以及其他一系列指数增长的趋势。这种图凭借一条直线就能清晰地评估速度的增长:指数越大,增长得越快,图中直线的斜率就会越大。

要破产的国王、没有头脑的创新者以及棋盘的另一半

实际上,我们的大脑很难理解持续不断的指数增长。尤其是,我们会严重低估最后数据的规模。发明家和未来学家雷·库兹韦尔(Ray Kurzweil)复述了一个古老的故事,清晰地阐述了这个话题。国际象棋起源于公元6世纪的印度笈多帝国。故事是这样的,国际象棋是一位非常聪明的人发明的,有一次他旅行到了笈多帝国的国都巴特利普特那,就把象棋献给了国王。国王对这个新奇的玩意儿非常入迷,他就想着给这个发明者一些奖赏。

发明者赞美了国王的慷慨,他对国王说:“我只要能够填饱我们一家人肚子的米就可以了。”由于国王的慷慨是由象棋的发明激发的,所以发明者建议使用象棋的棋盘来测量他所要的米。“在棋盘的第一个方格里放一粒米,在第二个格里放两粒米,在第三个格里放四粒,就这样一直放下去,”发明者提议道,“每个方格里的米粒都是前一格里的两倍。”“好,就这样做吧。”国王回答道,他认为这位发明者非常谦逊。

摩尔定律和前面毛球的例子使我们明白国王是无法满足发明者的要求的:即使以一个很小的数字开始,但以2倍的速度增长63次,最后产生的将是一个天文数字。如果这位发明者能够得到他所想要的米粒,那么最后一格米粒的数量将是264–1,如果将所有的米粒加起来,数量将超过1 800亿亿。一堆如此多的米粒将会令珠穆朗玛峰也显得矮小无比,这些米要比全世界历史上所有出产的米还要多。因此,这个国王是无论如何也满足不了这个要求的。在这个故事的其他一些版本中还有这样的结局,国王意识到他被戏弄了,于是把发明者的头砍了下来。

库兹韦尔讲述这个发明者和国王的故事是在2000年出版的书《灵魂机器的时代:当计算机超过人类智能时》(The Age of Spiritual Machines: When Computers Exceed Human Intelligence)中。他讲这个故事的目的不仅是为了说明指数增长的力量有多么强大,而且是为了强调当数字达到了一个很大的数量级时将会变得无法想象。在填完32格之后,国王已经赐给发明者40亿粒米了。这还是一个比较合理的数量——大约相当于一大片土地的产量,这时候国王才开始注意到数量的庞大。但这位国王依然神清气定,而那位发明者的项上人头也没落地。但当他们都进入棋盘的另一半时,他们中的其中一人就肯定会遇到麻烦了。

库兹韦尔极富远见地认识到,虽然棋盘的前一半的数量级已经很大了,但在现实世界中我们还是可以经历的。40亿粒米可能还处于我们直觉之内,比如我们在收获季节会想象米粒的数量,我们会去猜想当今世界最富有的人有多少财富,或者合算一下国家的债务水平。然而,在棋盘的另一半中,由于数量被累积到100万的平方、100万的3次方、100万的4次方,我们就无法想象了。我们甚至也无法想象这些数字是如何按照指数级的速度持续增长的。

库兹韦尔关于棋盘的一半和另一半的区别与分析激发了一种快速的计算方法。其中,美国经济分析局对美国公司费用支出的跟踪很有特色。经济分析局在1958年第一次把信息技术作为公司独特的投资领域。我们把那一年当作摩尔定律进入商业领域的起点,并且使用18个月作为双倍增长的时间节点。在经过32年的双倍增长之后,美国商业进入了棋盘的另一半,数字化工具开始使用了。那是在2006年。

当然,这种计算和划分方法并不正式,甚至还有点娱乐性质,也就是说,并不是你锁定了技术腾飞的某个起点之后,所有的改变都在这个点上发生了。你可以很容易地把1958年当作起点,将18个月作为双倍增长的时段。当然,不论这两个假定条件的哪一个改变,都将在棋盘的一半和另一半之间产生一个不同的分界点。我们也知道,商业技术专家并不仅仅在另一半棋盘里才进行创新;正像我们后来讨论的,今天和明天的技术突破如果没有昨天的技术推动也是不可能发生的。

我们之所以把这种评估方法提出来,是因为它涉及一个重要的思想理念,即指数增长最终会产生出令人惊愕的大数字,这些数字完全超出了我们的直觉和经验。或者说,事情突然在棋盘的另一半中变得奇异无比了。就像那个国王一样,我们大多数人都无法感知了。

能够让第二次机器革命时代突显出来的一个重要因素是,棋盘的另一半迸发出来的速度将有多快。我们当然不是在这里宣称,没有其他技术在以前出现过指数增长。事实上,由瓦特发明的蒸汽机带来的创新也曾经一度带来了巨大的技术提升,这种提升在接下来的200年时间里确实呈现了指数增长。但这种指数增长的规模还是相当小的,所以在那段增长时期,在效能上只出现了三四次的双倍增长。如果按照这种速度,那么要想达到棋盘的另一半,至少需要花费1 000年的时间。而在第二次机器革命时代,双倍增长发生的速度会快得多,也就是说,指数增长表现得会更显著。

棋盘的另一半里的技术

快速双倍增长的计算评估方法也能帮助我们理解为什么数字技术在这段时期里提升得如此迅速,以及为什么我们最近会看到如此多的商业小说所描述的场景都变成了商业现实。那是因为这种具备摩尔定律特征的稳定而快速的指数增长,使我们到达了一个与众不同的计算体系的节点之中。我们在前面章节所描述的创新技术,比如在车流中行驶的无人驾驶汽车,《危险边缘》游戏中获胜的超级计算机,自动创作生成的文章,廉价、灵活的工业机器人,价格低廉且集通信设备、三录仪与计算机为一体的电子设备,这些产品都是2006年之后才出现的,它们以及其他无数种令人炫目的科技产品大大有别于以前的产品。

它们之所以现在纷纷出现的其中一个原因是,构成这些产品核心的数字化技术已经变得足够迅速和廉价,能够大量地装配这些数字产品。这和10年以前的情况是不一样的。那么,数字技术的进步如果用对数标尺来衡量应该是什么样的?让我们来看一看(图3–3)。图3–3 摩尔定律的多种维度

这张图说明,摩尔定律既具有持久性,也具有一定的广泛性;它已经持续了很长时间(在一些情况下持续了10年),而且适用于很多种数字化技术的进步。正像你看到的,如果在竖轴上使用标准的线性标尺,那么所有近乎平直的线段都看起来像前面图中安迪的毛球家族一样——大部分都是水平的,然后突然在最后就接近垂直了。实际上在这种情况下,并没有真正可行的方法能在一张图上把它们全部展示出来——它们所涉及的数字差异太明显了。而对数标尺可以考虑到所有的这些问题,它能帮助我们对数字化技术和工具的提升有一个清晰而全面的认识。

很明显,计算机处理系统的关键组成要素——微型集成电路片密度、处理器速度、存储容量、能效、下载速度等,长时期以来一直在呈现指数增长。为了真正理解摩尔定律在现实世界中的影响力,让我们对比几段双倍增长时期之前以及之后计算机性能的优劣。ASCI Red超级计算机,是美国增强战略运算能力计划(ASCI)第一阶段的产品,当它在1996年被研发出来时是世界上运算速度最快的超级计算机。这台超级计算机被安装在新墨西哥州的桑迪亚国家实验室,它的成本费用高达5 500万美元,它由100个电子柜拼合而成,占地达到1 600平方英尺(约150平方米,有一个网球场80%的面积那么大)。在对计算机速度进行的标准的基准测试中,ASCI Red超级计算机成为第一台浮点运算达到万亿级别的计算机——每秒1万亿次的浮点运算。为了达到这一运算速度,这台超级计算机每小时要耗费800千瓦的电量,相当于约800个普通家庭的用电量。到1997年时候,它已经达到了1.8万亿次的浮点运算。

9年之后,另一台计算机也达到了1.8万亿次的浮点运算。但它不是用于模拟核爆炸,而是用于在实时的三维世界画面中进行复杂的图像处理。也就是说,这台计算机不是为物理学家服务的,而是为游戏玩家服务的。这台超级计算机就是索尼PlayStation 3(索尼家用综合计算机娱乐平台三代),它在性能上可以媲美ASCI Red超级计算机,然而其成本却只有500美元,所占用的面积不足一平方米的1/10,功率也仅有约200瓦。在不到10年时间里,数字化技术的指数增长已经把万亿级别的浮点运算从单一的政府实验室扩散到全世界的客厅和大学生宿舍。索尼PlayStation 3大约售出了6 400万台,而ASCI Red超级计算机在2006年就退出了服务的舞台。

指数增长还使得我们前面章节中提到的很多技术进步成为可能。IBM的“沃森”拥有极其聪明的运算“头脑”,但它如果没有优良的计算机硬件也是没有竞争力的——要知道“沃森”的硬件系统要比“深蓝”的性能强大100倍。而“深蓝”曾在1997年与世界象棋冠军加里·卡斯帕罗夫(Garry Kasparov)对弈中获胜。像Siri这样的语音识别应用也需要优良的计算处理能力,而它现在在像苹果iPhone 4S(是安装Siri系统的第一代手机)这类的手机上已经开始了应用。事实上,iPhone 4S在处理能力上就像苹果公司10年前研发的顶级Powerbook G4(第四代强力笔记本计算机)笔记本一样强大。正像现在所有的创新一样,指数增长和进步能够始终确保技术处在最前沿,也能促使科幻小说在棋盘的另一半中成为现实。

并不仅仅是计算机:摩尔定律的扩展

对计算机世代升级的另一种对比方法强调的不仅仅是摩尔定律的强大能量,还有它的广度。正像在ASCI Red超级计算机、索尼PlayStation 3、Cray–2超级计算机(1985年生产)和iPad 2平板计算机(2011年生产)的例子中,它们差不多都有相同的最高计算速度。但iPad 2还有扬声器、麦克风和耳机接口。它还有两个摄像头,一个是前置VGA(视频图形阵列)摄像头,另一个是后置摄像头,能够捕捉高清视频。这两个摄像头都具备摄像功能,背后的摄像头还有5倍的数字变焦。iPad 2平板计算机还拥有信号接收系统,这使它能够具备无线电话和WiFi(无线)网络系统的功能。它拥有GPS接收器、数字指南针、加速表、陀螺仪、光敏感器。虽然它没有内嵌式键盘,但它可以依靠高清触摸屏同步跟踪11个触控点。所有的性能都囊括在一种设备里,然而其成本却不到1 000美元,而且还要比很多杂志更小、更薄、更轻。Cray–2超级计算机的成本高达3 500万美元(以2011年的美元来衡量),但相比起来,它却是一个聋子、哑巴、瞎子和呆子。

苹果公司之所以能够把所有这些功能都融入iPad 2中,是因为一个更宽广而深远的转变在最近几十年里已经发生了:像麦克风、摄像头、加速表这类的传感器已经从模拟世界转移到了数字世界。在本质上,它们已经变成了计算机的芯片。在这一过程中,它们呈现出了摩尔定律指数级增长轨迹的特征。

记录声音的数字化工具和技术是在20世纪60年代开始使用的,1975年伊士曼柯达公司的一位工程师制造出了第一台现代意义上的数码照相机。早期的这种数码相机既昂贵又笨重,但之后产品性能迅速提升,价格也直线下降。柯达的第一台单反数码相机DCS 100在1991年出产时成本大约为1.3万美元;它拥有130万的最大像素,所拍摄的照片被存储在一块重量达4.5公斤的单独硬盘存储器里——拍摄者需要把存储器挂在脖子上。然而,数码相机每一美元所获得的像素每年都会成双倍增长[这一现象被称为“亨迪定律”,是由柯达公司澳大利亚雇员巴里·亨迪(Barry Hendy)发现并记录的],而与之相连的数字化部件也随着时间的变化而呈现出了指数级变化——更小了、更轻了、更便宜了、更好了。数字传感器累进式的技术提升也就意味着在DCS 100出现20年之后,苹果公司完全可以把兼具摄影和录制功能的微型摄像头融进iPad2之中。当苹果公司在第二年又推出了新一代的iPad产品时,后发的照相机革命已经把技术发展提升了7倍还多。

机器的眼睛

当摩尔定律在处理器、存储器、传感器以及其他计算机硬件(一个极其例外的情况是电池,它的性能并不是以指数比率而提升的,那是因为它基本上是由化学成分构成的,而不是电子化产品)发挥作用时,它并不仅仅使计算机设备变得更快、更廉价、更小、更轻,它还使得这些设备的性能提升到我们之前根本就无法想象的高度。

人工智能领域的研究专家一直着迷于(甚至是迷恋于)同步定位与建图问题,也被称作SLAM。实际上,SLAM就是当你穿梭于一栋不熟悉的建筑物时,你把这栋建筑物以地图的形式在脑子里绘制出来的过程,包括门在哪里、楼梯在哪里,以及你可能碰到的所有东西。同时,你也能把你在这栋建筑物的行踪完整地记录下来(比如,你能发现回到楼下以及从前门出去的路径)。对于绝大多数人来说,SLAM仅仅需要一点点思想意识就能做到。但如果教会一台机器这样做,将会是一个巨大的挑战。

应该给机器人安装哪种传感器(摄像头?激光器?声波定位仪),传感器在接收到信号后又该如何解析?这些都是研究专家们曾经认真思考过的问题,但针对这些问题的解答进展得并不顺利。正像2008年对这个研究课题所进行的总结一样,SLAM是“机器人所面临的基本挑战之一——(但它)看起来好像几乎所有当前的方案都无法在一个面积较大的区域内持续不断地完成地图的绘制,主要原因之一是由于计算成本的增加,另一个是由于当场景和区域变大时,一些不确定的因素就显现了出来”。总起来说,感知一大块区域,并且能够立即吸纳、解析获取的所有数据是非常棘手的问题,这个问题严重阻碍了SLAM的进展。直到一件售价150美元的视频游戏周边设备生产出来之后,这个问题才得以解决——这个时间正是SLAM的难题被公布出来两年之后。

2010年11月,微软公司推出了Kinect传感器,作为应用于Xbox游戏平台的周边设备。Kinect能够跟踪两名操作中的玩家,捕捉每名玩家多达20个关节点。如果一名玩家移动到另一名玩家的前面,这个设备就会对被隐藏在后面的玩家的动作做出最精准的推测,然后当他或她重新回到监控视野范围时,再对其所有的节点进行无缝式的捕捉。Kinect能够通过光线和声音识别玩家的脸、声音和手势,要完成这些,它需要使用数字传感器——包括一排麦克风(一排麦克风要比单独一只麦克风更精确地探明声音的来源)、一个标准的视频摄像头以及一套既能投射又能探测红外线的全方位感知系统。然后设备中的数个处理器和大量的专用软件把这些传感器的输出信息再转换成游戏设计者能够使用的信号。到最后,所有的功能都被融进了这台仅有4英寸(约10厘米)高、不足1英尺(约30厘米)宽、零售价为149.99美元的设备中。

在产品发售之后,Kinect在60天之内的销量就超过了800万台(超过了iPhone和iPad),直到现在这一数据还依然保持消费电子产品销售速度最快的吉尼斯世界纪录。早期的Kinect能够让玩家玩飞镖、搏斗以及哈利·波特的魔法术等游戏,但这些还远远没有穷尽这台设备的功能。2011年8月,在加拿大大不列颠哥伦比亚省温哥华市SIGGRAPH(图形与交互技术特别兴趣组)大会上,微软公司的员工和专家使用Kinect砰的一声关上了机器人领域这个长期存在的难题和挑战。

SIGGRAPH是致力于研究和实践数字图形规模最大且最负盛名的研究团体,参与者包括研究专家、游戏设计者、记者、企业家和对这一领域感兴趣的其他人士。这个团体的大会是微软展示“创想计划”网站所称的“自垦改变一切”项目的最佳平台。这个项目指的就是“KinectFusion”——它利用Kinect来解决SLAM难题。

在SIGGRAPH 2011年的一段视频展示中,一个人手持一台Kinect,对着一间普通的办公室——里面有椅子、盆栽植物以及台式计算机和显示器。当他这样做的时候,视频图像就被分解成Kinect能够感知的多幅屏幕。从这段视频中,我们就能很清楚地知道,即使Kinect没有完全解决这间办公室的SLAM的难题,也基本差不多了。在实际的过程中,Kinect能够绘制一幅三维的房间地图,里面有所有的物品,还包括一位待在房间里的人员。对于KinectFusion,科技博客Engadget在SIGGRAPH大会之后的登记条上所写道的是:“Kinect把3D感应带到了主流世界,而且研究专家们的智慧也变成了商品化的产品,简直太疯狂了。”

2011年6月,也就是在SIGGRAPH大会召开前夕,微软公司已经开发了Kinect软件开发包,供程序员使用。在大会之后,人们使用Kinect来进行同步定位与建图的兴趣迅速增长,很多机器人和人工智能研究领域的团队都下载了软件开发包。

在不到一年的时间里,一支由我们麻省理工学院计算机科学与人工智能实验室的同事约翰·伦纳德(John Leonard)引领的爱尔兰和美国研究团队宣布了Kintinuous的诞生,它实际上相当于一个“空间扩展”了的KinectFusion版本。借助Kintinuous,使用者可以使用Kinect扫描像公寓大楼里面积更大的室内场景,甚至是室外的环境(这个团队在夜间驾驶时,借助手持Kinect,透过汽车玻璃,来扫描外面的场景)。在阐述他们项目的文章最后,Kintinuous研究团队写道:“在未来,我们将会把这个项目扩展到彻底解决SLAM的难题。”我们也认为,距离他们宣布成功的日子已经不远了。当极富创造天分的技术专家与摩尔定律的指数增长完美结合起来的时候,即使最棘手的问题也可以迎刃而解。

在前面章节里我们谈到,价格低廉、功能强大的数字传感器是一些科技类科幻小说一定会涉及的话题。Baxter拥有多个数字摄像头,以及一组强大的定位探测器。所有这些工具和设备在不久之前还显得笨重无比,而且精确性也不够,昂贵的价格也使其无法实际应用。Google自动驾驶汽车吸纳了几种传感技术,但它最重要的“眼睛”是被装配在汽车顶部的巨大的LIDAR[是LIght(灯)和raDAR(雷达)的结合体]。这个设备是由Velodyne(一家激光雷达传感器制造公司)公司生产的,它安装在每秒旋转10次的机器罩里,包含了64道相互分离的激光束以及同等数量的探测器。LIDAR每秒可采集130万个数据点,然后设备上的计算机把这些数据点整合起来,转换成一个实时的3D画面——范围可以达到周围100米。早期的商业LIDAR系统在2000年左右就出现了,但其成本却高达3 500万美元,而在2013年中,Velodyne公司为自动行驶车辆装配的雷达系统价格却只有约8万美元,而且这个数字在不远的将来还会大幅下降。该公司的创始人和首席执行官戴维·霍尔(David Hall)预测,大批量生产将会使得这一产品的价格降至相当于“一台几百美元的照相机”的水平。

这一章所有的这些例子都在说明,为什么我们现在处于第二次机器革命时代的三个基本特征中的第一个:稳定的指数增长已经把我们带入棋盘的另一半时代——我们所惯常认为的那种可以催生未来的“前车之鉴”在这个时代里已经不再可靠。摩尔定律的双倍累积效应,以及双倍累积的外溢效应仍会纷至沓来,用不了多少年,我们的世界将会是一个超级计算机的世界。在这个世界里,前所未有的廉价传感器所带来的“廉价”解决方案将会使以前棘手的难题消遁于无形,科幻小说的虚幻世界也将变成活生生的现实。

有时候一定程度上的不同(换句话说,更多的是相同),能够变成根本上的不同(换句话说,与任何事物都不相同)。棋盘的另一半的故事提醒我们,我们应该充分意识到,充足的指数增长和进步能够把我们带入一个令人吃惊的新天地。实际上,最近的很多例子都让我们确信,我们已经进入了一个新天地。

第4章 数字化:关乎一切

“在你衡量你所谈论的话题时,如果能以数字的形式表达出来,那说明你对这个话题知其一二;而当你无法用数字表达时,你的知识就是贫乏的、不能令人满意的。”——开尔文男爵(Lord Kelvin)19世纪英国卓越的物理学家“嗨,你听说过……吗?”“你得看看……”

像这样的问题和建议是我们每天都会面对的话题。它们是我们从朋友、家庭和同事那里获取新消息、新事物的途径,也是我们在接触到描述新奇事物的语句之后再进行传播的有效渠道。一般情况下,这种形式的“寻酷”最终都会产生一些“美妙”的结局——一支乐队、一家饭店、一个旅游胜地、一个电视节目、一本书或者一部电影的名字都会从人们的嘴中“蹦跳”而出。

在数字化时代,像前面人们谈论的这些话题最终可能会变成一家网站或者一件新奇玩意儿的名字。而在当下,人们“寻酷”的对象可能就成了智能手机的一个应用程序。现在市场上流行的两种技术平台——即苹果公司的iOS操作系统和Android操作系统(又称安卓操作系统),其应用程序已经达到了50万种。大量的“前10名”以及“最佳”应用程序列表能够帮助手机使用者在智能手机应用程序的“海洋”里搜寻到有价值的“珍珠”,但传统口口相传的形式仍然活力不减。

不久前,麻省理工学院斯隆管理学院的博士生马特·比恩(Matt Beane)——他也是我们数字前线团队的成员,给我们提供了一个点子:“你们考虑一下使用Waze,真是太棒了。”但当我们发现他所说的Waze就是一个基于GPS的应用程序,而且这个程序只提供驾驶导航时,我们的兴趣立刻就消失得无影无踪了。因为我们的汽车有导航系统,而且iPhone里的地图应用程序完全能够给我们提供驾驶导航。所以,我们现在看起来并不需要另一个“指导我们如何到哪里”的导航技术。

迈特则给我们耐心地解释说,使用Waze就好像你在拉力赛中驾驶着一辆杜卡迪摩托车同一辆牛车进行比赛。Waze不像传统的GPS导航仪,它一般不会告诉你到达目的地的最佳路线,而是实时地告诉你应该走哪条路线。正像这家公司的网站所说的:Waze的设计理念起源于数年前,当时有人给埃胡德·沙卜泰(Ehud Shabtai)送了一台有GPS功能的掌上计算机。埃胡德本来很兴奋,但很快兴奋就被失望代替了,因为这款产品并不能根据车辆的行驶进程实时地反映变化的路况……于是,埃胡德要亲手来设计这样的产品。他的目标就是,他设计的这款产品在任何既定的时刻,都能够清晰地反映交通系统的运行状况以及与驾驶员相关的所有信息。

任何使用传统GPS导航系统的人都会有埃胡德所碰到的挫败感。是的,导航仪的确知道你的准确位置,因为天空中有美国政府发射和维护的24小时地球同步GPS导航卫星网络。这些卫星也很熟悉各种公路——哪一条是国道以及哪一条是城市单行道等,因为它们都有一个庞大的数据库以支持这种信息。这就是传统GPS导航系统所能做的。但一位驾驶员真正想要知道的,包括交通堵塞、交通事故、道路封闭以及其他影响行驶时间的因素,是传统的GPS导航系统无法满足的。例如,如果要计算从安迪家到埃里克家的最佳路线,只要规划好出发点(安迪车的当前位置)和终点(埃里克的家),并查询路线数据库就能计算出理论上的两地之间的“最快捷”路线。这条路线将包括主干道和国道,而且还有最高限速要求。

然而,如果在上下班高峰期,这种理论上的“最快捷”路线就不一定是最佳行驶路线了。想象一下吧,成千上万辆车拥挤在主干道上和国道上,行驶速度根本无法达到最高行驶速度,更别说超速了。为了避开拥堵路段,安迪必须尝试去寻找畅通的僻静小道——多年通勤者才会熟悉的道路。安迪的GPS是能够清晰地显示这些道路的(如果GPS能够按时升级,它能显示所有的道路),但它却不知道在星期二早上8点45分这些道路是不是最佳的行驶路线。即使他是从僻静小道出发的,而他“装备精良”的GPS也会引导他往高速公路上行驶。

埃胡德认为,一个真正有用的GPS系统需要知道的不仅仅是路上的某一辆车行驶在哪里。它也需要知道,其他车辆在哪里,这些车辆行驶的速度有多快。当第一批智能手机投向市场的时候,他看到了一种可能性,于是在2008年他与尤里·莱文(Uri Levine)和阿米尔·希纳尔(Amir Shinar)一起创建了Waze。Waze的“天赋之处”是能够把所有使用该程序的智能手机都变成传感器,然后持续不断地把它们的位置和行驶速度信息上传到公司的服务器上。当越来越多的智能手机都在使用这种应用程序时,Waze就会获得一个特定区域越来越多的的车辆行驶状况。Waze程序所显示的不仅仅是一幅静态的公路地图,它也能实时地升级最新的交通状况信息。它的服务器通过使用地图和这些升级,并通过一系列复杂的运算法则生成导航路线。如果安迪想要在星期二上午8点45分开车去埃里克家,Waze是不会把他导航到高速公路上的,它会一直引导他在城市街道上行驶——那里的交通状况在那个时点要相对好得多。

Waze这种使用者越多其使用性越强大的特性——对每个使用者来说,一种资源的价值会随着每个加入者的增加而增长,就是被经济学家称为“网络效应”的经典案例。事实上,Waze使用者的数量也一直在迅速地增长。在2012年7月,公司报告称,Waze的使用者在过去的6个月时间里已经实现了翻番,达到了2 000万用户。这个庞大的群体已经行驶了约52亿公里的路程,实现了数千次交通事故、突发性交通堵塞、警察限速、公路关闭、高速公路新出入口、降价加油站以及其他很多驾驶员们感兴趣项目的数据更新和升级。

有了Waze,GPS就成了驾驶员手里的全方位助手:一个能够让你快速而容易地到达你想要去的地方的系统,而不论你是否熟悉当地的公路以及公路状况。它会使你瞬间成为对那个城市无所不知的超级车手。

比特经济

由于摩尔定律和技术的指数级增长——也就是我们前面章节所提到的话题,Waze的规模才有可能做得很大。这种服务系统依靠的是大量功能强大却很廉价的设备和工具(也就是使用者的智能手机),这些设备和工具中的每一种都拥有一系列处理器、传感器和发射器。这类技术在10年以前都是不存在的,当然也包括Waze。之所以在过去的一些年里这类技术变得可行了,是因为数字能量的迅速积累和技术成本的下降。正像我们在第3章所看到的,计算机设备和工具的指数级提升和增长是催生第二次机器革命时代到来的三大根本动力之一。

当然,Waze也非常依靠这三大动力的第二个:数字化。在里程碑式的著作《信息统治》(Information Rules)中,两位经济学家卡尔·夏皮罗(Carl Shapiro)和哈尔·瓦里安(Hal Varian)把这种现象界定为“对信息流进行数字化的编码”。换一种说法,就是把所有的各种各样的信息和媒体形式——包括文本、声音、图像、视频以及工具、设备和传感器里的数据等等,转换成无数的“1”和“0”,也就是计算机以及其他同类产品能够识别的语言。比如,Waze使用的就是几种信息流:数字化的街道地图、应用程序发布的车辆定位以及交通拥堵的警示信息。Waze能够把这些信息流整合在一起,转换成对使用者非常有用的信息,这就是这一服务备受欢迎的原因。

我们理所当然地认为,在读了夏皮罗和瓦里安以及其他人的作品之后,而且还一直对互联网上相关的内容有所吸收和了解,我们对数字化应该是非常了解的。但让我们始料未及的是,在过去的数年时间里,数字化在各个领域的进步已经远远超出了我们的想象。它的体量、种类和速度已经发生了大爆炸。这种数字化的爆发带来了两个深远性的影响:获取知识(或者做科学研究)的思路更多了,创新的速度更快了。这一章我们将探究数字化那迷人的发展历程。

像其他很多种的线上服务系统一样,Waze使用的是数字信息两个众所周知、独特的经济特性:这类信息的非竞争性和复制时的零边际成本。我们可能每天都会说,数字信息是“取之不尽,用之不竭”的,而且要想复制成另一种数字化资源也是极其廉价的。下面让我们更详细地了解一下数字化技术的这些特性。

我们每天都会碰到竞争性产品,这种竞争性产品指的是,一个人或某件东西在一定时间里只能独自享有这种产品。如果我们两个人从波士顿飞往加利福尼亚,在我们之后起飞的飞机就不能使用我们飞机上的燃料。安迪也是无法使用埃里克已经坐上的座位的(航空公司的规定就是禁止座位共享,即使我们有意而为之),而且他也不能使用他同事的耳机——如果埃里克已经把耳机插在智能手机上并且正在听音乐。然而,数字化的音乐本身却不是竞争性产品。埃里克在听一首乐曲并不能阻止另一个人在同时或之后也听同样的乐曲。

如果安迪购买并阅读了科幻小说家儒勒·凡尔纳(Jules Verne)一部古老的精装本作品集,他并没有把它“用尽”;他阅读完可以把这本书送给埃里克。但如果我们两个都想在同一时间翻阅《海底两万里》(Twenty Thousand Leagues Under the Sea),那么我们要么去找一本复制本,要么安迪可以利用他手中的一本再复制一本。他这样做可能是合法的,因为这本书已经不在版权期内了,但他仍旧需要在复印机上花费很多时间或者付钱让别人代劳。不论是哪种情况,复制出来一本书都不是廉价的。另外,在一遍又一遍地多次复印之后,阅读起来也会变得更加困难。

但如果安迪获得了这本书的数字版权,只需要按几下按键或者点几下鼠标就能创造出一个复制品,可以把它保存在物理磁盘上,然后把这个复制品交给埃里克。不像复印机,对数字信息进行复制,复制版和原版几乎毫无差别。可以说,数字信息的复制极其廉价、快速和容易。虽然一本书或一部电影的原始版本需要花费大量的成本去制作,但如果去复制更多的样本却几乎不花费任何成本。这就是所谓的“复制的零边际成本”。

当然,现如今,安迪交给埃里克的也并不是一张磁盘,而更可能是以文件的形式附在邮件之中,或者通过类似Dropbox这样的云服务系统进行文件的共享。当然,不论是哪一种方法,他都要使用互联网。他之所以采用这种方法是因为,它更快、更方便,而且更重要的是,它基本免费。就像大多数人一样,我们在家里的互联网接入和我们的移动设备都是包月之类的固定付费(麻省理工学院要为我们的工作网络付费)。如果我们超出了一定的数据限制,我们的互联网服务提供商可能就会对我们额外收费,但在超额之前,我们都可以畅通无阻地使用互联网;而且不论我们上传或下载多少数据,也不需要额外付费。这样的话,即使通过网络接收或发送大块的数据也不用担心额外付费。不像原子组成的产品,由比特组成的产品能够进行完美的复制,它可以几乎零成本地瞬间穿越整个房间或者整个地球。对大多数产品来说,想要自由、完美并且即时地传输好像都是不合理的预期,但当更多的信息被数字化之后,更多的产品也将会变得自由、完美和即时。

商业模式:当第一个版本仍旧昂贵之时

夏皮罗和瓦里安比较雅致地把这些特征描述总结为,在一个计算机和网络时代,“信息是天价的生产、廉价的复制”。我们在第2章里所提到的“科幻小说走进现实”技术——即时在线翻译服务,就是利用了这样的事实。它们使用相匹配的两套文档——需要人工花费高额成本从一种语言翻译成另一种。还比如,欧盟以及它的前身自1957年起,签发的所有官方文件都要使用其所有成员国的主要语言;而联合国的语言也丰富多彩,要以6种官方语言起草文件。

这种大规模信息的创造并不是廉价的,不过这种信息一旦被数字化之后,它的复制、剪切以及共享就相当廉价了。基本上,Google翻译这类的服务遵循的就是这样的理念。当它需要把一句英语翻译成德语时,它基本会扫描它所知道的所有英语和德语文件,以寻找一个接近的匹配(或者一些接近匹配的片段),然后再转换成相应的德语文本。今天大多数高级的自动翻译服务,并不是建立在教计算机如何掌握人类语言使用规则以及如何使用语言的任何新近的研究结果之上的。相反,它们使用的是数据匹配模式,就是在翻译过程中,借以匹配海量的花费巨额成本生成但可以廉价复制的数据内容。

接下来会发生什么:当内容的获取变得免费之时

但如果信息生成并不需要花费巨额成本时,那么在这个数字化的世界里将会发生什么事情?如果在一开始的时候就不存在版权问题,将会发生什么?在《信息统治》这本书出版之后,我们一直在精神鼓舞地探寻着这些问题的答案。

传统的商业信条是,“时间就是金钱”,但在这个让人吃惊的现代互联网世界里,究竟有多少人愿意贡献出自己的时间去生产线上的内容而又不寻求任何金钱回报呢?例如,维基百科的内容是依靠全世界的志愿者免费创造的。到目前为止,它拥有世界上信息量最大的参考资源,但没有人通过撰写或者编辑网站上的文章获得任何报酬。同样的还有无数的网站、博客、讨论区、论坛以及其他在线的信息资源。它们的创作者总是无偿地提供信息,并不期望获得直接的金钱回报。

当夏皮罗和瓦里安在1998年出版《信息统治》时,使用者自主生成内容而并不存在金钱转换关系的时代还没有到来。Blogger是最早的网络日志服务商之一,它是在1999年8月创办的;维基百科是在2001年1月创办的;早期的交友网站Friendster是在2002年创办的。后来,Friendster很快被2004年创办的Facebook超越了,Facebook从此一路高歌,发展成为世界上最受欢迎的网站之一。事实上,世界上最受欢迎的内容网站中,有60%的网站是主要依靠使用者自主生成的,而在美国,顶级的10家网站中也有6家属于这种发展模式。

所有使用者生成的内容并不仅仅是让我们感到了自我表达和交流的通畅与自由,它们还帮助促进了最近我们看到的“科幻小说走进现实”技术的发展。例如,Siri通过分析它的使用者生成并日益增长的声音文件与声音识别系统的相互作用,就能够随着时间的推移而提升自己。而沃森超级计算机的数据库,包含了大约两亿张的文件页面,数据容量达到4 TB——内含维基百科的全部内容。有段时间沃森也收录了语言风格火辣的《城市词典》(Urban Dictionary)里的内容,但令生成这些内容的使用者惊愕的是,沃森开始骂脏话了,最后研究人员不得不去除了《城市词典》的内容。

对于互联网上使用者自主创造内容的流行和增长,我们也不应该太过吃惊。毕竟,我们人类喜欢分享和沟通。不过,令我们吃惊的是,我们的机器也喜欢彼此沟通。

M2M(机器对机器,指在信息需求的特定条件下,公司内部实现资产、机器、设备等相互间的数据交换以适应人力或公司管理系统对信息的需求的能力)通信指的就是,设备可以通过类似互联网这样的网络系统共享数据。Waze就使用了M2M,当智能手机上的Waze应用程序打开时,在没有人为干预的情况下,它会持续不断地向Waze的服务器发送信息。同样,当你在热门旅游搜索引擎Kayak查询打折机票时,Kayak的服务器立刻就会把你的需求发送给它们负责不同航班的同类服务器上,并且能够在不需要人工的情况下即时回复你的需求。ATM(自动取款机)会首先“询问”银行我们的账户中还有多少钱,然后才能让我们提取现金;冷藏货车里的数字温度计会持续不断地“通知”超市,车里的货品在运输过程中没有变得温度过高;每当有一个次品出现时,半导体工厂里的传感器就会“告诉”工厂生产总部;无数M2M通信系统则一直都在传输信息。《纽约时报》2012年7月的一份报道声称:“全世界无线网络上机器人聊天的综合水平和程度……很可能很快就会超过无线网络中人类之间所有的语音交流。”

我们的计量系统将会用尽:数据大爆炸时代的来临

所有一切的数字化,包括文件、新闻、音乐、照片、视频、地图、个人数据、社交网络、信息需求以及对这些需求的反馈、各种各类传感器中的数据等,是最近一些年中最重要的现象之一。在我们深度涉入第二次机器革命时代之后,数字化还将会持续地发酵、传播和加深,并产生出令我们惊愕不已的数据。根据思科公司的说法,仅仅在2006~2011年这5年的时间里,全世界互联网的流量就增长了12倍,达到了每月23.9艾字节(1艾字节=1 152 921 504 606 846 976字节)。

1艾字节是一个让人感到荒谬的大数字,它比20万个“沃森”的全部数据库还要多。然而,即使这样表述也不足以涵盖当前以及未来数字化的庞大体量。专注于技术研究的国际技术公司(IDC)估计,在2012年全世界共产生了2.7泽字节(泽字节是艾字节的1 024倍),或者说是2.7乘以1 000的7次方字节,这一数据比2011年增长了一倍。当然,这些数据并不是固定在磁盘驱动器上的,它还会一直变动不居。思科公司预计,到2016年,全世界IP协议数据流量将达到1.3泽字节,这个数据超过了2 500亿张DVD的信息量。

正像这些数据所表明的,数字化产生出了真正的大数据。事实上,如果这种增长能够保持足够长的时间,那么我们的数据计量系统也将会穷尽。在1991年召开的第19次国际计量大会上,数据计量单位又一次得到扩充,最大的单位变成了尧,也就是1 000的8次方,或者是1024。现在,我们离泽字节也只有一步之遥了。

第二次机器革命时代:大数据魔力再现

最近的数字化大爆炸给我们留下了深刻的印象,但这是否真的重要?所有这些艾字节和泽字节的数据真的有用吗?

事实是,它们的实用性难以置信。我们把数字化看作是塑造第二次机器时代力量的重要原因之一是,数字化增加了我们对这个世界的了解。数字化可以让我们源源不断地接触到海量的数据,数据堪称科学的生机和命脉。这里所说的科学指的是,把理论和假设公式化、数字化,然后再对其进行评估、测算的工作。或者,非正式地说,科学就是猜测事物是如何运转的,然后再研究、核实这种猜测是否正确。

不久之前,埃里克猜测关于互联网搜索的数据可能就预示着全国房地产销售和价格的未来变化。他解释说,如果一对夫妻要搬迁到另一座城市,并且购买一处房产,他们是不可能在几天之内就完成整个搬迁和购买流程的。他们要提前数月就开始筹划,比如他们首先要在网上做一些调查研究,他们有可能会在搜索引擎中输入类似“凤凰城房地产中介”、“凤凰城地区”以及“凤凰城两居室房子价格”这类的字眼。

为了证实这一假设,埃里克咨询Google是否能从那里获得搜索词语。他被告知,他用不着询问,因为Google会把这些数据放在网上,供人们自由查阅。埃里克和他的博士生吴琳(音)——他们对房地产经济学一窍不通,通过利用使用者在Google上生成的搜索词语内容,创建了一个简单的数据模型进行分析。他们的模型把搜索词语的变化与随后的房产销售和价格的变化联系在一起,预测出了如果类似前面提到的那些搜索词语在今天增加了,那么凤凰城的房产销售和价格在未来的3个月内就会出现上涨。他们发现,这个简单的模型预测效果非常好,事实上,它要比美国房地产经纪人协会的预测专家们公布的预测结果还要准确23.6%。

研究人员在其他领域也使用最新获取的数字化数据取得了类似的成功。由哈佛医学院专家鲁米·查那拉(Rumi Chunara)带领的团队发现,在对2010年海地地震之后霍乱的传播跟踪之时,Twitter(推特)网站140个字的短消息竟然和官方正式的报告一样准确,而在时间上要比官方报告至少提前两周。惠普社交媒体计算机实验室的研究人员西塔拉姆·阿瑟(Sitaram Asur)和伯纳多·休伯曼(Bernardo Huberman)发现Twitter短消息也可以被用来预测电影票房收入。他们总结认为:“这充分表明社交媒体蕴含着大量群体的智慧,如果能够开发得当,对未来的结果有着极其强大和精确的预测判断力。”

数字化也能够帮助我们更好地理解过去。截至2012年3月,Google已经扫描了在过去几个世纪里出版的2 000万册图书。这种海量的数字化单词和语句构成了被称为“文化组学”的基础。(也可以这样说,“文化组学”是利用高产量的数据集合和分析以研究人类文化的发展和演变。)由让–巴普蒂斯特·米歇尔(Jean-Baptiste Michel)和埃雷兹·利伯曼·艾登(Erez Lieberman Aiden)带领的一个多学科团队分析了1800年之后以英语形式出版的500万册图书。他们发现,英语词汇的数量在1950~2000年增加了70%还要多,这种增长速度给人们的印象是要比过去快得多,但相比而言消退得也更迅速,这也证明,在20世纪人类对进化演变的兴趣一直处于衰退状态,直到詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)于1953年发现了DNA(双螺旋)结构。

所有这些例子都能说明,我们对这个世界的理解更深入了,预测也更准确了,或者说在数字化的世界里,我们的科学研究更加通畅无比了。哈尔·瓦里安——当今Google的首席经济学家,多年来一直因为对此现象的研究而大名鼎鼎。他对数字化的研究独具一格,我们最喜欢引用他的一句话是:“我一直在说未来10年,这个世界最性感的工作就是统计学家,这绝对不是开玩笑。”当我们看到有如此海量的数字化数据被创造出来,并且思考我们将从中获得多少真知灼见时,我们可以非常确定地说,他说得没错。

不同层次的数字化“食谱”

数字化信息不仅仅是新科学的生机和命脉,还是塑造第二次机器革命时代的第二大动力(位于指数级增长之后)——因为它在推动创新中所发挥的作用极其重要。Waze就是这方面一个非常好的例子,它所提供的服务是建立在多个层面以及数代数字化基础之上的,由于数字化产品的非竞争性,它们是不可能衰退或者被用尽的。

第一层或者最早的那一层是数字化地图,它差不多跟个人计算机一样久远。第二层是GPS定位系统,它在2000年美国政府增加GPS定位准确性之后发挥的作用尤其明显。第三层是社交数据,Waze使用者可以彼此共享从交通事故到警察限速,再到降价加油站的几乎所有的交通信息,他们甚至可以使用Waze应用程序进行聊天。最后一层,就是Waze广泛使用的传感器数据,事实上,它基本上能够把每一辆车都变成交通顺畅传感器,从而用这些数据计算出最快速的交通路线。

使用第一代和第二代数字化数据的车内导航系统——地图和GPS定位系统,还有可能会绕弯路——它们也许非常有用,尤其是在我们不熟悉路况的城市中驾驶,但正如我们看到的,它们也有很大的缺陷。Waze的开发者认识到,在数字化技术升级和推广之后,他们是能够解决传统的GPS导航系统存在的缺陷的。这些创新通过给传统导航系统增加社交和传感器数据,大大提升了其导航能力和实用性。正像我们将在下一章看到的,这种形式的创新是我们这个时代创新的标志之一。事实上,这种创新非常重要,可以称得上是塑造第二次机器革命时代的第三大动力。在下一章里,我们将解释这一切为什么会发生。

第5章 数字时代的创新:无穷无尽

“如果你想拥有出色的思想,那么你必须拥有很多思想。”——莱纳斯·鲍林(Linus Pauling)美国著名化学家,量子化学和结构生物学的先驱者之一,两度获得诺贝尔奖

每个人都会认为,如果美国创新的速度下降,那么IT(信息技术)技术就是一个让人麻烦不断的新闻发源地。但对于这一切是否会发生,我们还是抱有很大疑惑的。

我们之所以如此关注创新,并不是因为我们喜欢新事物——虽然我们确实喜欢。正如小说家威廉·梅克比斯·萨克雷(William Makepeace Thackeray)所观察到的,“新奇事物展现的魅力在我们的头脑中怎么也无法抹除”。一些人很难抵制新奇小玩意儿的诱惑,还有一些人会为最新流行风尚的魅力所折服,也有一些人对去过的一些地方流连忘返。以经济学家的观点来看,满足这些期望与梦想是很伟大的事情——因为它能照顾或满足消费者的消费需求。但创新还有一个最重要的影响力,就是它能使我们的社会变得更加富裕。

为什么创新就是一切

作为经济学家的代表人物,保罗·克鲁格曼(Paul Krugman)曾说过:“生产率不是一切,但从长远来看,它几乎就是一切。”这是为什么呢?他解释说:“因为一个国家在一定时间内提升其国民生活标准的能力,几乎取决于提升其人均产出的能力。”这也就是说,取决于生产每一件产品的劳动时长,从汽车到拉链。大多数国家都没有丰富的矿产财富或者石油储备,因此无法通过开采这些资源而获取财富。这样的国家和社会如果想要变得富裕——有效地提升其国民的生活标准,唯一的方法就是让它们的公司和劳动者在保持同样投入的背景下,产出更多的数量,也就是说,要从同等数量的劳动者那里获取更多的产品和服务。

实际上,创新就是生产率提高的过程。经济学家们都喜欢彼此争论,但在他们中间也有一个很重要的共识,就是创新对于增长和繁荣发挥着根本性的作用。大多数业内人士都赞同伟大的经济学家约瑟夫·熊彼特(Joseph Schumpeter)的观点:“在资本主义社会的经济历史中,创新是最显著的一个事实……而且在很大程度上,它也使我们能够首先想到其他社会发展的促进因素。”说到这里,共识就没有了。所谓“最显著的事实”,到现在为止发生的程度如何,其发展趋势是向上还是向下,这些又成为经济学家们争论的焦点。

为什么我们会担忧——创新将走向穷尽

经济学家罗伯特·戈登(Robert Gordon,即Bob Gordon)是生产率和经济增长研究领域最富有思想、最值得尊敬的学者之一,他最近完成了一项对过去150年美国人生活标准变化的研究。这个研究结果表明,创新正在减缓。

戈登和我们大多数人一样,都强调新技术在驱动经济增长中的作用,并且对蒸汽机和工业革命以及其他技术所带来的生产率提升印象深刻。根据戈登的说法,它是全球经济历史中真正意义上的大事件。正像他写到的,在1750年之前,或者说在工业革命开始之前,也就是“在过去的4个世纪,甚至是在过去1 000年的时间里,都没有出现过明显的经济增长”。如我们在第1章所看到的,人口增长和社会发展的曲线几乎是平的,直到蒸汽机时代来临。毫无疑问,经济增长呈现的也是这种状况。

然而,正如戈登研究显示的,一旦经济增长开始了,在接下来200年的时间里,就呈现了近乎垂直式的增长。这不仅得益于工业革命的发生,还由于另一个因素的出现,即对科技创新的依赖。事实上,这个阶段有三种创新的手段:电力、内燃机和室内给排水系统,它们在1870~1900年走上了历史的舞台。

第二次工业革命阶段的“伟大创造和发明”,根据戈登的研究,“是非常重要且影响深远的,它们在整整100年的时间里,都在发挥着自己的效能”。而一旦这种效能得以实现,一个新的问题就出现了:增长发生了停滞,甚至开始下降了。在蒸汽机无法提升效率的情况下,

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载