第四次革命(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-26 13:09:33

点击下载

作者:卢西亚诺·弗洛里迪

出版社:浙江人民出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

第四次革命

第四次革命试读:

前言

图灵革命,重塑人类未来

信息与通信技术是如何影响人类的自我意识及人类与这个世界的沟通方式,乃至人类改造世界的方法的?

随着纳米技术、物联网、Web 2.0、语义网、云计算、动作捕捉游戏(motion-capturing games)、智能手机App、平板电脑与触屏技术、GPS、增强现实技术、无人驾驶飞机与汽车、可穿戴设备、3D打印、身份盗窃、网络课程、社交媒体、网络战争等新技术或新词汇的不断涌现,无论是技术爱好者还是技术畏惧者,都会问同一个问题:下一个创新是什么?哲学家们也在思考这些创新的背后逻辑,以及能否将所有这些现象归为一种单一的、微观的趋势。回答这一问题的困难在于,我们仍在把信息与通信技术看作人与外部世界、人与人之间沟通的工具。而事实上,它已经成了环境、人类学、社会等的发展甚至是解释外部世界的力量。信息与通信技术正普遍、深刻而又无情地创造和重塑着人类的理论基础与现实基础,改变着人类的自我认知,重组着人类与自身以及与他人之间的联系,并升华着人类对这个世界的理解。

图灵革命,一场信息时代的巨大变革《第四次革命》力图去识别和解释一些深刻的技术力量,这些力量正影响着我们的生活、信仰和身边的所有事物。但是,本书并不是一本技术性或学术性的专著。我们正在经历着一场意义深远的图灵革命,这场革命在很大程度上由信息与通信技术驱动。每一代人都会觉得自己所处的世界比较特别,周遭的一切都是新颖的,所以我认为保持对事物的洞察力非常重要。请暂且忘记1773年12月16日的波士顿[2]和1789年7月14日的巴黎——现在的你生活在新千禧年,正处在信息圈之中。

图灵革命对于人类的未来来说是一个绝佳机会。所以,这也是一本“适度”乐观的书。之所以说“适度”,是因为它取决于我们将来是否能够充分利用信息与通信技术,并同时避免它可能造成的糟糕后果。我们如何才能获得信息与通信技术带来的益处呢?为了识别、整合、创造出最好的技术性转变,我们应该怎样做?在信息与通信技术世界逐渐发展成为一个信息与通信技术友好型环境的过程中,隐藏着哪些风险?技术会赋予我们能力、让我们变得更加强大,还是会束缚我们的身体和意识空间,并悄然地强迫我们服从它的指挥,只因为从某种意义上来说,这是让世界得以运转的最好且唯一的方法?信息与通信技术是可以帮助我们解决最紧迫的社会和环境问题,还是会进一步恶化这些问题?以上只是图灵革命所展现出的富有挑战性的问题中的一部分。许多人为阐明和解释这些问题付出了很多努力,我希望本书也能够对此有所贡献。如果对信息与通信技术给我们现在和未来的生活带来的影响有更深刻的理解,我们就能找到一条解决这些问题的更切实有效的路径,并使信息与通信技术转变为现实的众多机会。

尽管伴随着巨大的智力重担,信息与通信技术也带来了一个绝佳机会,我们必须理解它,并以正确的方式利用它。所以,这本书是写给每一位关心人类技术发展的人,写给每一个关心这些技术在可预见的将来是如何影响整个人类的人的原因。我会尽量将书中的复杂概念或现象通俗化,但这种通俗化与不切实际的、无用的曲解之间有一道分界线,我会尽己所能地不越过它。

作为一本写给非专业人士的读物,请允许我再多说几句。本书是一项浩瀚工程的一部分,这项工程企图在信息哲学的基础上去更新我们的哲学体系,将其与不同的历史时代联系起来,并突破学术研究围墙的藩篱。鉴于信息时代的黎明所带来的诸多前所未有的创新,许多根植于现代历史和整个工业社会的基本哲学观点即使无须被完全替换,也需要进行一些更新和完善,这一点不足为奇。也许这些改变在学术界还不会发生,也不会发生在实验室、智囊团研究中心和研发办公室,但是它们一定会发生在街头和互联网上。在那里,会有一种混杂着期望与担忧的氛围;一些变化正在发生,我们对世界、对自我的认知将会改变,对人与世界以及人与人之间交流方式的认识也将发生改变。这种氛围与意识并不是研究方案的结果,也不受拨款申请是否顺利获批的影响。它们更加真实、有力,但也更加难以辨别和把握。

洞比你想的要深

我们对世界的认知的改变,是从日常经验、心理和行为这些角度,对发生在眼前的迅速和不间断的变化进行日常调节的结果。在急匆匆地迈向未来之时,我们正通过塑造与适应那些尚未发展成熟的新形势去寻找一种新的平衡。创新的结果不再是由最初的颠覆性力量所决定,而是由退化为一种稳定的、“大体上一致”的模式所得。举个例子,就像汽车制造业和图书出版产业,在经历了最初的混乱和快速调整后,它们最终会趋于稳定。很明显,一门新的历史哲学会把我们所处的时代定义为历史时代的后期和超历史时代的开端。这门历史哲学通过发展新的自然哲学、新的哲学人类学以及一种综合环境论,构造人与世界之间的桥梁,形成人与人之间新的政治哲学。只要试着去理解我们面对的这种新的超历史时代困境,就能理解“赛博文化”“后人类主义”“奇点”及其他类似的流行观点。我认为这些词是其有指导性意义的,甚至是具有启发性的,即使它们还不那么让人信服。正如巴西人所说:洞比你想的要深,问题也比你想的更加复杂。我们需要进行一些严肃的哲学探索。这就是为什么在一个日益技术化的世界中,重新思考现在与未来等同于对新信息哲学所做的一次探索,而这种信息哲学可以应用于超历史时代的方方面面。正因为我们现在与文化的花叶紧密相连,我们才需要从文化的根部仔细观察并去滋养它们。

信息社会源于书写、印刷和大众传媒的发明,但直到最近,当信息与通信技术的记录与传输设备发展到拥有信息处理功能时,信息社会才真正成为现实。这些由信息与通信技术带来的广泛而深远的变化造成了一个巨大的理论缺口。很明显,我们需要用哲学装备自己,去完成眼前的艰巨任务。我们需要借助哲学去抓住信息的本质;去预测和掌握信息与通信技术对人类自身和环境所造成的道德影响;去增强经济、社会和政治领域的信息动态性;去构建正确的知识框架,来帮助我们语义化(定义与理解)我们面临的新困境。总而言之,为了我们所处的时代,我们需要将信息哲学作为时代的哲学。

逆流而上前,为自己建造一艘救生艇

我对应对眼前的这项艰巨任务并不抱幻想。在本书中,我只是简单地勾勒出一些想法,它们与历史时代哲学有关,如超历史时代哲学;与自然哲学有关,如信息圈哲学;与人类学有关,如哥白尼学说、达尔文学说、弗洛伊德学说等之后人类自我认识的第四次革命;与政治哲学有关,如多智能体系统(multi-agent system)的设计,其有望解决人类面临的全球性问题。所有这些都将引发更多道德关注和对环境关切度的提升,包括对那些虚拟的、数字的和人造的环境的关切。这样一个新“电子环境”伦理观应建立在整个信息圈及其组成部分的信息伦理之上。在书中,我只会提到这些观点,并概述为什么我们需要建立与之对应的道德基础。许多工作尚未完成,我迫切希望能有更多人加入这个行列。

逆流而上并不等于在惊慌中瞎扑腾,相反,纪律在这之中更加有必要。我们需要提升自己的知识水平,而不是听之任之。因此,我或许需要引用另一个与水有关的比

[3]喻,它是另一位维也纳学派哲学家奥托·纽拉特(Otto Neurath)所说的:“即便没有救生艇,我们也不能白白淹死在一片模糊之中。”懒于思考只会加剧问题的严重性,我们需扫码关注“庐客汇”,回复“第四次革命”,先睹第四次革命真容!要作出理性的努力,并且在游泳前为自己建造一艘救生艇。我希望本书能够为这艘救生艇提供一些木材。01时间

超历史时代,人类发展新纪元

人类发展经历了三大时代:史前时代、历史时代与超历史时代。人类正在进入超历史时代,信息与通信技术越来越多地自主地去处理信息。未来,创新、福利和附加值都与此休戚相关。人类发展的三大时代

今天,世界上的人口比以往任何时候都要多,大多数人的寿命也更长。即使全球不平等程度仍颇受争议,不可否认的是,人均期望寿命在变长(见图1-1),贫困现象也在不断减少(见图1-2)。而目前,残疾已成为与人类健康相关的最大问题。

从更高的层面上说,至少在我们以一种明智的、和平和可持续的方式去使用与发展技术的情况下,图1-1和图1-2中所表现出的趋势已成常态。

有时,我们会忘记火石和车轮、火花和犁以及引擎和计算机曾对我们作出了多大的贡献。当我们将人类生活划分为史前时代和历史时代时,我们也许会记起自己对机器欠下的巨额“债务”。这样一条富有深意的分界线意味着,正是信息与通信技术的诞生和发展使得我们对一些问题有了不同的答案。这些问题包括我们曾经的生活方式、现在的生活方式,以及我将在本书中讨论的未来的生活方式。只有当各种系统开始记录信息,并为了满足人类未来的需要而积累和传递这些信息,且当这些留给后代的知识以一种温和的或者“拉马克式”[4](Lamarckian)的形式呈指数级增长时,人类才算进入了历史时代。图1-1 全球及不同发展水平国家的人均期望寿命(1950—2050)图1-2 全球各地日均消费1.25美元以下的人口比例和数量注:*以2005年的购买力来衡量。

因此,历史时代可以说是信息时代的同义词。这样一种推理思路意味着至少是自青铜时代以来,人类已经经历了数个不同的信息社会。美索不达米亚和一些其他国家早在青铜时代(公元前4000年)就发明了书写技术。事实上,苏美尔(今伊拉克东南部两河下游地区)的首都乌尔在公元前3000年是世界上最发达的中央集权城市。甚至在海湾战争(1991)和伊拉克战争(2003—2011)之前,那里仍然保留着一座存有成千上万个陶土盘的图书馆。它们记载的既不是爱情故事也不是历史典故,而主要是一些库存目录、商业交易记录以及行政文档。但是,乌尔并不是当我们谈及信息社会时脑海中浮现出的那个典型形象。这也许可以有很多种解释,但相比而言更为可信的一种解释是:只有在近年来,人类的进步与福祉才开始紧紧地依赖于对信息生命周期成功而有效的管理,而不仅仅是与之相联。我将在本章后文对这个周期予以更多讨论。但是,首先让我们弄清楚为什么这样一种依赖意味着人类在最近进入了超历史时代(见图1-3)。图1-3 从史前时代到超历史时代

史前时代与历史时代这两个名词是在告诉我们那时的人类怎样生活,而不仅仅是他们生活在何时或居于何处。从这个角度来说,如今人类社会的生存方式已经跨过了三个时代。对亚马孙河流域一个人数不明的封闭部落的多份研究报告显示,在第二个千禧年刚开始时,一些以史前时代方式生活的群体仍然存在。它们没有任何书面记录。一旦这些部落消失,或者说当这些部落消失的时候,人类进化史的第一个章节就将被画上句号。

目前,绝大多数人仍然以历史时代视角生活在一个依靠信息与通信技术来记录、传递和使用各类信息的社会。在这样一个社会里,由于其他技术,特别是与能源相关技术的重要性,信息与通信技术还没能超越它们。此外,世界上已经有一些人以一种超历史的方式在生活。在他们所生活的社会和环境里,在他们对社会福祉、个人安康和整体繁荣的维持或任何一点进步的取得中,信息与通信技术及其信息处理能力不仅十分重要,而且不可或缺。举个例子来说,七国集团的所有成员国,即加拿大、法国、德国、意大利、日本、英国和美国,都可以被认为已经进入超历史时代。这其中的每一个国家,至少有70%的GDP依赖于无形商品——而不是农业或者制造业加工后输出的实体商品,这些无形商品与信息密切相关。这些国家的经济严重依赖于信息化资产(知识型经济),信息密集型服务(特别是商业或属性服务、通信、金融、保险和娱乐),以及信息导向型政府产业(特别是教育、公共管理和卫生保健)。

冲突的本质将使这场一分为三的人类进化过程面临一次令人忧伤的考验。只有一个处于超历史时代的社会,才有可能从信息上受到威胁,例如网络攻击;只有依靠数字生活的人,才有可能因数字而死。我们将在第8章中讲述有关内容。

让我们回到乌尔。我们之所以不把乌尔看作一个信息社会,是因为它处于历史时代,而不是超历史时代。举例来说,其更多地取决于农业生产技术,而不是那些记录在陶土盘上的内容。苏美尔地区的闪族人发明了一种记录和传递基础知识的方法,从而使其他技术的缓慢进步成为可能,其直接结果就是加深了我们对更高层次技术的依赖。但是,这些信息与通信技术的记录与传递工具直到千年以后才进化到具备处理能力。这一变化发生在西方活字印刷术发明人约翰内斯·古腾堡(Johannes Gutenberg)与“计算机科学之父”艾伦·图灵(Alan Turing)之间的几个世纪里。这是一场信息与通信技术带来的、只有当代人类才能经历的根本性转变,而这场转变正在历史时代和超历史时代间画下一条分界线。

为了迎接超历史信息社会,我们不应当对信息与通信技术进化所需要的时间如此之长感到惊讶。信息的典型生命周期(见图1-4)通常包括以下阶段:产生与创造(发现、设计、编写等),记录,传递(网络化、访问、检索等),处理(收集、验证、合并、修正、组织、分类、筛选、更新、排序、存储等),以及使用(监控、建模、分析、解释、计划、预测、决策、指导、教育、学习、娱乐)等。

现在,不妨把图1-4想象成一台时钟和100万年后的某位史学家的作品。她也许会认为这样的一个时间段并不算长,甚至可以说是与之前的两次转变正好对称。从新石器时代到青铜时代,农业革命耗时整整6 000年,这之后又过了另一个6 000年,也即从青铜时代一直到第二个千禧年的后期,图灵革命才结出了果实。这位史学家也许会认为将人类的演化看作类似于一枚三级火箭会更加合理:在史前时代,没有信息与通信技术;在历史时代,信息与通信技术已经存在并被用于记录与传递信息,但是人类社会更依赖其他同基础性资源以及能源相关的技术;在超历史时代,信息与通信技术存在并被用于记录与传递信息,但更重要的是,被用于处理信息,而且越来越多地自主地去处理信息。

人类社会对信息与通信技术以及信息本身越来越依赖,并将它们看成是人类社会繁荣的基础性资源。在第三个千禧年开始的时候,未来的历史学家也许会这样总结:创新、福利和附加值都不再仅仅是和信息与通信技术有关,而是依赖于它们。她也许会认为这种转变需要一个空前等级的信息处理能力和海量的数据,而存储和连通性已经成了某种瓶颈。正如我们将在本章后文看到的那样,她在这两个角度的观点可能都是正确的。图1-4 信息的典型生命周期指令,人机交互的根本

图1-5所示即为摩尔定律,即指在数字计算机发展的时代,当价格不变时,集成电路上可容纳的晶体管数目大约每隔两年就会翻倍,性能也会提升一倍。图1-5 摩尔定律

图1-6所描述的趋势同样令人吃惊,但它与计算能力的价格不断下跌有关。在2010年,一台iPad2的计算能力可达到1 600 MIPS(millions of instructions per second,计算机每秒执行的百万指令数),而购买这样一个计算能力只需100美元。图1-6给出了在过去的数十年间如果要购买有着和iPad2一样计算能力的设备需要花费多少钱。注意,图1-6的纵坐标是对数形式的,因此计算能力价格的剧烈下跌以10的次方为单位。所有这些都意味着,在20世纪50年代,你手中握有的那个计算能力达到1 600 MIPS的设备会花费你100万亿美元。或者说你只是曾经拥有过这个设备,因为3年之后的iPad4已经能够达到17 056 MIPS——也许只有银行家或将军才能明白如此庞大的数字意味着什么。因此我们拿卡塔尔的GDP来做一个快速比较:2010年它的GDP在全球可以排到第57名,但是这仍然不足以在20世纪50年代购买一个与iPad2存储量相等的设备,因为卡塔尔的GDP只有1 251亿美元。图1-6 购买等同于iPad2计算能力的设备所需的费用

越来越多的人可以以更低的价格获得更强的计算能力,而这一切发生的速度之快简直令人难以置信。

在机器与机器之间的交互中,一个信息与通信系统,如一台仪表或传感器,会监督和记录下路况等,再通过数据网络将数据结果传输到另一台应用设备上。该设备会读取数据并据此作出相应操作,例如在必要时自动启用汽车的制动过程。你也许听说过,如今的一辆普通轿车的计算能力比当时NASA送宇航员登月时使用的计算能力都要大(“阿波罗”计划,以1969年为例),这是真的。今天的一辆普通轿车里有超过50个信息与通信系统,它们控制了所有东西,从卫星导航到音乐播放,从ABS(制动防抱死系统)到电子锁,从车内娱乐系统到安置在引擎里的所有传感器。TH对计算能力的限制似乎大多数是物理方面的,比如在信息与通信技术设备越来越小的同时,怎么THE 4才能更好地散热以及从硬件故障中恢复。借用一个REVOLUTION之前的比喻,信息与通信技术是一枚载着人类从历智能前沿史时代到超历史时代的火箭。这也解释了为什么信息与通信技术至今仍是颠覆性技术,而没有被时间所尘封:新的一代人不断地去教长辈使用这些新技术的方法,即使他们仍然需要向长辈学习怎样开车或怎样使用微波炉。

在这个节点上,一个显而易见的问题是,这些计算能力将会朝什么方向发展?答案并非像我们通常所想——将带着手机或平板电脑等高科技产品的人类带到月球上,而是“交互”,包括机器与机器之间的交互以及人和机器之间的交互,后者也被称为HCI(human-computer interactions)。

如图1-7所示,汽车制造产业中普通的半导体设备的市场价值在不断上升。根据从英特尔公司获得的信息数据,联网汽车已经成为除手机和平板电脑之外发展最快的技术设备。把所有新车都接入互联网也只是时间的问题。到那时,我们就可以通过互联网寻找停车位、感应其他车辆,或者对旅途上最便宜的加油站进行定位。当然,电动汽车需要进行更多的计算:2015年,它们装配的半导体数量是传统汽车的两倍。机修工正在变成电脑工程师。图1-7 汽车产业中普通半导体设备的市场价值增长趋势

而在人机交互过程中,信息与通信技术通常被用于创造、便利与改进人类使用者与计算机系统之间的交流。当说起信息与通信技术时,我们很容易忘记计算机其实并不会自己进行计算,手机也不会自己拨打电话,这似乎有些自相矛盾。电脑、智能手机、平板电脑等所有其他信息与通信技术设备能做的就是数据处理。我们借助这些设备的数据处理能力去处理大量的数据,我们可以更新Facebook状态、在线订购和阅读最新上架的电子书、付款、购买飞机票、扫描一张电子船票、看一场电影、监控商店内的情况、开车到某个地方或者去做几乎所有的事情,而不仅仅是做算术或给朋友打电话。这就是为什么人机交互如此重要。事实上,自20世纪90年代中期以来,人机交互设备甚至都不再需要屏幕或键盘。它也许只是一个植入大脑中的神经假体设备。当然,在所有的人机交互过程中,想要处理得越好,解决问题所需的计算能力就越强,也就是依赖于更高的MIPS。这也是老式计算机上几乎难以高效运行新系统的原因。

我们很清楚人类在这个世界上凭肉眼能够看到什么,如彩虹里的可见波谱。但它们只是包括伽马射线、X射线、紫外线、红外线、微波、无线电波在内的电磁波谱中很小的一部分。同样,相对于机器与机器之间的交互或人机交互过程中的数据处理“波谱”,我们现在能感知到的几乎可以忽略不计。为了推动超历史时代快速到来,大量信息与通信技术应用在每一毫秒都在执行着难以计数的指令。信息与通信技术在必要时会把绝大多数的MIPS用于互相之间的交流、合作与协调,让我们无论使不使用这些设备都能感觉更舒适。思科互联网商业解决方案事业部(CISCO IBSG)是一家知名的集设计、制造与销售网络设备为一体的跨国公司,它2011年发布了一本白皮书。从这本白皮书来看,在2015年有250亿台设备接上互联网,到2020年这一数字会是500亿(见图1-8)。图1-8 世界人口与联网设备的增长(F为预测值)

人均联网设备的数量从2003年的0.08台增长到2010年的1.84台,随后又增长到了2015年的3.47台,而到2020年,这一数字将会增长到6.58台。如图1-9所示,对于未来的历史学家来说,全球交流将会是一个没有人类参与的神奇景象。

就像我们呼吸的氧气那样,几乎所有的MIPS对我们来说都是不可见的,但是它们已经变得至关重要并且呈指数级增长。各种各样的计算设备产生了惊人的数据量,比人类有史以来产生的所有数据还要多。这是另一种使超历史时代成为可能的资源:泽字节(zettabyte,701ZB=2B)。图1-9 世界人口与联网设备数量增长对比(F为预测值)大数据,小模式

数年前,加州大学伯克利分校信息学院的研究者曾预计,人类在计算机商品化之前的整个历史过程中已经积累了约12艾字节60(exabyte,1EB=2B)的数据,但是到2006年,它已经达到180艾字节。根据近期的一项研究,数据总量在2006—2011年间已超过1 600艾字节。这一数字预计每3年就会翻4倍,也就是说,2015年会突破8泽字节数据量大关。仅每天新产生的数据量足够将美国所有图书馆装满8次。当然,信息与通信技术设备一直在工作,从而使我们得以漂浮在这片数据海洋上并找到自己的方向。这些数据在可预见的未来将会持续而稳定地增长,因为更多的数据正是来源于这些设备。而更多的数据又会增加或者说是可能会增加人们信息与通信技术设备的需求量。面对这样一个自我强化的循环,任何人都会觉得难以招架。这是一种或者说至少应该是一种复杂的情感,混杂着面对危险时的忧虑、看到机会时的兴奋、获得成功时的惊喜。这些,我们在后面的章节将会有所体会。

信息与通信技术使我们进入了泽字节时代。我们将会是切身体验泽量级数据洪流的第一代人,因此我们需要发明一个新的词汇来命名这场淹没了人类世界的数据海啸。在一些著作中,这个词也被称为“大数据”(见图1-10)。图1-10 大数据的发展

尽管这种现象非常重要,“大数据”一词到现在都还没有一个准确的定义。从类似的例子来看,它给人的感觉就像是美国最高法院法官波特·斯图尔特(Potter Stewart)形容色情文学时所说的:“我很难给出明确的定义,但是我看到时可以辨别出来。”其他的解释方法就没有这么形象生动了。举个例子来说,美国国家科学基金会(NSF)和美国国家卫生研究院(NIH)就把大数据当成热点项目。这两个机构之间的某次重要合作就旨在共同宣传对进一步发展大数据科学与工程的核心技巧与技术的需求。但是,他们是这样解释的:“大数据”一词指的是大量的、多种类的、复杂的、长的和(或)分散的数据集。这些数据集来源于各种传感器、电子交易、电子邮件、视频、点击流和(或)我们今天或以后可用的所有数字资源。

即使不是一个逻辑学家,你也能发现上面这段话不仅表述不清,而且晦涩难懂。而维基百科也将“大数据”描述为“一连串又大又复杂、难以用现代管理工具和传统信息处理方式来处理的字符集”。除了那个将“大”定义为“多”的循环论证问题(NSF和NIH似乎乐此不疲),将“大数据”与“小工具”对照着理解似乎只能让人觉得相对于我们目前的计算能力来说,数据只是“大而多”而已。这是一个误导人的解释。当然,同很多其他词一样,“大”是相对的:一双对你来说有点大的鞋,我穿可能就正好。也许我们不屑于去承认,但我们总是将不相干的事物放在一起去评价,而不管这个评价是否能够涵盖某些事物的隐藏含义,比如说大数据的“大”字。再例如,我们认为马是种大型动物,但这显然没有从鲸鱼的视角出发。这两个简单的例子也许可以给我们一个感觉,那就是我们其实可以只给大数据一个宽泛的定义,来描述我们目前的计算机无法有效处理如此大量数据的事实。

这里会有两点疑问:第一,大数据涉及了太多的认识论问题,也就是知识相关型问题,而现在更多的是我们应该怎样使用数据的道德问题;第二,解决这些认识论问题需要技术性方法,即用更多更好的技巧与技术将大数据筛减到一个可控的规模。然而,认识论问题是不一样的,它需要认识型的解决方案。TH先从疑问一出发。“大数据”一词是在其他各种不太知名、并逐渐被遗忘的表述方式之后被提出的,THE 4比如“信息过剩”(infoglut)、“信息过载”REVOLUTION(information overload)。这些词表达的都是同一种智能前沿令人抓狂的感觉,就像是我们含了一嘴食物以至于无法咀嚼,或者像鹅一样被别人强塞着进食,我们的脑容量因此而迫不得已地不断扩张。这样想是不对的。我们看到种类越来越多的数据呈指数级增长,但如果我们抱怨这些数据过多的话,那就像是在参加宴会时抱怨主人提供了太多食物一样。数据是一种资产,是一种待挖掘的资源,没有人强迫我们去消化每一个字节的数据。也许有一天,我们将会成为“数据富翁”,所以这并不是最关键的问题。

既然问题不是可用的数据量越来越大,很明显我们需要重新考虑解决方案,问题不是我们能从技术层面上处理多少数据;正相反,我们看到的是更多更好的技术产生了更多数据。如果问题在于数据量过多的话,那么信息与通信技术设备只会加剧这一问题的严重性。开发出处理能力更强的系统可以说是唯一的前进方向。

对大数据来说,真正的认识论问题在于其小模式(small patterns)。正是由于如今太多的数据可以被既快又廉价地在任何设备上产生和被处理,因此压力转移到了另外两个团体肩上。其中一个是数据“暴发户”,比如Facebook或沃尔玛、亚马逊或谷歌;另一个是传统领域,比如说遗传学或是药学、实验物理学或是神经科学,压力在于能否在它们庞大的数据库中找到那些真正有价值的新模型,它们怎样才能从创造财富、改善人类生活、促进知识增长的角度更好地去探索这些模型。这更多的是一个脑力问题,而不是计算能力问题。

小模式在超历史时代之所以重要,是因为它们代表了从科学到商业、从政府管理到社会政策、从保险到安全等领域的创新与竞争前沿。在一个自由、开放的创意市场里,如果别人比你更早且更成功地开发出了一个小模式,你也许会因此而失去生意,或是错失了一次开创性的发现并与相应的诺贝尔奖失之交臂,甚至是让你的国家处于危险之中。

小模式不断推进那些可预测事件或行为的极限,但它们也有成为道德问题的风险。美国零售企业塔吉特(Target)根据25种商品的顾客购买情况建立分析模型,给每一位女性顾客都打了一个怀孕预测分。同时,它还预测时间节点,根据顾客的怀孕时间送去对应的购物优惠券。在一个负面例子中,它将优惠券送到了一个顾客家并引发了一些严重的问题:因为这个收件的未成年女孩还没有告知父母自己的新情况(即她怀孕了)。我将在第3章和第4章说到个人身份和隐私时再讨论这些问题。

但是,小模式也许只有在得到合理的集中、关联、整合和比较后,才是有意义的。比如对于信用卡和购物建议,银行需要在有限的时间里处理相关数据,并利用大数据与诈骗犯展开对抗,金融市场同样如此。而且,由于有时候即使是不存在的信息也有一定的指导意义(一些信息的缺失本身也是一种信息),所以小模式不存在时也是有意义的。福尔摩斯正是因为观察到一只本该吠叫的狗表现得十分安静,从而破获了一宗非常有名的案子。如果当大数据应该“吠叫”的时候我们却没有听到声音,那么必然有事要发生。举例来说,金融监管机构就应该知道这些。

大数据将会不断膨胀。应对它的唯一方法就是认清我们是谁以及我们在寻找什么。我们不能仅仅通过收集数据去从事科学研究,也不能这样去经商和从政。目前,所需的认识论技术将会通过一种叫作分析论的“魔法”被传授和应用,而不是通过我们在学校里获得的学位。既然我们的幸福都取决于分析论,那么也许是时候去展开一场相关的方法论研究了。哲学家不仅仅需要学习不同的知识,他们也有一些经验教训可以传授给别人。我想柏拉图会同意这一点。他也许会对以下事实感到失望:信息存储将不再是一个选择。就如我们将在第7章中看到的那样,存储能力将会胜过智力本身。但是,当我们在等待更强大的计算机、更智能的软件、更新的人类技术时,只有数据堆积显然是不够的,尤其是在我们还没有足够的存储空间时。再一次从未来历史学家的角度出发:这将是她在超历史发展进程中所发现的第一个瓶颈,即一种数字“健忘症”。告别数字健忘症

超历史时代的实现取决于大数据,但是在本章中,需要提出两个关于我们对数字存储依赖性的谬论。

数字存储的质量

第一个谬论与数字存储的质量有关。信息与通信技术的存储能力其实并不好。它们记录的信息很快就会被废弃,这些信息是不稳定的(或者说是动态的),是可以被覆盖的。由于对应技术的消失,原先的数字文件很可能不再有用,比如,软盘驱动器和老的处理软件现在就不能用了;如今互联网上有数以百万计的被遗忘的网页,这些网页在被创建出来后并没有得到更新和修正。1998年初,一份文件在被遗弃前的平均寿命为75天;今天,这一数字预计为45天。其结果就是,链接衰减(link decay,即网上资源的链接不再有效)现象已经变得司空见惯。1993年4月30日,欧洲核子研究组织(CERN)宣布其创造的万维网将免费向所有人开放,不收取任何费用。20年后,为了庆祝这一举措,CERN的一个工作小组不得不重新制作第一个网页(使用原始的链接等),因为原来的网址已经不存在了。数字存储似乎和口头文化一样不稳定,甚至更加多变,因为它给我们留下了相反的印象。信息与通信技术并不会因为未来的需要而存储过去的信息,因为它们使我们一直活在当下。这个关于数字“史前时代”的悖论在不远的未来将会越来越明显。存储不仅仅是储存和有效管理的问题;它还与对显著差异进行小心翼翼的筛选有关,因此历史才会稳定地沉降,才会按照变化的次序排列。这两个历史进程现在正遭遇重大危机。

举个例子来说,泰德·尼尔森(Ted Nelson)是信息与通信技术领域的先驱,他发明了“hypertext”(超文本)和“hypermedia”(超[5]媒体)两个术语。他还设计了“仙那度计划”(Xanadu),让它不能删除旧文件的备份。一个不断升级的网站是一个没有历史记忆的网站,类似的允许他人成百上千次覆盖文件的动态系统,其历史版本的任何信息也将难逃之后的审查。“保存这份文件”的真实意思是“替换掉它的旧版本”,任何类别的任何一份数字文件都会遵循这样一种对历史漠不关心的天性。其风险在于,差异被消除,多样化的选择被合并为一,过去不断被改写,历史的长度被缩减到了此时此刻。当我们的大多数知识都来自于这个健忘的存储器时,我们会发现自己被囚禁于这个永恒的当下。这也是那些旨在为后代而保存日益增加的数字文化遗产的自发性组织,如美国国家数字管理联盟(NDSA)和国际互联网保存联盟(IIPC)等如此重要的原因。信息管理者的职位必然会变得越来越重要。

巨量数据被创造的同时也会带来潜在的灾难性风险。我们看到的大多数(甚至可以说是全部)数据都是在短短几年间被创造的。它们正同时变旧,并且将会同时达到系统失效阈值,就像出生于生育高峰期的一代人会在同一个时间段退休一样。为了理解这个问题,不妨想想你之前收集的音乐CD,它们是怎样在10年之内就都不能使用了;再想想你的黑胶唱片。根据从光学存储技术协会(OSTA)所得的信息,未刻录的新CD和DVD的保存期限保守估计在5~10年之间。根据美国国家档案和记录管理局(NARA)的资料,一旦被刻录之后,CD和DVD的预期寿命在2~5年之间,尽管其声称的预期寿命经常使用10年、25年甚至更长时间。问题是几年之后这些材料将会严重降解,以至于不再能够保证其可用性。这一问题同样存在于我们现在的各种储存设备中。“平均失效时间”(mean time before failure, MTBF)给出了对一[6]个系统预期寿命的估计值。MTBF越高,系统持续时间越长。对于一个标准硬盘来说,5万小时(约5.7年)的MTBF是正常的。这么短的预期寿命已经成了一个麻烦。但是在这里我想强调的真正的问题却是另一个。相较于我们过去所经历的一切,现在的数字支持设备的预期寿命正不断地被同步。这也是为什么你会把它想成一个生育高峰期的原因:大数据会一起老化并同时“死”去。很明显,大量数据需要定期重录和被转移到新的支持设备上去。事实上,人们现在就是这样操作的。但是哪些数据将会通过技术转移到另一种设备上呢?做个比较后,我们会将无声电影转移到新的支持设备上,或是将录制的音乐从黑胶唱片被转移到CD上。大量数据被抛在一边,它们已经丢失,变得不再可用,或者已经无法获取。

根据IBIS World在2012年的一份调查报告,数据恢复产业已经过了全盛期,其行业总产值在2012年之前的5年中以每年0.9%的速度下滑,共减少了100亿美元,2012年的下滑速度为0.6%。这也许与我们的直觉不符:既然大数据在不断膨胀,随之而来的文件或存储中介的损坏、崩溃和不可用等问题也越来越多,解决此类问题的产业应该越来越繁荣才对。对于这个问题的解释是,云存储和在线存储为数据恢复和预防数据丢失提供了更多选择。TH如果你使用Dropbox、Google Docs、苹果iCloud或是微软的Skydrive,当你的计算机损坏后,THE 4你的文件依旧可以从云端重新获得并且可以非常简REVOLUTION单地被恢复,因此你并不需要数据恢复服务。这仅智能前沿仅是一个过渡,也就是时间的问题。云计算已经从消费者角度向这个专注于计算机的产业施加压力。当我们手中的小工具更多地变成单纯的数据终端时,我们也就越来越不需要为数据操心了。但是这些数据的存储依旧依赖于物理基础设施,而后者需要更多的维护工作。数据恢复产业会消失,一个专注于解决云计算故障的新产业已经兴起。这并不是一个依赖于冗余数据(同一份文件有多份副本)蛮力的问题。然而根据数字存储的第二个谬论,这个策略从全球层面来说并不可行。

数字存储的容量

数字存储第二个谬论与容量有关。自2007年以来,全世界产生的数据量就已经超过了可用的存储空间。尽管事实是,根据克莱德定律(Kryder’s Law)的观点,硬盘存储密度的增长速度要比摩尔定律要快,预计到2020年,一个容量为12太字节的硬盘大小只有6厘米左右,售价为40美元。不过,这仍不能满足人们的需求,因为相比于我们制造新数据的节奏而言,即使是克莱德法则所预测的增长速度仍然太慢。试想一下,因为你拍了太多照片而导致你的智能手机内存过满,然后再把它扩大成一个全球性的数据问题。在历史时代,问题的难点是确定什么应该被保存:哪些法律或者名字会被刻在在陶器上或被刻在石头上,哪些文字会被书写在纸莎草纸或是牛皮纸上,又有哪些新的条款值得被印刷在纸上。在超历史时代,保存是默认选项,因而这个问题变成了什么应该被擦除。由于存储空间的不足,有一些东西必须被删除、覆盖,或者是从一开始就不被记录。默认情况下新的信息倾向于将旧信息挤出去,或者说是“先进先出”:更新网页将会抹掉旧版本,新照片也会让旧照片看起来可有可无,新信息将被记录在旧信息之上,近期的邮件会以删除去年的邮件为代价保留下来。

多年间产生的诸多数据在超历史时代将耗尽存储空间。这个与不断减少存储空间有关的法则并没有名字,但是看起来其缺口规模每年都在翻倍。除非在物理存储或软件压缩领域出现一些重大的技术性突破,否则,从定量角度来说,这个过程将会越来越糟。但是,好消息是,从定性的角度来说,情况并不像它所看起来的一样糟糕。改用广告业的一句俗语:我们的数据有一半都是垃圾,只是我们不知道是哪一半。你拍10张照片是因为你希望其中有一张是你想要的,其他9张都可以被丢弃掉。它们从一开始就不应该被保存下来。这意味着我们需要对哪些数据值得被保存和筛取有一个更好的理解。

如同我们在前文看到的,这也意味着我们需要去理解哪些问题是或将会是人们感兴趣的,不仅在当下,而且在未来。这引出了一个让人感到些许放心的正循环:不久之后,我们应该就可以通过大数据来确定什么样的数据值得被保存。试想你的智能手机里有一款App,它不仅会建议应该保留10张照片中的哪一张,而且一旦你做了一个决定,它还会向你学习。接下来新的挑战将与如何避免机器作出不好的决定有关,改进所谓的“机器学习”,或是切实确保机器将会重新学习新的偏好(在这之后你也许会喜欢明亮一些的颜色)。更多的信息可以帮助我们决定应该存储或筛取哪些信息。未来的历史学家也许会将超历史的泽字节时代,解读为盲目的大数据和有先见之明的大数据之间的过渡期。

有关第一个瓶颈(存储空间短缺)的内容到此为止。要理解下一个与连通性(connectivity)有关的内容,我们需要先看看网络有哪些特征。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载