信誉经济:大数据时代的个人信息价值与商业变革(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-02 16:31:15

点击下载

作者:[美]迈克尔·费蒂克,戴维·C·汤普森

出版社:中信出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

信誉经济:大数据时代的个人信息价值与商业变革

信誉经济:大数据时代的个人信息价值与商业变革试读:

版权信息书名:信誉经济:大数据时代的个人信息价值与商业变革作者:[美]迈克尔·费蒂克,戴维·C·汤普森排版:昷一出版社:中信出版社出版时间:2016-05-01ISBN:9787508660745本书由中信联合云科技有限责任公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —

迈克尔:

献给我的父母,比尔和格丽塔,感谢他们所做的一切。

献给我过去、现在以及未来的Reputation.com的同事,他们让互联网向更好的方向发展。

戴维:

献给斯蒂芬、库伯和雷丽,感谢他们的出色表现和一直以来对我的支持。第1章欢迎来到信誉经济时代

信誉就是力量。

你的信誉决定了什么样的人会与你交往,以及他们会如何对待你或为你做什么。它决定了银行是否会借钱给你买房买车;它决定了房东是否会接纳你为房客;它决定了什么样的雇主会雇用你,或你到底能否找到工作;它也许还决定了你会得到什么样的优惠和VIP(贵宾)服务;它甚至还可能深深地影响你约会的成功率。在保险公司那里的信誉决定了你能否享受健康险、汽车险、房屋险或人寿险,而在政府机构那里的信誉可能还决定了你是否会成为犯罪调查的对象。

而且,信誉的影响正变得比以往更加强大。随着数字技术的迅速发展,不管你喜欢与否,你的信誉将变成永久性的,变得无所不在,并为全世界所知。不论你知悉与否、同意与否,无论走到哪里,其他人都能够即刻获取你的信誉信息。

这远远超出了所谓的“大数据”(Big Data)。大数据是海量数据被采集并存储的趋势,而“信誉经济”(Reputation Economy)这一新概念依赖于我们所说的“大分析”(Big Analysis),即能够从海量数据采集中获取关于个人的预测并将其转化为行动的新体系。这些行动可能包括了拒绝给你贷款,给你一个哪怕没有贴出过广告的工作面试机会,甚至是被潜在约会对象拒于门外。所有这些行动都基于你的信誉——它正以各种眼花缭乱的方式被数字化、网络化。

当然,信誉一直以来都很重要,问问某个在小镇上住过的人便可见一斑:信誉可以持续多久,信誉如何影响你的人际交往——尤其当你犯下一个严重错误时。不过在信誉经济以前,信誉只能在同伴之间慢慢地建立,随着时间扩散开来:我们对大多数非名人知之甚少,而信誉的维持仅同人类的记忆一样短暂。

今天,数字技术使我们有可能采集、存储、分析并扩散与你有关的各种信息,从个人档案到驾驶记录,再到所有网上活动的一个完整列表,不一而足。这种所谓的“数据挖掘”(21世纪第一个10年的热门词,意指几乎任何可以想象得到的话题都可采集海量数据的趋势)的存在是因为科技使得数据的采集和存储几乎不需要成本。对于现今的数字数据存储容量,最通俗的理解是:一个内存为1TB(太字节,一种电子储存单位,1TB=1024G)的磁盘驱动器存储的信息比一座普通的研究型图书馆所装的信息还要多。这样的磁盘驱动器,可以轻而易举地买到,大小正好可以放在裤袋里或小提包里,价格不到100美元,消费者可欣然接受——而且每年价格都在下降。所以今天,企业或个人不必求助一家大公司(或国家安全局)的资源来存储看似无穷无尽的他人信息了。存储载体成本(可以追溯数千年的历史,从泥活字印刷术,到后来的印刷机,到现在的磁介质,再到不久后的大量固态存储设备)的大幅下降使得数据的存储和处理几乎无可限量。这在以往是不可能的事情。

既然数字化数据存储可以实现免费,那么一切可能的事物都将被采集和存储——永久地存储。事实很快变成:保存大量数据集比试图从中找出哪些数据需要删除要来得便宜。而且一旦数据可以获取,无疑会有人发现它的用处。因此,每一个人都有对应的海量数字化档案被建立起来,甚至包括你访问的网站和点击的链接。还有一种隐秘的经济模式迅速发展起来:档案库和数据存储网站悄悄地收集数万亿网上行为记录,就等着有人找出利用所有这些数据的方法。

尽管一想到大数据就觉得可怕,但如果企业不知道如何使用这些数据,其本身并没有什么价值,而只是一系列的1和0罢了。大数据的真正力量(不论好坏)在于下一步:通过新的计算机系统或算法,整理、筛选数百万数据点,从中找出意义,从而找到可用信息。这也是为什么我们说未来并不是由那些采集最多数据的企业或个人主导,而是由那些从海量数据中找到最多意义的人所主导,也即掌握“大分析”的人。如果说“大数据”是你知道自己坐在一个金矿上,那么“大分析”就是将矿石从地下挖出来变成黄金。

从“大数据”到“大分析”的改变是巨大的。不仅我们的信息存储能力增长了,描述、整理、分析这些数据的能力也迅速增长了。如果摩尔定律——计算机的能力每两年就提升一倍——这个一般规律如过去几十年一样继续成为现实的话,那么数字分析的力量也会继续增长。结果,人们已开始将越来越多的决策委托给计算机完成,其中包括数百万原本应由人类做出的决策。

要想知道这一切会如何影响你的切身利益,只需想一想众多企业已经在开发系统,每分钟做出数百万关于消费者(比如你)的决策就够了。这些决策的范围正迅速从符合常理的行为(比如,试图通过识别非常规交易来减少信用卡诈骗)延伸到让你震惊的决定:保险公司基于网上行为拒绝投保申请,雇主基于计算机分析自动拒绝雇用某人或提拔某人,手机应用程序让人们在酒吧快速启动背景调查。你买了这本书,基于此,你将做出什么样的决策呢?希望是好的决策。我们将在后面的章节中对决策制定做更深入了解。

不久后,企业甚至会利用他们获得的海量数据集,根据你在工作努力程度、财务责任感、健康状况等各方面的声誉情况对你进行声誉[1]评分——类似FICO信用评分。就像搜索引擎可以让用户搜索网页信息,“声誉引擎”让企业(乃至越来越多的普通大众)可以搜索你的数字足迹,获取所有关于你的线上活动、线下活动、人际交往的信息。信用评分可以当成未来信誉经济中我们将要看到的声誉评分的雏形;如果说你的信用评分像传统的座机电话,那么未来的声誉评分就像最新一代的iPhone(苹果手机)。不管你是否想要参与其中,它都将发生。而且这些评分将被他人所用,以此对你的生活做出重要决策,比如是否雇用你,是否给你保险,甚至是否与你约会。

这类决策以及其他方面的决策的制定,比以往任何时候都快。也许你听说过“眨眼间做个决定”,那不算什么;今天,电脑完成重要决策的速度要快几千倍。人类眨一下眼需要400毫秒;在相同的时间内,一台普通的笔记本电脑差不多可以进行10亿次计算。这一速度的提升带来的影响是巨大的;事实上,这些声誉引擎——由令人头晕目眩的精妙算法驱动的声誉引擎——已经可以每秒获取超过数百万条记录,以识别或好或坏的信用风险,识别有辞职可能的员工等等。举一个简单的例子:你在工作时浏览领英(LinkedIn)网站的频率变得比平时高吗?很多算法将这种情况视为员工找新工作的信号——也许是好事,也许是坏事。如果被招聘者发现了,你接到的电话马上会增多,对方试图吸引你去新岗位。如果被你的公司发现了,接下来要么被谈话(如何才能让你留下来),要么被迅速踢出门。

不难想象,已经有一些公司纷纷涌现,为那些愿意花钱购买数据的人提供数据。这些售卖数据的公司包括像Intelius(美国一家专门收集个人背景信息的公司)这样的批发商,一次卖数百万份记录;包括像Spokeo.com(美国一家人物搜寻网站)这样的零售商,能让消费者付少量的钱就找到任何人的家庭住址。但是数据的真正价值不会在数据零售公司的手中,而是在那些最有能力利用数据做出行为预测的公司手中。比如,谷歌成立之初,它并不具有最大的网页索引,也没有最完善的目录,它之所以能超越其他竞争对手,是因为它最擅长从少量数据集中识别出相关搜索结果。任何有此特长的公司都可以成为个人信息方面的“谷歌”。确实,这是一个宏大的目标,其价值如此之大,以至于2011年风险投资公司注入了24.7亿美元(是的,几十亿美元的级别)给那些操纵、处理、存储或售卖庞大数据集(一般是关于消费者行为的数据)的初创公司。2013年,这个数字至少增长到了36亿美元。

信誉对于企业、专业人员以及个人都有着强大的影响。企业方面,一家公司在市场上的价值,其中达75%在于它的信誉;你的私人生活方面,信誉的价值占比可能接近100%。事实上,随着数字信誉的发展,信誉也许比现金货币更具价值。正如科幻畅销书作家科利·多克托罗(Cory Doctorow)在《魔法王国的衰落》(Down and Out in the Magic Kingdom)一书中所描述的,“物非”(Whuffie)这种科幻的信誉货币取代了真正的货币。用多克托罗的话说:“‘物非’重新捕获了钱的真谛:过去,如果你破产了但备受爱戴,你不会饿死;相反,如果你很富有但遭人唾弃,再多的财富也换不来安全与安心。通过衡量金钱真正代表之物——在朋友、邻里眼中的个人资本——才能从真正意义上表明你的成功。”这听起来不着边际,却并非异想天开;在全新的数字时代,我们自己的“物非”将迅速成为现实。

这本书探讨的就是在一个信誉将比金钱或权力更具价值的世界里,如何变得“信誉富有”。

[1]美国个人消费信用评估公司开发的一种个人信用评级法。——译者注信誉的商业化“信誉经济”用来描述这样一个世界:信誉可以被即刻分析、存储并作为你享受特殊待遇和利益的通行证。在信誉经济里,你可以像使用现金一样使用你的信誉,将它用作债务抵押,将它作为担保去达成原本无法达成的交易。“数字信誉”这一新的概念将涉及你生活中的方方面面。试想你走进一家酒店(这是你首次光顾它),你马上受到了身着制服的礼宾人员的亲切问候。他领着你绕过常规通道,径直来到VIP入住登记处。他为你端来一杯饮料,前台接待员为你准备房间钥匙。你喝着饮料,接待员问你是否需要将客房免费升级到拐角的城市风景房。当然,你接受了,但是有一个疑问:“为什么我可以?”接待员解释说他的电脑有所提示,根据你的在线评论和旅行历史记录来看,你的品牌忠诚度和社交分享都具有很高评分——并且根据你在工作中的努力和付出,电脑还预测你在未来多年内都颇为富有。他解释说酒店期待你今后继续光顾,并且他的电脑计算出了这次的客房升级服务足够赢得你对酒店的终生信赖。当你在预订酒店的时候,所有这些被自动计算,信息被无线传送到前台并被使用,而你无须知悉或同意。

当然,数字信誉带给你的不只是特殊酒店升级服务那么简单。它的影响会十分深远:享有一个好的数字信誉,你生活中的方方面面都享受特殊待遇,也许你根本都不知道为什么(而且有时候都不知道你享有的正是特殊待遇);有一个坏的数字信誉,你将错过很多机会,并且都不知道自己错过了什么。

不仅如此,精明的人会利用信誉的力量颠覆传统供求关系。传统的应聘工作的方式可要过时了:在信誉经济里,如果你为高端的工作机会精心建立了一个好信誉,那么雇主们会主动找上门并给你最好的工作邀请,你甚至都不需要提交求职申请。如果你单身,在制造浪漫方面(也许是收入、智商或其他好的品质方面)有一个好信誉,那么最好的对象会主动找上你,而你无须花费大量时间在相亲网站上,无须应对酒吧里错综复杂的情景,也无须天天盯着手机相亲App(应用程序)。在财务方面有个好信誉,你不必烦心于给“工资日贷款”提供者或一家又一家的银行打电话寻求贷款:他们会主动借钱给你,无须传统的抵押模式;在银行里你被迅速接待,并享受特殊利率,只要签个名就够了。

当然,有的人享受了酒店VIP服务,有的人却被默默地否定了一次机会而毫不知情。有的人有机会得到梦寐以求的工作,有的人却从未得到电话回复,只因很久以前犯过的一个错误。有的人得到国家银行的特殊待遇,有的人却不知不觉地被引向支票兑现的方式和其他次级借贷。

信誉经济的发展已经加快到几十亿美元的水平,不仅因为信誉本身具有货币一般的价值,也因为获知他人的详细信誉能带来几乎无可限量的价值——如此详细地知晓一个人的信誉,这在20年前看来简直是不可思议。换句话说,你的信誉不仅对你自己有价值,对任何与你有业务关系的人都有价值。比如,健康保险公司会花大价钱来识别风险客户,房东(和邻居)会愿意花很多钱来识别(和排除)那些扰人的潜在租客,让他们甚至都没机会提出申请。消费者们在他们的iPhone或黑莓手机上活跃地使用信誉应用程序,以此进行付费;有的应用程序甚至可以让酒吧相遇的约会对象们查看彼此的犯罪记录(该程序的口号是:查一查再勾搭)。

那些具有绝佳的数字信誉(网上可以查看到的信誉)的专业人才将比那些没有好信誉的人得到更多主动找上门的工作机会。比如,我们可以通过Stackoverflow(一个与程序相关的IT技术问答网站)和Coderwall(全球黑客交流平台)这样的网站上的专业程序员的“信誉评分”来判别他们。Coderwall想把自动评分系统扩展到多个网站,覆盖程序员们在那些网站的“成就”,甚至做成一个“排行榜”,列出系统观察到的最佳程序员们。Klout(一家衡量用户在社交网络上影响力指数的公司)这样的类似服务,意图识别出各网站(像推特之类)最具影响力和最受敬重的用户;而且“Klout评分”已经在简历上出现,作为应聘者网上信誉的证明。

以这种方式利用数据的不只科技类初创企业。保险公司也公开承认,他们使用脸谱网的数据来研究保险索赔案例,而且已经悄悄地发起了基于网上数据的测试项目:通过潜在投保人在网上的活动情况对其进行等级评估,再决定其投保价格。一家保险行业的权威杂志甚至建议,保险公司可以关注一下你所点击的广告类型,以此数据来识别风险等级——如果其他点击类似广告的人具有高风险性,那么你也会被评定为高风险一类。基于消费类型的预测,你的信用卡额度毫无预警地被降低;就此,离“动态信用下降和网上行为相融合”只差一小步了:正如一位学者写的,“如果吉他手或离婚夫妇更有可能不还信用卡,那么当你看过吉他广告或给离婚律师发了邮件,这可能会让数据聚合系统将你列入信用等级不佳的那一类了”。

事实上,Visa(维萨卡)和MasterCard(万事达卡)都已启动了试点项目来分析消费者的交易趋势,以便投入更精准的广告。有一项报告指出:“我们的神圣目标是,比如,给一个刚刚在快餐连锁店刷了卡的人看一则减肥广告,然后进行追踪,看此人是否购买了那个广告中的产品。”那么也许不难想象,拉斯韦加斯的赌场在设置交互显示广告,根据其信誉引擎对途经客人的认知,来显示个性化精准广告。

为了了解这一切如何运作,假设一天深夜你正好在浏览网页,然后看到一条广告横幅写着“秘密植物精华一周减掉15磅(6.80千克)”——并附一张“使用前”的带个大肚子的人物线条画和一张“使用后”的身材恰到好处的人物线条画。出于好奇,你点开了广告。

在大数据的世界里,你刚才的行为正是给自己判了刑:未来数周,你将被各种减肥广告横幅纠缠。点击那则广告,已经注定了你的网页浏览器会被减肥广告所识别,以至于现在你访问的每一个网站上都会有广告横幅问候你,像“秘密武器去除腰间赘肉”“阿兹台克神奇减肥秘方”“油脂工业不愿让你知道的事”,诸如此类。然后制作这些广告的公司会利用你的数据及成千上万其他人的数据,对广告投放做出调整:点击“使用前”“使用后”人物线条画广告的人更多,还是点击骨感迷人的模特照广告的人更多?在中午点击广告的人更多,还是深夜点击广告的人更多?哪种样式的登录页面带来的购买量最多?在大数据世界,这些广告背后的公司可能还对计算机生成的成百上千个广告变量进行检验,来获知哪些因素带来最多的点击率和最多的成交量。

在“大分析”的新世界,事情还会进一步发展。在信誉经济里,你不仅会看到更多扰人的减肥产品广告,你的声誉评分也会因为那一次点击而受到多个方面的影响。无论是出于购买意图,还是仅仅因为好奇,或只是手不小心一滑,由于点击了一个大放厥词的可恶广告(很遗憾,没有一种植物提取精华会在一周内安全减掉15磅赘肉),你将获得一个“行事易受广告左右”的评价——或者根本就是“容易受骗的”。因为你半夜不睡觉却在上网,可能会得到一个“易失眠”的评分,相应地还有“生理或心理不健康”。但如果电脑有理由相信你在搜索与工作相关的东西,这些评分将被推翻,取而代之的是一个“工作努力”的评分。还有,声誉引擎显然有理由假定你具有严重的体重问题,因而你的“健康”评分会骤降(或者根据算法,你的“自我提升”评分也许有所提高,因为你热切地、努力地想要提升自己的形象,即使购买的产品并没有奏效的可能)。

比起网站上到处都在跟踪你的广告,这些评分的影响要深远得多。在大数据世界,只有那些提供广告的公司知道你是减肥产品市场中的一员;在信誉经济里,其他任何想要搜取信息的公司或个人都会知道这点。你的借贷权限将受到影响:如果银行知道你除了生活拮据以外还有深夜购物的癖好呢?但愿你还能得到低利率贷款。(体重超标?自卑?)但愿你还有不错的爱情运势,(易冲动?毫无判断力?)也但愿你还有好的工作机会。让我们现实点:只是留下了点击过一个愚蠢广告的痕迹,不太可能由此失去一个工作机会。但如果你点击了很多伪科学的、骗人的万灵油广告,这也许会触发潜在雇主的计算机算法,使得它自动将你从他们的人才库中筛查出来——而你一无所知。

当然,“深夜上网”的习惯不可能是信誉经济里唯一的数据来源:你与同伴、同事、顾客、代理商、约会对象或伴侣的互动情况都会被收集、评估、判别、评分并永久存储下来。甚至像网上电子游戏这样看似毫无关系的数据来源都会被整合到你的信誉资料中。比如,《我的世界》(Minecraft)或《魔兽世界》(World of Warcraft)中的策略向导可能被归类为“具有战略思考的潜能”。而另一方面,一个喜怒无常的玩家在输了一场游戏后大肆咒骂、诽谤对方,则可能被贴上“易怒”的标签——还有可能得不到想要的汽车险,因为保险公司认为这样的人更有可能发生“路怒症”事故。由于存储变得便宜(我们将在第2章介绍),这些数据将被永久保存。所以如果数据科学家们发明了某些新的数据分析方法(各种迹象表明他们真的会发明出来,我们将在第3章介绍),你会发现,今天的一个点击动作,会给明天带来比这还要深远的影响。

所到之处都被追踪,这听起来似乎有些抽象;每次去汉堡王之后就被减肥广告缠身,这最多有些扰人。但如果一家人寿保险公司开始查看这些数据来估测你的寿命并做相应的保额,那会怎么样呢?如果雇主们开始查看这些数据来判断雇用你是否会影响他们的保险费用,那会怎么样呢?万一数据被错误地记录了(其实你买了一份沙拉)或被错误地理解了(也许你买那个汉堡是给一位朋友的,或给一个流浪妇女的)或根本就是错的(你的信用卡被偷了)呢?如果这些数据出于某种目的卖给了出价最高的人,又会如何呢?

如果这种技术无可避免地延伸到脸部识别,让公共场合的监控摄像可以追踪每一个进入到反战集会或“计划生育”诊所的人,或说出每一个在年度“骄傲游行”队伍中的人的名字,或仅是登记每一个在周六晚上从当地酒吧踉跄着出来的人,那会怎么样呢?如果这类数据可以被采集(它会的),那么势必有人会找到从中谋利的方法——如果说今天脸谱网是一个受欢迎的跟踪工具,试想一下,不论喜欢与否,有个网站正在记录你所有的社交行为。目前没有一项法律是禁止这些做法的:数据公布者享有《第一修正案》的广泛保护;记录一个人的公共行为可能也是合法的,因为一个人来到世界的时候,并没有大致的“隐私权期望”。未来立案将不得不对数字跟踪程度的合法性做出决定。

如果说所谓的大数据是让我们可以将数据收集起来,那么“大分析”就是让公司和个人以影响你生活的方方面面的方式来使用数据。好消息是,只要你细心培养自己的信誉,确实可以影响个中的一些决策,有时还能够以意想不到的方式影响决策。懂得如何在全新的信誉经济里航行,你就是这个以信誉为最有价值的资产的世界里获益的人。那又怎样?

信誉的商业化只是全新的信誉经济的一部分——在它所反映的世界里,企业和政府将积极地从各类信誉的衡量和买卖中寻求利益。到最后,信誉无异于其他任何可以被货币化的商品;它将无可避免地被商业化,被挖掘、净化、腐化、败坏、争夺、交易、售卖、重新包装、存储,并以各种意想不到的方式被使用。就像中东地区对地下石油的探求塑造了那里的政治和历史一样,未来的信誉之战将塑造这个世界。如果“信誉引擎”的运行依靠的是数据,那么争夺数据的控制权就如同争夺其他任何有价值但分配不均的商品一样。

这种冲突是无可避免的。计算机和科技的发展比社会发展还快;连我们自己都还不知道如何使用我们正在发明的科技。我们害怕科技会超越社会和伦理,这已不是什么新鲜事(哪怕是爱因斯坦,他的理论开启了核动力技术,但他对原子武器所持的是严谨的保留态度),但声誉不同以往,它与个人密切相关:今天的科技做出的决策影响着你的私人生活——有时真的是很私密的方面。更可怕的是,计算机系统在神秘的面纱后面进行着秘密评分工作;每天,人们都不知道什么信息正在被收集,更不用说他们的信誉分数是如何计算并使用的。因此,一个错误的信息——一次错误输入、一个不实的传言、一次计算错误——都会导致严重的危害,而你对此一无所知。你可能永远都不知道因为自己的信誉而被区别对待了;即使你从未接到潜在雇主打来电话提供理想工作,或者Match.com(世界最大的婚恋交友网站)从未展示你的档案给你的梦中情人,或者天使投资者从未投资一分一毫到你的生意中,你永远都不会知道自己错过了这一切。

但并不是只有坏消息。一个坏信誉也许让你错失机会,一个好信誉可能让你在无数的机会和利益中通行无阻。多亏了互联网能够传递信息给世界上的任何人——就像传递给街角的人一样容易——影响一生的好机会可能来自世界的任何地方,甚至数千公里之外。不仅如此,在即将来临的信誉经济里,一个好声誉差不多具有“去中介”的功能——通过突破传统的门和守门人,打造公平的竞争环境。因此,今天,一个完全默默无闻的好声音可以通过一个受欢迎的YouTube(世界上最大的视频网站)频道转化为一份数百万美元的唱片合同,一个偏远地区的体育运动人才可以凭着声誉签下职业运动员合同。比如挪威人阿瓦尔·卢格兰(Havard Rugland)原本从未参加过一场橄榄球赛,但因为他将自己展示球技的视频放在网上并大受欢迎,他被底特律雄狮队选中签约并在季前赛中打进两个球。

有一个好的信誉,你可以随心所欲。雇主们的计算机算法会从成堆的数以千计的简历中瞬间自动挑出你的简历,同时他们也瞬间自动地排除掉了其他人。银行和其他贷方会自动批准更低的利率和更好的条件给你。Tinder(国外一款手机交友软件)、Match、OkCupid(美国在线约会网站)这样的App及网站上最有魅力的相亲对象在看到别人的资料之前最先看到你的资料。你的实体店或网店的顾客数量会超过你的同行。后面的章节将展开介绍信誉经济的发展带来的这些启示,以及如何做才能从中获益。

通过这本书,你将学习如何让自己的信誉最优化,从而去收获信誉经济带来的一切利益。我们会为你展示Reputation.com(美国一家在线信誉管理公司)的数百万用户改善生活的秘密——诸如如何管理一个数字信誉,让你在雇主、贷方、保险公司、投资人等每一个人眼中更有竞争力。例如,我们会告诉你,在简历、绩效评估和领英档案中使用哪些关键词能够确保你在招聘者或潜在雇主的搜索结果中排在最前面;以什么样的方式管理你的线上线下活动可以让保险公司计算出的风险等级(从而使保险价格)降低;如何为你的商业构想或初创企业吸引风险投资,从投资者处寻得低利率,并赢得谷歌和微软这样的科技巨头的关注。我们甚至会告诉你如何创建虚假痕迹和数字烟幕来隐藏负面信息或不想被发现的信息。你没有办法消除数字痕迹,但你有窍门不让它被发现。我们还会告诉你如何使用所有这些科技力量去评估他人的信誉,因而你总能知道正在往来的是什么样的人——不论是潜在雇员、投资者还是伴侣。简而言之,我们将为你展示如何在这个信誉的价值跟钱包里的现金一样的世界里变得“信誉富有”。

一个新的数字世界即将来临。在这个世界里,做好准备的人将驾驭数字信誉的力量赢得利益;没有准备的人则被甩在后面,且不知原因何在。你准备好了吗?第2章信息存储革命信誉永久、便宜、无处不在

在明天的信誉经济里,几乎所有进入数字领域的事物,都可以以各种各样的形式毫不费力地、低成本地、无限地保存下来。确实,小规模的数字数据存储已经实现免费,大规模的数据存储也已变得极其便宜。不仅如此,它还变得异常容易:既然海量数据可以存储在“云”上,那么你不再需要靠有计算机科学学位的人(甚至不需要电脑,一部普通的智能手机就足够了)来建立一定规模的数据库了——建立这样的数据库原本需要庞大的硬盘设施和专业技能才能实现。于是,海量数据存储不再是中央情报局(CIA)、国家安全局(NSA)和其他“三字母”机构的独占领域,也不是IBM(国际商用机器公司)、SAP(全球性的企业应用和解决方案提供商)或其他“三字母”公司的专有事项了。现在,任何具有亚马逊(Amazon.com)账户的人都可以存储几乎无限的数据,任何类型的企业——从银行到零售商到当地杂货铺——都在这么做。因此,你可以认为,你今天所做的任何数字化行为——从互联网搜索到信用卡交易——都将被记录下来并永久保存。

今天的计算机记忆内存比以前大多少呢?说真的,问一问火箭科学家们吧。宇宙飞船“旅行者一号”的功绩之一是,它是人类制造的首个离开太阳系的航天器。“旅行者一号”于1977年发射,带有当时最好水平的6台移动计算机,在2012年或2013年的时候(取决于如何定义太阳系的模糊周边)离开了太阳系。它的6台计算机总共带有约等于68KB(千字节)的记忆内存。相比之下,今天仅一部当前水平的2013版iPhone 5s,其价钱是前者的数百分之一,大小正好可以放进口袋,且具有986000倍之多的记忆内存。

这场数字数据革命的开端可以追溯到1890年美国人口普查。那个时候,人口普查每10年进行一次,每次需要8年时间来统计,也就意味着上一次普查结束的时候,政府已经准备开展下一次的普查了。普查人员会挨家挨户地走访,在一张纸单上记下居民的情况,然后把单子交给许多个核对中心,那里的统计人员辛辛苦苦地对数据进行汇总。人们能做的似乎仅此而已了,直到赫尔曼·霍尔瑞斯(Herman Hollerith)的出现。这位地质工程师想出了一个办法,用穿孔卡片代替每家每户的手写记录。在霍尔瑞斯找到这个办法以前,穿孔卡片是用在织布机上面的,从未用来采集数据,但政府当时对于人口普查速度失望至极,于是指派霍尔瑞斯去开展1890年的人口普查,尽管他毫无相关经验。新办法的效果比霍尔瑞斯自己设想的还要好:穿孔卡片的方法使得处理人口普查数据所需的时间从8年减少为1年。一个人的生活情况可以在一张穿孔卡片上汇总起来,这一发现在很大程度上预示了一个世纪以后将要发生的数字数据革命。事实上霍尔瑞斯后来还成立了一家公司——后来的IBM,它花了近80年的时间生产穿孔卡片,并主导了早期的计算机市场。

到20世纪60年代,穿孔卡片(有时也叫霍尔瑞斯卡片)仍是当时专业数据存储方面最好的技术,而且它无所不在,以至于伯克利大学的学生们的座右铭都是“不要折叠、刺插或毁坏”(Do not fold,spindle or mutilate)——这是IBM穿孔卡片上的标准警示语,警示人们不要毁坏卡片(比如将卡片插到餐厅里插票据的轴锭上)。从伯克利跨过旧金山湾,一个名叫斯图尔特·布兰德(Stewart Brand)的反文化者,也许是最著名(尽管有些讽刺意味)的穿孔卡片使用者了。1968年,布兰德出版了《全球目录》(The Whole Earth Catalog)。这是一本文字目录,共有430多页,封面是最早期的从太空拍摄到的地球全貌图中的一张(那是布兰德游说了美国宇航局而发表的)。该目录意图囊括所有维持一个环保的可持续文明所需的物资和信息,从电弧焊机广告和网格穹顶广告,到贻贝层中磷脂成分的数学预测,到叙事性描写肯塔基州一个特拉普派共同体的葬礼过程,不一而足。

尽管布兰德的目录包含了假定计算机瓦解后文明发展所需的一切,他却是用IBM的穿孔卡片来管理目录的发行量的。他给每位订阅者发放了一张穿孔卡片。穿孔卡片让他可以快速处理数千份订阅信息、打印邮寄标签和收据、建立订阅者名单。业余之时,布兰德是位受欢迎的科技未来主义作家;他相信海量数字存储可以使利用信息和数据处理的机会被广泛民主化。他对声誉的最直接的影响是在1984年的一次会议上。其中非常著名的一段是,他告诉Apple(苹果公司)的联合创始人史蒂夫·沃兹尼亚克说“信息要免费”(information wants to be free)。这句话很快演变成科技自由论者的哲学信条,定义了互联网的早期追崇者,也启迪了我们现今生活于其中的整个数据采集文化。

15年很快地过去了,布兰德的“信息要免费”像句咒语一样,使得斯坦福大学校友谢尔盖·布林和拉里·佩奇建立谷歌时定义的公司使命就是:“整合全球信息,使人人都能访问并从中受益。”布兰德的“信息要免费”的想法为“全球数据瞬间共享”奠定了基础。换句话说,很大程度上是由于布兰德的哲学信条,使得人人皆可获取的信息,从《全球目录》中书写的多类事实和描述,扩展到最终包罗世界上一切事物,包括个人情况在内。

布兰德说对了,但同时穿孔卡片的问题是,它们要占据大量的空间:1959年拍摄的一张照片显示了当时的一间联邦档案存储仓库里堆满了装穿孔卡片的货板,每个货板放45箱卡片,加总起来约有4.3GB(千兆字节)的存储量,占满的仓库至少有一个橄榄球场那么大。到了IBM和“350”磁盘存储系统的时代,数字被存储在堆聚的50个庞大的旋转磁盘上。这个磁盘系统就跟一个冰箱那么大,重1吨多,存储空间大约4MB(兆字节)——只够存放一张数码相机拍出的分辨率较好的照片,或存一首标准音质的傻朋克乐队(Daft Punk)的《Get Lucky》。而且它的价格是数百万美元——可以租赁,每月约3200美元(这是以当时美元值算的,接近于现在的每月27000美元)。

然而,正当IBM发行它的首个重要磁盘驱动产品时,它也在忙着升级磁盘驱动的最大竞争对手:727型盘式磁带系统,该磁带系统成了那个时代计算机技术的象征。727磁带系统将数据存储在类似于卡带录音机使用的磁带上[对1980年后出生的人来说,当时没有iPod(苹果公司的便携式多功能数字多媒体播放器)或CD(激光唱片),人们使用的便携式音乐播放器就是卡带机]。

不同于使用庞大的旋转磁盘存储数据(它的优势是可以快速读取数据),IBM的磁带系统则是在一卷长长的磁带上将数据存储为各个磁点。磁带系统的好处非常明显:存储容量只受限于可以装入机器的磁带的长度。如果磁带太长,那就将带子卷到另一个轴上。它的缺点是耗费时间——有时需要几分钟,甚至几小时来读取一卷长长的磁带上的数据。结果,虽然通过磁带存储数据的商用模式操作起来缓慢,但存储规模确实巨大。仅一个例子说明:今天,IBM的竞争厂商StorageTek推出的最小的商用模式磁带系统可以让你访问1448卷磁盒,总共存储约1.4PB(拍字节)的数据(1PB=1024TB=1 048 576GB≈1 576 000 000 000 000字节)。StorageTek宣传的最大系统可以存储457PB的数据——比今天居住在美国的所有人的信息(假设每人1.5GB)总和还要多。而那只是一个存储单元而已;我们还有可能将多个这样的存储单元连接到一起——如果你对数据存储量的需求真的如此让人难以置信的话。

存储单位换算

1字节=1个字母或数字

1024字节=1KB≈半页文字

1048 576字节=1MB≈一张中等分辨率的照片

1073 741 824字节=1GB≈一部高清电影

1099 511 627 776字节=1TB≈半个研究型图书馆(客户端设备可以实现)

1125 899 906 842 624字节=1PB≈足够存储每一位美国居民的高分辨率照片(商业上可以实现)

但是,磁带系统——还有庞大的硬盘系统——又大又笨重,且操作复杂。它们需要特殊的电源连接、专门的计算机服务器、特殊的灭火系统、易于散热和安装电缆的拔高的地板、一个组装系统的团队,有时还需要特殊准许。以上描述的磁带系统可不是个苗条美人,它重达15125磅(合6869千克)——一个可以压垮大梁的重量,足以要求人们对地板进行特殊规划,以免不小心把地板变成了升降井。而且当[1]它工作的时候,每小时产生44380 Btu的废热——比你打开一个普通的壁挂式燃气炉并让它烧一整天产生的热量还要多。

为了说明从那以后数据存储世界发生了多么大的变化,让我们将其与现在最无处不在、最为人所知的东西——iPod Nano(苹果的音乐文件播放器)——做个比较。第7代Nano是一个长方形的音乐播放器,具有独特的混合性能和尺寸。它跟一个普通的腕表差不多大小,只有31克重,在充满电的情况下可以连续播放24小时,可存储16GB的音乐——大约一个160码(约146.30米)长(约一个橄榄球场的大小,包括达阵区)的书架装满的数据量,而零售价只有149美元(2013年美元值)。该存储空间足以轻松装下美国所有男人、女人、儿童的地址和电话号码,还有剩余空间放一些健身音乐。

当然,一个腕表大小的iPod还不是当前存储能力的最好水平。事实上,哪怕一个非商用的外带硬盘(可以连接到笔记本或台式电脑的那种)都可以存储几个TB的数据——约128个iPod Nano的存储空间,而且通常不会比两副扑克牌的尺寸大(如果按过去的发展趋势继续发展,它们将很快缩小到衬衫口袋的大小)。据估计,一个1TB的磁盘驱动器存储的信息,跟写在5万棵树制成的纸上的内容一样多;2TB可以存储一个普通图书馆的所有内容。换句话说,一个5TB的磁盘驱动器(现在任何有亚马逊网站账户的人都可以买到)可以存储美国所有人的数据(按每人17500字节,足够放一张脸谱网的头像照片及过往现今的住址清单,还有空间给其他数据)。这些驱动器的价格已经低于200美元,如果按照过去30年存储技术的发展趋势继续下去,其价格将不断下降。

而这仅仅是普通个人在其台式电脑上能够存储的数据量!今天,大大小小的企业都可以在所谓的“云”(存在于互联网上的“永远在线”远程数据存储及处理设备的集成)上存储更海量的信息,而且几乎无须成本。多亏了一家默默无闻的网上零售商——亚马逊——提供了一项服务,让世界任何角落的任何公司,甚至任何持有信用卡或比特币的个人,只需点击鼠标就可创建一个海量存储系统。你不需要有一间特殊的服务器房、一辆叉车或宜家家具那样的组装指导,你只要有一张有效的信用卡,就能够在一般人们开车去最近的咖啡馆所花的时间内,建立自己的海量存储系统(几个TB的存储空间)。

这一切开始于2006年,当时亚马逊的首席执行官杰夫·贝佐斯面临一个难题:华尔街在经历前所未有的高速发展,而贝佐斯开始意识到亚马逊的商业模式——将货物装入箱子并运往全美国各个地方——出现了饱和迹象;某些时候,人们愿意在网上购买的东西一定是有限的。与此同时,亚马逊在南非的一小支研发团队已经十分擅长开发一些技术,让亚马逊的计算机服务器能够每秒同时处理数百个用户的请求。亚马逊由此可以使用更少量的计算机来处理网站的服务任务(网站有数百万的产品,有每秒2750美元左右的交易,亚马逊需要处理海量数据的计算能力),这为亚马逊节省了大笔资金,也让它在发展壮大中更轻松地扩展计算机体系。

贝佐斯知道这项技术具有巨大价值——不仅对亚马逊自己的盈亏有影响(可以节约各处的计算机规模),对其他公司也有潜在意义。但问题是,亚马逊并不是一个卖计算机软件的公司;出售软件的自主安装的做法,跟其依赖广大用户群的商业模式背道而驰。而且这种软件也不是那种可以让你放到“App商店”供他人下载的软件;它仅作用于数千台计算机相互连接而成的庞大的计算机“集群”。

但是,贝佐斯向来是个梦想家,他意识到他的这两个难题(其一,为了公司发展,有必要取得大众市场;其二,自主软件缺少出路)似乎可以用同一个办法解决。贝佐斯(在一些帮助下)想出了一个办法:将亚马逊自己的原始计算能力[就是后来我们所熟知的“规模可调云托管服务”(Elastic Computing Cloud),或叫EC2]和它自己的在线存储容量[“简单存储服务”(Simple Storage System),或叫S3]租出去,让个人用户可以轻松地登录、创建账户,指示亚马逊的服务器处理或存储任何类型的亚马逊“云”数据。总之,亚马逊利用其新软件获得了一个巨大的消费者市场;这些消费者需要强大的计算能力,但不想购买或维护自己的硬件设施。有一个评论家这么说:亚马逊的天才计划就好比沃尔玛将传说中的配送中心和物流系统卖出去,让其他零售商可以使用它们来配送任何商品——从卫生纸到吸尘器到汽车零部件。

当然,所有这些存储空间如果没有东西填进去,便是毫无意义的。将电影《梦幻之地》(Field of Dreams)里那句著名的话改编一下:“你建好了,他们就会来填”(Build it and they will fill it)——他们已然填进去了。2013年初,亚马逊S3基本在线存储服务就存储了超过两万亿的“对象”——每个对象约等于一个文件夹或一个数据库。用户包括Netflix(一个收费视频网站,它的流媒体服务利用亚马逊S3存储服务存储及分配了超过17000个视频)这样的大公司,也包括Heroku(支持多种编程语言的云平台服务,它选择使用亚马逊的服务,而不是建立自己的数据中心或雇用自己的研发团队,也不需处理计算机硬件设备所带的各种复杂问题)这样的小型初创公司,以及后来更多的类似公司。虽然最初的S3和EC2服务实现了“存储空间”和“可使用性”的小小变革,但它们也相对昂贵。为了解决花费问题,2012年亚马逊宣布了一项叫作“冰川”(Glacier)的新服务,提供免费的数据存储,但有一点:你可能无法立即得到想要的数据。亚马逊说,获取任意特定档案可能需要几个小时;实际使用者反映约有4个小时的延迟。该服务推出的时候,亚马逊每月每GB存储服务的售价约0.01美元,约等同于每月以0.16美元的价格买到前面所说的iPod的存储空间。虽然有些用户仍在抱怨价格“高”,但要知道,每月仅花费50美元就可以存储5TB的数据了——足以存储生活在美国的每个人的照片,或存储每一份记录在案的纳税申报单。

当然,亚马逊Glacier只是多个服务中的一个。这些服务让任何有电脑的个人都能够以几乎想象不到的极低价格存储海量数据。其他的例子包括Dropbox(碉堡箱,提供本地文件的网络存储的在线应用),目前正免费提供给所有用户2GB的在线存储空间,并提供升级选择:每月仅花10美元就可升级到100GB(即每GB存储价格0.1美元);Google Drive(谷歌的在线云存储服务)可以让Gmail Picasa(谷歌的免费图片管理工具)及其他谷歌服务的所有用户都可以免费存储15GB的电子邮件、照片等等。还有雅虎旗下的Flickr(图片分享网站),这一热门图片共享服务现在也给每个账户提供1TB的存储空间,足以存放约60万张普通大小的图片。这些数据存储容量一直在增加:谷歌历史性地在Gmail(谷歌邮箱)首页放了一个计数器,来显示它的免费存储空间在持续增加——15GB的存储空间是2012年时的“仅仅”5GB的3倍。

所有这些存储的总量是巨大的。一项研究估计,早在2007年全球数字数据存储总量已经超过了2950亿GB。一位研究员说:“如果我们要将所有这些信息存储到书本中,我们将以13层的书本覆盖整个美国或中国。”

总而言之,今天,花费不到一部iPod的价钱,企业就可以存储海量的关于你的数据,从“点击过的广告”的历史记录(包括你在访问哪个网站、在一天中的什么时间访问、你最终是否从广告主那儿购买了产品),到收费器上的交易历史(反映了你开车到过什么地方),到信用卡购买记录,到你在脸谱网上发布的每一张照片(不论是你上传的还是一个朋友上传的),不一而足。

[1]Btu为英制热量单位,1Btu约等于1055.06焦耳。——译者注像泥土一样免费

数据存储价格大幅下降的真正意义,也即令人震惊的一点是,现在大多数数据的保存比将其删除更便宜、更容易。删除数据关乎艰难的商业抉择:万一我们还需要那些数据怎么办?万一它还有价值呢?要是我们不小心删除了一个活跃用户的订单怎么办?而且就算做出了“删除”的决定,也需要计算机程序——有时还需要数据库工程师——来实际操作。在一个理想的世界里,每一个数据库都是谨慎地设计出来的,可以轻松删除旧数据。但现实中,大多数据库都随着时间的推移拼在一起,并未考虑今后要如何删除数据;如果一个数据库非常复杂,那么一个程序员需要耗费几十个小时(或更多)从新数据中整理出旧数据并准确地删除不再需要的部分。

雇用一个可以娴熟地处理如此复杂的数据库的程序员,一不小心就要花费100多美元(每小时),而且价格只会越来越高。一个非常小的数据库——比如一个拥有几千用户的小型网站——也许就要耗费10个小时(这是一个极其乐观的估计,前提是数据库整体设计良好)来对其进行梳理,以确定如何删除掉一堆旧数据。那么仅编程至少需要花费1000美元,更别说错失的机会和因此分散的注意力;如果没有任何备份的磁带(很慢)或其他“线下”的数据备份,代价往往更大,也许需要多花数小时(甚至更多)到这项工程。对于像脸谱网的数据库那样的,它存储在许多不同的服务器上,具有数万亿的记录,所以哪怕在原数据库设计之外做一点小小的改变,都可能花费成千上万美元甚至更多。

就在不久以前,1000美元(从一个简单的数据库删除数据所需的花费)只能再新买800000字节的存储空间,还不够存放一张脸谱网的头像照片(价值500美元的磁盘驱动器是20世纪80年代苹果麦金托什电脑的标配,按现在的标准,它的存储容量小得可笑)。由于存储的成本很高(相对今天来说),因而通过删除数据来保留存储空间的策略在当时看来情有可原。而如今,对于一个维持自有存储方案的公司来说,1000美元(按当前美元值)可以买到超过20TB的永久存储空间,是麦金托什驱动内存的4000万倍之多。如果一个公司愿意使用磁带存储,1000美元可以买5倍的(约100TB)磁带存储空间。存储价格下降如此之快,以至于假如你今天买了一个带1TB内存的电脑,等到需要更换电脑的时候,同等的价格可以买到内存大得多的电脑了。所以,一个公司如果可以以无限低的价格购买更多的存储空间,何必还要自寻烦恼去删除数据呢?

于是,无限存储数字数据(而非删除它们)成了既定的策略。这个策略不仅适用于你在脸谱网上发布的东西以及保存在个人电脑里的信息。你的工作邮件很可能会保存在备份磁带上面若干年,除非你的雇主有理由删除它们(虽然有些聪明的雇主为了谨慎起见,确实会推出一些邮件销毁政策来抵消数据永久传递的可能)。你的工作项目——无论是演讲、报告、财务预估、幻灯片(还有你傻傻地保存在工作电脑上的任何私人信息)——都可能永久地保存在一些公司硬盘上。再说一次,如果硬盘满了,买一个替代硬盘会比从数千个旧文件中找出哪些需要删除、哪些需要保存要便宜且简单得多。如果搜索一个主流法律公司的档案存储系统,只需一个点击就能展示从20世纪80年代起直到21世纪第一个10年的成百上千个文件;公司里有哪个律师(每小时挣几百美元)会耗数百个小时的宝贵时间去找出哪些文件依旧有用、哪些文件已经无用呢?

还有你的私人电子邮件,如今也被无限地存储。在2004年谷歌推出Gmail之前,许多网页邮箱仅提供10MB存储空间。微软有名的Hotmail(微软的电子邮件服务)服务只提供2MB的存储空间,比现在的一张数码照片还小。受限于如此小的容量,用户不得不经常删除一些邮件来释放空间给未来的邮件。从某种程度上说,人们习惯了像处理普通信件一样处理电子邮件:读完来信内容,然后将大多数信件扔进垃圾桶,可能只保留了最重要的几封。清理邮件是个无穷无尽的任务——电子邮件应用(比如Hotmail)甚至还带有一个显眼的“删除邮件”(Delete Message)按钮,来帮助用户清理收件箱。

2004年,Gmail的问世改变了这一切。Gmail宣布,用户可以得到1GB的存储空间——当时普遍标准的100多倍,微软标准的500多倍。不用说,谷歌将“删除”按钮换成了“档案管理”(Archive)按钮,用以将旧邮件从收件箱中移出去(并非删除它们),将它们永久地保存在Gmail“云”上(说不定哪天,你需要那封你姑妈在2006年写给你的“搞笑”邮件——来自她的AOL(美国在线)账户,尽是些搞笑段子——请放心,它被归档了)。多年来,谷歌为用户提供的邮件存储空间持续地扩大;多年来,它提供的总存储空间每天都会增加一点;如今,连同其他“云”产品一起,谷歌总共提供了15GB的存储空间。其他的电子邮件服务商也跟着扩大他们的存储空间,让“档案管理”按钮比“删除”按钮更显眼。谷歌通过让删除邮件的操作比保留邮件更不容易(当然删除还是可以的,只不过“删除”按钮放在不容易找到的地方),从而改变了用户对于如何处理数字数据的看法,让他们更坚定地相信:数据永远在那里。

同样地,这几年来脸谱网也扩大了它的存储容量;它发现了购买新的存储空间比删除数据更容易、更节约成本。脸谱网购买新的硬盘驱动的速度之快足以存储每一个新增的用户账号、每一张新上传的照片、每一条新发送的消息及每一个被10亿多全球用户点击的广告,即每天增加500TB的存储量。这意味着每天增加到脸谱网数据库的数据相当于议会图书馆所有印刷资料上的信息的50倍。即使那些从你的公共页面上去除的信息,也很可能被保存在了其他地方:如果法律执行有所要求,脸谱网可以建立用户数字档案,有些用户资料不止80页;它不仅涵盖你公开的信息(照片、状态等等),还包括公众看不到的信息,比如你删除的好友关系、你以为已经删除掉的信息墙、近期登录的IP(互联网协议)地址、浏览过的一系列网页等等。一些数据专家认为,即使你点击了“删除照片”(Delete Photo)的按钮,脸谱网其实并没有从它的服务器上删除这照片。还有推特呢?推特每天产生4亿条信息,美国国会图书馆甚至还永久保存了推特上的每一条公开信息,不论其内容是什么。

还有数不清的其他领域都是如此。可以这么认为,现在你的每一个数字行为都被永久地记录在一个或一个以上的地方。也许它还没有完全被分析(很快会的,见第3章)或被使用(见第4章和第7章),但它就在那里,在某个地方永久存档,等待着在你意想不到的时候浮出水面。所有你的财务往来是这样的,从信用评分查询,到ATM(自动柜员机)取款,到股票交易。你写的关于公司或业务的每一个字是这样的,从博客文章,到推特信息,到正式的新闻稿。所有你在政府的记录也是一样——每一次财产税支付都是公开的,并归档于州政府处;每一张犯罪嫌疑人的照片都在线公布且存放在几十个网站上,无论当事人有罪无罪,或哪怕根本是一次错误的拘捕行动。你发布在网上的每一条评论——关于每一家酒店、每一部电影、每一本书、每一家餐厅的评论以及你在餐桌前拍的Instagram(一个抓拍图片的程序)照片——亦是如此。还有大量丰富的元数据——比如你的位置——也是一样,你可能都没有意识到自己的智能手机正在记录你的信息。多年来,主流线上广告主们无限地保留了你每一次广告点击的详细记录;只有来自监管机构的压力,让他们在数月后开始从数据中去掉你(但不删除)的名字。

你的每一次信用卡交易——不管是线上或线下——不仅被信用卡公司追踪并永久保存,也被卖方的支付操作系统追踪并永久保存下来(然后通常卖给了其他的零售商)。每个填好的药物处方都进入了庞大的处方数据库,即使它本身是最高法院诉讼案件的话题。你二十几岁时的在线相亲档案(带着那些尴尬、讽刺的信息)保留在某处的某个服务器上,哪怕你早已幸福地结婚并生育了三个可爱的孩子。你的手机所连接的每个信号塔都建立了永久的数字轨迹,让你的每一步都被切切实实地、永恒地记录下来。还有每天通过手机或家庭电脑浏览过的网站,还有很多公共场所的安全监控录像等等,数不胜数。

跟你的职业发展直接相关的数据也被永远地追踪和存储。即使你不使用领英,你的朋友和同事们已经开放了他们的通讯录并自动将你列为认识的人,这给了精妙的计算机算法一个重大提示,使其了解你在公司里的情况。你的历史薪水记录被雇主的薪水支付程序存储下来;尽管还不知道它会被如何利用,但都保存着。你发布的每一篇关于公司的帖子也都保留在案——即使你认为自己是匿名发的,它仍可能被追踪到;尤其现在,越来越强大的计算机软件往往只要根据写作风格就能认出是你。[1]

有没有曾经行驶在乡间小路上然后看到“免费泥土”的标牌?有这样的标牌是因为这种泥土无处不在,且几乎无法处理掉——容易找到,容易保存,但很难去除。大多数人如果把它挖了出来,结果就那么把它留在那儿了;大堆的泥土也许几个世纪都留在那里。在美国一些地方还留存着内战期间防御用的泥土;在伊利诺伊州,有些泥土甚至是公元1400年前卡何齐亚当地族群留下的。这些泥土似乎要永远地留下了。你的数据就像泥土一样留在这里:积累容易,清除很难。

这场数据存储革命最显著的结果是,声誉上的污点将永远存在。哪怕是犯下的一次性错误,如果它被保存在数字领域,它将跟着你一辈子。如今不都是这样吗?有没有在心情极差的某一天骂了客户一顿,结果被录成视频放到了YouTube上?上班时偷偷忙自己的私事被逮个正着?戴着谷歌眼镜的八卦邻居看到你在丈夫出差时与一位陌生人共

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载