大数据主义(txt+pdf+epub+mobi电子书下载)

作者:(美)洛尔 

出版社:中信出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

大数据主义

大数据主义试读:

推荐序

大数据何以成为“主义”?

数据者,有广义与狭义之分。狭义的数据,就是数字或数值,如1、2、3、4、5……;广义的数据,则可概括为人类观察、实验、计算等的记录。作为这些记录的符号,或数字,或文字,或图像,或音视频,从上古时代的结绳记事、楔形文字、甲骨文,到古代乃至现代以竹简、布帛、羊皮、纸张等为载体的图文,直至现在以比特为单位的电子信息,可谓无所不包。

也许,正是由于互联网技术工程师们习惯于把以电子信息方式存在的内容统称为“数据”,于是,“数据”一词便由狭义的“数字”或“数值”演变为主要指向通用的广义“数据”。

随着计算机、互联网、现代通信以及相关软硬件技术的飞速发展,大数据和云计算,如同一枚硬币不可分离的两面,成为我们这个时代的高频词。

大数据之大,不仅大在巨量或海量——由人们熟知的千字节(KB)、兆(MB)、千兆(GB)和太字节(TB),跃升为专业人士才了解的拍字节(PB)、艾字节(EB)、泽字节(ZB),乃至尧字节(YB)。(1KB=1 024B,1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,1PB=1 024TB,1EB=1 024PB,1ZB=1 024EB,1YB=1 024ZB)。其中,不变的是基本单位B,即比特或字节,而从K到Y,则是成千倍的递增,以致有人据此宣称,目前的数据计算已经进入“PB时代”。

大数据之大,还大在数据结构的有容乃大——它不再需要传统的数据库表格来整齐排列,几乎可以无所不包地记录、存储和计算各种规则的结构化数据和不规则的非结构化数据,于是便有了逐步演变为一个数字化世界的可能。

如此庞大和复杂的数据,远远超出传统计算机的处理能力,于是,建立在互联网基础上的云计算技术应运而生,承担起存储、传输、计算和应用大数据的重任。而正是大数据与云计算的有效互动,打开了世界观、方法论乃至价值观的新视野。

在本书中,作者引用专业研究机构的统计,揭示了大数据的规模与速度:一方面,到2014年,全世界电子化数据已增至4.4ZB,即4.4亿万亿字节,如果将如此之巨的信息量存入只有7.5毫米厚的苹果平板电脑,后者叠加起来的厚度可达地球与月球间距离的2/3;另一方面,有史以来90%的数据量,都是在过去两年的时间里产生的。

由此不难预期,一个电子化的、独立于物质世界的“数字世界”,正在大数据和云计算的互动中迅速构建,它虽然不可能穷尽物质世界全部存在,越来越逼近物质世界本体却是不争的事实。

尤为值得注意的是,许许多多以往被闲置的数据,由于一些精明商家的开发和利用,开始“变废为宝”。一个耳熟能详的案例,就是那个“尿片+啤酒”的商业发现与行动。世界最大零售商沃尔玛通过大数据统计和分析发现,男性顾客在购买婴儿尿片时,常常会顺便买上几瓶啤酒,于是推出将啤酒和尿片捆绑销售的促销方式,从而有效地提高了啤酒销量。

凡此种种表明,如同宇宙大爆炸般飞速扩张的“数字世界”,不仅日益成为外在的客观物质世界的“镜像”,而且正在越来越多地包含对人类自身行为的追踪和记录,成为人类观察和认识自我的“镜子”。

二者的叠加,形成一个有趣的悖论:由大数据构筑而成的数字世界,在日趋脱离客观物质世界的同时,又越来越接近世界的本原。因此,人们在解码这样一个虚拟世界的同时,也在一定程度上改变着对世界的看法。

然而,就在哲学家们对数字世界的属性还没有来得及给出明确界定之际,为利益所驱动的商家们却迫不及待地启动了对这一新矿藏的发掘。

它们是如此急切:还没来得及弄清两个相关现象之间的互动机理或因果关系,便急匆匆地将其中的商机转化为提升经济效益的手段;云计算技术刚刚出现,便迅速地将统计分析对象由随机采样拓展为可获取的全部数据;为寻求“大数据的高效率”,不惜置“小数据的精确度”于不顾……

回过头来看,正是这近乎“饥不择食”的匆忙,竟在无意中成就了认识数字世界的锁钥:不再执着于因果关联,不再满足于抽样分析,不再一味地追求精确度的提高,转而直面模糊与混杂,关注看似不相关的相关现象。这一系列有别于以往的方法,为人类认识世界、解决问题提供了传统工具箱中没有的新工具。

诚如史蒂夫·洛尔在本书中的比喻,这些大数据时代的新工具,犹如“望远镜”或“显微镜”。“望远镜”让人们看得更远,发现新的星系;“显微镜”则将比细胞更加微小的世界展示在人们面前,人们据此看到并计量之前一无所知的事物。

抛开学术和技术层面的研讨,大数据及其应用几乎与生俱来就伴随了喋喋不休的争论。

其中有两个关键词,一是“开放”,一是“保护”。如果说开放就是要打破垄断分割,推动信息与数据互联互通;变革体制机制,实现数据资源共有共享;鼓励技术创新,促进大数据资源开发利用……最大限度地拓展数字世界“公共空间”,让大数据和云计算普惠大众,造福人类;那么保护则意味着要在数字世界为个人留下一方“私密领地”,或者为公权力画上一道不能逾越的“红线”——“风可进,雨可进,国王不能进”。

开放与保护,“公共空间”与“私密领地”,在这里构成既对立又统一的关系。对立在开放与保护“井水不犯河水”,统一在“公共空间”与“私密领地”共存于同一个数字世界,且双方都以对方的存在为自身存在的证据,正所谓没有“公”即没有“私”,没有“私”亦没有“公”。

一言以蔽之,数字世界与现实世界理应奉行同样的价值理念:该开放的一定要最大限度开放,该保护的必须严格加以保护。

本书向读者展示了这样一幅图景:不管你自觉还是不自觉,乐意还是不乐意,大数据正以空前的速度和规模渗透到人类社会生活的方方面面,它在一定程度上已经和正在改变人们观察、认识、思考乃至生存与发展的方式。特别是这后一方面的变化,或许就是“大数据”之所以成为“主义”的原因。

孤陋寡闻,借题发挥,难免贻笑于大方。

忝为推荐。《经济参考报》总编辑杜跃进第1章大数据到底有多“大”?

在孟菲斯的郊区,人与各种机器正在来回穿梭,搬运货物。机械臂从传送带上抓取一捆捆塑料薄膜收缩包装的货物,然后由叉车搬到卡车上运往远方。工人们的血肉之躯在力量上比不上各类机械,因此分配给他们的任务是监控货物的流向,驾驶那些叉车与卡车,利用条形码扫描器与发射无线电波的芯片追踪货物上的识别标志。在井然有序的忙碌中,人与机器演奏出一首和谐的工业交响曲。

把这幅略显忙乱但是效率极高的画面呈现在我们眼前的是麦克森(McKesson),一家完成了全美约1/3的药品分销工作的大型公司。公司的各类建筑占地超过8个橄榄球场的面积,形成了麦克森全美分销网络的中枢,各类商品从这里被配送到包括社区药店与沃尔玛超市在内的26 000个客户那里。货物主要由药品构成,每天需要配送大约2.4亿片。药品分销的工作量极大,但是利润空间却非常小。因此,效率是麦克森几十年来孜孜不倦追求的目标。

但是最近几年,麦克森在追求效率的道路上取得了一个令人瞩目的突破,将任意时间的分销网络库存减少了10亿美元。之所以能取得这一成绩,得益于产品、位置及运输数据给麦克森的启示。麦克森利用各种扫描器、传感器收集这些数据,然后运用智能软件从数据中挖掘各种省时减耗的潜在机会。这种通过技术加强经营的观念是一个重大突破,麦克森公司的高级主管唐纳德·沃克尔形容它可以“让一切潜在机会无所遁形”。

镜头切换到亚特兰大。我来到埃默里大学医院的5楼,站在一间玻璃围封的重症监护室外。病房中摆满了密密麻麻、林林总总的医学计算电子设备,包括呼吸机、透析机、输送抗生素与镇痛剂的输液器,以及监控心率、呼吸、血压、血氧饱和度等重要指标的器具。几乎每台机器都配备了电脑平面显示器,电子元件不停地发出“哔哔”的声音和各种警报声。我数了数,大的电脑平面显示器加上跟智能手机差不多的小尺寸的平面显示器,一共有12台。

通常,一个有20张床的重症监护室每秒钟估计可以生成16万个数据点。埃默里大学医院的研究表明,医生与护士每天都要根据这些数据,针对每位病人迅速做出约100个决定。换言之,一个重症监护室全年要做出930多万个跟护理有关的决定,因此,做出错误决定的概率非常高,必须采取某些措施帮助他们摆脱这种困境。目前,有多家医学研究中心正在致力于研究如何利用数据改进成人及新生儿重症监护室的关键性护理工作,埃默里大学医院就是其中的一家。这家医院利用监控病人病情变化的医学设备得到相关数据流,通过软件加以分析,以捕捉代表病情恶化的预警信号。

计算机与软件善于消化大量数据,并从中发现极不明显的规律,在这方面它们的效率高于人类。在埃默里大学医院,负责此项工作的是蒂莫西·布克曼博士。布克曼是一名外科医生、科学家,还是一名经验丰富的飞行员,因此,他用飞行来打比方,向我们解释他的研究目标。如果飞机偏离航向(用布克曼的话说是“偏离轨道”),飞机上的全球定位系统(GPS)位置数据就会转变成图像,显示在空中交通管制员的屏幕上,这项工作在飞机坠毁之前就早已完成。布克曼希望医学上也能建立同样的预警系统,在病人“坠毁”之前,及时捕捉重要指征的某种规律偏离医学轨道的信号。布克曼说:“这就是大数据的意义所在。”我们已经进入大数据时代

早在谷歌、脸谱网等硅谷互联网孵化器问世之前,大数据时代就已经拉开了帷幕。起初,大数据是由字节构成的纯数字形式,然后它迅速迈进了由原子构成的物理世界,最后融入了社会主流。麦克森分销中心与埃默里大学医院重症监护室的例子告诉我们,大数据不仅可以节省时间,还可以挽救生命。从长远来看,大数据技术必将发展成为数据驱动的人工智能,驻留于数码世界与物理世界的顶层。现在,我们扬帆起航,朝着这个愿景进发。大数据技术正在引导一场计量方面的革命,有望为下一个席卷整个经济领域的效率与创新浪潮奠定基础。但是,技术并不是孤军作战。将来,我们在考虑如何决策,或者说应该如何决策这个问题时,同样需要大数据为我们出谋划策。我在《纽约时报》的同事戴维·布鲁克斯把这种正在兴起的观点称作“大数据主义”,这个词可以形象地反映大数据的深远影响。经验一再告诫我们,创新工具非常重要,它们不仅有利于经济增长,还可以帮助我们重塑世界观,以及做出相关决策。

大数据催生了大量技术,首先是各种新老数据源,包括Web网页、浏览习惯、传感器信号、社交媒体、智能手机的GPS位置数据、基因组信息和监控录像等。数据潮汹涌而来,每两年数据总量就会增加一倍。但是我认为,大数据被严重夸张的(经常也是最不重要的)方面就是这个“大”字。计算全球数据总量变成了书呆子们玩的各种预测与评估游戏,把人们引上了研究泽字节、尧字节、布朗多字节等冷僻字眼的歧途,各种类似表达令人震惊。据估计,历史上90%的数据都产生于过去两年。2014年,国际数据公司推算出全世界的数据总量有4.4泽字节之多,即4.4万亿兆字节。这家研究公司称,如果把这么多的信息塞进纤薄的苹果平板电脑里,那么这些平板电脑摞起来可以[1]达到157 000英里高,是地球与月球距离的2/3。

但是,并不是所有数据的地位都是平等的,或者说都具有相同的价值。数据总量如此之大,是数码图片与数码影像的兴起产生的结果。想一想,我们的智能手机里收发的那些亲朋好友的图片与影像文件夹,就能明白这个道理。俗话说,图片胜千言。然而,在数字计量的各种运算中,这个说法还是过于保守,因为图片要占用大量比特,而文本则与之相反,占用的比特非常少。一个字节有8个比特,一个字母占一个字节,而一幅标准的高清照片的大小是以兆字节为单位的,占数百万个字节。但是说到占用比特的数量,与视频文件相比,静止图片就相形见绌了。在我创作本书的过程中,每分钟有播放时长为48个小时的视频被上传到YouTube网站,而且上传速度很可能会越来越快。

大数据中的“大”字确实重要,但是远没有很多人想象的那么重要。海洋里的水也非常多,但是我们无法直接饮用。因此,更重要的问题是如何运用、如何理解这些数据。本书讲的成功故事都涉及大数据的应用,但是通常来说,这些数据的量还不足以让谷歌的工程师们为之惊讶。此外,尽管计算机在处理、存储与内存等方面取得的进步有助于解决大数据遭遇的难题,但亟须解决的最大问题还在于软件,因为关键性程序指令主要是为了满足机器学习软件等人工智能工具包持续升级的需要。

数据与智能技术不断为我们开辟计量的新天地,让我们看得更远、更清楚。大数据技术就是数字时代的“望远镜”或者“显微镜”,使我们可以看到并计量之前我们一无所知的新事物。“望远镜”让我们看得更远,发现新的星系;而“显微镜”则将比细胞更微小的神秘世界展现在我们眼前。

现代望远镜改变了天文学,现代显微镜使生物学发生了翻天覆地的变化,大数据也有同样的效果,不过它的作用范围更广,涉及每一个领域、每一门学科。技术的长足进步是推动经济发展的发动机。互联网首先驱使通信经济学发生了变化,随后在互联网基础之上发展的Web网络服务等技术为创新与新型经营活动提供了平台。大数据技术同样如此,虽然它还是一项年轻的技术,但它正在改变经济的意义,可以说这项技术将会变成人类决策活动的一个平台。

所有决策活动对经验与直觉的依赖将逐渐减少,而对数据与分析的倚重将与日俱增。在决策活动中,本能的作用逐渐减弱,而科学的重要程度将逐渐增强。技术进步与摩尔定律

纵观历史,技术变革一直在挑战传统做法,不仅仅是教育后代的方法,甚至连我们理解世界的方法都受到了影响。1959年,在现代计算机时代即将拉开帷幕之际,英国化学家、小说家查尔斯·珀西·斯诺在剑桥大学发表了题为“两种文化”的演讲。斯诺在演讲中深入剖析了自然学科与人文学科这两个阵营之间的不同点,并讨论了两者之间日益明显的鸿沟。他警告说,如果人文学科继续对科学进步及其深远意义视而不见,那么科学学者与“人文学者”之间的分裂必将对经济与社会进步构成威胁。这次演讲在美国引起了强烈反响,影响了一大批人,其中包括达特茅斯学院的两名教授——约翰·科姆尼与托马斯·科尔茨。科姆尼是一位数学家,曾经是艾尔伯特·爱因斯坦的研究助手,后来担任达特茅斯学院院长。20世纪60年代早期,年轻的数学老师科尔茨认为应该让绝大多数达特茅斯学生接触一些电脑编程的知识,于是他找到了科姆尼。

科姆尼与科尔茨认为,正在兴起的计算机应用是一股重要的科技力量,将影响经济与社会的方方面面。但是,在达特茅斯学院,最有可能对计算机应用感兴趣的理工科学生只占全校学生的1/4。科尔茨说,“企业与政府部门的大多数决策者”通常都来自于另外75%的学生,这些学生在技术方面要逊色于其他学生。因此,科尔茨与科姆尼设计了一种非常简单、便于非工程技术人员使用的编程语言——Basic(初学者通用符号指令码)。1964年,他们开始教达特茅斯学院的学生使用Basic语言编程。后来,成千上万的人在编写软件程序时都会使用各种版本的达特茅斯Basic语言。比尔·盖茨对Basic语言进行了精简,推出了微软公司的奠基性产品——微软版Basic语言,用于早期的个人电脑。几年之后,盖茨回忆起这件事时仍然非常自豪,他认为在20世纪70年代中期将精简版Basic应用于早期的个人电脑是一个创举。比尔·盖茨告诉我:“在我的整个编程生涯中,这是最令我自豪的作品。”

早在20世纪60年代,科姆尼与科尔茨并没有把达特茅斯学院变成职业编程人员培训营的打算,他们的目的是引导学生体验与这些数字机器的交互和计算机思维。他们要求学生通过特定方法分析并有逻辑性地整理数据,以便更好地借助计算机解决问题。达特茅斯学院的老师们所从事的其实并不是编程教学,他们的目标是改变学生们的思路,鼓励他们换一种角度看事物。如今,在提及针对数据时代特点改革教育与培训工作时,人们所讨论的常常是一些狭义概念,指的是一个个具体的技能。但是,就大局而言,重要的不是高手们处理数据的高超能力,而是对数据产生根深蒂固的好奇心。教育与培训应当实现的更远大目标是改变思路,使对数据的思考成为学术活动的第一原则,以及探索活动的起始点。我们可以用一个问题来概括这种理念:这些数据到底要告诉我们什么?

大数据带给我们的无论从内容丰富程度还是详细程度上看都将超过从前,从而有可能让我们的视野宽度与学习速度实现突破。用麦克森公司管理层的话来说,大数据可以让“一切潜在机会无所遁形”。大数据带给我们的不是小突破,而是颠覆性的进步,我认为这是一种意义更为深远的摩尔定律。从技术层面看,英特尔联合创始人戈登·摩尔提出的摩尔定律认为,计算机芯片上的晶体管密度大约每两年就会增加一倍,计算能力也会呈指数级增长。但是,从实践层面看,这条定律还告诉我们量变会带来质变,为各种新的可能打开大门,为我们的探索与实践活动增添新的内容。1946年,ENIAC(电子数字积分)计算机需要完成的任务是计算炮弹的飞行轨迹,这是计算机应用的开始。到2011年,国际商用机器公司(IBM)的超级计算机沃森在美国电视智力节目《危险边缘》中击败了其最强劲的人类对手。

对于计算机而言,一切事物都可以用1与0这两个数字来表示。但是,随着时间的推移,计算机性能已经取得了巨大的量变式进步,因此我们的行为能力也发生了显著变化。接受过数据时代专业训练的物理学家常常把量变到质变的变化比喻成“相变”,或者比喻成由气态变成液态或者由液态变成固态的物态变化。这种比喻非常恰当,形象地表现了这种变化的特点。但是,我更倾向于把它比作摩尔定律,因为水在气温降到零摄氏度时会结冰,这是一个自然过程和自然定律,而摩尔定律不是自然定律,它是通过对多年来所发生的情况以及未来很有可能发生的情况进行研究之后得出的结论。多年以来,由于人类的创造力、不懈努力与投入,摩尔定律经受住了考验。其中,科研人员、企业与投资人功不可没。大数据主义的兴起

大数据的发展同样如此。由于计算能力、传感技术与通信技术的长足进步,对大数据的处理在技术层面已经成为可能,智力、精力与财力的投入必将推动软件、硬件的稳步发展与大数据主义的兴起。大数据革命既需要个人的锐意进取,还需要机构提供保障。本书将以一位年轻人和一家有悠久历史的公司为主角,重点介绍他们的相关经历。这位年轻人名叫杰夫·哈梅巴赫,32岁,是大数据主义思想的典型代表,从他职业生涯的变迁不难看出数据技术与方法不断发展的步伐。哈梅巴赫的童年是在印第安纳度过的。从哈佛大学毕业之后,他进入华尔街的一家投资银行,成了一名宽客。之后不久,他加入脸谱网,组建了第一支数据科学家队伍。离开脸谱网之后,他与人合作创办了一家名为Cloudera的公司,并担任首席科学家,编写用于数据科学研究的软件。2012年夏天,哈梅巴赫又走上了一条截然不同的职业道路。他加入纽约西奈山伊坎医学院,领导一个数据小组从事遗传信息等方面的医学研究,探索疾病模型的建立方法与治疗突破口。哈梅巴赫认为,在当今社会,将他掌握的技能投入应用的最佳途径就是通过医学研究。

数字时代的另一个标杆是IBM公司。这家有上百年历史的科技巨人以精于研究和为主流公司客户提供服务而闻名于世。这些客户为IBM打开了一扇窗户,帮助他们了解数据技术在所有行业中的进展情况及其面临的挑战。IBM也组建了自己的研究队伍,并制定战略方针、投入大量资金,用以支持大数据业务。IBM公司的首席执行官罗睿兰在采访中告诉我:“我们把整个公司的前途都押在了大数据应用业务上。”

但是,对于IBM而言,大数据既是机遇,也可能是威胁。为众多大数据应用程序(云计算、开源码)提供保障的新硬件与新软件成本低廉,必将取代IBM的某些传统产品。因此,公司拓展新的数据市场的速度必须快于其传统业务的萎缩速度。IBM在数据领域拥有无与伦比的辉煌历史:1890年,美国人口增长到6 300万(在当时,这算是一个大数据),IBM利用赫尔曼·霍尔瑞斯发明的穿孔卡片,成功地统计并以列表形式显示出该年的人口数,成就了自己的赫赫威名。现在,IBM的研究人员正站在大数据技术的最前沿。麦克森公司与埃默里大学医院的两个项目,就是与IBM的科研人员合作完成的。数据驱动人工智能的发动机——IBM超级计算机沃森项目,也不再是科研人员闲暇之余的娱乐性科学实验,而是得到了10亿美元的资金支持,成为IBM内部一个五脏俱全的业务单元,可以在医药、客户服务、财经机构等领域大展身手。沃森技术现在是一种由远程数据中心通过互联网提供的云服务,而且IBM希望软件工程师们把超级计算机沃森看成面向未来的操作系统,鼓励他们编写可以在沃森上运行的应用程序。

新与旧、个人与机构,有时相互冲突,有时又相互补充。很难想象哈梅巴赫与IBM将来是否会默契地走到一起,但是他们正在朝着相同的方向努力,而且两者都对大数据有浓厚的兴趣。

本书还涉及另外一个与大数据既相互冲突,又相互补充的主题,其核心内容就是决策行为。大数据的功能确实强大,但是也有其局限性——过于倚重计量的具体内容与计量方法等因素。我们总有办法收集数据,也有可能发现其中的规律,但是,这种规律性是否显著?是不是我们希望得到的数据?换句话说,我们计量某些数据,是因为这些数据最有价值,还是因为它们最容易计量呢?计量必要性与计量短视性之间必然会产生矛盾,有两句名言精炼地概括了这个问题。第一句名言是:“无法计量,就无法管理。”这句名言可能源自统计学家、质量控制专家爱德华·戴明,也有可能是管理大师彼得·德鲁克。到底谁是原创者并不重要,关键在于它表达的是商业经营中反复强调的观点,是一种常识性真理。

第二句名言的知名度不是很高,但是同样富含哲理:“计算得清楚的东西未必都重要,重要的东西也未必都计算得清楚。”人们通常认为这是艾尔伯特·爱因斯坦的名言,但是更可信的出处应该是社会学家威廉·布鲁斯·卡梅隆。同样,这句话是谁说的并不重要,重要的是它所表达的意思。数据科学的各种技术就摆在我们面前,这些技术不断发展,并得到应用。总的来说,这是一件好事。不过,第二句名言所表现出来的适度谦虚,对于狂热的大数据决策支持者们大有裨益。

我在《纽约时报》工作的10多年时间里,陆续接触到一些被贴上“大数据”标签的技术。但直到最近几年,“大数据”这个名词才逐渐被业界所接受,并成为一个耳熟能详的时髦词语。时至今日,我仍然会关注这类技术。但是,本书的目的是在更宽泛的经济领域,调查那些处于前沿位置的项目与创意,与科研人员、企业家与企业管理人员共同探讨摆在他们面前的大数据理论必然给技术与人类带来的难题,并展开更深入、更广泛的研究。我始终认为,如果现代数据技术可以在经济上发挥重要作用,就必然会成为一种主流,在绝大多数行业中找到用武之地。消费者互联网在前期取得了令人瞩目的成功(个性化搜索、定向在线广告、针对性影片推介等),但是在物理世界中,如何在医药、能源、农业等更加庞大的行业中应用这些技术,是一个难度更大的挑战。如能取得最终的成功,必将在更多方面影响更多人的生活,具有更加显著的意义。在以下章节中,我们将了解大数据在更宽泛的经济领域中取得了哪些进展。我们将剥下推销艺术的华丽外衣,了解其实质内容。大数据主义将把我们带往何方?大数据将在哪些领域大放异彩,在哪些领域举步维艰?[1] 1英里≈1.609 3千米。——编者注第2章人的潜力与数据的潜力

杰夫·哈梅巴赫站在曼哈顿上东区西奈山伊坎医学院大礼堂的讲台上,一边来回踱步,一边慷慨陈词,想要努力说服台下的听众。讲台下坐着100多人,其中有很多人穿着医学实验室里常见的白大褂。哈梅巴赫长着一双深邃而锐利的眼睛,鼻梁棱角分明,络腮胡子修剪得很短,一头浓密而凌乱的深棕色头发。他是医学院的一名遗传学与基因组学副教授,但是他并不喜欢穿白大褂。他的上装经常是紧身合体的套头运动衫或者T恤衫,因此能看出他臂膀上的肌肉非常结实,二头肌与前臂也十分强壮。他在中学时是一位明星级棒球投手,现在每周还要完成一两次投手的负重训练,因此,他依然保持着中学时代的强壮体格。

面对这群医生与医学研究人员,哈梅巴赫简要地讲述了他的数据应用策略与思想,然后系统地介绍了数据处理的一些基本要点:利用数据生成传感器“处理所有可以处理的东西”;对于所有可以存储的数据,要即时存储,以后再找时间思考这些数据可以告诉我们什么;向机构组织中的所有人公开我们收集的数据,允许他们在做实验时使用这些数据。

哈梅巴赫认为,在大多数领域,数据驱动的探索活动方兴未艾,因此,探索活动的近期目标应该是观察,而不是预测。他说:“你必须看清现在,才可以预测未来。”接着,他又说:“看清现在可能并不比预测未来更容易。”然而,要清楚地掌握现在或者未来的情况,就必须从数据开始。他告诉大家:“如果没有数据,你就无法从事科研活动。数据是科研活动的媒介。”

几个月之后,我和哈梅巴赫在纽约的一家三明治店吃午饭。他一边吃着三明治,一边兴致勃勃地与我聊天,连脸颊沾上了蛋黄酱都不知道。哈梅巴赫说:“我可能有点儿自以为是,但我认为数学就是一个竞技场,人类的智力在这里表露无遗。”他的这番话真诚坦率,很有说服力,令我久久难忘。我知道正在与我共进午餐的这位年轻人并不寻常,他是一位非常有想法的人。通晓数据与定量分析的人都在不断增加。越来越多的迹象表明,价值与智慧就隐藏在数据之中,这是大数据主义的核心信条。大数据主义有斜睨一切的傲气,而颇具魅力、能言善道、勤反省的哈梅巴赫则代表其亲和的一面。他甚至还用一个非常简练的表达来描述大数据主义的宗旨,即大数据主义的目的是开发“数值想象力”,超越摆在我们眼前的这些数据与数字,发掘它们的真正价值。

在职业生涯中,年轻的哈梅巴赫一直坚守在数据经济的最前沿。在华尔街上班时,他是一名宽客,为各种复杂的金融产品创建数学模型。在脸谱网供职时,他组建了一个团队,通过整理、挖掘社交数据寻找方法,改进服务与定向广告的效果。他把自己及同事称作“数据科学家”,在当时,这个名词还鲜为人知,但随后很快就变成了最热门的职业之一。后来,他又把这套方法与思路带到了西奈山伊坎医学院。哈梅巴赫说,他的目标是“把医学变成宽客的乐园”。

我们也许会不屑一顾地认为,哈梅巴赫的梦想只不过是年轻人天真无知的臆想。但是,学术界的一些前辈却对他在医学及其他方面的观点表示认同。西奈山伊坎医学院院长丹尼斯·查尼预言,在计算机分析不断取得进展的情况下,遗传及医疗卫生数据的激增将推动医学发生“范式转移”,科学、体育、政治、公共医疗卫生等领域,以及广告、农业等行业,也会发生同样的变化。哈佛大学定量分析社会科学学院的加里·金认为,这是一场刚刚兴起的“革命”,但它的影响力“将席卷学术界、商界和政府部门,任何领域都无法置身事外”。大数据主义的发展使局面趋于紧张,它也面临着诸多阻碍。金说:“所有领域都在抵抗定量分析的影响力。”他常常告诉人们,之所以形成这种对峙局面,是因为人们发现自己的眼前横亘着一条文化鸿沟,造成这条文化鸿沟的便是人们的误解。此外,在面临决策行为全部由人完成还是由计算机自动完成的选择时,人们做出的错误决定也是原因之一。作为定量分析领域的“使者”,金认为自己已经表达了善意,并且正在积极寻求合作,“我在试图说服他们时说,我们是来为你们提供帮助的”。尽管遇到重重阻碍,但是大数据主义的发展态势似乎已经非常明晰了。麻省理工学院媒体实验室的阿莱克斯·彭特兰认为,大数据主义有望实现一次“堪比文字或互联网发明的巨变”。

与整个劳动大军相比,这些数据科学家(利用数学与计算方面的聪明才智理解数据含义的一群人)似乎不足挂齿,但是他们已经隐约表现出一种磅礴的气势。数据科学受到了人们的热情追捧,被视为一个有发展前途的研究领域。有多所大学在争先恐后地建立数据科学中心和学院,设置相关课程,众多企业也不甘落后地争相聘请数据科学家。人们也许会嘲笑当前这股数据狂潮有跟风的意味,但是很难说这种现象存在方向性错误。一位年轻的明星数据科学家

杰夫·哈梅巴赫天生就对数字情有独钟,他的母亲勒诺至今还保留着他7岁时发表在校报上的一篇文章。在这篇文章中,杰夫写道:“我的最大嗜好是一边吃东西,一边做数学题。这是因为数学是我最喜欢的学科,而且我喜欢吃个不停。”随后,他有条不紊地列举了身体各器官在这项边吃边算的活动中所发挥的作用:“我需要‘古头’(这是他这篇文章中唯一的错别字,应为‘舌头’)品尝味道、大脑思考问题、肺呼吸空气,手则要拿起纸笔完成书写的任务。”接着,他说眼睛的任务是看数学题,牙齿咀嚼,胃消化食物,心脏的作用是供血。

从这篇文章中可以看出,杰夫·哈梅巴赫对定量分析的喜爱,以及热衷于科学观察的性格在他小时候就已经表露无遗了。时至今日,32岁的哈梅巴赫拥有了巨额财富,妻子哈蕾·塔科拿到了哈佛大学的工商管理学硕士学位,现任Rock Health公司(一家为医疗类科技型初创公司提供种子资金与咨询服务的公司)的创始人与首席执行官。2013年,他们斥资购买女演员科洛·塞维尼位于曼哈顿东村的公寓时,引起了《纽约时报》和英国《每日邮报》的关注。《纽约时报》称他们夫妻二人为“科技企业家”, 《每日邮报》认为他们是“在技术界有影响力的一对夫妻”。

哈梅巴赫人生历程中的这些重要改变清楚地表明,他有远大的抱负,还拥有某种特权。我们有理由认为,对于现代金钱与科技经济中的大多数人而言,只要具备这两个条件,就注定会成功。但是,哈梅巴赫却不属于此列。同所有领域中众多有传奇色彩的人一样,我们也很难根据哈梅巴赫的个人背景与人生履历,预测出他今天的成就。

哈梅巴赫出生于密歇根州的卡拉马祖市,5岁时全家搬到了印第安纳州的韦恩堡市。他的父亲格伦是通用汽车公司的一名工人。由于底特律在更高效的日本汽车制造业面前节节败退,市场份额逐步缩水,通用汽车公司决定缩减其在密歇根工厂的规模。受此影响,格伦被调到印第安纳的工厂就职。在2004年退休之前,格伦一共在通用工作了32年,先后在三家工厂就职,韦恩堡工厂是最后的一家。杰夫的母亲是一名护士,至今还在做一些志愿性的护理工作。格伦从通用汽车公司退休之后,夫妻二人为了躲避中西部地区寒冷的冬季,最终搬迁到南卡罗来纳州。杰夫的哥哥杰伊·瑞安·哈梅巴赫,比杰夫大两岁,是一名私人健身教练。这个职业与他弟弟在高科技领域从事的小众性工作毫不相干,但是在美国后工业化服务型经济中却是一个新兴职业。

在过去30年时间里,美国制造业陷入了混乱,不过格伦·哈梅巴赫却是一名幸运儿。由于他在全美汽车工人联合会中的资历较深,因此没有受到中西部行业衰退风暴的袭扰。不过,格伦带着家人搬了好几次家,多年来从事过多种工作,这说明他适应能力强,拥有多种技能。正因为如此,他在工厂上班时可以得到奖励性工资,享有丰厚的医疗保险与福利,而且通用汽车公司在2009年提交破产保护申请时也没有影响到他的养老金。格伦的工资收入,再加上勒诺从事护理工作的收入,使哈梅巴赫一家过着稳定的中产阶级生活。他们全家住在韦恩堡郊区的一栋两层住宅中,格伦还在家中的游泳池上方搭建了一个木质露台。工厂的上班时间是有规律性的,而且勒诺从事的大多是兼职工作,因此夫妻二人有时间与两个儿子一起参加幼童军和体育活动,也有时间与精力通过言传身教来影响他们。

上托儿所时,杰夫就是一个有想法的孩子。在他三岁时,老师有一天给勒诺打来电话,说杰夫一直在捣乱。不知出于什么原因,杰夫决定不参加班级的所有活动。更糟糕的是,其他孩子也纷纷效仿他,托儿所似乎随时会发生罢课事件。勒诺建议老师不要理会杰夫,事实证明,这个办法的确有效,因为问题最终得到了解决。但是,这位托儿所老师警告说,如果杰夫不学会与人合作,不积极参与集体活动,他的人生将会问题不断。勒诺认为,在以后的生活中,这类问题还会反复发生,因此,她决定跟杰夫谈谈。勒诺告诉杰夫,数学对于他来说是小菜一碟,但是其他人学起来却非常难,这是因为尺有所短、寸有所长;他必须在团结协作与遵从习俗这两个方面下功夫,以后的生活才不会出现问题。勒诺回忆说:“杰夫根本就不接受我的建议。”格伦用一句话对这件事进行了概括:“如果他不想做某一件事,他就绝对不会做。”一个阅读兴趣广泛的“T型人”

格伦与勒诺都具有中西部美国人的特点:不拘小节,为人坦率,不拖泥带水,握手有力,说话直截了当。在哈梅巴赫家,年轻人可以有叛逆之举,但必须适可而止,某些行为则绝不允许发生。格伦与勒诺是虔诚的罗马天主教徒,每个星期天,他们都会要求两个儿子去做礼拜,而且必须穿西装、打领带。格伦说:“这是必须做到的。”据格伦回忆,他在给孩子们进行人生抱负与价值观教育时说过:“只要你尽力做好本职工作,即便你是一名清洁工,我都不会介意。”格伦的父母在教育格伦时可能并没有这样直截了当,但他们所传递的信息是一样的。有一次,在我们交谈时,格伦说:“在我父母眼中,刻苦努力永远比聪明伶俐更加重要。”

不过,杰夫的头脑非常灵光。他4岁时开始上幼儿园,但是开学没几天,老师就给他家里打了一个电话,说她认为杰夫已经学会阅读了。勒诺回答说,杰夫确实已经学会阅读了,但是他们在家里并没有公开讨论这件事,因为他哥哥还没学会。勒诺告诉老师:“我们的想法是低调处理这件事。”很小的时候,杰夫的阅读面就非常广,与男孩玩具有关的书他都爱读。他把这些书装在一个箱子里,父母开玩笑说这些都是“杰夫未来的发展方向”。杰夫很早就成为本地图书馆最忠实的读者,大多数夜晚,他都会在自己的卧室里看书,直到父母催他上床睡觉。后来,他用毛巾堵住卧室房门下面的缝隙,不让勒诺看见灯光,这一招还真奏效了一段时间。

五六岁时,杰夫在回答认知卡片上的加减乘除题目时就能做到对答如流,速度之快连格伦都不敢相信。他怀疑杰夫是不是按照卡片的先后次序记住了那些答案,因此他不断打乱卡片的顺序。但是,杰夫的答题速度没有受到任何影响。在杰夫7岁第一次领圣餐那天,他收到了很多亲朋好友的红包,里面装有小额现金或者支票。格伦记得,杰夫快速地翻看了这些红包,然后通过心算得出红包的总金额,约300美元。格伦说:“这孩子在数学方面的表现时常令我感到吃惊。”

上高中时,数学老师给杰夫的父母打电话,交流杰夫在微积分跳级模拟考试中出现的一个问题:杰夫给出的答案是正确的,但是没有演算过程。这位老师说,如果杰夫不写出计算步骤,就会被扣分。但杰夫认为,解决这些问题并不一定需要写出中间步骤,因为对于像杰夫这样数学天赋极高的人而言,解方程式这样的数学题实在是太简单了,他无须演算就可以得出答案。

8岁那年,杰夫在暑期班的一堂课上第一次接触到计算机编程。他需要完成的第一个项目是编写一个空间程序:利用一台苹果IIe电脑制作一个像素化飞碟,同时在电脑屏幕上粗略地显示出若干行星,而且飞碟可以在这些行星中穿行。刚开始的时候,杰夫使用Basic语言编写程序,但是到了中学之后,他就开始使用Pascal以及C++等高级计算机程序语言了。杰夫还是“毁灭战士”、“雷神之锤”等第一视角射击游戏的顶级玩家,可以得心应手地完成升级、杀怪、赢取武器这类任务。他熟练地掌握了软件工具,可以免费登录在线游戏网站DWANGO(拨号上网的广域网络游戏运营商)和消费者在线服务商美国在线(AOL)的网站。他回忆说:“如果你是计算机高手,你就会这样做——入侵各类网站。”

作为一名学生,杰夫既桀骜不驯,又有极高的天赋。从小学开始,杰夫就没有参加普通班的学习,而是接受特殊的数学指导。韦恩堡市除了公立学校与天主教教会学校以外,还有一所私立学校——坎特伯雷学校。这所学校规模不大,它的中学部与东西海岸的大学预科学校比较相似。每年,坎特伯雷学校都会组织缴不起学费的学生参加一次考试,得分最高的那些学生可以获得去坎特伯雷上学的奖学金。杰夫参加了这次考试,并考了第一名。后来,在坎特伯雷上学的几年时间里,他每次都考第一名。课堂教学对杰夫来说通常没有多大的吸引力,但是每次标准化考试他都能以接近满分的成绩脱颖而出。

近年来,通过一番努力,坎特伯雷学校已经发展成为一所为韦恩堡市富裕阶级服务的学校了,就读学生的父母大多是医生、律师、企业主和管理人员。这与杰夫记忆中的情形大不相同,杰夫说,“在我的印象中,当时的学生都是一些富有想象力的孩子。”他的母亲回忆说,杰夫在坎特伯雷上学的第一年,也就是上十年级时,学习非常刻苦,考试成绩都很优秀,而且获得了各种奖励。但是到了第二年,他丧失了学习的兴趣。勒诺说:“他的团队协作能力极差。”学校的辅导员与杰夫的父母会面时会反复强调:“潜力!潜力!潜力!”他的意思自然是说杰夫很有潜力,但他没有充分发掘。

在坎特伯雷上学期间,杰夫集多种特点于一身:头脑聪明,经常违反纪律,还是棒球队的明星级投手。用杰夫的话说,他的朋友圈是一个“极客与运动迷”的混合体。拉查娜·沙是这个圈子的成员之一,比杰夫高一年级,但是两个人要上同样的两门课:高级微积分班只有他们两个学生,拉丁语班除他俩之外还有另外一名学生。在性格上,沙与杰夫截然相反。据沙自己说,她属于A型性格。但是在学习上,她与杰夫志趣相投。沙的父母分别是当地的企业主和医生,全家住在韦恩堡市富有的西科莫山区,旁边还有一个网球场。用沙的话说,当时的坎特伯雷学校有点儿像“乡村俱乐部”。在那样的环境中,作为一名汽车工人的儿子,桀骜不驯的杰夫给人一种格格不入的感觉。

现在,拉查娜·费希尔(沙的夫姓)是保罗·黑斯廷斯法律事务所驻硅谷办事处的一名诉讼律师。她回忆说,中学时代的杰夫跟一般的男孩子一样,为了引人注意,经常干一些“愚蠢的事”,例如在冬天结冰的街道上飙车,结果撞倒了学校门前的路灯杆。但是,他依然爱好阅读,不仅读完了学校收藏的所有数学著作,还阅读了纽约派诗人弗兰克·奥哈拉和俄国未来主义诗人弗拉基米尔·马雅可夫斯基的诗作。费希尔说:“他在诗歌方面颇有几分才气。”此外,杰夫与生俱来的领悟力给她留下了深刻的印象,让她至今难忘,“学习对他来说似乎不费吹灰之力,他一天就能看完一本书。读书对于他而言,根本就不是难事。”

坎特伯雷学校的学生都必须遵守诚信荣誉规章和学校的其他规章制度,例如,学校以寄物柜无须上锁为荣。费希尔是学生荣誉规章仲裁委员会的负责人。一天下午,她与杰夫参加的化学课要求做一个耗时很长的实验,而他们接下来还需要上只有他们两人报名的高级微积分课。令费希尔感到吃惊的是,杰夫说他打算不去上微积分课。于是,这位荣誉规章仲裁委员会的负责人陷入了两难境地:如果她逃课,就会违反学校的规章制度;如果她去上课,老师肯定会问她杰夫为什么逃课。她回忆说:“于是,我生平第一次逃课了。”

费希尔从哈佛大学毕业后,又考入了哈佛法学院。在杰夫申请到哈佛大学就读时,她为杰夫写了推荐信。她说,在写这封推荐信时,她着重强调的是“一个人取得的成就有时难以衡量”,她认为杰夫是一个“真正的天才”,尽管“他的年级平均成绩并不是最优秀的”。近年来,费希尔一直关注杰夫以及他在事业上取得的成绩。她认为:“杰夫的工作是利用数据和数值来分析人,但是,如果要分析他本人的情况,却并不适合采用这种方法。”这个颇具讽刺意味的发现,令她感到非常有趣。

凭借棒球与智力上的优势,杰夫最终被哈佛大学录取。作为一名[1][2]投手,杰夫6英尺的身高、185磅的体重算不上高大魁梧,也无法让对手感到一种压倒性的气势。但是,杰夫可以投出漂亮的快球,而且他的曲线球质量很高。他在中学棒球比赛和夏季联赛中表现出色,有几支棒球大联盟球队邀请他参加试训营,还有几所大学也向他发出了邀请,其中包括密歇根大学。但是,在杰夫与父亲参观密歇根大学的安娜堡校园时,他们遇到了密歇根大学棒球队的一位助理教练。这位教练已经接受了哈佛大学的邀请,准备去那里担任教练。当知道杰夫的考试成绩非常优秀之后,他强烈建议父子俩考虑申请进入哈佛大学。

在这之前,杰夫没有考虑过就读哈佛大学,但是他越想就越觉得难以抗拒哈佛大学的诱惑力。用杰夫的话说:“这是跳出中西部的一个机会。”凭借棒球技术和考试成绩,杰夫来到了哈佛大学,在得到了哈佛大学的资助之后,他自己需要缴纳的学费与他在印第安纳上一所州立大学的费用差不多。等到格伦与勒诺把杰夫送到哈佛大学的校园时,他们才惊讶地发现哈佛大学的学生宿舍实行男女混住制度。勒诺说:“我们差一点儿就把他带走了。”格伦补充了一句:“也没有那么严重。不过,这样的住宿制度实在太开放了,而我们都比较保守。”而且,哈佛大学并不强制要求学生上课,也没有相关的管理措施。这意味着杰夫可以根据自己的意愿决定是否去上课,这种情况让杰夫的父母更加担心。事实证明,杰夫确实经常不去上课。

据哈梅巴赫估计,他在哈佛大学就读的前两年时间里,去教室上课的次数一共只有十几次。在那段时间,他对学习的漠视程度达到了极致。不过,教室本来就不是他所向往的场所。老师们一个个都极具权威性,而他似乎本能地不相信权威,仿佛怀疑课堂上教授的知识与经验证据是对立的。他对权威的这种怀疑甚至延伸到了企业主的身上。上中学时,他从事的第一份实质意义上的工作是在韦恩堡市史密斯食品药品店担任收银员。一个星期五下午,他希望提前下班,去观看中学橄榄球比赛。经理不同意他提前下班,并以解雇相威胁。哈梅巴赫对他的威胁充耳不闻,径直离开了。结果,他被辞退了。但是,杰夫没有把这件事告诉父母,每天仍然穿着收银员的制服(黑裤子,黑皮鞋,白衬衫,再套上工作服),把车开到商店的停车场。停好车后,他就穿过大街来到公立图书馆,读上8个小时的书。他在回忆这件事时面带笑容地说:“让我一辈子都这样生活,我也愿意。”勒诺知道真相之后,请人把杰夫的车拖走了。

对于父母在他的教育上所做的安排,杰夫也抱有一种抵制态度。在杰夫15岁时,当汽车工人的父亲认为他应该学习更换汽车轮胎这项生活中的必需技能。格伦记得这次“教学活动”在更换了一个轮胎之后就结束了,因为杰夫不愿意学习这项技能,“我为什么要学习换轮胎?我才不想干体力活呢。”

对于课堂上以及书本中形形色色的学术权威,哈梅巴赫都持有类似的怀疑态度,不会轻易听从。例如,进行新的探索时,他都会阅读至少三本视角各异的书,目的是“剔除作者的偏见”。由于他特立独行地坚持自学——亲自搜集数据,钻研时随心所欲——在学校学习期间引发了很多冲突,让老师们非常生气,他的父母也感到困惑不安。格伦说:“当时,我们都觉得这孩子太固执了。”

但是,哈梅巴赫辩解说,他之所以采用这套方法,目的是尽可能地提高学习效果。他认为自己喜欢的是与自主学习相类似的学习风格:“我在学习时不喜欢有人在一旁指手画脚,而是希望通过阅读以及与人交谈、互动来学习。”“博览群书”一词似乎还不足以代表哈梅巴赫的阅读面之广。他在旧金山的公寓里有一个两层楼高的书架,摆放着1 000多本图书,而且他的亚马逊金读之光(Kindle)阅读器中还存有约200本书。有的藏书既有电子版,又有纸质版。不过,哈梅巴赫用数据表把他自2001年以来购买并阅读的书籍列了一份清单,包含1 100多个条目。我让他从他最喜欢的书中挑出一些有代表性的,结果他列出了一份包含299本书的书目,主题涉及思想史、经济学、计算机科学、生物学、哲学、音乐、体育、小说与诗歌。长长的书目反映出哈梅巴赫广泛的阅读范围:排在书目首位的是保罗·霍夫曼的《数字情种》,排在末尾的是戴维·福斯特·华莱士的《无限诙谐》,中间还有杨·哈灵顿的《关系数据库设计》、列奥·托尔斯泰的《安娜·卡列尼娜》、安德鲁·塔能鲍姆的《现代操作系统》(第2版)、詹姆斯·迪基的《诗集》、斯图尔特·罗素和彼得·诺威格合著的《人工智能:一种现代方法》(第2版)、迈尔斯·戴维斯与昆西·特鲁普合著的《迈尔斯·戴维斯自传》、格里高利·曼昆的《经济学原理》、弗吉尼亚·伍尔夫的《到灯塔去》等书。此外,这份书目中还包含J·K·罗琳的《哈利·波特》系列。妻子哈蕾·塔科说,强烈的好奇心是哈梅巴赫“遗传基因的一部分,书籍则是他学习新知识的一个途径”。

在一些探讨大数据的技术会议与行业大会上关于数据科学家这个概念的内涵,以及优秀数据科学家应当具备哪些品质,与会人员莫衷一是。通常的答案是数据科学家应当具备两个特点:其一是深厚的专业技能,其二是对计算与数学以外的世界有浓厚的兴趣,两者缺一不可。专业技能显然必不可少,兼收并蓄的好奇心也是一个必备优点,因为数据科学涵盖众多领域,而且依赖于实验得出的新发现。IBM公司大学项目部主任吉姆·斯伯热把数据科学家称作“T型人”,意指他们不仅具备深厚的专业技能,而且有宽广的知识面(字母“T”的上部形状)。斯伯热认为,“T型人”成为革新者与企业家的可能性更高,不仅在工程技术领域如此,在商业、公共政策与学术界同样如此。斯伯热还认为“T型人”具有更高的团队合作技能,他们可以更有效地同其他学科的人才进行交流。哈梅巴赫列出的书目就形象地揭示了“T型人”的智力特点。聪明人也会犯低级错误

哈梅巴赫在哈佛大学就读的头两年里,并没有意气风发地追求独特的(或者说与传统相悖的)学习风格,他对参加派对的兴趣超过了学习。大学一年级时,哈梅巴赫对棒球失去了兴趣,并且退出了球队。到了二年级的第二个学期,他不再参加任何课程的期末考试。那时,他最亲密的好友辍学了,他也与女友分手了。哈梅巴赫回忆说:“现在回想起来,那段时间完全荒废了。我真是太蠢了。”

从哈佛大学退学后,哈梅巴赫凭借自己的努力,终于在纽约市皇后区找了一份工作,去一家小型计算机网络公司上班。那年夏天,他住在皇后区一套面积不大的公寓里,但是不上班时,他经常与安德鲁·斯米尔一起待在曼哈顿。斯米尔与哈梅巴赫的一位哈佛大学室友是中学同学,当时正在耶鲁大学上学。斯米尔回忆说,哈梅巴赫在购买食物时有一个标准:花最少的钱,买到最多热量的食物。(他还专门为此建了一个电子表格。)斯米尔说,这是一种“典型的杰夫方案”,即通过数字解决问题。磅饼、花生酱和金鱼饼干是哈梅巴赫常吃的食物,这种做法简直就是一个实例示范,告诉我们如何让每一个单位(对食物来说,就是每个卡路里的成本)发挥最大作用。哈梅巴赫回忆从中学得到的生活经验时说:“别在饮食方面斤斤计较,因为饮食质量会影响情绪。”

哈梅巴赫在夜生活方面显然要慷慨得多。斯米尔说,那年夏天他们两个人相处得十分融洽,原因之一就是“我们都不善于拒绝,不会拒绝再喝一杯,也不会拒绝多玩一会儿。有一个相处融洽、在社交方面精力旺盛的伙伴真是一件乐事。”

斯米尔这位拥有工商管理学硕士学位的汉学家回忆说:“我们的融洽关系在很大程度上得益于我们在控制冲动方面的特点,或者说,是因为我们都不善于控制自己的冲动。现在,他有了很大的改变,我也与以前大不相同了”。

哈梅巴赫在计算机网络公司的这份工作并没有维持很长时间。由于他经常不按时上班,又抱着一种目空一切的态度,这家小型公司的管理层终于对他忍无可忍了。三个月之后,他被辞退了。哈梅巴赫给家里打了一个电话,格伦和勒诺说,他们可以开车接他回家,并捎上他的行李,但他必须支付车钱。付了车钱之后,杰夫只剩下40美元了。回到韦恩堡之后,父母要求杰夫每周支付100美元。他们把这笔钱交由第三方代为保管,留着他继续上学时使用。父母告诉杰夫,他可以去普渡大学或者哈佛大学就读,至于到底去哪所大学,由他自己决定,但是他必须继续读大学。

除了爱之深责之切以外,杰夫的父母还感到一丝担忧。勒诺在本地一所名叫“马太福音第25章”的慈善机构从事志愿性护理工作。这家机构为没有保险、收入较低、无家可归的人提供免费医疗与牙齿护理服务。勒诺说,在这些服务对象中,有很多人的智商很高,但由于养成了一些不好的习惯和做出了一些错误的选择,导致生活陷入困境。杰夫在哈佛大学上学期间,饮酒无度,经常参加派对,责任心缺失。这些行为在那些前来接受免费医疗服务的人身上都能看到,勒诺对此见怪不怪。在她看来,杰夫简直是自暴自弃。

回到韦恩堡之后,杰夫逐渐安分了下来。他的那些朋友都在上大学,没有人跟他一起厮混。回到韦恩堡的杰夫结束了在曼哈顿与剑桥时的夜夜笙歌,取而代之的是餐桌边安安静静的家庭晚餐。白天,他老老实实地工作,刚开始是在巴诺书店找了一份工作,后来又在通用汽车公司做了一段时间的工人。但是,后一份工作杰夫只干了一个月左右的时间。据格伦说,这是因为“工厂的装配线让他感触良多”。事实证明,这次体验激发了他的动力,也让他得到了启发。他决定继续上学,不是在印第安纳上大学,而是回到哈佛大学继续完成学业。

哈梅巴赫说,哈佛大学求学历程中的这次挫折是“我人生的一个转折点”。在纽约的独立生活以及回到韦恩堡的生活,使他对正常的生活以及父母的关爱有了深刻的认识。他回忆说:“我与父母的相处发生了彻底的改变,这次挫折让我理解了父母的所作所为和他们为我做出的牺牲。”(他的父母退休之后,哈梅巴赫在南卡罗来纳为他们买了一套房子,并且告诉他们:“你们一直辛勤工作,付出了很多,这套房子是你们应得的回报。”)

回到哈佛大学之后,为了赚取生活费,哈梅巴赫又开始做那份图书馆的工作。而且,他也不像以前那样经常逃课了。他选修的课程中有一门是概率方面的小型数学研讨课,这门课的实践活动要求学生们编写语音识别软件程序。由于概率计算及语音频率模式匹配在语音识别中占有非常重要的地位,因此语音识别程序可能是测试数学知识的有效平台。有必要说明的是,这门课的指导老师是Dragon Systems公司(语音识别软件商业化先驱)的合作创始人保罗·班伯格。编程过程中需要完成的一项任务是执行快速傅里叶变换算法,在时间或空间与频率之间实现双向变换。这门研讨课是面向数学能力极强的学生开设的,只招收了5名学生,其中包括马克·扎克伯格(一年之后,他创建了脸谱网)。但是在哈佛大学求学期间,哈梅巴赫与扎克伯格还不十分了解对方。哈梅巴赫回忆说:“马克那时候不怎么善于社交,因此我们很少交流。”

至于哈梅巴赫,绝不会有人认为他不善于社交。当然,有时候他也会太过不拘小节,例如,经常缺席饭局或会议,或者好几天不回电子邮件。这些行为看似粗心大意,但是,朋友、同事和妻子都知道,其实他的头脑里装满了各种想法,只不过不是社交或商务活动的日常礼仪罢了。他可能太专注于思考问题了,但绝不是不善于社交。

如果以硅谷技术人员的标准来衡量,哈梅巴赫绝对是一位社交高手。脸谱网前首席技术官、现在Quora公司(一家在线问答型初创公司)担任首席执行官的亚当·德安杰罗说:“他的性格十分外向,这在整天跟数据打交道的技术人员当中很少见。”据德安杰罗称,由于天生外向,而且兴趣广泛,“杰夫非常善于同各类人打交道”。

在哈佛大学上学期间,哈梅巴赫在学校一家叫作Spee的男生俱乐部负责会员招募工作,这项工作把他的社交能力发挥得淋漓尽致。传统上,这类促进社交、追求享乐的俱乐部招收的会员通常都来自非富即贵的家庭,这一特点现在仍然存在,不过不如以前那么明显了。Spee男生俱乐部成立于1852年,多年来以思想进步而著称,约翰·F·肯尼迪与罗伯特·F·肯尼迪都曾经是该俱乐部的会员。1965年,Spee俱乐部开始接收非裔美国籍会员,是首批招收非裔美国籍会员的俱乐部之一。几年前,在该俱乐部担任负责人的是一位汽车工人的儿子。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书

若在网站上没有找合适的书籍,可联系网站客服获取,各类电子版图书资料皆有。

客服微信:xzh432

登入/注册
卧槽~你还有脸回来
没有账号? 忘记密码?