因为星星在那里:科学殿堂的砖与瓦(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-02 13:24:21

点击下载

作者:卢昌海

出版社:清华大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

因为星星在那里:科学殿堂的砖与瓦

因为星星在那里:科学殿堂的砖与瓦试读:

版权信息

书名:因为星星在那里:科学殿堂的砖与瓦

作者:卢昌海

出版社:清华大学出版社

出版时间:2015-06-01

ISBN:9787302400660

本书由清华大学出版社有限公司授权北京当当科文电子商务有限公司制作与发行。

版权所有 侵权必究绘画:张京

谨以本书献给我的家人

序言

作为一位出版了四本书的作者,如果要用一句话来概括写书的感觉的话,那就是:写书比写文章累。这貌似是一句显而易见的大白话,对我这种在写作上有一定兴趣,甚至以写作为乐的人来说,却是一种只有经历过了才意识到的新感觉。这新感觉的起因也是一句显而易见的大白话,那就是:书比文章长。不过,这个“长”对我来说与其说是篇幅之长,不如说是指所费时间之长。因为在一本书的写作过程中,我得不断约束自己的阅读兴趣,把主要精力投注于单一主题。另一方面,我的写作速度又比较慢(或美其名曰“认真”),从而使得写作过程往往长到了对题材的兴趣将尽而书稿远未完成的程度。这时候,写书就变成了对恒心和毅力的考验,而我——很遗憾地——曾两度在这种考验面前失败过,致使《黎曼猜想漫谈》和《从奇点到虫洞》“烂尾”多年(对这一“丢人”事迹感兴趣的读者可参阅那两本书的后记),其“累”亦由此可见。

在这种感觉下,若有谁愿把我的文章汇集成书出版,让我既免除写书之累,又可得出书之乐,那对我来说简直就是“天上掉馅儿饼”的美事,几乎要让我生出一种“偷懒”的愧疚了。最近,这样的美事居然落在了我的头上——清华大学出版社愿意出版我的两本文章合集,一本收录科学史方面的文章,一本收录科普方面的文章。

兴奋之下,我很快选好了篇目,但问题来了:一堆文章汇集在一起,以什么作为书名呢?当然,假如我是著名作者,这根本就不是问题,大可取名为“卢昌海科学史作品集”和“卢昌海科普作品集”。但对于明显不著名的我来说,就算不怕僭越地将自己的名字厚颜纳入书名,也只会成为“票房毒药”,因此必须另谋思路。读者可能会笑话我这么小的事情都不能轻松搞定,其实非独我如此,像阿西莫夫(Isaac Asimov)那样的大牌作家也常常为书名发愁呢,以至于在文章合集The Sun Shines Bright的简介中感慨地说,他几乎想用数字编号来作书名了——当然,他发愁的原因跟我是不同的,他那是因为作品实在太多,显而易见的书名几乎用遍了。

经过思考,为了让两本书略显对仗,我提议将科学史合集取名为《科学殿堂的人和事》,将科普合集取名为《科学殿堂的砖与瓦》。但编辑看了之后觉得这两个标题太平淡。于是我又绞尽脑汁想了半天,却没再想出什么点子来。无奈之下,我决定效仿阿西莫夫,他虽然也为书名发愁,点子可比我多多了,在The Sun Shines Bright的简介中做完了用数字编号作为书名的“白日梦”后,随即采用了一个颇有些取巧的办法,那就是从所汇集的文章中选取一篇的标题作为书名。现在您所看到的这两本文章合集的书名——《小楼与大师:科学殿堂的人和事》和《因为星星在那里:科学殿堂的砖与瓦》——便也是如此而来。

关注我文章的读者或许注意到了,收录在这两本书中的某些文章是曾经在杂志或报纸上发表过的。不过,杂志和报纸大都有自己固定的风格,有时不免需要作者“削足适履”来契合之。因此,发表在杂志和报纸上的版本与我自己的版本相比大都存在一定的缺陷,比如经过编辑的改动,以及因字数所限作过删节等。此外,发表在杂志上的版本大都略去了注释及对人名和术语的英文标注等,这其中后者——即英文标注——或许并不重要,但前者——即注释——其实是颇为重要的,往往起着补充正文、澄清歧义等诸多作用。所有这些缺陷在此次汇集成书时都尽可能予以消除了。

与以前的四本书一样,这两本书也是非常接近原稿风格的,在个别细节上甚至有可能略胜于原稿,因为编辑订正的个别错别字由于未曾标注,我未必能在阅读校样时一一察觉并在自己的版本上做出相应的订正。在尊重原稿这个最至关重要的特点上,我要再次对清华大学出版社表示感谢,感谢其对我作品及写作风格的长期——从出版第一本书至今已五年了,够得上用这个词了吧——信任和支持。

最后,希望读者们喜欢这两本新书。

第一部分 数学

孪生素数猜想

2003年3月28日,在美国数学研究所(American Institute of Mathematics)位于加州帕洛阿尔托(Palo Alto)的总部,一群来自世界各地的数学家怀着极大的兴趣聆听了圣荷西州立大学(San José State University)数学教授戈德斯通(Daniel Goldston)所做的一个学术报告。在这个报告中,戈德斯通介绍了他和土耳其海峡大学(Boaziçi University)的数学家伊尔迪里姆(Cem Yildirim)在证明孪生素数猜想(twin prime conjecture)方面所取得的一个进展。这一进展——如果得到确认的话——将把人们在这一领域中的研究大大推进一步。

那么,什么是孪生素数(twin prime)?什么是孪生素数猜想?戈德斯通和伊尔迪里姆所取得的进展又是什么呢?本文将对这些问题做一个简单介绍。

要介绍孪生素数,首先当然要说一说素数(prime number)这一概念。素数是除了1和自身以外没有其他因子的自然数。在数论中,素数可以说是最纯粹、也最令人着迷的概念。关于素数,一个最简单的事实就是:除了2以外,所有素数都是奇数(因为否则的话,除了1和自身以外还会有一个因子2,从而不满足定义)。由这一简单事实可以得到一个简单推论,那就是:大于2的两个相邻素数之间的最小可能的间隔是2。所谓孪生素数指的就是这种间隔为2的相邻素数,它们之间的距离已经近得不能再近了,就像孪生兄弟一样。不难验证,在孪生素数中,最小的一对是(3,5),在100以内则还有(5,7)、(11,13)、(17,19)、(29,31)、(41,43)、(59,61)和(71,73)等另外7对,总计为8对。进一步的验证还表明,随着数字的增大,孪生素数的分布大体上会变得越来越稀疏,寻找孪生素数也会变得越来越困难。

那么,会不会在超过某个界限之后就再也不存在孪生素数了呢?

这个问题让我们联想到素数本身的分布。我们知道,素数本身的分布也是随着数字的增大而越来越稀疏的,因此也有一个会不会在超过某个界限之后就再也不存在的问题。不过幸运的是,早在古希腊时代,著名数学家欧几里得(Euclid)就证明了素数有无穷多个(否则的话——即假如素数没有无穷多个的话——今天的许多数论学家恐怕就得另谋生路了)。长期以来数学家们普遍猜测,孪生素数的情形与素数类似,虽然其分布随着数字的增大而越来越稀疏,总数却是无穷的。这就是与哥德巴赫猜想(Goldbach conjecture)齐名、集令人惊异的表述简单性与令人惊异的证明复杂性于一身的著名猜想——孪生素数猜想。孪生素数猜想:存在无穷多个素数p,使得p+2也是素数。

究竟是谁最早明确地提出这一猜想我没有考证过,但1849年法国数学波利尼亚克(Alphonse de Polignac)曾提出过一个猜想:对于任意偶数2k,存在无穷多组以2k为间隔的素数。这一猜想被称为波利尼亚克猜想(Polignac's conjecture)。对于k=1,它就是孪生素数猜想。因此人们有时把波利尼亚克作为孪生素数猜想的提出者。值得一提的是,人们对不同的k所对应的素数对的命名是很有趣的:k=1(即间隔为2)的素数对我们已经知道叫做孪生素数;k=2(即间隔为4)的素数对被称为cousin prime(表兄弟素数),比“孪生”稍远;而k=3(即间隔为6)的素数对竟被称为sexy prime!这回该相信“书中自有颜如玉”了吧?不过别想歪了,之所以称为sexy prime,其实是因为sex正好是拉丁文中的“6”(因此sexy prime的中文译名乃是毫无联想余地的“六素数”)。

孪生素数猜想还有一个更强的形式,是英国数学家哈代(Godfrey Hardy)和李特伍德(John Littlewood)于1923年提出的,有时被称为哈代-李特伍德猜想(Hardy-Littlewood conjecture)或强孪生素数猜想(strong twin prime conjecture)。这一猜想不仅提出孪生素数有无穷多组,而且还给出其渐近分布为其中π(x)表示小于x的孪生素数的数目,C被称为孪生素数常数22(twin prime constant),其数值为

强孪生素数猜想对孪生素数分布的拟合程度可以由表1看出。很明显,拟合程度是相当漂亮的。假如可以拿观测科学的例子来作比拟的话,如此漂亮的拟合几乎能跟英国天文学家亚当斯(John Couch Adams)和法国天文学家勒维耶(Urbain Le Verrier)运用天体摄动规律对海王星位置的预言,以及爱因斯坦(Albert Einstein)的广义相对论对光线引力偏转的预言等最精彩的观测科学成就相媲美,可以算同为理性思维的动人篇章。这种拟合对于纯数学的证明来说虽起不到实质帮助,却大大增强了人们对孪生素数猜想的信心。表 1

在这里还可以顺便提一下,强孪生素数猜想所给出的孪生素数分布规律可以通过一个简单的定性分析来“得到”:我们知道,素数定理(prime number theorem)表明对于足够大的x,在x附近素数的分布密度大约为1/ln(x),因此两个素数位于宽度为2的区间之内2(即构成孪生素数)的概率大约为2/ln(x)。这几乎正好就是强孪生素数猜想中的被积函数——当然,两者之间还差了一个孪生素数常数C,而这个常数显然正是哈代和李特伍德的功力深厚之处。2

除了强孪生素数猜想与孪生素数实际分布之间的漂亮拟合外,对孪生素数猜想的另一类“实验”支持来自于对越来越大的孪生素数的直接寻找。就像对大素数的寻找一样,这种寻找在很大程度上成为了对计算机运算能力的一种检验。1994年10月30日,这种寻找竟然使人们发现了英特尔(Intel)奔腾(Pentium)处理器浮点除法运算的一个瑕疵(bug),在工程界引起了不小的震动。截至2002年底,人们发现的最大的孪生素数是:169 690169 690(33 218 925×2-1,33 218 925×2+1)这对素数中的每一个都长达51 090位。许多年来这种纪录一直被持续而成功地刷新着,它们对于纯数学的证明来说虽也起不到实质帮助,①却同样有助于增强人们对孪生素数猜想的信心。①666

截至2011年底,这一纪录已被刷新为了:(3 756 801 695 685×2669666 669-1,3 756 801 695 685×2+1),这对素数中的每一个都长达200 700位。

好了,介绍了这么多关于孪生素数的资料,现在该说说人们在证明孪生素数猜想上所走过的征途了。

迄今为止,在证明孪生素数猜想上的成果大体可以分为两类。第一类是非估算性的,这方面迄今最好的结果是1966年由中国数学家陈景润利用筛法(sieve method)所取得的。陈景润证明了:存在无穷多个素数p,使得p+2要么是素数,要么是两个素数的乘积。这个结果的形式与他关于哥德巴赫猜想的结果很类似。目前一般认为,由于筛法本身所具有的局限性,这一结果在筛法的范围之内已很难被超越。

证明孪生素数猜想的另一类结果则是估算性的,戈德斯通和伊尔迪里姆所取得的结果就属于这一类。这类结果估算的是相邻素数之间的最小间隔,更确切地说是:翻译成白话文,这个表达式所定义的是两个相邻素数之间的间隔与其中较小的那个素数的对数值之比在整个素数集合中所取的最小值。很明显,孪生素数猜想要想成立,Δ必须为0。因为孪生素数猜想表明p-p=2对无穷多个n成立,而ln(p)→∞,因此两者之比的最小值n+1nn对于孪生素数集合——从而对于整个素数集合也——趋于零。不过要注意,Δ=0只是孪生素数猜想成立的必要条件,而不是充分条件。换句话说,如果能证明Δ≠0,则孪生素数猜想就被推翻了;但证明了Δ=0,却并不意味着孪生素数猜想一定成立。

对Δ最简单的估算来自于素数定理。按照素数定理,对于足够大的x,在x附近素数出现的几率为1/ln(x),这表明素数之间的平均间隔为ln(x),从而(p-p)/ln(p)给出的其实是相邻素数之间的n+1nn间隔与平均间隔的比值,其平均值显然为1。平均值为1,最小值显然是小于等于1,因此素数定理给出Δ≤1。

对Δ的进一步估算始于哈代和李特伍德。1926年,他们运用圆法(circle method)证明了假如广义黎曼猜想(generalized Riemann hypothesis)成立,则Δ≤2/3。这一结果后来被苏格兰数学家兰金(Robert Alexander Rankin)改进为Δ≤3/5。但这两个结果都有赖于本身尚未得到证明的广义黎曼猜想,因此只能算是有条件的结果。1940年,匈牙利数学家埃尔德什(Paul Erdös)利用筛法率先给出了一个不带条件的结果:Δ<1(即把素数定理给出的结果中的等号部分去掉了)。此后意大利数学家里奇(Giovanni Ricci)于1954年,意大利数学家蓬皮埃利(Enrico Bombieri)、英国数学家达文波特(Harold Davenport)于1966年,以及英国数学家赫克斯利(Martin Huxley)于1977年,分别将Δ的估算值推进到了Δ≤15/16,Δ≤(2+)/8≈0.466 5,以及Δ≤0.442 5。戈德斯通和伊尔迪里姆之前最好的结果则是德国数学家梅尔(Helmut Maier)于1986年得到的Δ≤0.248 6。

以上这些结果都是在小数点后面做文章,戈德斯通和伊尔迪里姆的结果将这一系列努力大大推进了一步,并且——如果得到确认的话——将在一定意义上终结对Δ进行数值估算的长达几十年的漫漫征途。因为戈德斯通和伊尔迪里姆所证明的结果是Δ=0。当然,如我们前面所述,Δ=0只是孪生素数猜想成立的必要条件,而不是充分条件,因此戈德斯通和伊尔迪里姆的结果即便得到确认,离最终证明孪生素数猜想仍有相当的距离,但它无疑将是近十几年来这一领域中最引人注目的结果。

一旦Δ=0被证明,下一个努力方向会是什么呢?一个很自然的方-1向将是研究Δ趋于0的方式。孪生素数猜想要求Δ~[ln(p)](因n为p-p=2对无穷多个n成立)。戈德斯通和伊尔迪里姆的结果所给n+1n-1/9出的则是Δ~[ln(p)],两者之间还有不小的差距。但是看n过戈德斯通和伊尔迪里姆手稿的一些数学家认为,戈德斯通和伊尔迪里姆所用的方法还存在改进空间。也就是说,他们的方法还有可能对Δ趋于0的方式作出更强的估计。从这个意义上讲,戈德斯通和伊尔迪里姆这一结果的价值不仅仅在于结果本身,更在于它有可能成为一系列未来研究的起点。这种带传承性的系列研究对于数学来说有着双重的重要性,因为一方面,这种研究可能取得的新结果将是对数学的直接贡献;另一方面,这种研究对戈德斯通和伊尔迪里姆的结果会起到反复推敲与核实的作用。现代数学早已超越了一两个评审花一两个小时就可以对一个数学证明做出评判的时代。著名的四色定理(four color theorem)和费马大定理(Fermat's Last Theorem)都曾有过一个证明时隔几年、甚至十几年才被发现错误的例子。因此,一个复杂的数学结果能成为进一步研究的起点,吸引其他数学家的参与,对于最终判定其正确性具有极其正面的意义。2003年4月6日写于纽约2014年9月15日最新修订

魔方与“上帝之数”

2008年7月,来自世界各地的很多优秀的魔方玩家聚集在捷克共和国(Czech Republic)中部城市帕尔杜比采(Pardubice),参加魔方界的重要赛事:捷克公开赛。在这次比赛上,荷兰玩家阿克斯迪杰克(Erik Akkersdijk)创下了一个惊人的纪录:只用7.08秒就复原了一个颜色被打乱的魔方。无独有偶,在这一年的8月,人们在研究魔方背后的数学问题上也取得了重要进展。在本文中,我们就来介绍一下魔方以及它背后的数学问题。

一、风靡世界的玩具

1974年春天,匈牙利布达佩斯应用艺术学院(Budapest College of Applied Arts)的建筑学教授鲁比克(Ernö Rubik)萌生了一个有趣的念头,那就是设计一个教学工具来帮助学生直观地理解空间几何中的各种转动。经过思考,他决定制作一个由一些小方块组成的,各个面能随意转动的3×3×3的立方体。这样的立方体可以很方便地演示各种空间转动。绘画:张京

这个想法虽好,实践起来却面临一个棘手的问题,即如何才能让这样一个立方体的各个面能随意转动?鲁比克想了很多点子,比如用磁铁或橡皮筋连接各个小方块,但都不成功。那年夏天的一个午后,他在多瑙河畔乘凉,眼光不经意地落在了河畔的鹅卵石上。忽然,他心中闪过一个新的设想:用类似于鹅卵石表面那样的圆形表面来处理立方体的内部结构。这一新设想成功了,鲁比克很快完成了自己的设计,并向匈牙利专利局申请了专利。这一设计就是我们都很熟悉的魔方(magic cube),也叫鲁比克方块(Rubik's cube)。

6年后,鲁比克的魔方经过一位匈牙利商人兼业余数学家的牵头,打进了西欧及美国市场,并以惊人的速度成为了风靡全球的新潮玩具。在此后的25年间,魔方的销量超过了3亿个。在魔方的玩家中,既有牙牙学语的孩子,也有跨国公司的老总。魔方虽未如鲁比克设想的那样成为一种空间几何的教学工具,却变成了有史以来最畅销的玩具。

魔方之畅销,最大的魔力就在于其数目惊人的颜色组合。一个魔方出厂时每个面各有一种颜色,总共有6种颜色,但这些颜色被打乱②16后,所能形成的组合数却多达4 325亿亿(1亿亿=1×10)。如果我们将这些组合中的每一种都做成一个魔方,这些魔方排在一起,可以从地球一直排到250光年外的遥远星空——也就是说,如果我们在这样一排魔方的一端点上一盏灯,那灯光要在250年后才能照到另一端!如果哪位勤勉的玩家想要尝试所有的组合,哪怕他不吃、不喝、不睡,每秒钟转出10种不同的组合,也要花1 500亿年的时间才能如愿(作为比较,我们的宇宙目前还不到140亿岁)。与这样的组合数相比,广告商们常用的“成千上万”、“数以亿计”、“数以十亿计”等平日里虚张声势、忽悠顾客的形容词反倒变成了难得的谦虚。我们可以很有把握地说,假如不掌握诀窍地随意乱转,一个人哪怕从宇宙大爆炸之初就开始玩魔方,也几乎没有任何希望将一个色彩被打乱的魔方复原。②具体的计算是这样的:在组成魔方的小立方体中,有8个是顶点,它们7之间有8!种置换;这些顶点每个有3种颜色,从而在朝向上有3种组合(由于结构所限,魔方的顶点只有7个能有独立朝向)。类似的,魔方有12个小立方体是边,它们之间有12!/2种置换(之所以除以2,是因为魔方的顶点一旦确定,边的置换就只有一半是可能的);这些边每个有两种颜色,在朝向上11有2种组合(由于结构所限,魔方的边只有11个能有独立朝向)。因此,魔711方的颜色组合总数为8!×3×12!×2/2=43 252 003 274 489 856 000,即大约4 325亿亿。另外值得一提的是,倘若我们允许将魔方拆掉重组,则前面提到的结构限定将不复存在,它的颜色组合数将多达51 900亿亿种。不过颜色组合数的增加并不意味着复原的难度变大,魔方结构对颜色组合数的限制实际上正是使魔方的复原变得困难的主要原因。举个例子来说,26个英文字母在相邻字母的交换之下共有约400亿亿亿种组合,远远多于魔方颜色的组合数,但通过相邻字母的交换将随意排列的26个英文字母复原成从A到Z的初始排列却非常简单。

二、魔方与“上帝之数”

魔方的玩家多了,相互间的比赛自然是少不了的。自1981年起,魔方爱好者们开始举办世界性的魔方大赛,从而开始缔造自己的世界纪录。这一纪录被不断地刷新着,截至2013年,复原魔方的最快纪录已经达到了令人吃惊的5.55秒。当然,单次复原的纪录存在一定的偶然性,为了减少这种偶然性,自2003年起,魔方大赛的冠军改由多次复原的平均成绩来决定,截至2013年,这一平均成绩的世界纪录为6.54秒。这些纪录的出现,表明魔方虽有天文数字般的颜色组合,但只要掌握窍门,将任何一种给定的颜色组合复原所需的转动次数却很可能并不多。

那么,最少需要多少次转动,才能确保无论什么样的颜色组合都能被复原呢?这个问题引起了很多人,尤其是数学家们的兴趣。这个复原任意组合所需的最少转动次数被数学家们戏称为“上帝之数”(God's number),而魔方这个玩具世界的宠儿则由于这个“上帝之数”而一举侵入了学术界。

要研究“上帝之数”,首先当然要研究魔方的复原方法。在玩魔方的过程中,人们早就知道,将任何一种给定的颜色组合复原都是很容易的,这一点已由玩家们的无数杰出纪录所示范。不过魔方玩家们所用的复原方法是便于人脑掌握的方法,却不是转动次数最少的,因此无助于寻找“上帝之数”。寻找转动次数最少的方法是一个有一定难度的数学问题。当然,这个问题是难不倒数学家的。早在20世纪90年代中期,人们就有了较实用的算法,可以用平均15分钟左右的时间找出复原一种给定的颜色组合的最少转动次数。从理论上讲,如果有人能对每一种颜色组合都找出这样的最少转动次数,那么这些转动次数中最大的一个无疑就是“上帝之数”了。但可惜的是,“4 325亿亿”这个巨大数字成为了人们窥视“上帝之数”的拦路虎。如果采用上面提到的算法,用上面提到的速度寻找,哪怕用一亿台计算机同时进行,也要用超过1 000万年的时间才能完成。

看来蛮干是行不通的,数学家们于是便求助于他们的老本行:数学。从数学的角度看,魔方的颜色组合虽然千变万化,其实都是由一系列基本操作——即转动——产生的,而且那些操作还具有几个非常简单的特点,比如任何一个操作都有一个相反的操作(比如与顺时针转动相反的操作就是逆时针转动)。对于这样的操作,数学家们的“武器库”中有一种非常有效的工具来对付它,这工具叫做群论(group theory),它比魔方问世早了140多年就已出现了。据说德国数学大师希尔伯特(David Hilbert)曾经表示,学习群论的窍门就是选取一个好的例子。自魔方问世以来,数学家们已经写出了好几本通过魔方讲述群论的书。因此,魔方虽未成为空间几何的教学工具,却在一定程度上可以作为学习群论的“好的例子”。

对魔方研究来说,群论有一个非常重要的优点,就是可以充分利用魔方的对称性。我们前面提到“4 325亿亿”这个巨大数字时,其实有一个疏漏,那就是未曾考虑到魔方作为一个立方体所具有的对称性。由此导致的结果,是那4 325亿亿种颜色组合中有很多其实是完全相同的,只是从不同的角度去看——比如让不同的面朝上或者通过镜子去看——而已。因此,“4 325亿亿”这个令人望而生畏的数字实际上是“注水猪肉”。那么,这“猪肉”中的“水分”占多大比例呢?说出来吓大家一跳:占了将近99%!换句话说,仅凭对称性一项,数学家们就可以把魔方的颜色组合减少两个数量级。

但减少两个数量级对于寻找“上帝之数”来说还是远远不够的,因为那不过是将前面提到的1000万年的时间减少为了10万年。对于解决一个数学问题来说,10万年显然还是太长了,而且我们也并不指望真有人能动用一亿台计算机来计算“上帝之数”。数学家们虽然富有智慧,在其他方面却不见得富有,他们真正能动用的也许只有自己书桌上那台计算机。因此为了寻找“上帝之数”,人们还需要更巧妙的思路。幸运的是,群论这一工具的威力远不只是用来分析像立方体的对称性那样显而易见的东西,在它的帮助下,更巧妙的思路很快就出现了。

三、寻找“上帝之数”

1992年,德国数学家科先巴(Herbert Kociemba)提出了一种寻找魔方复原方法的新思路。他发现,在魔方的基本转动方式中,有一部分可以自成系列,通过这部分转动可以形成将近200亿种颜色组合。利用这200亿种颜色组合,科先巴将魔方的复原问题分解成了两个步骤:第一步是将任意一种颜色组合转变为那200亿种颜色组合之一,第二步则是将那200亿种颜色组合复原。如果我们把魔方的复原比作是让一条汪洋大海中的小船驶往一个固定目的地,那么科先巴提出的那200亿种颜色组合就好比是一片特殊水域——一片比那个固定目的地大了200亿倍的特殊水域。他提出的两个步骤就好比是让小船首先驶往那片特殊水域,然后从那里驶往那个固定目的地。在汪洋大海中寻找一片巨大的特殊水域,显然要比直接寻找那个小小的目的地容易得多,这就是科先巴新思路的巧妙之处。

但即便如此,要用科先巴的新思路对“上帝之数”进行估算仍不是一件容易的事。尤其是,要想进行快速计算,最好是将复原那200亿种颜色组合的最少转动次数(这相当于是那片特殊水域的“地图”)存储在计算机的内存中,这大约需要300兆(300MB)的内存。300兆在今天看来是一个不太大的数目,但在科先巴提出新思路的年代,普通计算机的内存连它的十分之一都远远不到。因此直到3年之后,才有人利用科先巴的新思路给出了第一个估算结果。此人名叫里德(Michael Reid),是美国中佛罗里达大学(Unversity of Central Florida)的数学家。1995年,里德通过计算发现,最多经过12次转动,就可以将魔方的任意一种颜色组合转变为科先巴新思路中那200亿种颜色组合之一;而最多经过18次转动,就可以将那200亿种颜色组合中的任意一种复原。这表明,最多经过12+18=30次转动,就可以将魔方的任意一种颜色组合复原。

在得到上述结果后,里德很快对自己的估算作了改进,将结果从30减少为了29,这表明“上帝之数”不会超过29。此后随着计算机技术的发展,数学家们对里德的结果又作出了进一步改进,但进展并不迅速。直到11年后的2006年,奥地利开普勒大学(Johannes Kepler University)符号计算研究所(Research Institute for Symbolic Computation)的博士生拉杜(Silviu Radu)才将结果推进到了27。第二年(即2007年),美国东北大学(Northeastern University)的计算机科学家孔克拉(Dan Kunkle)和库伯曼(Gene Cooperman)又将结果推进到了26,他们的工作采用了并行计算系统,所用的最大6存储空间高达700万兆(7×10MB),所耗的计算时间则长达8 000小时(相当于将近一年的24小时不停歇计算)。

这些计算表明,“上帝之数”不会超过26。但是,所有这些计算的最大优点——即利用科先巴新思路中那片特殊水域——同时也是它们最致命的弱点,因为它们给出的复原方法都必须经过那片特殊水域。可事实上,很多颜色组合的最佳复原方法根本就不经过那片特殊水域,比如紧邻目的地,却恰好不在特殊水域中的任何小船,显然都没必要像中国大陆和台湾之间的直航包机一样,故意从那片特殊水域绕一下才前往目的地。因此,用科先巴新思路得到的复原方法未必是最佳的,由此对“上帝之数”所做的估计也极有可能是高估。

可是,如果不引进科先巴新思路中的特殊水域,计算量又实在太大,怎么办呢?数学家们决定采取折中手段,即扩大那片特殊水域的“面积”。因为特殊水域越大,最佳复原路径恰好经过它的可能性也就越大(当然,计算量也会有相应的增加)。2008年,研究“上帝之数”长达15年之久的计算机高手罗基奇(Tomas Rokicki)运用了相当于将科先巴新思路中的特殊水域扩大几千倍的巧妙方法,在短短几个月的时间内对“上帝之数”连续发动了四次猛烈攻击,将它的估计值从25一直压缩到了22——这就是本文开头提到的人们在研究魔方背后的数学问题上取得的重要进展。罗基奇的计算得到了电影特效制作商索尼图形图像运作公司(Sony Pictures Imageworks)的支持,这家曾为《蜘蛛人》(Spider-Man)等著名影片制作特效的公司向罗基奇提供了相当于50年不停歇计算所需的计算机资源。

由此我们进一步知道,“上帝之数”一定不会超过22。但是,罗基奇虽然将科先巴新思路中的特殊水域扩展得很大,终究仍有一些颜色组合的最佳复原方法是无需经过那片特殊水域的,因此,“上帝之数”很可能比22更小。那么,它究竟是多少呢?种种迹象表明,它极有可能是20。这是因为,人们在过去这么多年的所有努力——其中包括罗基奇直接计算过的大约4 000万亿种颜色组合——中,都从未遇到过任何必须用20次以上转动才能复原的颜色组合,这表明“上帝之数”很可能不大于20;另一方面,人们已经发现了几万种颜色组合,它们必须要用20次转动才能复原,这表明“上帝之数”不可能小于20。将这两方面综合起来,数学家们普遍相信,“上帝之数”的真正数值就是20。

2010年8月,这个游戏与数学交织而成的神秘的“上帝之数”终于水落石出:研究“上帝之数”的“元老”科先巴、“新秀”罗基奇,以及另两位合作者——戴维森(Morley Davidson)和德斯里奇(John Dethridge)——宣布了对“上帝之数”是20的证明。他们的证明得到了谷歌公司(Google)提供的相当于英特尔(Intel)四核心处理器35年不停歇计算所需的计算机资源。

因此,现在我们可以用数学特有的确定性来宣布“上帝之数”的数值了,那就是:20。2008年11月2日写于纽约2014年9月18日最新修订绘画:张京

ABC猜想浅说

由前三个英文字母拼合而成的“ABC”一词据说自13世纪起便见诸文献了,含义为“入门”。这些年随着英文在中国的流行,该词在中文世界里也夺得了一席之地,出现在了很多图书的书名中,大有跟中文词“入门”一较高下之势。不过,倘若你在数学文献中看到一个以“ABC”命名的猜想——“ABC猜想”(ABC conjecture),千万不要以为那是一个“入门”级别的猜想。事实上,这一猜想在公众知名度方面或许尚处于“入门”阶段,以难度和地位而论却绝不是“入门”级别的。

在本文中,我们将对这一并非“入门”级别的猜想做一个“入门”级别的介绍。

一、什么是ABC猜想?

在介绍之前,让我们先回忆一下中小学数学中的两个简单概念。其中第一个概念是素数(prime number)。我们知道,很多正整数可以分解为其他——即不同于它自己的——正整数的乘积,比如9=3×3,231=3×7×11,等等。但也有一些正整数不能这么分解,比如13,29等。这后一类正整数——1除外——就是所谓的素数。素数是一个被称为“数论”(number theory)的数学分支中的核心概念,其地位常被比喻为物理学中的原子(atom),因为与物理学中物质可以分解为原子相类似,数学中所有大于1的正整数都可以分解为素数的乘积(素数本身被视为是自己的分解)。第二个概念则是互素(co-prime)。两个正整数如果其素数分解中不存在共同的素数,就称为是互素的,比如21=3×7和55=5×11就是互素的。

有了这两个简单概念,我们就可以介绍ABC猜想了。ABC猜想针对的是满足两个简单条件的正整数组(A,B,C)。其中第一个条件是A和B互素,第二个条件是A+B=C。显然,满足这种条件的正整数组——比如(3,8,11)、(16,17,33)……——有无穷多个(请读者自行证明)。为了引出ABC猜想,让我们以(3,8,11)为例,做一个“三步走”的简单计算:(1)将A、B、C乘起来(结果是3×8×11=264);3(2)对乘积进行素数分解(结果是264=2×3×11);(3)将素数分解中所有不同的素数乘起来(结果是2×3×11=66)。

现在,让我们将A、B、C三个数字中较大的那个(即C)与步骤3的结果比较一下。我们发现后者大于前者(因为后者为66,前者为11)。读者可以对上面所举的另一个例子——即(16,17,33)——也试一下,你会发现同样的结果。如果随便找一些其他例子,你也很可能发现同样的结果。

但你若因此以为这是规律,那就完全错了,因为它不仅不是规律,而且有无穷多的反例。比如(3,125,128)就是一个反例(请读者自行验证)。但是,数学家们猜测,如果把步骤3的结果放大成它的一个大于1的幂,那个幂哪怕只比1大上一丁点儿(比如1.000 000 000 01),情况就有可能大不一样。这时它虽仍未必保证能够大于三个数字中较大的那个(即C),但反例的数目将由无穷变为有限。这个猜测就是所谓的ABC猜想,它是由英国数学家麦瑟尔(David Masser)和法国数学家厄斯特勒(Joseph Oesterlé)于20世纪80年代中期彼此独立地提出的。“ABC”这个毫无创意的名字——大家可能猜到了——则是来自把猜想中涉及到的三个数字称为A、B、C的做法,而非“入门”之意。

与数学猜想大家庭中的著名成员,如黎曼猜想(Riemann hypothesis)、哥德巴赫猜想(Goldbach conjecture)、孪生素数猜想(twin prime conjecture),以及(已被证明了的)曾经的费马猜想(Fermat conjecture)、四色猜想(four-color conjecture)等相比,ABC猜想的“资历”是很浅的(其他那些猜想都是百岁以上的“老前辈”),公众知名度也颇有不及,但以重要性而论,则除黎曼猜想外,上述其他几个猜想都得退居其后。

二、ABC猜想为什么重要?

ABC猜想有一个在普通人看来并不奥妙的特点,就是将整数的加法性质(比如A+B=C)和乘法性质(比如素数概念——因为它是由乘法性质所定义的)交互在了一起。不过,数学家们早就知道,由这两种本身很简单的性质交互所能产生的复杂性是近乎无穷的。数论中许多表述极为浅显,却极难证明的猜想(或曾经的猜想),比如前面提到的哥德巴赫猜想、孪生素数猜想、费马猜想等都具有这种加法性质和乘法性质相交互的特性。数论中一个很重要的分支——旨在研究整系数代数方程的整数解的所谓丢番图分析(Diophantine analysis)——更是整个分支都具有这一特性。丢番图分析的困难性是颇为出名的,著名德国数学家希尔伯特(David Hilbert)曾乐观地希望能找到其“一揽子”的解决方案,可惜这个被称为希尔伯特第十问题的希望后来落了空,被证明是不可能实现的(对这一点感兴趣的读者可参阅拙作《小楼与大师:科学殿堂的人和事》中的《希尔伯特第十问题漫谈》一文)。与希尔伯特的乐观相反,美国哥伦比亚大学(Columbia University)的数学家戈德菲尔德(Dorian Goldfeld)曾将丢番图分析比喻为飞蝇钓(fly-fishing)——那是发源于英国贵族的一种特殊的钓鱼手法,用甩出去的诱饵模拟飞蝇等昆虫的飞行姿态,以吸引凶猛的掠食性鱼类。飞蝇钓的特点是技巧高、难度大、成功率低,而且只能一条一条慢慢地钓——象征着丢番图分析只能一个问题一个问题慢慢地啃,而无法像希尔伯特所希望的那样“一揽子”地解决掉。

但是,与交互了加法性质和乘法性质的其他猜想或问题不同的是,ABC猜想这个从表述上看颇有些拖泥带水(因为允许反例)的猜想似乎处于某种中枢地位上,它的解决将直接导致一大类其他猜想或问题的解决。拿丢番图分析来说,戈德菲尔德就表示,假如ABC猜想能被证明,丢番图分析将由飞蝇钓变为最强力——乃至野蛮——的炸药捕鱼,一炸就是一大片,因为ABC猜想能“将无穷多个丢番图方程转变为单一数学命题”。这其中最引人注目的“战利品”将是曾作为猜想存在了300多年,一度被《吉尼斯世界纪录》(Guinness Book of World Records)称为“最困难数学问题”的费马猜想。这个直到1995年才被英国数学家怀尔斯(Andrew Wiles)以超过100页的长篇论文所解决的猜想在ABC猜想成立的前提下,将只需不到一页的数学推理就能确立。其他很多长期悬而未决的数学猜想或问题也将被“一锅端”。这种与其他数学命题之间的紧密联系是衡量一个数学命题重要性的首要“考评”指标,ABC猜想在这方面无疑能得高分——或者用戈德菲尔德的话说,是“丢番图分析中最重要的未解决问题”,“是一种美丽”。

ABC猜想的重要性吸引了很多数学家的兴趣,但它的艰深迟滞了取得进展的步伐。截至2001年,数学家们在这一猜想上取得的最好结果乃是将上述步骤3的结果放大成它的某种指数函数。由于指数函数的大范围增长速度远比幂函数快得多,由它来保证其大于A、B、C三个数字中较大的那个(即C)当然要容易得多(相应地,命题本身则要弱得多)。

除上述理论结果外,自2006年起,由荷兰莱顿大学(Leiden University)的数学系牵头,一些数学和计算机爱好者建立了一个名为ABC@Home的分布式计算(distributed computing)系统,用以寻找ABC猜想所允许的反例。截至2014年4月,该系统已经找到了超过2 380万个反例,而且还在继续增加着。不过,与这一系统的著名“同行”——比如寻找外星智慧生物的SETI以及计算黎曼ζ函数非平凡零点的已经关闭了的ZetaGrid——不同的是,ABC@Home是既不可能证明,也不可能否证ABC猜想的(因为ABC猜想本就允许数量有限的反例)。从这个意义上讲,ABC@Home的建立更多地只是出于对具体反例——尤其是某些极端情形下的反例,比如数值最大的反例——的好奇。当然,具体反例积累多了,是否会衍生出有关反例分布的猜想,也是不无趣味的悬念。另外,ABC猜想还有一些拓展版本,比如对某些情形下的反例数目给出具体数值的版本,ABC@Home对那种版本原则上是有否证能力的。

三、ABC猜想被证明了吗?

如前所述,ABC猜想的公众知名度与一些著名猜想相比是颇有不及的。不过,2012年9月初,包括《自然》(Nature)、《科学》(Science)在内的一些重量级学术刊物,以及包括《纽约时报》(New York Times)在内的许多著名媒体却纷纷撰写或转载了有关ABC猜想的消息,使这一猜想在短时间内着实风光了一番。促成这一风光的是日本数学家望月新一(Shinichi Mochizuki)。2012年8月底,望月新一发表了由四篇长文组成的系列论文的第四篇,宣称证明了包括ABC猜想在内的若干重要猜想。这一宣称被一些媒体称为是能与1993年怀尔斯宣称证明了费马猜想,以及2002年佩雷尔曼(Grigory Perelman)宣称证明了庞加莱猜想(Poincaré conjecture)相提并论的事件。

由于这一原因,我应约撰写本文时,约稿编辑曾希望我能找认识望月新一的华人数学家聊聊,挖出点独家新闻来。可惜我不得不有负此托了,因为别说是我,就连《纽约时报》等擅挖材料的重量级媒体在报道望月新一其人时,也基本没能超出他在自己网站上公布的信息。

按照那些信息,望月新一1969年3月29日出生于日本东京,16岁(即1985年)进入美国普林斯顿大学(Princeton University)就读本科,三年后进入研究生院,师从著名德国数学家、1986年菲尔茨奖(Fields Medal)得主法尔廷斯(Gerd Faltings),23岁(即1992年)获得数学博士学位。此后,他先是“海归”成京都大学(Kyoto University)数理解析研究所(Research Institute for Mathematical Sciences)的研究助理(Research Associate),几个月后又前往美国哈佛大学从事了近两年的研究,然后重返京都大学。2002年,33岁的望月新一成为了京都大学数理解析研究所的教授。望月新一的学术声誉颇佳,曾获得过日本学术奖章(Japan Academy Medal)等荣誉。

有关望月新一其人的信息大体就是这些,但读者不必过于失望,因为望月新一所宣称的对ABC猜想的证明虽引起了很大关注,离公认还颇有距离,因此目前恐怕还未到挖掘其生平的最佳时机。事实上,在ABC猜想并不漫长的历史中,这并不是第一次有人宣称解决了这一猜想。2007年,法国数学家施皮罗(Lucien Szpiro)就曾宣称解决了ABC猜想。施皮罗的学术声誉不在望月新一之下,不仅是领域内的专家,其工作甚至间接促成了ABC猜想的提出。但是,人们很快就在他的证明中发现了漏洞。这种宣称解决了一个重大数学猜想,随后却被发现漏洞的例子在数学史上比比皆是。因此,任何证明从宣称到公认,必须经过同行的严格检验。这一检验视证明的复杂程度而定,可长可短。不过对于望月新一的“粉丝”来说,恐怕得有长期等待的心理准备,因为望月新一那四篇论文的总长度超过了500页,几乎是怀尔斯证明费马猜想的论文长度的四倍!更糟糕的是,望月新一的证明采用了他自己发展起来的数学工具,这种工具据说是对以抽象和艰深著称的1966年菲尔兹奖得主格罗滕迪克(Alexander Grothendieck)的某些代数几何方法的推广,除他本人外,数学界并无第二人通晓。就连研究方向与望月新一相近的英国牛津大学(University of Oxford)的韩国数学家金明迥(Minhyong Kim)都表示,“我甚至无法对[望月新一的]证明给出一个专家概述,因为我并不理解它”,“仅仅对局势有一个一般了解也得花费一段时间”。美国威斯康星大学(University of Wisconsin)的数学家艾伦伯格(Jordan Ellenberg)则表示阅读望月新一的论文“仿佛是在阅读外星人的东西”(reading something from outer space)。2006年菲尔茨奖得主、澳大利亚数学家陶哲轩(Terence Tao)也表示“现在对这一证明有可能正确还是错误做出评断还为时过早”。

像望月新一那样宣称用自创的数学工具证明著名数学猜想的事例在数学界也是有先例的。2004年,美国普渡大学(Purdue)的数学教授德布朗基(Louisde Branges)宣称证明了著名的黎曼猜想,他所用的也是自创的数学工具。不过德布朗基在数学界的声誉和口碑均极差,加之年事已高(七旬老汉),其宣称遭到了数学界的冷淡对待。与之不同的是,望月新一却不仅有良好的学术声誉,精力和研究能力也尚处于巅峰期。用陶哲轩的话说,望月新一“与佩雷尔曼和怀尔斯类似”,“是一个多年来致力于解决重要问题,在领域内享有很高声誉的第一流数学家”。有鉴于此,数学界不仅对望月新一的证明给予了重视,对他自创的方法也表示了兴趣,比如美国斯坦福大学(Stanford University)的数学家康拉德(Brian Conrad)就表示“激动人心之处不仅在于[ABC]猜想有可能已被解决,而且在于他[望月新一]必须引入的技巧和洞见应该是解决未来数论问题的非常有力的工具”。戈德菲尔德也认为“望月新一的证明如果成立,将是21世纪数学最惊人的成就”。

在这种兴趣的驱动下,一些数学家已经开始对望月新一的证明展开检验与讨论,比如著名数学讨论网站Math Overflow就已出现了一些有金明迥、陶哲轩等一流数学家参与的认真讨论。不过,检验过程何时才能完成,目前还不得而知,检验的结果如何,更是无从预料。证明得到公认固然是很多人乐意见到的,但一个长达500多页的证明存在漏洞也是完全可能的,当年怀尔斯对费马猜想的“只有”100多页的证明,其早期版本就存在过漏洞,经过一年多的时间才得以弥补。不过,无论望月新一的证明是否成立,不少数学家对ABC猜想本身的成立倒是都抱有乐观态度,这一方面是因为能因这一猜想的成立而得到证明的很多数学命题(比如如今被称为费马大定理的费马猜想)已经通过其他途径得到了证明,从而表明ABC猜想的成立与数学的其他部分有很好的相容性(著名的黎曼猜想也有这样的特点)。另一方面,ABC猜想还得到了一些启发性观点的支持,比如陶哲轩就从所谓的“概率启发式理由”(probabilistic heuristic justification)出发,预期ABC猜想应该成立。

当然,信心和预期取代不了证明。望月新一证明的命运将会如何?ABC猜想究竟被证明了没有?都将有待时间来回答。2012年10月14日写于纽约2014年10月1日最新修订绘画:张京

谷歌背后的数学

一、引言

在如今这个互联网时代,有一家公司家喻户晓——它自1998年问世以来,在极短的时间内就声誉鹊起,不仅超越了所有竞争对手,而且彻底改观了整个互联网的生态。这家公司就是当今互联网上的第一搜索引擎:谷歌(Google)。

在这样一家显赫的公司背后,自然有许许多多商战故事,也有许许多多成功因素。但与普通商战故事不同的是,在谷歌的成功背后起着最关键作用的却是一个数学因素。

本文要谈的就是这个数学因素。

谷歌作为一个搜索引擎,它的核心功能顾名思义,就是网页搜索。说到搜索,我们都不陌生,因为那是凡地球人都会的技能。我们在字典里查个生字,在图书馆里找本图书,甚至在商店里寻一种商品,等等,都是搜索。只要稍稍推究一下,我们就会发现那些搜索之所以可能,并且人人都会,在很大程度上得益于以下三条:(1)搜索对象的数量较小——比如一本字典收录的字通常只有一两万个,一家图书馆收录的不重复图书通常不超过几十万种,一家商店的商品通常不超过几万种,等等。(2)搜索对象具有良好的分类或排序——比如字典里的字按拼音排序,图书馆里的图书按主题分类,商店里的商品按品种或用途分类,等等。(3)搜索结果的重复度较低——比如字典里的同音字通常不超过几十个,图书馆里的同名图书和商店里的同种商品通常也不超过几十种,等等。

但互联网的鲜明特点却是以上三条无一满足。事实上,即便在谷歌问世之前,互联网上的网页总数就已超过了诸如图书馆藏书数量之类传统搜索对象的数目。而且这还只是冰山一角,因为与搜索图书时单纯的书名搜索不同,互联网上的搜索往往是对网页内容的直接搜索,这相当于将图书里的每一个字都变成了搜索对象,由此导致的数量才是真正惊人的,它不仅直接破坏了上述第一条,而且连带破坏了二、三两条。在互联网发展的早期,像雅虎(Yahoo)那样的门户网站曾试图为网页建立分类系统,但随着网页数量的激增,这种做法很快就“挂一漏万”了。而搜索结果的重复度更是以快得不能再快的速度走向失控。这其实是可以预料的,因为几乎所有网页都离不开几千个常用词,因此除非搜索生僻词,否则出现几十万、几百万、甚至几千万条搜索结果都是不足为奇的。

互联网的这些“不良特点”给搜索引擎的设计带来了极大的挑战。而在这些挑战之中,相对来说,对一、二两条的破坏是比较容易解决的,因为那主要是对搜索引擎的存储空间和计算能力提出了较高要求,只要有足够多的钱来买“装备”,这些都还能算是容易解决的——套用电视连续剧《蜗居》中某贪官的台词来说,“能用钱解决的问题就不是大问题”。但对第三条的破坏却要了命了,因为无论搜索引擎的硬件如何强大,速度如何快捷,要是搜索结果有几百万条,那么任何用户想从其中“海选”出自己真正想要的东西都是几乎不可能的。这一点对早期搜索引擎来说可谓是致命伤,而且它不是用钱就能解决的问题。

这致命伤该如何治疗呢?药方其实很简单,那就是对搜索结果进行排序,把用户最有可能需要的网页排在最前面,以确保用户能很方便地找到它们。但问题是:网页的水平千差万别,用户的喜好更是万别千差,互联网上有一句流行语叫做:“在互联网上,没人知道你是一条狗(On the Internet,nobody knows you're a dog)。”连用户是人是狗都“没人知道”,搜索引擎又怎能知道哪些搜索结果是用户最有可能需要的,并对它们进行排序呢?

在谷歌主导互联网搜索之前,多数搜索引擎采用的排序方法,是以被搜索词语在网页中的出现次数来决定排序——出现次数越多的网页排在越前面。这个判据不能说毫无道理,因为用户搜索一个词语,通常表明对该词语感兴趣。既然如此,那该词语在网页中的出现次数越多,就越有可能表示该网页是用户所需要的。可惜的是,这个貌似合理的方法实际上却行不大通。因为按照这种方法,任何一个像祥林嫂一样翻来覆去倒腾某些关键词的网页,无论水平多烂,一旦被搜索到,都立刻会“金榜题名”,这简直就是广告及垃圾网页制造者的天堂。事实上,当时几乎没有一个搜索引擎不被“祥林嫂”们所困扰,其中最具讽刺意味的是:在谷歌诞生之前的1997年11月,堪称早期互联网巨子的当时四大搜索引擎在搜索自己公司的名字时,居然只有一个能使之出现在搜索结果的前十名内,其余全被“祥林嫂”们挤跑了。

二、基本思路

正是在这种情况下,1996年初,谷歌公司的创始人,当时还是美国斯坦福大学(Stanford University)研究生的佩奇(Larry Page)和布林(Sergey Brin)开始了对网页排序问题的研究。这两位小伙子之所以研究网页排序问题,一来是导师的建议(佩奇后来称该建议为“我有生以来得到过的最好建议”),二来则是因为他们对这一问题背后的数学产生了兴趣。

网页排序问题的背后有什么样的数学呢?这得从佩奇和布林看待这一问题的思路说起。

在佩奇和布林看来,网页的排序是不能靠每个网页自己来标榜的,无论把关键词重复多少次,垃圾网页依然是垃圾网页。那么,究竟什么才是网页排序的可靠依据呢?出身于书香门第的佩奇和布林(两人的父亲都是大学教授)想到了学术界评判学术论文重要性的通用方法,那就是看论文的引用次数。在互联网上,与论文的引用相类似的显然是网页的链接。因此,佩奇和布林萌生了一个网页排序的思路,那就是通过研究网页间的相互链接来确定排序。具体地说,一个网页被其他网页链接得越多,它的排序就应该越靠前。不仅如此,佩奇和布林还进一步提出,一个网页越是被排序靠前的网页所链接,它的排序就也应该越靠前。这一条的意义也是不言而喻的,就好比一篇论文被诺贝尔奖得主所引用,显然要比被普通研究者所引用更说明其价值。依照这个思路,网页排序问题就跟整个互联网的链接结构产生了关系,正是这一关系使它成为了一个不折不扣的数学问题。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载