证明达尔文:进化和生物创造性的一个数学理论(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-27 14:33:56

点击下载

作者:格雷戈里·蔡汀

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

证明达尔文:进化和生物创造性的一个数学理论

证明达尔文:进化和生物创造性的一个数学理论试读:

谨献

谨以本书献给约翰·冯·诺伊曼(1903—1957)一位出类拔萃的数学家

一则寓言

从前,拉比学校的一位年轻学生去听了一位知名拉比的三场讲座。事后他对朋友说:“第一场演讲非常棒,我听懂了每句话的意思。第二场更加精彩,深刻而玄妙。有很多地方我都不太明白,但拉比理解其中的一切。第三场演讲是迄今为止最好的,一次伟大而难忘的经历。我没听懂拉比讲的是什么,连拉比自己也都不明白。”——尼尔斯·玻尔,转引自亚伯拉罕·佩斯的《尼尔斯·玻尔的时代》

自相矛盾的引文?

高等生命形态按照这种方式[达尔文的进化论]出现的几率,堪比垃圾场的废物旧货在龙卷风的作用下自发组装出一架波音747飞机。——弗雷德·霍伊尔,《智能宇宙》,1983年

在我看来,如果达尔文理论如它的信奉者所相信的那样简单、本质和基础,那就应该存在一个同样基本的关于它的数学理论,通过它可以一般、精确且抽象地表达达尔文理论的思想,如同我们在纯数学中习以为常的那样。——格雷戈里·蔡汀,《关于生物学、信息与复杂性的思考》,《EATCS会刊》,2007年2月

数学能成功处理的只是一些最简单的情况,或者更确切地说,即便是一个复杂的情况,那也要是机缘巧合使得这个复杂的情况依赖于几个主导的简单因素。一旦偏离了自己轻车熟路的路径,数学就会在一片密布无名的特殊函数以及不可解的组合特殊性的丛林中迷失方向。因此,数学技巧只有在它是从触及某个问题的简单实质(如果这个问题有简单实质的话)的一点出发时才有效。那种与一根筋相对的智慧,那种同时把握多条线索的能力,以及那种利用多个不同来源进行论证的能力,对数学而言都是相当陌生的。——雅各布·T. 施瓦茨,《数学对科学的消极影响》(1960),转引自《离散的思考:论数学、科学和哲学》(马克·卡克、吉安-卡洛·罗塔、雅各布·T. 施瓦茨编),1992年

中文版序

达尔文及其著作《物种起源》对生物学和社会学等领域的影响是无与伦比的。在《新科学家》杂志2012年所做的一次读者投票中,《物种起源》位居最具影响的十大科普书首位。以自然选择为基础的进化理论是达尔文进化思想的精髓,这个理论主要包括进化、渐变、物种形成、共同祖先、自然选择,以及进化改变的非选择机制等六个方面。被誉为“达尔文猎犬”的道金斯在评论科因的新著《为什么要相信达尔文》时,曾说得很严厉:“我曾经说过,任何不相信进化论的人,一定是愚蠢、狂妄,或者无知,后面我又很小心地加上了‘无知不是罪过’。现在我需要更新我的言论,任何不相信进化论的人,他就是愚蠢和狂妄……”我们更熟悉的应该是杜布赞斯基的那句名言:“如果不从进化的观点理解,生物学的所有东西都说不通。”

一个生命现象有近因(proximate cause)和远因(ultimate cause)两个方面。我们所知晓的一些生物学科学问题的规律,多是一个模式(pattern),一个趋势,不是简单的、物理学中“是”或“不是”的问题。所以生物哲学有其特殊性。在我的浅显认识里,数学是有巨大威力的,可把复杂的现象和过程很漂亮地定量表达出来。在生物学领域,数学应该是一个强有力的工具,可定量描述复杂多样的生命现象和生命规律。但造物主把生命塑造得太复杂了,要精细定量描述生命世界的规律,似乎也是难以想象的事情。比如大自然中植物花的颜色和形状、叶的形态,以及动物的个体大小、形态特征、行为特征、生理特征,一直到分子特征等,它们如何在进化长河中保留和延续下来,如何产生新的性状,存在哪些精细的调控机制等,对此我不知道能否用数学精确描述出来。

生物学与数学的结合产生了理论生物学、理论生态学、数学生态学等学科领域。数理统计在生物学研究中的应用也日趋普遍和广泛。对于生态学中的一些复杂现象的数据分析,各种数理统计方法的使用无疑提供了强大的支持。

那么达尔文的进化理论是否可以用简明精确的数学语言来表达呢?本书作者进行了一次大胆尝试,试图用数学语言来阐释达尔文的进化理论。作者的中心论题是利用软件的思想解释计算机和生物圈的可塑性,根本思想是借助随机突变和自然选择来实现进化,从数学上证明达尔文的进化理论。这个思路可以表述为没有程序员的编程。

生命的出现是偶然的,是没有设计者的。本书提出了一个数学理论,“元生物学”(metabiology)。元生物学处理软件,也就是遗传信息和DNA。冯·诺伊曼在关于自我复制自动机的论文中,提出了“DNA=软件”的思想。生命作为不断进化的软件,这是很有启发性的。莫诺也说过:“大自然是一个勤杂工,是一个修补匠。你凑合着用旧的东西,你给它们打补丁,你修补它们使得它们可以再利用。”生命的起源可以理解为软件的起源,也就是DNA的起源。DNA是在每一个细胞中发现的通用编程语言,是一种强大的编程语言,几乎可以表达任何用于构造和运行一个有机体的可能算法和指令集。

生命是可塑且富有创造性的。生物创造性,包含生物的创新性、丰富性和多样性。我们如何能基于静态、永恒而完美的数学,构造出可塑且富有创造性的生命呢?作者给出的答案是:生命是富有创造性的、可塑的软件,而物理学是刚性的、机械的硬件。

生命起源、物种起源、进化过程,这些一直是生物学界的核心话题。随着新技术、新方法的产生和运用,尤其是进入组学时代,人们对生物本质的了解会越来越深入。用数学语言阐释达尔文的进化理论是一种有益的尝试,也许会为我们认识生物的本质打开一个新的窗口。

作者相信,“如果达尔文理论如它的信奉者所相信的那样简单、本质和基础,那就应该存在一个同样基本的关于它的数学理论,通过它可以一般、精确且抽象地表达达尔文理论的思想,如同我们在纯数学中习以为常的那样”。然而,作者也承认,“生物学实在是太复杂了,与数学已经相去甚远。虽然元生物学在数学上很有前景,但元生物学与真正的生物学的相关程度还有待观察”。这也是我们在阅读时需要留意的。王德华中国科学院动物研究所研究员

英文版代序:解题家与理论家*

* 节选自:Gian-Carlo Rota, Indiscrete Thoughts, Boston: Birkhäuser, 1997, pp. 45–46.

数学家可以分为两种类型:解题家与理论家。尽管很容易找到这两种类型的极端例子,但大多数数学家是两者的混合。

对于解题家而言,数学的最高成就是解决一个已被认为无望解决的问题。即使答案可能是笨拙的也无关紧要,紧要的是,它应该是第一个被证明为正确的答案。一旦解题家找到了答案,他将对此永远不再有兴趣。在听到新的、更简化的证明时,他会有些不屑一顾,也会觉得非常无聊。

解题家本质上是一个保守主义者。对他来说,数学是由一系列需要克服的挑战构成的,是一条充满问题险阻的道路。陈述数学问题所需的数学概念被默认为是永恒的、不可改变的。

在他看来,数学论述是次一等的活动。他对新的理论总是充满怀疑,因为擅入者必须通过解决挑战性的问题来证明自己的价值,才能够获得重视。解题家厌恶一般化,尤其是那些使他的答案变得无关紧要的一般化。

解题家是年轻数学家的榜样。当我们向公众描述数学的成就时,解题家是我们推崇的英雄。

对于理论家而言,数学的最高成就是一个能让我们对某些以前不可理解的现象突然有所理解的理论。数学的成功并不在于解决问题,而在于使它们变得无关紧要。荣耀的时刻是发现一个新的理论,它不解决任何老的问题,却使它们变得无关紧要。

理论家本质上是革命者。从过去沿袭下来的数学概念被认为只是那些尚有待发现的更一般的概念的不完美实例。数学论述则被认为是比数学研究更困难的活动。

在理论家看来,唯一会永存的数学是定义。伟大的定义是数学对世界的贡献。定理作为必要的恶而被容忍,因为它们在定义的理解中起到了辅助作用——或者理论家所不情愿承认的,起到了核心作用。

理论家经常会遇到不被数学界认同的问题。而他的慰藉是,他确信(哪怕历史可能会,也可能不会证实这一点),在当前的问题被遗忘很久以后,他的理论还存在。

如果我是一个太空工程师,正在寻找数学家帮我发射火箭,那我会选择一个解题家。但如果我寻找的是一个给我的孩子良好教育的数学家,那我会毫不犹豫地选择理论家。吉安-卡洛·罗塔

中文版前言

我很高兴应邀撰写《证明达尔文:进化和生物创造性的一个数学理论》的中文版前言。在我写的所有书中,这是第一本用中文出版的。

表面上看,这本书的理论色彩很浓,但它事实上与技术和制造有着很多关联。在一篇关于自我复制的自动机的论文(宣读于1949年,出版于1951年)中,约翰·冯·诺伊曼意识到,计算技术与生物学的核心数学思想都是相同的一个,即软件的思想——软件解释了计算机和生物圈的可塑性。这也正是本书的中心论题。

冯·诺伊曼还意识到,计算机可以制造出其他计算机和一般的实体物件。在半个世纪后,这个预见现在终于变成了一种新的制造技术:增材制造或3D打印。这种革命性的新技术(3D打印机有可能成为一种通用制造设备)正迅速在多个不同的应用领域得到发展。下面就是一个例子:《华尔街日报》最近报道了,一家中国企业利用3D打印技术在24小时内建造了10所房子(http://blogs.wsj.com/corporate-intelligence/2014/04/15/how-a-chinese-company-built-10-homes-in-24-hours/)。

所以一个根本思想最终会产生巨大的实际应用。

那么本书的根本思想又是什么?尽管他在书中没有这样子说,但达尔文的根本思想可以表述为,存在没有设计师的设计。所以本书的根本思想也不妨表述为,存在没有程序员的编程。通过数学证明借助随机突变和自然选择实现进化是可能的,我的书试图从数学上证明达尔文的进化论。

我还应该更新一下对于本书第七章提到的安德烈·罗西可能革命性的新能源技术(一种尤其有希望的利用氢和镍实现的低能量核反应)的质疑。就在几天前,我很高兴地读到一条新闻,获知这种能源技术将在天津华苑工业园新成立的镍氢电能研究中心专门展开研究。

3D打印、低能量核反应以及数字生物学,它们无疑将给我们带来一个真正令人惊叹的未来。格雷戈里·蔡汀2014年5月于里约热内卢

英文版前言

本书的目的是试图揭示生物学深层的数学结构,展现隐藏在生命中的数学内核。我将这个只有三岁的新兴领域命名为“元生物学”(metabiology)。仍有许多工作要做。这一理论工作与实际的生物学之间的关联程度还有待观察。不过,我觉得是时候将这种思考生物学的新方式公之于众了。

促使我创建元生物学的是一本由我的朋友戴维·贝尔林斯基(David Berlinski)撰写的著作,《恶魔的迷思》(The Devil's Delusion)。在这本引发争议的书中,他对达尔文主义提出了激烈的质疑,并将生物学视为与理论物理学截然相对的一种学说。这本书是我对戴维的回应,也是我试图寻找补救的一次尝试。

本书实际上是一门名为“元生物学:生命是不断进化的软件”的课程。该课程是我在2011年4月至6月间在里约热内卢联邦大学(UFRJ)讲授的,是我的朋友、诗人/数学家理查多·库布鲁斯理(Richardo Kubrusly)主持的“科学技术的认识论与历史”的系列课程之一。这不是一门数学课程,而更像是一门哲学和思想史课程,是关于如何以及为什么用数学去研究生物学的课程。

我希望你们喜欢阅读本书,就如同我很享受教授它一样。教授这门课程使我的想法在脑海里变得更清晰,一切终于井井有条了。

本研究得到了COPPE/UFRJ的院长,路易斯·平格利·罗萨(Luiz Pinguelli Rosa)教授,以及CAPES的外国访问教授项目提供的资金支持。

我要感谢布宜诺斯艾利斯大学以及瓦尔帕莱索复杂系统研究所,在我的多次访问期间,我在那里介绍了这些新想法,并受益良多。其他许多机构也邀请我去介绍元生物学:我要特别感谢伊利亚斯·考斯蒂瑞斯(Ilias Kotsireas)教授为我举办“蔡汀在安大略”的讲座系列,感谢海法大学的凯撒里亚·罗思柴尔德研究院、计算机科学系和数学系邀请我做知名学者讲座系列,感谢吉姆·克拉奇菲尔德(Jim Crutchfield)和乔恩·马克塔(Jon Machta)邀请我参加桑塔费研究所的一个会议,使元生物学得以在上面“正式亮相”。本书的第五章正是我在桑塔费所做的演讲。

我还要感谢安娜·巴赞(Ana Bazzan)和西尔维奥·达门(Silvio Dahmen)邀请我参观南里奥格兰德联邦大学。在那里,我一边撰写此书,一边做了三场元生物学的讲座,多有启发。

此外,如果没有我的妻子,弗吉尼亚·玛丽亚·丰特斯·贡萨尔维斯·蔡汀的支持,也就不会有元生物学[我将它定义为一门与生物学平行的领域,主要处理人工软件(计算机程序),而非自然软件(DNA)的随机演化]。这是我们共同努力的结果,就好似我们三岁的孩子。弗吉尼亚的研究领域是哲学。

然而,本书是献给约翰·冯·诺伊曼的,这大概有点出人意料。在撰写本书时,我越来越觉得自己是站在了他的肩膀之上。你会在书中看到这其中的原因。

冯·诺伊曼是匈牙利人,但有些人却认为他是一个伪装成人类的外星人。他非常聪明,并仔细研究过人类,所以能够很好地模仿人类!

本书每章开头的美丽插图都来自恩斯特·黑克尔(Ernst Haeckel)的《大自然的艺术形式》(Kunstformen der Natur)一书。它们展现了大自然无比旺盛的创造性,而本书正是试图为此提供一种解释。在其最深层次,从广义的视角看,这其实是库尔特·哥德尔著名的不完全性定理的一个推论,只不过它是这个极为消极的定理的一个积极方面。

生物创造性和数学创造性没有什么不同。阅读本书,你将找到答案!

格雷戈里·蔡汀

2011年4月29日,格雷戈里·蔡汀在南里奥格兰德联邦大学的讲座上(尼古拉·马亚尔拍摄)第一章引言:本书概述

像许多纯数学家一样,我喜欢“粉笔谈”:使用最少的技术辅助手段,借助黑板或白板展开即兴讲演。我会采用的另一种策略是在开始讲课之前,将所想讨论的主题先写在黑板上。这样当人们走进来的时候,他们一眼就能看到所有的关键想法。不过,在一个大礼堂里,是需要一台投影机的,否则任何人都将一无所见。

在对页,你可以看到我在巴西南部阿雷格里港的南里奥格兰德联邦大学大礼堂上所给出的本书概述。在第三页和第四页,我准备了四张幻灯片。它们把第二章至第四章的内容作了总结,概述了我使生物学数学化所用的策略。在读完这些章节之后,你应该重温一下这些幻灯片。这样,你将进一步理解它们所表达的含义。

你可能已经听过有人把DNA比做计算机程序?的确,我的核心思想可以归结为一句话:把这个比喻变成一个进化的数学理论。其实事实上,早在20世纪70年代,这样的数学工具就已经出现。更确切地说,我们把进化看做软件空间中的随机漫步。随机漫步是一个数学家很熟悉的思想,尽管我们漫步的空间比一般的空间要大得多。

我把这个新领域称做“元生物学”,因为它是实际生物学的一个高度简化的版本——不然我将无法证明任何定理。这些定理出现在第五章,那是本书的高潮部分,也是我在桑塔费研究所讲座的内容。第六章至第八章讨论元生物学中更宽泛的意涵,包括神学、政治学和认识论上的。本书最后还有两个附录。

在附录一中,你可以阅读约翰·冯·诺伊曼关于自我复制自动机的关键章节。在这篇论文中,冯·诺伊曼卓有远见地提出了“DNA=软件”的观点,这影响了西德尼·布伦纳(Sydney Brenner),他反过来又影响了弗朗西斯·克里克。这是我在撰写本书时,发现的一个了不起的事实。附录二则提供了数学专家可能会感兴趣的一些额外数学细节。

最后,如果你想进一步了解元生物学,我列出了一个简短的书单,可供进一步阅读。有些书和文献在帮助我提出使生物学数学化的策略时助益良多,还有一些则只是由于内容有趣而被我放了进去。它们都值得好好阅读!生命作为不断进化的软件人工数字软件计算机编程语言,具有五六十年的历史自然数字软件DNA,具有三四十亿年的历史DNA=通用编程语言生命=不断进化的软件生物学=软件考古学(进化发育生物学!)生命的起源=软件的起源生物创造性=数学创造性哥德尔不完全性→无止境的进化软件的人类发现史分子生物学的历史薛定谔,《生命是什么?》软件的发现:图灵/冯·诺伊曼,1936/1951阿兰·图灵→冯·诺伊曼→西德尼·布伦纳→弗朗西斯·克里克元生物学的历史把生命定义为某种不断进化的东西(约翰·梅纳德·史密斯,1986)给出了存在某种东西满足该定义的数学证明(2010)使用后现代(后哥德尔)数学算法信息论,可计算理论复杂性理论,计算机科学元生物学的数学(第一部分)我们关于进化的玩具模型一个不断突变的软件有机体计算出一个整数,然后停机有机体的适应度=它计算出的整数NNN…需要创造性:N→N+N→N×N→N→N进化=软件空间中随机漫步的爬山算法(增加适应度)-K尝试K比特的算法突变M(其概率为2),使有机体 A 变为A'=M(A)仅当A'=M(A)比初始有机体 A 的适应度更好时,突变 M 有效需要oracle来消除那些不能产生 A' 或者产生的 A' 不能停机的突变2A 与 B 之间的突变距离=-log(从 A 到 B 的单步突变的概率)=满足B=M(A)的最短程序 M 的比特长度元生物学的数学(第二部分)为度量生物创造性的速度/速率,我们使用BB(N )=N 的忙海狸函数=任意长度不超过 N 比特的程序的最大适应度计算BB(N )需要 N 比特的灵感BB(N )比任意可计算函数增长得都快不同的进化方式N穷举搜索:在2 时间内达到BB(N )的适应度智能设计:在 N 时间内达到BB(N )的适应度23随机进化:在N到N之间的时间达到BB(N )的适应度请注意如果有机体是在机械地、以算法形式地改进,比如序列A, A′, A″, …是可计算的,那么其适应度只能按可计算函数那样增长第二章生命作为不断进化的软件:不断突变的软件的进化恩斯特·黑克尔的《大自然的艺术形式》

夏日的一天,你抬头往窗外看,看到了什么?灌木,树木,花,鸟,虫,鱼……一个充满生物多样性的世界。大自然的多样性和丰富性是如此令人震撼……达尔文的进化论真能解释这一切旺盛的创造性吗?生物学家相信就是如此。然而,如果你对比生物学理论与物理学理论,如果你从一个数学家的角度看生物学,事情就并不那么令人信服了。存在许多经验证据支撑达尔文理论,但却没有数学证明。

记得有一件轶事,在普林斯顿高等研究院的一次晚餐上,一位年轻的天体物理学家自豪地向哥德尔描述自己的最新发现,结果只得到了哥德尔这样的回应:“我不相信经验科学,我只相信先验真理!”的确,哥德尔确实有此观点。如果达尔文的理论如同生物学家认为的那样根本,那么就应该存在一个一般性的、抽象的进化数学理论,它能从数学上把握达尔文理论的本质,并对此加以发展。

而这正是我们在此所要做的事情。还记得开普勒的《世界的和谐》、牛顿的《自然哲学的数学原理》以及拉普拉斯的《宇宙系统论》吗?是它们首先揭示了支撑物理世界的数学结构(我有幸拥有一本两百年历史的拉普拉斯著作的原版)。但考虑到生物学与物理学如此不同,我们该如何构建一个支撑生物学的数学结构?

显然,不是使用理论物理学的微分方程!要想发展生物学的“理论物理学”,一个生物学的基本数学理论,我们必须使用一种不同类型的数学。微分方程在这里没有用,一点用都没有。

生物学的本质究竟为何?的确,它的本质就是信息。即便是理论物理学,甚至量子力学,现在也都开始研究信息:量子比特。但生物学是另一种类型的信息:算法信息。当人们说DNA像一个计算机程序,当进化发育生物学(evo-devo)把胚胎发育描述为DNA程序,那指的就是算法信息。我们这种能应用到生物系统和生命的新型“理论物理学”,要处理的正是这类信息。

甚至在开普勒、牛顿和拉普拉斯之后,还有人认为生物学是不同的,每个生命都内含一个神圣的火花。不过,根据达尔文的理论,我们并没有神圣的火花。实际上,整个世界是神圣的、创造性的。生命的出现是偶然的,而非设计的。这里,我们为此提出了一个数学理论,称为“元生物学”。

元生物学是一种新型的“理论物理学”。相较于使用微分方程的理论物理学与实际物理世界之间的差异,元生物学与实际生物世界的差异更大,其原因在于,发现生物学的数学结构要更难。从表面上看,在生物学中,由于生物过于复杂,有太多的例外,似乎不可能得到一个类似理论物理学那样数学化的理论生物学(在理论物理学中,可以说,实际物理世界是可以借助数学直接构建出来的)。

元生物学处理软件,也就是遗传信息和DNA。不妨看看尼尔·舒宾关于进化发育生物学的著作《我们的身体里有一条鱼》。我们的身体充满软件,且都是非常古老的软件。我们有来自海绵的子程序,来自两栖类的子程序,来自鱼的子程序。在人类妊娠期的某个阶段,人的胚胎还出现了鳃!每个细胞含有DNA软件的完整副本,相当于包含整个生物历史,因为进化只做微小变化,它做可能的最小变化,就像我们在大型软件项目中所做的那样。你不能从头开始,你必须物尽其用。正如雅克·莫诺(Jacques Monod)所说的,大自然是一个勤杂工,是一个修补匠。你凑合着用旧的东西,你给它们打补丁,你修补它们使得它们可以再利用。

事实上,它类似考古学——生物学实际上是一门软件考古学!所以说,存在人工软件,计算机程序,也存在自然软件,DNA。大自然在我们之前很早就发明了软件。生命的起源其实是软件的起源,也就是DNA的起源。DNA是在每一个细胞中发现的通用编程语言,是一种强大的编程语言,几乎可以表达任何用于构造和运行一个有机体的可能算法和指令集。这是我们正在开始了解的一种编程语言,一种非常复杂的编程语言,一种历经数十亿年逐步积累而成的编程语言,如同印度教石刻寺庙的浮雕,神灵之上有神灵,层层堆叠……又如同使用多年而未刮除熔蜡的烛台……

我们的人工软件,我们的编程语言,与DNA相比要简单得多,而且我们知道它们的工作机理。它们是我们设计的,并且只有半世纪的历史,而非数十亿年之久。因此,我们并不去研究随机进化的自然软件(DNA),相反,我们打算发展一个与之平行的理论,一个关于随机进化的人工软件(计算机程序)的理论。这正是元生物学的研究内容。这比实际进化要简单,希望简单到足以让我们在其中进行定理证明,简单到足以让我们精确理解其机制和工作原理。

实际上,世界是由数学构成的这一概念并不始于开普勒、牛顿和拉普拉斯,它来源于毕达哥拉斯。元生物学是一种毕达哥拉斯主义的生物学。古希腊人起初用神话来描述世界,在其中一切都是有生命的:反复无常的神,太阳,风,河流,树木……后来,古希腊人转向了逻各斯,相信宇宙是由定律统治的。

对于毕达哥拉斯来说,不仅自然定律是数学化的,而且在本体论意义上,世界就是数学的,世界是由数学构成的。现代理论物理学遵循了毕达哥拉斯的思想。而对于柏拉图而言,(数学)思想的世界比现实世界更真实。思想的世界是静态、永恒而完美的,而现实世界,也就是表象的世界,是短暂的。然而,生命是可塑且富有创造性的!我们如何能基于静态、永恒而完美的数学构造出可塑且富有创造性的生命?

同样的张力在法国大革命之前的启蒙运动中再次出现。启蒙运动不仅反对君主专制,也反对宗教。拉·梅特里在他那本著名的小册子《人是机器》(1748)中,否认生命包含一个神圣的火花。拉·梅特里是一名医生,他通过解剖人体以了解人体的运作机理。他的结论是,人体是一部非常复杂的机器,但终究只是一部机器。

我们已经比拉·梅特里更进了一步。现在,我们知道关于计算机的一切,也了解硬件与软件之间的区别。的确,人是机器,但如果你想了解进化,那你必须聚焦到软件上,因为是软件在进化并促使硬件发生改变。软件比硬件更重要。因此可以说,本书讨论的是:人是软件,而非人是机器。

在马塞尔·帕尼奥尔(Marcel Pagnol)于20世纪30年代执导的法国电影中,乡村牧师和教师是最好的朋友,尽管其中一人是信徒,而另一人是无神论者。他们总是用这一点相互取笑对方。同样的张力在今天的美国,在神创论与更传统的生物学家之间的政治斗争中依然可见。

即便时至今日,传统的生物学家仍对如下事实感到惊讶:无细胞核的单细胞生命在地球形成两亿年后就出现了,而有细胞核的细胞用了二十亿年时间才得以出现。他们也怀疑这地球上的生命种子要么是偶然播种的,即所谓的“胚种论”,要么是故意种植的,即所谓的“定向胚种论”。你可以在弗朗西斯·克里克的《生命》、弗雷德·霍伊尔的《智能宇宙》(The Intelligent Universe)以及马丁·诺瓦克的《超级合作者》中发现这样的观点,所以它绝对不是极少数人的观点。在霍伊尔那本颇具先见之明的书中,他甚至把生物学比做一个乱糟糟的计算机程序,后者的进化像白矮星那样通过吸积演变为超新星——这恰是元生物学的核心主题,也是舒宾的《我们的身体里有一条鱼》一书所阐述的进化发育生物学的核心主题。

重复一遍问题:生命是可塑且富有创造性的!我们如何能基于静态、永恒而完美的数学构造出可塑且富有创造性的生命?为此,我们将使用后现代数学,即1931年哥德尔和1936年图灵之后的数学,这是一种开放的而非封闭的数学,是一种关于创造性的数学。

我们需要的是一个开放的、非还原论的数学,因为生物圈的创造性是我们要讨论的关键议题。生物创造性(生物创新性、丰富性和多样性)长久以来一直不见于进化论的标准表述。不过,在恩斯特·黑克尔那里,情况却有所不同。黑克尔被认为是德语世界的达尔文。他向德语世界介绍了自己版本的达尔文理论,并因此发了财。他的书成了当时的畅销书,而他的豪宅现在成了一个生物博物馆。黑克尔给出的进化的一个证据是他那个著名的(或臭名昭著的)学说:个体发育(ontogeny)重演系统发生(phylogeny),也就是说,胚胎发育过程或多或少重演了有机体的进化历史——这个主题后来得到了进化发育生物学的扩展和修正。系统发生学博物馆

上图是我的妻子弗吉尼亚在耶拿拍摄的黑克尔故居的照片,现在它已经是一个博物馆。注意在房子墙上的生命树以及树上的ontogenie和phylogenie字样!

如果你对生物创造性感兴趣,你应该阅读黑克尔的两本书:《海洋的艺术形式》(Art Forms from the Ocean)和《大自然的艺术形式》,其中包含了许多奇妙而惊人的展示生命形态多样性的插图。它们分别于2009年和2010年由普雷斯特尔出版社重印,并增补了一些历史注释。

也可以看看斯蒂芬·古尔德的《奇妙的生命》。这本书主要介绍了寒武纪生命大爆发,介绍了由大自然所尝试的大量令人惊讶的身体形态规划,这是一种探索所有简单可能性和简单程序的组合式爆炸。事实上,这也正是斯蒂芬·沃尔弗拉姆(Stephen Wolfram)所说的“挖掘计算的宇宙”(mining the computational universe),即尝试所有可能的简单程序。这是他常讨论的一种设计策略,具体可参照他的《新科学》(A New Kind of Science)一书。

所以大自然是极富创造性和创新性的。在此不妨让我们看一下一个流行的用数学讨论生物学的方法,种群遗传学。它由罗纳德·费希尔、休厄尔·赖特、J. B. S. 霍尔丹、威廉·汉密尔顿、约翰·梅纳德·史密斯、理查德·道金斯以及马丁·诺瓦克等人提出,可以说是一个优美的领域。但不幸的是,种群遗传学将进化定义为因竞争或因环境选择压力所致的、种群中的基因频率变化。有限的基因库是固定的,因此根本没有创造性可言。与之相反,元生物学面对的是一个极其广阔的可能性空间,一个软件空间,从而让我们有可能讨论新基因从何而来。事实上,这正是元生物学的核心要义所在。不过,元生物学并没有太多关注种群、竞争或者环境。因此,种群遗传学和元生物学是互补的,它们处理不同的问题。

再次重复一遍问题:生命是可塑且富有创造性的!我们如何能基于静态、永恒而完美的数学构造出可塑且富有创造性的生命?答案就是:生命是富有创造性的、可塑的软件,而物理学是刚性的、机械的硬件!

生物圈充满软件,每一个细胞是由具有三四十亿年历史的软件所控制的。我们的人工软件仅仅只有五六十年的历史。但直到我们发明人类计算机编程语言,我们才有可能意识到,自然界充满软件。这个世界充满软件,即使在我们知道那是软件之前!软件是生物圈可塑性的原因——通常的机器是刚性的、机械的和死的,而软件是活的!

此外,生命的起源其实就是软件的起源,是在软件控制下的实体(细胞)的自发涌现,以及这个软件的DNA语言的自发涌现。我们身体的每个细胞都含有整个人完整的DNA,尽管根据器官的不同,它只使用这个软件的一部分。地球上的每一个有机体在本质上都采用了一套相同的DNA语言——到目前为止,还没有证据表明存在其他独立的生命创造和生命起源。

诺贝尔奖得主西德尼·布伦纳曾与弗朗西斯·克里克(沃森与克里克中的克里克)共用一间办公室。他那一代的分子生物学家大都声称曾受薛定谔的《生命是什么?》(1944)一书的启发。但在自传《我的科学生活》(My Life in Science)中,布伦纳把这个荣誉归给了冯·诺伊曼的自我复制自动机理论。冯·诺伊曼在希克森研讨会上的论文《自动机的一般逻辑理论》包含了许多生物学的核心思想,它们的提出甚至早于沃森和克里克发现DNA。在布伦纳看来,它们是真正了不起的数学预言。

多年前,我有幸在麻省理工学院,在一场由罗尔夫·兰道尔(Rolf Landauer)和爱德华·弗雷德金(Edward Fredkin)组织的讨论计算的物理学的会议上遇见布伦纳。布伦纳做了一个关于分子生物学的精彩讲座,并对自动机理论在冯·诺伊曼之后的发展表示了兴趣。

还是在我学生时代,通过阅读冯·诺伊曼的《自动机的一般逻辑理论》,我了解到,是图灵在1936年的《论可计算数及其在判定性问题上的应用》论文首先提出了灵活机器、通用机、通用计算机,以及区分软件和硬件的思想。DNA被认为是一种通用编程语言,强大到足以表达任何算法。布伦纳把DNA包含构建(和运行)有机体的软件的思想归功于冯·诺伊曼。这个思想现在由于进化发育生物学(研究胚胎的形成过程是如何进化的)而广为人知。

正如我之前所说的,这些思想在舒宾的书中清晰可见,该书解释了我们是如何具有海绵、鱼类和两栖类的子程序的。要想理解人体内一些奇怪的事情以及人体设计中一些奇怪的特性,你必须将人与鱼的构造相对比。只需做微小变化就能将鱼转换为哺乳动物!

现在,让我们回到薛定谔在1944年提出的问题:“生命是什么?”在1986年由牛津大学出版社出版的《生物学诸问题》(The Problems of Biology)一书中,约翰·梅纳德·史密斯(我曾在北极圈以北的瑞典阿比斯库召开的一次会议上遇见过他)专门有一章对此进行讨论。火焰有代谢——为了保持形态,它们摄取物质,并释放物质。此外,它们能自我复制。然而,它们没有遗传以及变异或进化。而根据梅纳德·史密斯的观点,生命在于进化,在于可塑性和创造性。

我的毕达哥拉斯主义生物学就是对于生命存在的一个数学证明。也就是说,我构造了人工的数学生命形态,并为此建立了一个极简的生物学模型,一个玩具模型,但包含所有核心的概念和特征,这样我可以证明它按照达尔文的进化论方式进化。这样,我在纯数学的毕达哥拉斯世界中发现了一个不断进化的生命形态。

我的有机体没有新陈代谢,没有形体,只有DNA;也就是说,没有硬件,只有软件。我研究不断突变的软件(实际上是一个不断突变的有机体)的进化,它在软件空间中随机漫步。而包含所有可能计算机程序的软件空间,则为这个有机体的所有可能设计提供了足够空间。

这是不是太简单了?如果我能使生命进化,那这就绝不简单!物理学家都已经非常习惯于他们所谓的“玩具模型”。毕加索说过:“艺术是一种帮助我们看清真相的谎言。”同样地,理论也是一种帮助我们看清真相的谎言。生物学家认为每一个细节都很重要,他们并不区分什么是首要的,什么是次要的,毕竟他们努力发现所有的东西。然而,正如布伦纳在他的自传中所强调的(詹姆斯·格雷克在他的《信息简史》一书中引用过),生物的能量和新陈代谢都不重要,重要的是信息,重要的是你从何处获得怎么做某事的指令。之后,就无需为能量的事情操心了!

所以我们的DNA是一个非常非常古老的软件,反复修补,绝不是干净、优雅和精心设计的。如果我们能重新开始,直接设计哺乳动物,我们自然能够做得更好。然而,我们不能重新开始,即使是对只有半个多世纪历史的软件技术和人工软件领域,我们都不能推倒重来,更不用说对有数十亿年历史的DNA了。

我们和黑猩猩具有几乎相同的编码蛋白质的基因,但用来控制哪些基因表达、哪些基因静默的许多DNA是不同的。换言之,低层的子程序不会发生大的变化,因为很多有机体依靠它们,它们有着广泛应用。但高层和更新的软件可以更容易地发生变化。

在短短的五十多年里,人类的编程环境已经变得非常高级:图形界面,以各种方式从因特网获取素材,等等。今天没有人会想从头开始,使用汇编语言对裸机编程,就像我以前为了谋生曾做过的那样。我们把高级编程语言和编程环境认为是理所当然的。我们不能重新开始。所有的决策都是基于当时已有的技术,比如低效率的“qwerty”打字机键盘,当初这样设计是为了避免早期的打字员因打字过快而卡住打字机,而这样的问题是现代键盘所没有的。

一如冯·诺伊曼的数学预见生物学后来的发现的方式,我的工作(元生物学),为了保持数学的优美,要求是算法突变而不是点突变,是高层突变而不是低层突变。目前尚不清楚发生在生物学上的是何种程度的算法突变。因此,正如我的妻子弗吉尼亚向我指出的:元生物学提出了这样一个问题,即实际有机体中的突变机制究竟属于多高层级?

这一章到此为止。现在,你应该对生命作为不断进化的软件的思想有了相当的概念。我们已经看到,大自然在很久以前就发现了软件。在下一章中,我们将详细研究人类在晚近发现软件的充满惊奇的历史。而在之后的章节,我将解释如何将生命作为不断进化的软件的思想变成一个可以拿来证明东西的数学理论。然后,我们将进入第五章,我在桑塔费研究所的演讲,这也是本书的高潮部分。

一点提示:现有程度的元生物学还无法解决思维和意识的问题,虽然这些问题相当吸引人。第三章人类发现软件:作为生物学家的图灵与冯·诺伊曼有孔虫

在本章中,我们将从元生物学的视角,重写分子生物学的早期历史以及软件的发现史,毕竟现在总是在重写过去以便证明自己的合理性。正如豪尔赫·路易斯·博尔赫斯指出的,我们创造了自己的祖先!

作为这种历史重写的一个例子,我们现在熟悉的是,伏尔泰把牛顿塑造成了一位具有机械世界观的无神论现代科学家的形象。但在《牛顿其人》(“Newton, the Man”)一文中,约翰·梅纳德·凯恩斯把牛顿描述为“最后的魔术师,最后的巴比伦人和苏美尔人”,而绝非第一个现代科学家,他更接近于浮士德而非哥白尼。牛顿花在炼金术和神学上的时间要比在数学和物理上的多,他还收集了大量中世纪炼金术的图书。我的朋友斯蒂芬·沃尔弗拉姆在他的书架上并排摆放着具有三百年历史的牛顿和莱布尼茨的神学著作(都是原版书,而非复印本)。牛顿的《数学原理》已经买不起了,但并没有很多人对他的神学著作感兴趣。

事实上,过去并不是偶然被重写,而是必然会被重写以便可以为现在所理解。关于该如何撰写科学史,可以参看黑尔格·克拉格(Helge Kragh)那本精彩的《科学编史学导论》(An Introduction to the Historiography of Science)。

现在,就让我们从元生物学的视角重新审视计算理论和分子生物学的早期历史,找出那些指向元生物学的线索。

我们的故事充满惊奇,它要从哲学和数学的基础的问题说起,其中还涉及一个价值超过一万亿美元的技术的创立(这已经发生了),以及可能随后出现的第二个这样的变革性技术。这个故事甚至还与中世纪的魔法有关。

你想知道更多内容吗?那请继续往下阅读!

很少有人记得图灵在生物学的形态发生(morphogenesis)方面所做的工作,但图灵著名的1936年论文《论可计算数》对分子生物学的诞生间接地产生了巨大影响——它影响了冯·诺伊曼的自我复制自动机理论,后者影响了西德尼·布伦纳,他反过来又影响了弗朗西斯·克里克,发现DNA分子结构的沃森和克里克中的克里克。此外,冯·诺伊曼将图灵的思想应用到了生物学,这得到了近期的进化发育生物学漂亮的支持。其核心思想是:DNA是具有数十亿年历史的软件。这一点在图灵1936年的论文之前并没有人认识到,而按照冯·诺伊曼的观点,这进而引发了计算机硬件和软件的思想。

我们在前面的章节已经讨论过这一核心思想。不过或许在继续之前,我们应该总结一下已经讨论过的内容:硬件物理学死的刚性的封闭的机械的软件生物学活的可塑的开放的创造性的自然软件DNA三四十亿年的历史人工软件计算机程序五六十年的历史牛顿式数学连续数学、微分方程用于物理学后现代数学离散数学、组合数学、算法用于生物学生命的定义(约翰·梅纳德·史密斯,《生物学诸问题》,1986)某种符合该定义的东西存在的数学证明(2010)

还记得在莫里哀的戏剧《贵人迷》中那个惊讶地发现自己的一生原来一直都在说散文的绅士吗?我们就是那个绅士。我们的身体充满软件,它们一直都那里,但只有在发明了人工软件和人类的计算机编程语言之后,我们才恍然大悟,认出大自然的DNA软件。

软件一直都在我们身边,在每一个细胞中。那是古老的软件,但我们无法明白,直到我们自己发明了软件!此外,正如进化发育生物学所表明的,生物包含自身的历史,正如舒宾所说的你体内的鱼、你体内的海绵、你体内的两栖动物……生物学只不过是一类奇特的考古学,软件考古学。

人类做爱的目的是整合男性的软件(在精子中)和女性的软件(在卵子中)。这就是人们相爱的原因,因为他们想结合他们的子程序。所以在某种意义上,冯·诺伊曼发现了人类为什么会坠入爱河的原因。

此外,生命的起源(它现在依然神秘不可解)其实就是软件的起源——当然,这里的软件是指自然软件,而非人工软件。但我们似乎看到了解决问题的希望。斯蒂芬·沃尔弗拉姆的《新科学》可以被重新解释为一本关于生命起源的书。斯蒂芬的一个主要观点是,很容易得到一个组合的符号系统,使之成为一个通用图灵机或通用计算机。也就是说,很容易用几乎任何离散数学部件构建出一台计算机。他将这称为“通用的普适性”(the ubiquity of universality)。在哲学层面,这意味着一般意义上的生命的起源并不是那么令人吃惊。当然,它在地球上的特定实现则是另一回事。但不管怎样,谢谢你,斯蒂芬!

泛泛而谈就说到这吧!现在让我具体回顾一下阿兰·图灵(以及同时代的埃米尔·波斯特)是如何通过发明计算机来帮助澄清一个关于数学的基础的问题——显然,是大自然率先发明了计算机和硬件/软件,不过它并不关心像数学的基础这样的问题,可塑性倒是它关心的。

首先,让我们来谈谈一个古老的梦想,确定性知识,或者按博学的莱布尼茨的说法,机械性知识。对它的推理应该像算术那样确定,其真值应该像2+2=4那样显而易见。这样便不再有争论,莱布尼茨会说:先生们,让我们通过计算来确定谁是正确的!这是个多么美好的梦想!

莱布尼茨并没有在今天所谓的符号逻辑或数理逻辑方面做太多工作,但他极其清晰而有力地阐述了目标。因此,他被认为是现代逻辑之父或者之祖。莱布尼茨对于任何主题都没有投入太多时间,他是杂食性的,兴趣广泛。例如,他还发明了二进制算术,以及能够做乘法运算的计算机器——帕斯卡最初发明的计算机器只能做加减运算。

之后的许多年,许多逻辑学家致力于莱布尼茨的确定性知识或者机械推理的梦想:德摩根、布尔、皮亚诺、弗雷格、罗素、希尔伯特、哥德尔、图灵、波斯特,等等。但该梦想并没有实现,事实证明它不可能实现。与确定性和机械性知识相反,哥德尔发现了不完全性,图灵发现了不可计算性。但在此过程中,图灵还发现了完全的/通用的编程语言、硬件、软件以及通用机。

这个梦想的一个里程碑是德国数学家希尔伯特提出的莱布尼茨梦想的改进版。希尔伯特想要为所有的数学提供一个形式化公理理论,欧几里得的《几何原本》的机械化版本,它将涵盖所有的数学,而不仅仅是几何。这其中的关键是,它应该能够机械地检查证明是否正确,推理是否遵循所有的规则。要做到这一点,我们需要发明一个细致的人工语言,强大到足以表达所有可能的数学推理、所有可能的数学证明。

但在1931年,哥德尔证明了这是不可能的:永远不可能发现这样的机械通用语言,通过它,我们能够证明所有的数学真理。这被称做不完全性。随后在1936年,图灵发现了实际上存在完全的或通用的机械语言,只不过不是表达数学证明,而是进行数学计算。接下来的历史就是:现代计算机诞生了!

哥德尔是如何摧毁希尔伯特和莱布尼茨的梦想呢?通过构造一个断言它自己不可证的算术断言:“我是不可证的”——它是可证的,当且仅当它为假时。

图灵所用的方法则有所不同,没有那么巧妙,但更深刻。他研究什么机器能够计算,并注意到大多数实数是不可计算的,因此存在形式证明所不能确定的数值,否则人们就可以机械地遍历所有可能的证明,从而系统地计算这些不可计算实数的值。

实际上,这才是我更为欣赏的表述图灵基本结论的方式。通常的解释方法是使用著名的停机问题。图灵表明,不存在系统的方式,不存在机械过程,也没有形式化公理理论,可以用来判定一个自包含的计算机程序是否最终会停机。你可以开始运行它,并一步步地计算,但要判定它是否会一直运行下去,一般来说是不可能的。

这样,我们有了计算机编程语言,通用且强大到足以编写任何算法。但同时我们丧失了确定性,丧失了机械推理。这个梦想已经彻底破灭。

不过,这不值得担心!根据埃米尔·波斯特(他虽然不及哥德尔和图灵那么有名气,但他们其实是处于同一个层级的;他也提出过图灵机和不完全性定理,但在数年内都未发表),公理化方法,尤其是希尔伯特的形式化公理,只不过是一个可怕的错误,一个混乱的误解。

在波斯特看来,数学不能提供确定性,因为它不是封闭的、机械的,它是创造性的、可塑的、开放的!听起来很熟悉?的确,我们在前面的章节中一直在谈论生物的创造性,现在我们发现在纯数学中也有类似的东西!所以数学是创造性的,不是机械的;数学是生物,不是机器!我刚才说,数学和生物学的创造性并没有多大的不同——我们将在下一章看到更多的细节。

这一点在哲学家保罗·费耶阿本德的两本书书名中得到了很好体现:《反对方法》和《告别理性》。费耶阿本德基于他对科学史的阅读(不过,他并未提及哥德尔和图灵),强调科学的创造性和想象力(一句话,无政府状态)。但在我看来,“反对方法”可以成为关于图灵停机问题的不可判定性的图书的最好书名,而“告别理性”则可以成为关于哥德尔的不完全性定理的图书的最佳书名。费耶阿本德出于哲学原因在科学世界中所反对的,在数学世界中相应的就是数学定理——因此,可以证明不存在解决所有数学问题的通用方法。

然而,正如数学家吉安-卡洛·罗塔在《数学对哲学的消极影响》(“The Pernicious Influence of Mathematics upon Philosophy”)一文中所指出的,哲学实际上是一门为自己那些从骨子里本能相信的东西寻找坏理由的艺术。事实上,潜意识中的种种情绪渴求促使我们得出结论,而这时理性不过只是配角。这样的睿智言论让罗塔在哲学圈中并不受欢迎,但我喜欢哲学,我也认为罗塔的言论有些道理:哲学不应该试图去过多地模仿数学,尤其是希尔伯特倡导的形式化公理方法。因此,正如罗塔所指出的,如果我们能精确地定义我们的术语,那就意味着哲学的终结。形式化公理体系不是创造性的……

实际上,存在多种不同类型的数学创造性。有些人,或者说大多数人,感兴趣的是,形式化公理理论中的创造性=在当前的范式下,找到一个证明=常规科学(库恩)。而我本人更感兴趣的则是,“野蛮的创造性”(德勒兹)=改变形式化理论=新公理、新概念=范式转变(库恩)=反对方法(费耶阿本德)!

现在轮到冯·诺伊曼的自我复制自动机了。冯·诺伊曼于1951年从哥德尔那里获得了这样的想法,有机体内存在对该有机体的描述=构造有机体的指令=遗传信息=数字软件=DNA。首先,你遵照DNA中的指令构造该有机体的一个副本,然后你复制DNA,并将其插入新的有机体,接着你让新的有机体开始运行。在精子中没有无穷倒退,也没有所谓的“小人”!

相关详情,请参见附录一冯·诺伊曼关于自我复制自动机论文的核心部分。正是该论文启发了西德尼·布伦纳去剑桥与弗朗西斯·克里克合作。而克里克也需要找人合作,因为沃森发表完《自然》杂志上那篇著名论文后,已返回了美国。

所以克里克首先与沃森共用一间办公室,然后是与布伦纳。他不能单独工作,他需要来自身边的灵感,他需要有个人整天陪他说话。弗朗西斯·克里克是顶尖的理论家,是战略家,是分子生物学建立过程背后的操盘手。而克里克的功劳里也有布伦纳的一半。你看,在沃森和克里克发现DNA的分子结构、四碱基的字母表(A、C、G、T)之后,我们仍然不清楚用这个包含四个符号的字母表写就的是什么,也不明确DNA是如何工作的。但克里克,在冯·诺伊曼和布伦纳的启发下,在内心某处萌发了一个想法:DNA是指令,DNA是软件。并且他意识到,重要的是这些信息如何在细胞中流动,以及信息如何转变成为蛋白质……

那么布伦纳当初是如何得知冯·诺伊曼在希克森研讨会上的论文?布伦纳还在南非时,在去牛津和剑桥之前,他曾有一位计算机科学家的同学,名字叫西摩·佩珀特(Seymour Papert),这个人后来到了麻省理工学院,与马文·明斯基(Marvin Minsky)合作。正是佩珀特,提醒布伦纳关注冯·诺伊曼的论文。(我从未见过佩珀特,但我认识马文。)

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载