毕昇再现:汉字印刷革命与“北大方正”(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-05 20:40:24

点击下载

作者:王治国

出版社:吉林出版集团有限责任公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

毕昇再现:汉字印刷革命与“北大方正”

毕昇再现:汉字印刷革命与“北大方正”试读:

前言

自1949年10月1日中华人民共和国成立至今,新中同已走过了60年的风雨历程。历史是一面镜子,我们可以从多视角、多侧面对其进行解读。然而有一点是可以肯定的,那就是,半个多世纪以来,在中国共产党的领导下,中国的政治、经济、军事、外交、文化、教育、科技、社会、民生等领域,都发生了深刻的变化,中国人民站起来了,中华民族已屹立于世界民族之林。

60年是短暂的,但这60年带给中国的却是极不平凡的。60年的神州大地经历了沧桑巨变。从开国大典到60年同庆盛典,从经济战线上的三大战役到经济总量居世界第三位,从对农业、手工业、资本主义工商业的三大改造到社会主义市场经济体制的基本确立,从宜将剩勇追穷寇到建立了强大的国防军,从废除一切不平等条约到独立自主的和平外交政策,从“双百”方针到体制改革后的文化事业欣欣向荣,从扫除文盲到实施科教兴国战略建设新型国家,从翻身解放到实现小康社会,凡此种种,中罔人民在每个领域无不留下发展的足迹,写就不朽的诗篇。

60年的时间在历史的长河中可谓沧海一粟。其间究竟发生了些什么,怎样发生的,过程怎样,结果如何,却非人人都清楚知道的。对此,亲身经历者或可鲜活如昨,但对后来者来说却可能只是一个概念,对某段历史的记忆影像或不存在或是模糊的。基于此,为了让年轻人,特别是青少年永远铭记共和国这段不朽的历史,我们推出了这套《共和国故事》。《共和国故事》虽为故事,但却与戏说无关,我们不过是想借助通俗、富于感染力的文字记录这段历史。这套500册的丛书汇集了在共和国历史上具有深刻影响的500个蘑大历史事件。在丛书的谋篇布局上,我们尽量选取各个时代具有代表性的或深具普遍意义的若干事件加以叙述,使其能反映共和国发展的全景和脉络。为了使题目的设置不至于因大而空,我们着眼于每一重大历史事件的缘起、过程、结局、时间、地点、人物等,抓住点滴和些许小事,力求通透。

历史是复杂的,事态的发展因素也是多方面的。由于叙述者的视角、文化构成不同,对事件的认知或有不足,但这不会影响我们对整个历史事件的判断和思考,至于它能否清晰地表达出我们编辑这套书的本意,那只能交给读者去评判了。

这套丛书可谓是一部书写红色记忆的读物,它对于了解共和国的历史、中国共产党的英明领导和中国人民的伟大实践都是不可或缺的。同时,这套丛书又是一套普及性读物,既针对重点阅读人群,也适宜在全民中推广。相信它必将在我国开展的全民阅读活动中发挥大的作用,成为装备中小学图书馆、农家书屋、社区书屋、机关及企事业单位职上图书室、连队图书室等的重点选择对象。

编者2010年1月

一、挑战难题

●王选接到陈堃銶的来信,由他所设计的编译系统被正式列入北大科研计划,王选兴奋得在上海再也呆不住了,他告别父母,回到了离开3年的校园。

●王选和许卓群去中科院登门请教,果然得到对方的热情点拨,这使王选很快就搞明白了,回到北大不久他就研究出了磁鼓数组的设计。

●经过一番分析,王选大胆提出跳过目前正在攻关的第二代、第三代照排机,直接研制当时尚无商品的第四代激光照排系统。

寻找创新的思想源泉

1961年春天,北京大学无线电系教师王选接到系里交给他的一项教学任务:教授“计算机原理”课。

为了使教学生生动充实,另外也想借此来了解国际上计算机科学技术发展的最新动向,王选开始了对大量文献,而且大部分是外国文献的阅读。

王选在大学里学的是俄文,但他仍坚持自学英语,后来接触到计算机后,王选看到欧美其他国家比苏联的技术要先进得多,所以更加强了英语学习。因此这时他阅读那些晦涩的科技文献并不费力。

王选还比较注意了解20世纪50年代国外有名的计算机的情况,它们的体系结构设计得非常巧妙,常常让他赞叹不已。

慢慢地,王选就问自己,为什么只能欣赏别人的成果,而不能有自己的创新思想呢?于是他开始研究做出这些创造性成果的科学家的背景,一下发现了一个规律,就是这些人大多具有两个以上领域的知识和实践,所以他们在面临挑战时往往会萌发新的构思。

王选首先在发明世界上第一台电子计算机的美国科学家毛奇利和埃克特身上发现了这个规律。

毛奇利是物理学博士,曾经致力于天气预报的研究,因为这一领域的题目计算量很大,他便想出许多方法提高计算速度,从而在数学和计算方法方面能力突出。

1941年夏天,34岁的毛奇利来到宾夕法尼亚大学任教,在这里遇到了才华横溢的年轻研究生埃克特。

埃克特在数学和电子工程两个领域都有深厚功底,两人兴趣相投,相见恨晚。

1942年毛奇利提出了电子计算机的基本构思,由埃克特负责具体实现,终于在1945年秋使第一台计算机运行成功。

冯·诺依曼在介入计算机研究之前,是研究数学和数理逻辑学的,后来他发明了“存储程序”的概念。

1944年的一天,在美国费城火车站,冯·诺依曼遇到了一名上尉军官,便与他随便攀谈起来。当时他们谁也没有意识到这次谈话从此改变了冯·诺依曼和电子计算机的命运。

从谈话中冯·诺依曼得知这位军人是美国军方派来参加毛奇利和埃克特的第一台计算机研制项目的,这引起了冯·诺依曼的极大兴趣。他的直觉告诉他,运用自己的数学和数理逻辑知识,很可能会为计算机带来革命性的变革。

怀着这种令他激动的想法,冯·诺依曼很快来到宾夕法尼亚大学,投身到研制世界上第一台计算机的工作中。

果然,过了不久,冯·诺依曼就提出了“存贮程序”的概念。

王选还发现,微程序的创始人维克斯也具有数学和无线电两个领域深厚功底的。

1946年夏,当维克斯33岁的时候,发生了被他称为“一生中最重要的事件”:他接到一个电报,邀请他参加莫尔电机工程学院的计算机培训班,主讲人是埃克特和毛奇利,当时他们的名字还鲜为人知。

那天,维克斯去晚了,只听到后半部分的课程,但世界第一台计算机的成就和新的存贮程序计算机概念给他留下极深的印象。维克斯灵感突现,立即回到剑桥大学着手研制工作,发明了第一台微程序结构的计算机。

王选后来说:

最使我激动不已的是1961年初看到的关于Atlas计算机的一篇不到一页的简短报道。Atlas是英国曼彻斯特大学20世纪50年代末研制的一台大型计算机,每秒运算高达几十万次,支持多道程序。主设计师叫汤姆·基尔本(TomKill9U111)。他精通程序,又有很出色的无线电才能。由于英国当时比较穷,用不起超大容量的磁心存贮器,基尔本只用了16K×48位的磁心存贮器,再加上第二级90多K字的磁鼓存贮器,首创了虚拟存贮器。同时,又以极大的魄力用晶体管分立元件来实现了这一创新的方案。

这样的例子还有很多,从中我总结出一点:20世纪50和60年代计算机硬件方面的很多高招都来自程序和应用(后来叫软件)的需要,硬件和软件的结合给计算机体系结构带来一系列的突破。可见,程序和应用对硬件设计是非常重要的,只掌握硬件设计,不懂得程序和应用,照样产生不出创新的想法。看来,这就是创造的源泉。

就在1961年,王选决定:从硬件转向软件,从事软、硬件相结合的研究,以探讨软件对未来计算机体系结构的影响。这是王选又一个产生前瞻意识的远见,因为当时整个中国也鲜有人这样做。

直到后来,他一直把这称作一生中最重要的一个决定。因为,从那以后,王选找到了产生创新思想的源泉。

接触照排科研项目

1961年夏天,正当王选在如痴如醉地工作时,由于长期的饥饿和劳累,他病倒了。

经过一年的治疗,他的病情不但没有好转,还一天天加重了。迫于无奈,王选于1962年夏天向学校请了长期病假,回到了上海的家中。

在上海养病期间,王选仍然不断吸取新知识,还不时地向复旦大学的许自省和施伯乐两位老师请教问题。

两位专家非常热心地对他进行指导,这让王选学会了调试手编程序的相关知识。

此时,王选开始自己设计编译系统,他还将进展情况写信告诉了陈堃銶。

1965年夏天,王选接到陈堃銶的来信,由他所设计的编译系统被正式列入了北大科研计划的项目,王选兴奋得在上海再也呆不住了,他立即告别父母,回到了离开3年的校园,迅速投入了紧张的工作。

编译系统研制小组正式成立了,成员除了王选、许卓群、陈堃銶、朱万森以外,还包括3名协作单位的技术人员。这个小组在当时很不起眼,许多人都没有把它当回事。

软件设计是一项十分艰苦的工作,王选的体力还很虚弱,实在累得不行了,他就靠在床上工作。好在有陈堃銶,她好像对王选的设计心领神会,总能编写出精确漂亮的程序去实现。同时,她也被王选的设计所折服,常暗暗惊叹,这个瘦弱不堪的人怎么会有这么多奇思妙想。

在整个设计过程中,王选并不赞成硬件直接执行高级语言的方案,而是主张寻找编译和目的程序运行中的瓶颈问题,这些问题,对于一个只懂软件不懂硬件的人,可能会束手无策,而王选已经有了硬件实践的经验,他将硬件和软件结合着来想,就试着从硬件上想办法,果然很容易就想出了克服这些瓶颈的方法,他感到自己真的找到了创造的源泉。

但是,有一些问题王选也会百思不得其解,例如怎样在语言中有效地利用当时DJS21机上的磁鼓外存贮器,就把他困扰了很久。

这时,在国内先于北大从事高级语言编译系统研究的单位还有中国科学院和南京大学,其中,中科院计算所集中了以董韫美教授为首的一批很有才华的研究人员,他们的研究在国内居于领先地位,与国外的差距也不大,在国内外都很有影响力。

于是,王选和许卓群去中科院登门请教,果然得到对方的热情点拨,这使王选很快就搞明白了。回到北大不久,他就研究出了磁鼓数组的设计。

通过与中科院计算所的接触,王选一方面为同行间能如此无私相助而感动,另一方面也切实感受到北大的差距。

王选所设计的编译系统,终于在1967年研制成功,这一成功给了他更大的自信。

20世纪70年代,在美国等西方国家,计算机技术的发展突飞猛进,开始从国家尖端科技向商业化方向延伸,IBM公司的大型机和DEC公司的小型机已经各领风骚。

1971年,英特尔研制出世界上第一块4位字长微处理器4004,并在1974年再度推出处理速度比4004快20倍的8080,同一年,MITS公司以8080设计出全球第一台微型电子计算机“牛郎星”。

然而在中国,计算机仍高不可攀,要跟上世界信息化发展的步伐,使计算机从高处走下来,除了突破各种客观条件的限制,还必须解决一个巨大的技术难关,那就是汉字进入和输出计算机的问题,也就是汉字的信息处理问题。

于是,1974年8月,四机部、一机部、中国科学院、新华社和国家出版事业管理局5家单位,联合向国务院和国家计委提出报告,要求将研制汉字信息处理系统工程作为国家重点科研项目。

周恩来总理亲自听取了汇报,很快由国家计委批准立项,定名为“748”工程,列入国家科学技术发展计划。

该工程分为:键盘输入、中央处理及编辑、校正装置、精密型文字发生器和输出照排装置、通用型快速输出印字装置远距离传输设备、编辑及资料管理等软件系统、印刷制版成形等,共7个部分。

陈堃銶把这个消息告诉了王选,王选分析了一下“748”工程的3个子项目:汉字通信系统、汉字情报检索和汉字精密照排。他说:

对于通信系统而言,汉字与西文没有多大差别,不会有什么特色;情报检索系统虽然价值大,从长远看有很大的发展前景,但当时中国的硬件条件、联网和使用情况还不足以使这类系统在较短时期内形成一个大的气候。

尤其重要的是,情报检索系统的关键之一在于建大容量的信息库,只有出版业采用计算机系统后,才能方便地获得建库需要的信息,特别是文献的全文信息。

汉字精密照排是指运用计算机和相关的光学、机械技术,对中文信息进行输入、编辑、排版、输出及印刷,也就是用现代科技对我国传统的印刷行业进行彻底改造。虽然难度巨大,但它的价值和前景同样不可估量,因为在当时中国最多的厂,恐怕就是印刷厂了。

王选被自己的分析震住了,通过一个科研项目发明一项技术,再用它来改造一个行业,这真是一个激动人心的创举!

印刷术是中国举世闻名的四大发明之一,隋唐之际产生了雕版印刷,11世纪40年代,北宋的毕昇发明了活字印刷术,先是烧泥刻字,后人又搞了木字、铜字、铅字,但是受社会发展和冶金、机械等工业水平的制约,始终没能取代雕版印刷占据主导地位。

1445年至1455年,德国的谷登堡使铅活字与印刷机相结合,发明了铅活字机械印刷术,大量推广并形成产业,引起了信息传播的飞跃。

19世纪中期,西方的铅活字印刷技术进入中国,逐步成为中国印刷业的主宰。进入20世纪,随着电子计算机和光学技术的迅速发展,西方率先结束了活字印刷,采用了“电子照排技术”。

而在20世纪70年代的中国,仍然是“以火熔铅,以铅铸字,以铅字排版,以版印刷”,这不但严重污染了环境,而且出版印刷的能力也极低。一般图书从发稿到出书,要在出版社压上一年左右,有的要拖二至三年,许多新书发行时就已经成了旧书。因此,当时报刊、杂志的数量品种也十分缺乏,人们的精神生活严重缺乏,难以满足人们的精神生活需求。

如果汉字精密照排项目研制成功,无疑将引起中国报业、出版印刷业甚至媒体传播领域一场轰轰烈烈的革命,这怎么能不让王选激动?

值得注意的是,王选在选择这一科研项目时是完全自发的,因而也是自主的,是一个每月只领40多元劳保工资、长期在家养病的老病号不愿放任自己,找些事做而已。

可贵的是,王选从一开始选择汉字精密照排项目,就看到了它的巨大实用价值,并且抱定了实现这一价值的目的和信心,因此,他的创造激情被激发了。

就这样,王选决定着手研制汉字精密照排系统。

挑战最新技术成果

王选当时想,既然要在别人的基础上推进一步,就要把国内和国际上在照排系统方面的研究现状和发展动向了解清楚。

于是,王选开始克服巨大的经费困难,开始查找资料,寻找依据和技术的突破口。因为北大图书馆的资料不够全,于是,他就挤公共汽车到位于和平街的中国科技情报所查外文资料,那里的资料较全、较新。

由于没有经费来源,车费不能报销,他只好尽量节约。为了节省5分钱,他提前一站下车徒步去中国科技情报所查阅资料。而且复印也需要算计,字数不多的就手抄,以便节省复印费。因为42元的月薪既要养家又要维持起码的研究费用。但王选不能停步,因为国外在发展相关技术,国内也有五家实力雄厚的机构在研制。

1975年的春天,全国人民没有几个人会像王选,自己掏钱,走很远的路去看什么外文资料的。一连几个月,王选走在从和平西街到和平街的路上,他没有在意路边的玉兰花开了一树,像站了满树的白鸽,脑海里都是照排机的影子。

西方人早在30年前,就开始了用照排机取代铅字的研究。第一代是手动照排机。1946年美国Intenype公司研制成功,称为FotoseRer。它实际上是一种西文的照相排字机,字模制做在一块透明的模板上,通过键盘的控制,把选中的字符对准一个窗口,用很强的灯光照射,使这个字符在底片上感光,然后底片移动一下,再照下一个字符。

1951年美国研制出第二代是光学机械式照排机,叫做Photon200。它把西文字模制做在有机玻璃圆盘或圆筒上,在照排过程中圆盘作高速的匀速转动,当选到需要照相的字符时,自动启动闪光灯,使字符在底片上成像。

20世纪50年代末,第二代照排机与计算机相连,构成了计算机排字系统,从而使文字照排进入了一个新阶段。

第二代照排机是欧美60年代电脑排版的主力,日本在20世纪70年代初期仍很流行。

1965年由德国的一家公司研制成的第三代照排机,1968年开始成为商品。它把所有的字模以数字化形式存贮在计算机内,输出装置是一个超高分辨率的阴极射线管,依靠它发光在底片上成像。

1975年的时候,三代机在欧美广泛使用,已经十分流行了。

第四代是激光照排机。字模以点阵形式存贮在计算机中。输出时用激光束在底片上直接扫描打点成字。英国蒙纳公司到1976年才研制成功,1975年还处于研制阶段,能查到的资料非常少,而且都反映困难重重。

有一则报道提到美国一家公司研制出了样机,但很快就放弃了推出商品的计划;另一则报道说,激光逐行扫描使控制器的设计难度大大增加,研制出的系统很难达到廉价推广。

不过,与第三代照排机相此,激光照排分辨率高、精度高、幅面可以很大、速度潜力也很大,还可以过渡到激光直接制版,前景十分诱人。

至于汉字照排系统的研制,当时只有日本搞出了三代机,但是还没有从根本上解决汉字信息的存贮问题,只能提供宋体和黑体两种字体,仅能勉强应付日文中的少量汉字,质量也达不到印刷要求,无法投入实际应用。

当时国内共有五家攻关班子从事汉字照排系统的研究。最早要属清华大学,他们和中科院长春光机所合作,从20世纪60年代末就开始研制二代照排机,使用了清华大学研制的112计算机,1973年在北京新华印刷厂首次实现了汉字进入电脑。

当时是用一键九字的大键盘输入的,1975年秋王选还专门去看过一次。在试生产车间,熟练的大键盘操作员紧张地录入汉字,车间的黑板上还记录了每天的录入字数。但这套系统机械故障频繁,无法投入实际生产。

最大的研究单位要属上海的一个班子,由一批著名的研究单位组成,是五家中实力最雄厚的。

王选发现,在照排机方面,这五套班子有两家选择了光学机械式的二代机,另外三家采用了阴极射线管输出的三代机。

王选发现在存贮汉字方面,二代机本身就是模拟方式;三代机方面,国外大多数采用的是数字存贮,就是把每个字形变成一连串二进位信息,存贮在计算机内。

可是,国内的这三家却分别采用了飞点扫描、全息存贮和字模管的模拟存贮方式。

通过进一步仔细地分析和比较,王选作出了一个大胆的判断。

他认为二代机用机械方式选字,对机械精密程度要求极高,需要非常精细的机械制造工艺,依照中国此时的机械工业水平,很难达到要求,研制和生产都很困难。同时,也不能适应复杂版面的要求,尤其不可能实现文图合一的输出,因此,二代机是没有发展前途的。

三代机所用的阴极射线管比黑白电视机分辨率高20倍,生产难度极大,对底片灵敏度要求也很高,国产底片很难过关;更重要的是,汉字字形的信息量庞大,模拟存贮的方法不可能解决存贮和输出等技术难关。

这时,王选想起了德国Hell公司研制的Digiset系统,它首创的数字式存贮和数字式输出,被称为“真正的突破”。有一份杂志登载了Digiset输出的线条图,质量很好。看来,数字式存贮将占统治地位。

经过一番分析,王选大胆提出跳过目前正在攻关的第二代、第三代照排机,直接研制当时尚无商品的第四代激光照排系统。

同时,他还得出了第一个重要的结论:

要研制汉字照排系统,首先必须解决汉字信息的存贮问题,模拟存贮的道路是走不通的,一定要采用数字存贮的技术途径。

二、攻克难关

●陈堃銶已被学校指派参加调研,恢复了正常工作,她便自告奋勇,向数学系作了汇报,没想到引起很大反响,系领导决定尽快将报告呈送北大领导。

●王选毅然决定跳过第二代、第三代排版系统,直接跨入国外还没有商品化的第四代系统,用激光扫描的方法来还原输出。

●全国各地的多家单位带着自己的研究方案和成果相聚北京,跃跃欲试,都想从中脱颖而出。

攻克最大技术难关

激光照排系统中的汉字信息处理有两个重大的根本性难题,一是汉字的储存,一是汉字字形信息的还原输出。而第一个难题显得尤为突出。

汉字的基本笔画不如字母文字多,“点、横、撇、捺、竖、弯、钩、折、提”而已,但汉字的构成却比字母文字复杂得多。字母文字的单词由字母简单排列而成,而每一个单个汉字的构成,都是笔画之间互相交错重叠,你中有我,我中有你,不可拆分。因此,汉字的一个单字实际上相当于字母文字的一个字母了。

西文只有26个字母,所以存贮量问题并不尖锐,而汉字字数繁多,《康熙字典》收入的汉字多达47000多个,常用字就有五六千个,印刷用的汉字更存在多种字体,有宋体、黑体、仿宋、楷体等10余种,而且还有10多种大小不同的字号。

汉字字形信息量太大,是中文信息处理系统最大的难题。要把汉字信息存储进计算机,就要把汉字变成点阵来表示。

一个5号字的正文字,至少需要100×100点阵,大号字体甚至需要1000×1000以上点阵。

汉字的常用字在3000字以上,印刷用的汉字多达2万多,加上每个字都有50多种不同风格的字体和50多种大小不一的字号,如果都用点阵来表示,信息量高达上千亿字节。

Digiset采用的是黑白段的描述方案,压缩率很低,对付26个英文字母还可以,对付海量的汉字点阵信息就行不通了。

汉字字形信息量大的问题,一下子成为摆在王选面前的主要难关。

日本京都大学倒是发明了一种字根组合方案,压缩率高,但质量不好。

从1946年西方发明第一代照排机开始,到1975年已经过去了30年,美国报界在1970年前后已全部采用电子排版,但中国仍然在拣铅字。

铅字印刷的痛苦深深地印在每个排版工人的心中!他们迫切地希望,有一种比较先进的技术能替代这种原始的劳作。

但是,汉字照排系统的问题却一直没有得到圆满解决。

20世纪70年代,王选有条件使用的国产计算机的磁心存贮器,最大容量只有64KB;没有磁盘,只有一个512KB的磁鼓和一条磁带,相当于美国20世纪50年代末的水平。

在这样简陋的条件下,王选不得不另辟蹊径,开始设法压缩汉字信息。

在接下来的日子,王选满脑子的汉字横竖弯勾,连做梦也尽是笔画。他的数学背景显示出意想不到的功效,王选很快想到了用轮廓加参数的数学方法描述汉字字形,这样做可以大大地压缩汉字信息。

这时,他发现,汉字虽然繁多,但是有规律可循,每个汉字都可以细分成横、竖、折等规则笔画,和撇、捺、点等不规则笔画。

对于规则笔画,可以用一系列参数精确表示;对于不规则笔划,可以用轮廓表示。他统计了一下,汉字中规则笔画的比例占了近一半,所以压缩的空间很大。

王选不停地统计和计算着,遇到问题就与陈堃銶讨论,两个人完全沉浸在汉字的一笔一画里。

1975年5月,“全电子照排系统”的初步设计方案终于完成。王选决定尽快向系里介绍这份方案,争取学校的支持。

但连续数月的劳累,使他虚弱得作不了报告。另外,他也有一点担心,担心自己“人微言轻”。

此时,陈堃銶已被学校指派参加调研,恢复了正常工作,她便自告奋勇,向数学系作了汇报,没想到引起很大反响。系领导决定尽快将报告呈送北大领导。

王选的手稿被拿到北大印刷厂打印。一些印刷工人得知他们正在研究用“电脑代替铅字”,非常兴奋,有的说:“这事真要成了,咱就不用天天跟黑乎乎的铅字打交道了。”

有的说:“每天手托着沉甸甸的铅字盘,来回拣字排版,相当于走几十里路,排好了再印刷,又脏又累,有了电脑,轻轻松松坐在那里一敲键盘就齐了。”

大家的话,给了王选很大的鼓舞,他没想到自己一个微不足道的病号只是提出了一个初步方案,就得到了工人们如此强烈的反应,说明他的研究与印刷工人们是休戚相关的,这更坚定了王选的信心。

很快,北大有关部门拿到了打印好的报告。他感到事情重大,决定立即召集有关单位开会研究。

1975年5月的一个晚上,北大数学系、无线电系、图书馆和印刷厂的联合会议在魏银秋主持下举行。陈堃銶参加了会议。

会上作出了两项重要决定:一是把汉字精密照排系统列为北大自选项目,确定了“数字存贮、信息压缩和小键盘输入”的总体方案,争取列入国家“748”工程的计划;二是从各单位抽调人员成立会战组,协作攻关。

开完会,夜已深了,陈堃銶一回到家里,就立即向王选细述了会议的情况,两人心中的感受难以言表。从1966年开始,近10年来,王选一直是个边缘人物,很多时候都有一种永世不得翻身的绝望。

直到此时,他才重新感觉到了学校、科研对他的需要,甚至感到了祖国和人民的重托。

5月的北大正是槐花盛开的季节,空气中暗香浮动,王选有些热血澎湃,他兴奋地对妻子说:“咱们又要大干一场了!”生活对于这对患难中走过来的夫妻,又掀开了崭新的一页。

万事开头难,会战组的组建是很不顺利的。数学系比较积极,派了陈堃銶、丁霭丽参加软件研制;中文系派出李一华、陈竹梅、石新春参加字模和输入方案的工作。其他系却不积极。

会战组从1975年5月筹建,直到1977年4月,始终缺乏计算机方面的教师。

王选的编制在无线电系,但他是“吃劳保”的病号,没人约束他,这也恰恰给了他进行独立思考的自由空间,可以集中全部精力来完善总体方案。

实际上,在这些人中,真正懂硬件又懂软件的只有王选,懂软件的也只有陈堃銶。在接下来的几个月里,王选一心一意地投入了工作中。

7月流火,屋里闷热难耐,王选就搬一张破旧的木椅坐在柿子树的荫凉下写写画画,进一步实现和完善总体方案。陈堃銶则把压缩信息拿到计算机上进行各种模拟实验。

数学和汉字,这两种代表不同意义的学科和符号,被王选和谐、紧密地结合起来,一系列世界首创的神奇发明诞生了:用轮廓加参数的描述方法,使汉字字形信息以1比500的比率高倍压缩;设计出一套递推算法,使被压缩的汉字信息高速复原成字形,而且适合通过硬件实现,为进一步设计关键的激光照排控制器铺平了道路。

更独特的是,王选想出用参数信息控制字形变大或者变小时敏感部分的质量的高招,从而实现了字形变倍和变形时的高度保真。

印刷用的汉字根据需要有大小不同的字号,1975年,中国报纸的正文字是五号,书刊的正文字一般也是五号。因此王选把五号字看作主体字号,使其字心正好是96×96个点,成为常规计算机字长的整倍数。所以,当他把系统的输出分辨率定为742线/英寸(DPI),刚好满足书报对文字分辨率的要求。

王选后来说:

这个分辨率一确定,就出现了一个问题:汉字笔画多,尤其是横道很多,在字形变倍特别是变小时,笔画会出现粗细不匀。比如“量”字中有九道横,同样宽度的两道横当字形变小后会变得宽度不一样。在1500DPI的高分辨率照排机上,这一细小差别对文字质量影响不大,而在我们选择的742DPI时,应该一样粗的横道变倍后却粗细不一,明显影响了文字质量。竖也有类似问题,但竖一般比横粗,数量相对少一点。怎么才能保证一个字在变大尤其是变小时的质量呢?我想出用参数这一附加信息来描述横宽、竖宽,并保证本来一样宽的横或竖变倍后仍维持相同的宽度,使742DPI下的小字仍旧美观匀称。

王选的这一发明在1975年是世界首创。

与汉字相比,西文字母笔画少,结构简单,而且西方工业技术先进,选择的都是1000DPI以上的高分辨率输出,文字变倍后基本不存在质量变化,所以也就不必用附加信息控制敏感部分变倍后的质量。

直到1985年,300DPI的激光打印机开始大量流行,在300DPI分辨率下,西文也出现了变倍后的文字保真问题,才有人想到用“提示信息”描述字形的宽度、间距以及需要保证对称的敏感部分,轮廓加参数的描述方法才在西方大大流行起来。

1975年9月,王选的高倍率字形信息压缩技术、字形的高速还原技术进一步成熟,并通过软件在计算机中模拟出“人”字的第一撇。

这是汉字信息处理技术的重大突破,38岁的王选有过人的胆识和信心,他用数学和智慧轻轻一叩,汉字进入计算机的大门被轰然打开了。

然而,此时许多人认为,这只不过是个名不见经传的小助教,拖着长期病弱的身体凭空想像出来的数学游戏。

积极争取领导的支持

在攻克技术上的最大关之后,王选又面临着另一个难关。11月初的北纬旅馆论证会,给了王选第一个沉重打击。

自从着手精密照排系统的研究以来,王选越来越清楚地感到,要想使自己的研究成果投入生产和实际使用,仅靠北大单打独斗是很难实现的,必须取得国家有关部委以及协作单位的支持,最好加入到“748”工程中来,把其中“汉字精密照排系统”这个子项目争取过来。这也是北大成立会战组时定下的目标。

1975年,汉字精密照排系统子项目以及100多万元经费已经下达给了北京市出版办公室,并指定北京新华印刷厂为第一用户。

为了论证我国精密照排的技术方案,北京市出版办公室在宣武区的北纬旅馆召开了方案介绍和论证会。全国各地的多家单位带着自己的研究方案和成果相聚北京,跃跃欲试,都想从中脱颖而出。其中研制二代机的几家更是信心十足,志在必夺。

对于北大和王选,这是一次极好的展示机会,王选、陈堃銶征得学校同意,参加了会议。

公共汽车上,陈堃銶小心翼翼地护着包,里面是夫妇俩辛苦多日的成果:一个用字形信息压缩方案、通过软件还原、宽行打印机打印的“义”字,是3张打印纸拼接起来的,展开大约有五六十厘米见方。之所以选“义”字,是因为这个字的压缩信息简单,并且包括了撇、捺、点3个不同笔画。

王选虽然参加会议,但身体太虚,说话无力,仍让陈堃銶代作报告。虽然讲过几次,但这次不同,关系到能否争取到国家项目和经费,因此陈堃銶感到压力很大。

新华社的钱乔其在会上介绍了云南大学的字模管三代机和小键盘编码输入方案,科学院自动化所的毛绪瑾介绍了他们正在研制的飞点扫描西文三代机方案,新华印刷厂的贝贵琴介绍了与清华大学合作研制的字模平板移动、静止曝光的二代机,樊景泉则介绍了上海有关单位的研制情况。

王选的字形信息压缩方案和“义”字引起了与会者的很大兴趣,新华社孙宝传在会上明确表示北大的方案很有发展前途,应该支持北大继续研究。

孙宝传是新华社技术局的技术专家,1974年被派到新华印刷厂参加“748”工程的筹备工作。

此时,孙宝传也在调查并研究汉字信息压缩技术,听了王选的方案,他立即有一种不谋而合、找到知音的感觉。

会后,孙宝传把自己的想法和王选进行了交流,鼓励王选一定要继续搞下去。

但是,王选的方案,在许多人看来是太超前了,近乎在玩“数字游戏”,因此,最终没有被会议采纳。

大多数与会者对字模数字压缩信息在存储器里能否容纳得下、字模压缩信息复原的速度能否跟得上汉字输出设备的速度、复原后的字模质量能否满足印刷的要求等一系列问题抱有一定的疑虑。

经过几天论证,会议最终还是选择了所谓“现实可行”的二代机作为“748工程”的正式方案上报。

王选的心情一下子变得很沉重了,因为他很清楚地知道,二代机是没有发展前途的,选择二代机不只是一个技术决策的错误,还将给国家带来人力物力的巨大浪费,更重要的是将延误我国在照排领域内赶超世界先进水平。

但是他又意识到,依他个人的力量,是没有能力改变这个决定的。

王选还是决定不受影响,准备继续干下去。此时他想到了一句话,就是美国的巨型机之父克雷所说的:“当他提出一个新的构思时,人们常常说做不成,对这种怀疑的最好回答是自己动手做。”这句话给了王选很大的启示,并且始终鼓舞着他。

不过,幸运的是,此时除了孙宝传,还有两个人对北大的方案深感兴趣。

一位是新华社技术局的王豹臣,作为“748”工程的5个发起单位之一,新华社被定为第一用户。但通过一个阶段的试验,王豹臣他们觉得二代机问题太大,不仅速度慢,灵活性差,而且经常出现机械故障,很难满足报纸的要求。相比之下,王选的设计思路超前,可行性也很值得研究。

北纬旅馆会议结束后不久,王豹臣便率人于11月26日、12月19日两次来北大了解情况,观看软件还原字形的演示,对北大方案进行了解。

另一个人是四机部“748”工程办公室的干部张淞芝。

其实,早在会前一个月左右,张淞芝就来北大听取过有关字形信息压缩技术的简单汇报。

11月27日,就在王豹臣来了解王选技术的第二天,张淞芝又一次来北大,经过一番更为详细地调研,他开始倾向于北大方案。

王豹臣和张淞芝一协商,决定联合对北大进行一次“会诊”。

1976年2月11日,春节刚过,新华社、四机部和十五所的一行多人在北大召开会议,正式听取了方案介绍。王选看得出,与会专家问得很仔细,对自己的方案表示出赞许的态度,事实上这次介绍的确对日后项目的下达起了很好的作用。

2月25日,王选等人第一次来到新华社,王豹臣很明确地对王选说,新华社赞成采用北大的方案,并且会向上积极争取。

这时虽然还隆冬,王选却感到浑身暖融融的,他深知有了新华社的支持,事情就有希望了。

会后,张淞芝和王豹臣立即向主管“748”工程的工程办公室主任、四机部计算机工业管理局局长郭平欣作了汇报。

郭平欣是支持北大方案的关键人物,作为电子和计算机方面的专家,他从一开始就参与了“748”工程立项的全过程。

1973年,在对国外汉字信息处理技术情况的调研过程中,郭平欣也了解到日本正在采用信息压缩技术解决汉字存贮问题,但他们只看重计算机技术的应用研究,而忽略了汉字本身在字形、字号、出现频率等方面的特点,因此没有成功。

通过调研,郭平欣认识到,汉字字形的模拟存贮问题很大,数字存贮才符合技术发展潮流。现在,北大冒出一个王选,出奇制胜地解决了这个问题,郭平欣一贯主张工程项目不能采取政府分配任务的办法,而应该集思广义、公平竞争、择优支持。

王选的研究成果属于汉字信息处理的核心技术,如果真有突破,意义太重大了。这一次,郭平欣决定不顾得罪某些单位的可能,给北大的王选一个机会。要知道,这个机会的背后是一大笔科研经费,现在要让给与四机部毫无“亲缘”关系的北大,肯定会被指责为“肥水外流”。

1976年5月4日,北大接到张淞芝的信,说郭局长指定了11个字,要北大做从信息压缩还原成点阵的模拟实验,一个半月后来看演示。这11个字是“山、五、瓜、冰、边、效、凌、纵、缩、露、湘”。大家一看,都觉得题目出得有水平,因为这些字从简到繁,包括了汉字的主要笔画和结构,知道郭平欣想实际检测一下不同风格和框架的汉字的压缩率以及复原后的文字质量。

当天晚上,会战组组长张龙翔召集全组开动员会,决定突击一个半月完成模拟实验。因为以前的软件模拟都是陈堃銶负责,所以这次仍由她主持。

他们先请北大印刷厂的刁一斌在96厘米×96厘米的座标纸上用宋体写出这11个字,然后王选和中文系的人员作出压缩信息,再由陈堃銶他们来编制模拟程序。

此时使用的是北大计算中心的6912中型机,白天有教学任务,只能利用深夜和清晨四五点钟上机调程序,纸带、宽行打印机和内存又经常出错,所以非常紧张和辛苦,陈堃銶的血压也一度降到70/55。但大家为即将下达国家任务的消息所振奋,不懈努力,提前一周完成了任务。

6月11日,郭平欣、张淞芝、新华社王豹臣、国家出版局副局长沈良等人来到北大计算中心参观表演。演示异常地顺利,宽行打印机打出的11个字规范漂亮,笔锋光滑,几乎看不出有失真的地方。

郭平欣看后满意地笑了,结果比他预想的还要好,他下了决心,就把精密照排项目的主持和总体设计任务给北大。

然而,郭平欣的意见在北京市一些单位却遇到了重重阻力。在此之前,精密照排项目的研制任务已经下达给了北京市出版局和新华印刷厂,现在要改成由北大总抓,自然大受抵触。

郭平欣他们观看北大的实验后不久,意想不到的事情发生了:一份北京市的红头文件正式下达给北大,明确规定“748”工程采用二代机方案,要求北京大学承担二代机的排版软件研制任务。这份文件印刷精美,还盖了三个大印,显得威风凛凛。

此时正值“四人帮”反对“条条专政”的风口上,四机部无法给北大直接下达任务,必须通过北京市。这份红头文件等于封住了四机部的口。

一晃3个月过去了,进入9月,事情有了转机。

此时,在北京市科技局主持的一次二代机方案报告会上,不少人表示了对北大方案的怀疑和不满。

报告会是在北京新华印刷厂举行的,由北京市科教组和科技局主持,北大的会战组组长张龙翔参加旁听,却听到了颇多指责,说“北大想搞先进的系统,看来要先进到修正主义那里去了”。

会后,张龙翔请持反对意见的人到北大参观。王选他们的精湛演示,使这些人的态度彻底发生了变化。

9月8日,鲁延武一行来北大听取了方案介绍后,大为称赞,态度完全变了,特别起劲和热情,表示回去后向北京市领导汇报,争取说服新华印刷厂,尽可能统一到北大方案上。

王选他们都赞叹鲁延武的实事求是的科学作风。可惜的是,由于种种原因,二代机方案未能放弃。

几个月来,郭平欣一直在想办法把任务落实给北大。就在鲁延武他们参观北大的当天,征得四机部刘寅副部长的同意,郭平欣让张淞芝在普通信纸上手写了一封信,亲自签发,给北京大学正式下达了这一研制任务。

王选和同事们感到欢欣鼓舞的同时,深深地被打动了。

王选大脑里不停闪现的创新火花,终于得到“748工程”领导小组的认可。北大的激光照排研究从“游击队”变成了正规军。

从1975年到1982年,北京存在两个“748”,一个是郭平欣领导的北大“748”,一个是北京市“748”。

郭平欣后来回忆说,当时748工程全国都很关注,他为这个项目“跑”了1亿元的资金,承诺10年完成研发。“很多人和单位都来参加竞选,但属王选的方案最好。”

王选取得初步成果

1976年,就在郭平欣为把汉字精密照排系统的研制任务下达给北大而奔走努力的时候,王选却全然不顾这些,他始终在琢磨第二道难关,就是汉字压缩信息的高速还原和输出方案。

在考虑汉字信息的高速还原和输出问题时,王选再次有了“跨越式思维”:

搞应用必须着眼于系统成熟时的国际技术情况,否则等产品研制出来,就已经落后了,只能永远跟在别人后面亦步亦趋。

于是,他毅然决定跳过第二代、第三代排版系统,直接跨入国外还没有商品化的第四代系统,用激光扫描的方法来还原输出。

1975年的时候,王选曾经打算采用阴极射线管三代机的输出方案,但国产高分辨率的阴极射线管不过关,屏幕尺寸也很小,满足不了报纸版面要求;所需要的高灵敏度底片也没有人研制。

另外,他从文献上看到,为保证高质量输出,需要研制一整套复杂的校正电路,这些都是德国Hell公司首创的技术,后来传到了美国,而王选对这些毫无经验。输出设备一直是困扰他的严重技术困难。

1976年4月的一天,王选听说邮电部杭州通信设备厂研制成一种用于报纸的传真机,已在《人民日报》投入了实用。这种高精度的传真机能够每天把《人民日报》清样传真到外省市,然后再制版印刷,其印刷质量能够符合报纸的基本要求。

很快,王选在北京的一个展览会上见到了这一设备,立即被吸引住了。他觉得这种报纸传真机实在太好了,幅面宽、分辨率高、对齐精度好;更重要的是,它是成熟的、已经每天在使用的设备。

王选一下想到了国外正在研制的激光照排,一个念头冒了出来:如果把报纸传真机的录影灯光源改成激光光源,不就变成激光照排机了?

但他在光学方面并不内行。于是,他就跑到物理系去请教。北大物理系老师张合义给他了满意的回答。

但除此之外,还必须要解决激光输出控制器的技术困难。

对于此时中国的激光照排技术来讲,样机生产比科研还难。中国此时的技术水平,尤其是硬件水平根本达不到。

最令王选头疼的是,国外的阴极射线管三代机可以在瞬时改变光点的直径和扫描步长,因此可以走走停停,逐字扫描。而杭州通信设备厂滚筒式的传真机却不行,一旦开始扫描就要连续不断地运转,必须不停地高速提供点阵信息给扫描头,这种扫描方式叫逐线扫描。激光不能改变光点直径、逐线扫描和不能走走停停这三个特点,使控制器提供字形点阵变得十分困难。

这些问题成为几个月来一直折磨王选的技术难题。他手里拿着一张《光明日报》,苦思冥想,功夫不负苦心人,终于让他想出了解决办法。

根据大量统计数据,王选发现了一个特点:虽然汉字字模个数多达6万以上,但每天4版的《光明日报》所用的字模通常只有2000多个,一本96页的《参考资料》也只用到3000个左右,也就是说,每次照排所用的字模通常只有3000个左右。

因此,可以先把全部汉字字模的压缩信息存到外设的磁带机里,每次照排时,不用反复访问磁带机,那样速度会很慢,而是作挑选式读带写鼓,大约花1分钟时间把排版文稿中要用到的全部字模从磁带机中挑出来送到磁鼓上存贮,以后照排过程中不再访问磁带,只要反复访问磁鼓就可以了。为了加快汉字复原速度,又设计了取一行字模压缩信息送磁心存贮器,分段生成字形点阵并缓冲的方案,用一个专门的硬件来完成高速复原,达到每秒复原大约150字的速度,从而赶上了传真机滚筒扫描的输出速度。

找到解决激光扫描控制器技术难关的办法之后,王选作出决定:采用激光输出方案,直接研制第四代激光照排系统。

这在有些人眼里,无疑只是一个天方夜谭的故事罢了,因为只知道二代机、三代机,还从来没有听说有人搞成过四代机。在当时世界上,第一台激光照机还处在研制过程中呢,王选却做起了四代机的梦想,这在许多人看来是痴人梦想。

于是,有人私下议论:“国外还没搞出来的东西,他能行吗?”“王选想搞第四代,我还想搞第八代呢!”对这么一个小小助教加长期病号的狂妄想法,很多人嗤之以鼻。“王选怎么去搞黑不溜秋的印刷!”不少计算机的同行都瞧不上

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载