办公软件高级应用实用教程(txt+pdf+epub+mobi电子书下载)

作者:吴林华

出版社:中国铁道出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

办公软件高级应用实用教程

办公软件高级应用实用教程试读:

前言

FOREWORD

高等教育的大众化、普及化对强调应用型、教学型课程的教学工作提出了更高的要求,新的高等教育形势需要我们积极进行教学改革,研究和探索新的教学方法。在长期的教学实践中,我们体会到“因材施教”是教育教学的重要原则之一,把实验实践环节与理论教学相融合,抓实验实践教学促进学科理论知识的学习,是有效提高教学效果和教学水平的重要方法之一。随着教改研究的不断深入,我们在教学实践中已经开发了数十本以实验实践方法为主体开展教学活动的具有鲜明教学特色的课程主教材,相关的数十篇教改研究论文也赢得了普遍的好评,并多次获得教学优秀成果奖。

全社会计算机普及水平的提高,对大学计算机基础教育(包括计算机文化)课程提出了发展和提高的要求。本书是为传统的“计算机基础”课程编写的旨在提高与深化的后续教材,也是高起点的“计算机基础”课程的新教材。全书以基于案例实验为主线开展教学,通过一系列在网络环境下学习和实践的能力训练环节,把计算机基础和办公软件应用的更深入的概念、理论知识与技术融入到实践中,从而加深对该课程的认识和理解,切实提高学生的计算机基础应用水平。

全书教学内容和能力训练包含了计算机基础知识和办公软件应用的各个方面,涉及计算机基础提高、文字处理软件Word高级应用、电子表格处理软件Excel高级应用、演示文稿制作软件PowerPoint高级应用、绘图工具Visio、数据库管理软件Access和办公软件综合应用。全书共设置了15个能力训练,以帮助读者熟练掌握办公软件的应用与技巧,每个能力训练均设有“训练总结”和“教师评价”部分。全书最后的课程能力训练总结部分还设计了“课程学习能力测评”等内容,希望以此方便师生交流对学科知识、训练内容的理解与体会,以及学生对自己学习情况进行必要的评估。

本书由吴林华主编,谭支军、王春燕、杨志、王文、周苏、张丽娜、朱卓越等参加了本书的部分编写工作。本书的编写得到了浙江商业职业技术学院、浙江大学城市学院、温州安防职业技术学院等多所院校师生的支持,在此一并表示感谢!欢迎教师索取本书配套的相关教学资料或与编者交流。E-mail:zhousu@qq.com;QQ:81505050;个人博客:Http://blog.sina.com.cn/zhousu58。

编者2015年11月第1章计算机基础提高

办公软件应用所涉及的计算机基础知识十分重要,但往往会被人们所忽视。在这一章中,我们通过软件基础、万维网与搜索引擎、计算机病毒防范,以及使用压缩软件几部分内容的学习,力求概括出在办公软件高级应用的背景下,读者所应该掌握和得到加强的计算机基础的知识范围。1.1软件基础

软件是由计算机程序发展演化而来的,是程序设计发展到规模化和商品化后逐渐形成的概念,软件也是程序及其实现和维护时所必需的文档的总称。1.1.1 软件概述

计算机软件的类型决定了计算机能帮助用户完成哪些类型的任务。有的软件能帮助用户创建文档,而有的软件则是保护计算机不受病毒侵害,或提高计算机的性能。软件一般被分为系统软件和应用软件。对于许多计算机用户而言,其间的区别并不明显。

系统软件负责执行使计算机硬件有效工作的关键任务,协助计算机完成基本操作,像在屏幕上显示信息、在磁盘中存入数据、向打印机发送数据、解释用户命令以及和外围设备通信等。系统软件的4个子类是:操作系统、实用工具、设备驱动程序和编程语言。

应用软件可以协助人们完成某一项任务。即使用户没有计算机也能做某件事情,但为了让这件事情由计算机完成而使用某个软件时,就可以认为该软件是应用软件。例如,用户使用计算机写信或写报告,用来制作信件或报告文档的软件就属于应用软件。1.1.2 操作系统基础

操作系统(OS)是控制计算机中所有活动的核心系统软件,如果没有操作系统,计算机就不能正常工作。因此,操作系统是计算机的关键软件。同时,从用户观点来看,操作系统为计算机所运行的所有应用软件提供了平台。目前主流的操作系统包括:Microsoft Windows、Mac OS、UNIX和Linux等,曾经主流的操作系统还有DOS等。这些操作系统具有不同的用户界面,并且只允许计算机运行与之兼容的软件。例如,使用Windows操作系统的计算机只能运行Windows软件,使用UNIX操作系统的计算机通常也只能运行UNIX软件。

如果把计算机硬件设想成计算机系统的核心,那么操作系统协助计算机完成基本硬件操作,并且和更外层的应用软件进行交互,完成诸如打印和存储数据等应用任务。

操作系统执行许多不同的任务,这个过程通常称为“服务”,这些服务可以分为“外部服务”和“内部服务”两种。

操作系统提供外部服务以协助用户启动程序,管理和维护被存储的数据。计算机用户负责控制这些外部功能。操作系统提供选择程序的方法,也能帮助查找、重命名与删除文档和其他在存储介质中的数据。在有些计算机上,操作系统在允许用户访问程序和数据之前,通过检查用户ID和口令来维护程序和数据的安全。

此外,操作系统提供内部服务来保证计算机系统有效运行,这些内部服务一般不受用户的控制,而是受到操作系统本身的控制。操作系统控制输入/输出、分配系统资源、管理程序和数据的存储空间以及检测设备是否失效。系统资源是计算机系统中能够被程序利用的部分,如磁盘空间、内存量或者处理器时间等,操作系统负责分配系统资源以便程序可以有效地运行。1.1.3 桌面和服务器操作系统

尽管市面上的操作系统数量繁多,但一般分成两大类:服务器操作系统和桌面操作系统。因特网Web站点的计算机通常称为“服务器”,它通过分散的计算机向人们提供信息,人们在家中或办公室使用的计算机通常称为“桌面”或者“客户端”计算机。

服务器操作系统(也称“网络操作系统”)是专门为那些在网络和Web站点提供集中化存储机制和通信功能的计算机而设计的;桌面操作系统(也称“客户端操作系统”“个人操作系统”)是专门为单用户微型机设计的。一般用户通常与桌面操作系统进行交互,而不直接使用服务器操作系统。但是,了解主流的服务器操作系统也是很有必要的。

1.Windows

微软公司的Windows操作系统为大多数的计算机用户所直接使用。如同任何其他事物一样,Windows操作系统也有其诞生、成长和发展的过程。Windows操作系统的最初版本Windows 1.0和Windows 2.0并没有在计算机用户中产生很大的反响。那时,微型计算机的主流操作系统是微软公司的DOS操作系统。

1990年5月22日,微软发布Windows 3.0;1992年发布的Windows 3.1真正使Windows操作系统成为微型机操作系统的重要选择。

1995年8月24日,微软发布Windows 95;1998年6月25日,微软发布Windows 98。这两个Windows版本逐渐巩固了Windows操作系统的“霸主”地位。

2000年9月14日,微软发布了Windows 98的第三版,即Windows ME(千禧版),这是最后一个16位/32位混合模式的Windows 9x系列产品。

上述各个版本的Windows主要用在个人计算机上。与此同时,Windows的服务器操作系统版本也在不断成长,称为Windows NT。

从MS-DOS到Windows 9x,操作系统的发展宣告MS-DOS命令行界面的终结,迎来了32位程序设计和图形界面的崭新时代。

2000年2月17日,微软发布Windows 2000 Server。

2001年10月25日,微软发布Windows XP。XP系列包含了Windows XP Home Edition(家用版)和Windows XP Professional(专业版)。2003年5月22日,微软发布了XP时代的服务器版本Windows Server 2003。

随着PC实现向64位的升级,2007年1月30日微软发布Windows Vista和Office 2007。作为新一代操作系统,Windows Vista传递出3C的特性,努力帮助用户实现工作效益的最大化,即:

①信心(Confident):使用户在使用时更放心,更有信心。

②简明(Clear):更简单、方便,让用户不用过多学习,就可以做想做的事情。

③互联(Connect):实现信息同步,与各种设备都能实现更好的互联互通。

2008年2月27日,Windows Server 2008、Visual Studio 2008(开发工具)和SQL Server 2008(数据库)在洛杉矶共同发布。Windows Server 2008包含了功能强大的Internet Information Server(IIS)7.0。

2009年10月22日,微软正式发布Windows 7(见图1-1),其核心版本号为Windows NT 6.1。Windows 7可供家庭及商业工作环境、笔记本电脑、平板电脑、多媒体中心等使用,还延续了Windows Vista的风格。同时,还发布了服务器版本Windows Server 2008 R2。2011年2月23日,微软发布Windows 7升级补丁SP1和Windows Server 2008 R2升级补丁SP1。

2012年10月26日,微软公司正式发布Windows 8(见图1-2)。Windows 8支持来自Intel、AMD的芯片架构,被应用于个人计算机和平板电脑上。该系统具有更好的续航能力,且启动速度更快、占用内存更少,并兼容Windows 7所支持的软件和硬件。Windows 8独特的开始界面和触控式交互系统,旨在让人们的日常电脑操作更加简单和快捷,为人们提供高效易行的工作环境。

图1-1 Windows 7的典型界面

图1-2 Windows 8的典型界面

与Windows 7的版本定义不同(旗舰版、家庭版等),Windows 8提供了4个不同的版本,分别是Windows RT、Windows 8标准版、Windows 8 Pro(专业版)以及Windows 8 Enterprise(企业版)。其中Windows RT是专门用于平板电脑的,其余3款均是PC版。Windows 8企业版拥有Windows 8 Pro的所有功能,IT组织/企业能够实现对PC的管理和部署、先进的安全性、虚拟化、新移动场景等功能。

新版Windows和Office的创新设计旨在改进人们利用技术沟通、互联、创造和分享内容以及娱乐的方式。面对数字时代的挑战,其卓越的性能提升将消除人员、信息和社区之间沟通的羁绊,为消费者带来更便捷、更安全的PC体验,更好的互联性能,以及更好的娱乐体验。

2015年7月29日,微软公司正式发布Windows 10(见本书1.1.4节)。

像其他图形化用户界面一样,Windows提供了图标、按钮和其他屏幕控制方式,用户可以使用鼠标或者类似设备来进行操作。之所以称为“windows”,是因为其图形化界面最基本的容器是矩形的工作区域,像窗口一样。每个窗口可以显示不同的文档或者程序,用户可以同时操作多个项目,这种服务被称为多任务。Windows也提供了一些基本的网络功能。

2.Mac OS

1984年,Apple计算机公司迈出开创性一步,发布了Apple Lisa计算机。该计算机提供图形化用户界面,包含可以通过鼠标进行操作的菜单、图标等。Lisa计算机在商业上并不成功,但Apple的下一个产品,即Macintosh计算机取得了很大的成绩,图形化用户界面的操作系统Mac OS是其成功的决定性因素。1998年Apple公司发布的iMac计算机也包含Mac OS。像Windows一样,Mac OS经历了多个版本的改进,能提供多任务功能并支持小型网络。

Mac OS基于UNIX内核,一般情况下在普通PC上无法安装。目前,苹果计算机的操作系统版本已经到了OS 10,代号为Mac OS X(X为10的罗马数字写法),这是苹果计算机诞生15年来最大的变化(见图1-3)。新系统非常可靠,它的许多特点和服务都体现了苹果公司的理念。

图1-3 OS X 10典型界面

另外,疯狂肆虐的计算机病毒几乎都是针对Windows的,由于Mac OS的架构与Windows不同,所以很少受到病毒的袭击。Mac OS X操作系统界面非常独特,突出了形象的图标和人机对话。

2011年7月20日,Mac OS X正式改名为OS X。最新版本为10.10.3(2015年4月17日)。

与Mac OS兼容的软件被称为Macintosh软件,或简称Mac软件。尽管Macintosh和iMac用户可以选择许多Macintosh软件,但是其应用软件的数量远小于Windows操作系统下可以运行的软件数量。借助于特殊的仿真硬件和软件插件,Macintosh计算机可以运行某些Windows软件,但是运行性能不是最佳的,所以大多数Mac OS用户坚持只使用Macintosh软件。

3.DOS

在微型计算机发展的早期,人们只能通过DOS(Disk Operating System,磁盘操作系统)与计算机进行对话。DOS是微型机上最早使用的操作系统之一,其复杂的命令行用户界面也给人们留下了深刻印象。DOS最初是在IBM PC个人计算机上使用,命名为PC-DOS,微软公司也把这个操作系统销售给其他PC兼容机制造商,命名为MS-DOS。

如今,曾经辉煌的DOS并没有彻底消失,实际上它被集成在Windows中,通常在幕后发挥作用,所以,一般的Windows用户没有必要记住和输入这些复杂的命令。

4.UNIX和Linux

如今流行的服务器操作系统有Microsoft Windows Server、UNIX和Linux等,这些操作系统提供管理大型网络和Web站点上数据流特性的功能。

UNIX是一个在专业领域中较为流行的功能强大的操作系统,它有3个显著的特点:

①UNIX是可移植的操作系统,它只需经过较小的改动就能方便地从一个平台移植到另一个平台。这是因为它的主要部分是用C语言编写的(而不是机器语言)。

②UINX拥有一套功能强大的工具(命令),能够组合起来(在可执行文件中被称为脚本)解决许多问题,而这一工作在其他操作系统中则需要通过编程来完成。

③UNIX具有设备无关性,因为操作系统本身就包含了驱动程序,这意味着它可以方便地配置以驱动任何设备。

概括来说,UNIX具有一个强大的操作系统所拥有的一切特点,包括多道程序、虚拟内存和设计得非常优秀的文件和目录系统。唯一经常听到的有关UINX的批评,是说它的命令短,而且对一般用户来说很深奥。事实上,这一点却非常适合程序设计员,因为他们喜欢短的命令。

Linux最初是芬兰的Linus Torvalds开发的基于UNIX的操作系统。事实上,Linux和UNIX非常接近,以至于被人称为UNIX的复制品。整个设计是为了让UNIX在Intel微处理器上更有效地运行。如今,Linux可以运用到各种平台上,而且在程序员和商业用户中变得越来越流行。1.1.4 Windows 10操作系统

Windows 10是微软公司研发的新一代跨平台及设备应用的操作系统,其典型界面如图1-4所示。据微软公司声称,在Windows 10正式发布后的一年内,所有符合条件的Windows 7、Windows8.1等版本的用户都可以免费升级到Windows 10,Windows Phone 8.1则可以免费升级到Windows10 Mobile版。所有升级到Windows 10的设备,微软都将提供永久生命周期的支持。据称,Windows10是微软独立发布的最后一个Windows版本。Windows 10一共有7个发行版本,分别面向不同用户和设备,如表1-1所示。

图1-4 Windows 10的典型界面

表1-1 Windows 10版本划分

对于“为何跳过逻辑上的Windows 9命名”这一问题,微软高管认为Windows 10这个名字很合适整个产品线,也暗指Windows 8.1相当于Windows 9,同时表明Windows 10在Windows系统中是质的提升。微软还宣布以Windows 10 Mobile作为下一代Windows 10手机版的正式名称,此SKU也会作为其他小型Windows设备的软件版本名称,如迷你平板设备。1.1.5 Windows系统管理

在Windows“控制面板”(见图1-5)的“管理工具”选项中集成了许多系统管理工具(见图1-6),利用这些工具,用户可以很容易地对它们进行操作和使用,方便地实现各种系统维护和管理功能。默认情况下,只有一些常用工具,如服务、计算机管理、事件查看器、数据源(ODBC)、性能监视器和组件服务等,随Windows的安装而安装。

图1-5 Windows 7控制面板

图1-6 Windows 7管理工具

①服务:启动和停止由Windows系统提供的各项服务。

②计算机管理器:管理磁盘以及使用其他系统工具来管理本地或远程计算机。

③事件查看器:显示来自于Windows和其他程序的监视与排错信息。例如,“系统日志”中包含各种系统组件记录的事件,如使用驱动器失败或加载其他系统组件;“安全日志”中包含有效与无效的登录尝试及与资源使用有关的事件,如删除文件或修改设置等,本地计算机上的安全日志只有本机用户才能查看;“应用程序日志”中包括由应用程序记录的事件;等等。

④数据源(ODBC):添加、删除以及配置ODBC数据源和驱动程序。

⑤性能监视器:显示系统性能图表,配置数据日志和警报。

⑥组件服务:配置并管理COM+应用程序。1.1.6 办公套件

像Microsoft Office、Google Docs和WPS Office这样的办公套件,不管对一般计算机用户还是企业而言都是很常用的,这些办公软件能提供一些真正有助于用户完成工作和提高生产力的功能。

所谓“办公套件”是一套程序,通常包含文字处理、电子表格、演示文稿和数据库模块等。套件中还可能包含电子邮件和联系人管理器、日历、项目管理和画图模块。

在提到办公套件时,“模块”是指组成该套件的某一组件,比如文字处理模块。模块可以作为单独的程序运行,但办公套件中的所有模块都具有一套标准控件,方便擅长使用某一模块的用户也能熟练使用其他模块。

最热门的办公套件有Google Docs、iWork、LibreOffice、Microsoft Office、Microsoft Office 365、Zoho Office Suite和WPS Office(见表1-2)。

表1-2 热门办公套件通常包含的类似模块组

Microsoft Office(见图1-7)是由微软公司为Microsoft Windows和Apple Mac OS X而开发的办公套装软件,它包括联合的服务器和基于互联网的服务。

图1-7 Microsoft Office 2013

MS Office软件最初出现于20世纪90年代早期,最初是一个推广名称,指一些以前曾单独发售的软件,如Word、Excel和PowerPoint以及后来的Access的合集。当时主要的推广重点是购买合集比单独购买要省很多钱。随着时间的流逝,Office应用程序逐渐整合,共享一些特性,例如拼写和语法检查、OLE数据整合和Microsoft VBA(Visual Basic for Applications)脚本语言等。

该套装软件被认为是一个开发文档的事实标准,而且有一些特性在其他产品中并不存在;但是其他产品也有Office缺少的特性。

Microsoft使用早期的Apple雏形开发了Word 1.0,于1984年发布在最初的Mac中。Multiplan和Chart也在512K Mac下开发,最后它们于1985年合在一起作为Microsoft Excel 1.0发布,成为第一个在Mac上使用的轰动一时的零售程序。

因此,早期的Microsoft Office程序源于Mac,当然,这也反映在用户界面上。作为Mac的第一个和最大的软件提供者,在最初的Macintosh上做的一些UI(用户界面)决定受Microsoft开发团队的要求影响。当然,Office图形化用户界面(特别是顶级菜单栏)的最基本轮廓有它在第一个Macintosh版本中的身影。

Office 2013于2012年底面向企业用户发布,2013年2月底面向个人用户推出。Office 365订阅用户不仅有权在5台Windows/Mac计算机上安装Office,还能够在Windows Phone或是Surface平板电脑上安装Office,而iOS和Android版Office不计算在内。也就是说,用户订阅一份Office365,可以在10台机器上安装。思考题1.1

1.什么是CPU?它在计算机中起什么作用?

2.内存容量对计算机有什么影响?

3.在什么地方能查看CPU使用率?

4.为什么调整程序窗口的大小很有用?

5.Windows包含一个强大的帮助和支持中心,联机和脱机帮助之间的区别是什么?

6.固定程序是指什么?

7.如果有很多程序和文件图标在桌面上,你可以用什么样的方法来组织它们,从而能够尽快地找想要的程序或文件?

8.当你不能确定一个文档存在何处时,如何搜索它?

9.打印机文件夹的作用是什么?

10.在什么情况下需要安装打印机?

11.说明本地打印机和网络打印机之间的区别。

12.设置默认打印机的作用是什么?

13.当一个文档送去打印时,后台打印程序在做什么?

14.在什么情况下把打印机状态更改为脱机状态很有用?

15.在一个打印作业被暂停之后,它可以继续或重启,继续和重启一个作业之间的主要区别是什么?

16.如果你意外地发送了200页文档去打印,怎样做才能使打印机停止打印?能力训练1.1

本节“能力训练”的目的是:

①提高对操作系统基础知识的认识。

②通过学习Windows系统管理工具的使用,熟悉Windows系统工具的内容,并由此进一步熟悉Windows操作系统的应用环境。

1.工具/准备工作

①在开始本训练之前,请回顾本节的相关内容。

②需要准备一台运行Windows 7操作系统的计算机。

2.训练内容与步骤(1)Windows管理工具

为了帮助用户管理和监视系统,Windows提供了多种系统管理工具,其中最主要的有计算机管理、事件查看器和性能监视器等。

步骤1: 登录Windows 7。

步骤2: 在Windows的“开始”菜单中单击“控制面板”命令,单击“管理工具”图标,打开窗口。

在“管理工具”组中,有哪些系统管理工具,其基本功能是什么(提示:可在工具栏中单击“帮助”按钮):

①___________________________________________________________________

②___________________________________________________________________

③___________________________________________________________________

④___________________________________________________________________

⑤___________________________________________________________________

⑥___________________________________________________________________

⑦___________________________________________________________________

⑧___________________________________________________________________

⑨___________________________________________________________________

⑩______________________________________________________________________________________________________________________________________________________________________________________________________(2)计算机管理

使用“计算机管理”可通过一个合并的桌面工具来管理本地或远程计算机,它将几个Windows管理实用程序合并到一个控制台目录树中,使管理员可以轻松地访问特定计算机的管理属性和工具。

在“管理工具”窗口中,双击“计算机管理”图标。“计算机管理”窗口与“Windows资源管理器”相似。用于导航和工具选择的控制台目录树中有“系统工具”“存储”及“服务和应用程序”等节点,窗口右侧的“名称”窗格中显示了工具的名称、类型或可用的子工具等。它们是:

①系统工具,填入表1-3中。

②存储,填入表1-4中。

表1-3 训练记录一

表1-4 训练记录二

③服务和应用程序,填入表1-5中。

表1-5 训练记录三(3)事件查看器

事件查看器不但可以记录各种应用程序错误、损坏的文件、丢失的数据及其他问题,还可以把系统和网络的问题作为事件记录下来。管理员通过查看在事件查看器中显示的系统信息,可以迅速诊断和纠正可能发生的错误和问题。

步骤1: 在“管理工具”窗口中,双击“事件查看器”图标。

在Windows事件查看器中,管理员可以查看到5种类型的本地事件日志,请填入表1-6中。

表1-6 训练记录四

步骤2: 在事件查看器中观察“应用程序和服务日志”:

本地计算机中,共有_____________个“应用程序和服务日志”事件。(4)性能监视器“性能监视器”工具通过图表、日志和报告,使管理员可以看到特定的组件和应用进程的资源使用情况。利用性能监视器,可以测量计算机的性能,识别及诊断计算机可能发生的错误,并且可以为某应用程序或者附加硬件制订计划。另外,当资源使用达到某一限定值时,也可以使用警报来通知管理员。

在“管理工具”窗口中,双击“性能监视器”图标。“性能监视器”窗口的“性能”目录树中包括的主要节点有:

①_______________________________

②_______________________________

③_______________________________

单击“监视工具”中的“性能监视器”节点,观察本地计算机的实际性能曲线。(5)服务

在“管理工具”窗口中,双击“服务”图标。

在本地计算机中,管理着_______________________________个系统服务项目。

通过观察,重点描述你所感兴趣的5个系统服务项目:

①______________________________________________________________

②______________________________________________________________

③______________________________________________________________

④______________________________________________________________

⑤______________________________________________________________(6)数据源(ODBC)

ODBC全称是Open Database Connectivity,即开放数据库互连。通过ODBC可以访问来自多种数据库管理系统的数据。例如,ODBC数据源会允许一个访问SQL数据库中数据的程序同时访问Access数据库中的数据。为此,必须为系统添加称为“驱动程序”软件组件。

步骤1: 在“管理工具”窗口中,双击“数据源(ODBC)”图标,打开“ODBC数据源管理器”对话框,请描述其中各选项卡的功能,填入表1-7中。

表1-7 训练记录

步骤2: 选择“驱动程序”选项卡,试分析,系统默认为个数据源安装了ODBC驱动程序,请通过观察,重点描述你所感兴趣的5个数据源默认项:

①______________________________________________________________

②______________________________________________________________

③______________________________________________________________

④______________________________________________________________

⑤______________________________________________________________

3.训练总结

______________________________________________________________

______________________________________________________________

______________________________________________________________

______________________________________________________________

4.教师评价

______________________________________________________________

______________________________________________________________

阅读与思考:人工智能之父——图灵

阿兰·麦席森·图灵(Alan Mathison Turing,1912.6.23—1954.6.7,见图1-8),生于英国伦敦,英国数学家、逻辑学家,被称为人工智能之父。1931年,图灵进入剑桥大学国王学院,毕业后到美国普林斯顿大学攻读博士学位,第二次世界大战爆发后回到剑桥大学,后曾协助军方破解德国的著名密码系统Enigma,帮助盟军取得了第二次世界大战的胜利。

图灵是计算机逻辑的奠基者,许多人工智能的重要方法也源自于这位伟大的科学家。他对计算机的重要贡献在于他提出的有限状态自动机,也就是图灵机的概念。对于人工智能,他提出了重要的衡量标准“图灵测试”,如果有机器能够通过图灵测试,那它就是一个完全意义上的智能机。杰出的贡献使他成为计算机界的第一人。现在,人们为了纪念这位伟大的科学家,将计算机界的最高奖定名为“图灵奖”。

上中学时,图灵在科学方面的才能就已经显示出来。少年图灵感兴趣的是数学等学科。在加拿大他开始了职业数学生涯,在大学期间他对前人现成的理论并不感兴趣,什么都要试验得出。大学毕业后,他前往美国普林斯顿大学,也正是在那里,他制造出了后来被称为图灵机的机器。图灵机被公认为现代计算机的原型,这台机器可以读入一系列的0和1,这些数字代表了解决某一问题所需要的步骤,按这个步骤走执行,就可以解决某一特定的问题。这种观念在当时是具有革命性意义的,因为在20世纪50年代,大部分的计算机只能解决某一特定问题,不是通用的,而图灵机从理论上却是通用机。在图灵看来,这台机器只用保留一些最简单的指令,一个复杂的工作只用把它分解为这几个最简单的操作就可以实现了,在当时能够具有这样的思想确实是很了不起的。他相信有一个算法可以解决大部分问题,而困难的部分则是如何确定最简单的指令集,怎样的指令集才是最少的,而且又有效,还有一个难点是如何将复杂问题分解为这些指令。

1936年,图灵向伦敦权威的数学杂志投了一篇论文,题为《论数字计算在决断难题中的应用》。在这篇开创性的论文中,图灵给“可计算性”下了一个严格的数学定义,并提出著名的“图灵机”(Turing Machine)的设想。“图灵机”不是一种具体的机器,而是一种思想模型,可制造一种十分简单但运算能力极强的计算装置,用来计算所有能想象得到的可计算函数。“图灵机”与“冯·诺依曼机”齐名,被永远载入计算机的发展史中。1950年10月,图灵又发表了另一篇题为《机器能思考吗》的论文,成为划时代之作。也正是这篇文章,为图灵赢得了“人工智能之父”的桂冠。1951年,图灵以杰出的贡献当选为英国皇家学会会员。

图1-8 图灵

就在图灵事业步入辉煌之际,灾难降临了。1952年,由于同性恋倾向,图灵离开了当时属于高度保密的英国国家物理实验室(NPL)。1954年6月8日,英国曼彻斯特,42岁的图灵,正逢他生命中最辉煌的创造顶峰。这天早晨,女管家走进他的卧室,发现台灯还亮着,床头上有一个苹果,只咬了一小半,图灵沉睡在床上,一切都和往常一样。但这一次,图灵永远地睡着了,不会再醒来……经过解剖,法医断定图灵是剧毒氰化物致死,那个苹果是在氰化物溶液中浸泡过的。图灵的母亲则说他是在做化学实验时,不小心沾上了氰化物,她的“艾伦”从小就有咬指甲的习惯。一代天才就这样走完了人生。

今天,苹果(Apple)电脑公司以咬了一口的苹果作为其商标图案(见图1-9),就是为了纪念这位伟大的人工智能领域的先驱者——图灵。

资料来源:百度百科(http://baike.baidu.com/)。

图1-9 苹果公司Logo1.2万维网与搜索引擎

网络中包含数以亿计的页面,它们存储在遍布世界各地的服务器上。要使用这些信息,就必须找到它们。Web浏览器软件主要为因特网用户提供客户服务软件的功能,可以访问很多类型的服务器。通过使用Web浏览器和Web搜索引擎,可以完成显示网页、在计算机间传输文件、访问商业信息服务、发送电子邮件,以及与其他因特网用户进行交互等操作。1.2.1 因特网与万维网

因特网(Internet),是由一些使用公用语言互相通信的计算机连接而成的网络,即广域网、局域网及单机按照一定的通信协议组成的国际计算机网络,始于1969年的美国,是一种比以往任何一种通信媒体都要快的公用信息的载体。

万维网(亦作Web、WWW、W3,全称为“World Wide Web”)是一个由许多互相链接的超文本组成的系统,通过因特网访问。在万维网系统中,每个有用的事物,都称为“资源”;并且由一个全局“统一资源标识符”(URI)标识;这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给用户,而后者通过单击链接来获得资源。万维网联盟(World Wide Web Consortium,W3C),又称W3C理事会。万维网联盟的创建者是蒂姆·伯纳斯·李。1994年10月在麻省理工学院计算机科学实验室成立。

20世纪60年代中期,“HTTP之父”Ted Nelson尝试设计一种可以存储文学档案的计算机系统,依照逻辑关系对它们进行连接,并且允许读者对他们所读文章进行评论和注释。他构思建立文档集合(即“超文本”),相互间使用一组“超文本链接”进行连接,读者可以通过这些“超文本链接”导航以查看某个主题的相关材料。但是,当时的商业机构对它并不欣赏:由谁来创建这些文档?有哪台计算机具有足够的能力来处理它?谁会有兴趣沿着超链接来寻找信息呢?除了学者和科学家,谁又会对在线通信感兴趣呢?因此,Nelson的方案没有成为现实。然而,二十多年之后,他的想法以万维网的形式重新出现了。

万维网于1990年出现在欧洲粒子物理研究所(CERN),一开始也没有引起一般人的关注。然而,数年后,新闻媒体对万维网开始感兴趣,大众也开始对它好奇。因特网是组成通信网络的大量电缆和网络互连设备,而万维网却是存储和提供信息的因特网服务。

对万维网的正式描述是:“一个可以提供全球接入的巨大的超媒体独立信息检索空间。”组成万维网的文档被称为网页,网页包含与特定主题相关的信息。一个网页可能还包含了指向其他网页的一个或多个链接。链接可以使你很容易就找到一系列相关的信息,即使它们存储在不同国家的计算机里。

万维网的出现加速了因特网的扩展。由于它简单、易用,而且信息来源是图形化的,所以人们都喜欢采用浏览网页的方式来寻找和交流信息。可以使用Web浏览器来请求某个Web服务器的网页,为此,输入一个URL地址或单击网页链接,服务器将网页的数据从因特网上传送到用户的计算机上。这些数据包括两部分:想浏览的网页信息和告诉浏览器怎样显示这些信息的说明。这些说明包括背景色、文本字体大小及图像的位置等。

万维网的内容始终在变化着,如新网站上线或旧网站被关闭等。所以,链接并不总是有效的。有时单击某个链接后可能没有任何反应,或者得到了错误的信息,这可能是因为Web服务器断线或网络异常繁忙等。一般来说,如果某个网页在15~20s后还没有出现,就可以停止其显示,过一段时间再尝试访问该网页。

所谓“主页”指的是Web站点的主要页面。大多数浏览器都允许用户选择某个网页作为自己的主页(例如自己最喜欢的搜索引擎等)。当沿着链接查询信息时,菜单和工具栏可以帮助用户导航万维网,并返回到前面的链接。在每次会话过程中,浏览器都会保存所访问网页的历史记录。1.2.2 Web门户网站

Web门户网站是提供一组流行Web服务的站点,如搜索引擎、电子邮件、聊天室,以及有关商店、新闻、天气和体育消息的链接等。

门户网站中的“门户”,是指在因特网上,把各种应用系统、数据资源和因特网资源统一集成到通用门户之下,根据每个用户使用特点和角色的不同,形成个性化的应用界面,并通过对事件和消息的处理,把用户有机地联系在一起,用户通过它开始自己的搜索、漫游和进行其他WWW活动。当用户启动浏览器时,所选择的门户网站就会自动载入,使熟悉的内容每次都出现在页面的同一位置上。言下之意,门户网站是用户通向因特网世界的大门,迈向网络社会获取信息资源及服务的第一步。门户网站通过集合众多内容,以及提供多样服务,成为网络用户的首选网站。同时,门户网站引导因特网用户前往其他目标网站,及时跟踪用户的使用兴趣爱好和行为,满足用户的需求。

政府门户网站是电子化公共服务的一个重要窗口,它通过高速接入因特网实现资源共享,为公众、企业或下属单位提供信息和服务,并使他们以最简便的操作方式,快速地找到自己所需要的服务和信息。在各种政府网站中,最重要也最具代表性的就是政府门户网站(例如杭州市政府门户网站http://www.hangzhou.gov.cn/)。1.2.3 搜索引擎基础

Web搜索引擎(简称“搜索引擎”,search engines)是指一种通过简单的关键字查询来帮助人们定位Web上的信息的程序。作为对查询的响应,搜索引擎会把结果以相关网站列表的形式显示出来,还含有指向源页面的链接以及包含关键字的简短摘录(见图1-10)。

换句话说,搜索引擎是对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息搜集、信息整理和用户查询3部分。

图1-10 对“山地车”的查询会返回相关网站链接的列表

搜索引擎也可以是一个网站,这种网站专门为用户提供信息检索服务,它使用特有的程序把因特网上的所有信息归类,以帮助人们在浩如烟海的信息海洋中搜寻到自己所需要的信息。常用的搜索引擎是存放在网站上的,如www.baidu.com、www.google.com、www.bing.com和www.ask.com等。这些站点上的搜索引擎和图书索引起着相同的作用。图书索引能帮助读者找到含有特定词语或概念的书页,而搜索引擎能帮助Web冲浪者链接到包含他们所找信息的网页。但与书本不同的是,Web上的信息量实在大得惊人,根本不能靠手工对其分类,而搜索引擎软件会自主完成这项工作。

搜索引擎按工作方式分为两类:一类是分类目录型的检索,把因特网中的资源收集起来,按资源的类型不同而分成不同的目录,再一层层地进行分类,人们要找自己想要的信息可按此分类一层层进入,就能找到自己想要的信息;另一类是基于关键字(Keyword)的检索,用户可以用逻辑组合方式输入各种关键字,搜索引擎服务器根据这些关键字寻找用户所需资源的地址,然后根据一定的规则将包含此关键字信息的所有网址和指向这些网址的链接反馈给用户。

一些诸如www.mahalo.com、answers.yahoo.com和www.chacha.com之类的搜索网站有时会被称为“人工搜索引擎”,因为搜索结果都是由相关专家(通常被称为“向导”)收集和筛选的。不过这些网站更适合分类为问答网站,因为它们会提供针对具体问题的回答,而不提供与关键词相关的网页的链接。

可以简单地认为www.google.com就是搜索引擎,但更确切地说,它是一个提供搜索引擎服务的网站。搜索引擎是在后台从Web上收集信息、编制索引、查找和排列信息的程序。

包括谷歌(Google)在内的一些网站使用的是自有版权的搜索引擎,而其他网站则会付费使用第三方搜索技术。例如微软的必应(Bing)搜索引擎就是使用了雅虎(Yahoo!)搜索的底层技术。

搜索引擎技术还可以与电子商务网站、信息网站和公司网站结合在一起,最常见的形式就是用来搜索网站内信息的查询工具栏。

搜索引擎包含以下4个组件:

①爬网程序(Web crawler):遍寻Web以收集表示网页内容的数据。

②索引器:处理爬网程序收集来的信息,将其转换成存储在数据库中的关键字和URL。

③数据库:存储数以十亿计网页的索引引用。

④查询处理器:允许用户通过输入关键字访问数据库,然后会产生一个网页列表,列表中包含与查询相关的内容。

下面研究各个组件,弄清楚它们对用户从Web挖掘信息的能力有何影响。(1)爬网程序

爬网程序也叫蜘蛛程序(Web spider),它是一种能有条不紊地自动访问网站的计算机程序。爬网程序可以在它们访问网站时进行各种活动,不过对搜索引擎来说,爬网程序只会下载网页,并将其提交给索引程序处理。

爬网程序会从一个可访问URL的列表开始,在复制完指定URL的材料后,会查找超文本链接并将其添加到这个可访问URL的列表。为了尽可能高效地覆盖Web,爬网程序可以并行地进行多个处理。尖端的算法可以保证处理不重叠、不陷入死循环,并且不会试图抓取由服务器端脚本动态生成的网页。高性能的爬网程序每天能访问数以亿计的网页,但那些页面却只是整个Web的冰山一角。据研究人员估计,即使是覆盖面最广的搜索引擎也只能覆盖Web不到20%的部分。每一种搜索引擎所关注的网站集都有细微差别。在不同搜索引擎中输入相同的搜索会产生不同的结果,所以有时尝试多种搜索引擎是很值得的。

爬网程序通常不会从不可见的网站上收集材料,所谓不可见是指需要利用受保护密码登录的页面,或是由服务器端脚本动态生成的页面。

动态生成的网页潜在的数量(如Amazon.com根据它的库存数据库可能生成的所有页面)巨大,要编索引根本不可行。如果要访问与电子商务商品或图书目录相关的信息,就可能需要直接访问商家或图书馆的网站,并使用它们提供的本站搜索工具。

在用户查询搜索引擎时,会希望结果是最新的,这样就不会把时间浪费在那些指向已更改或已被删除的网页链接上。搜索引擎会使用多种算法来刷新它们的索引。

搜索引擎的爬网程序访问网页的次数各有不同,这取决于多种因素,如页面的更新频度和网站的受欢迎程度等。不重要的页面可能一个月仅被访问一次,而新闻网站的页面则每天都会被访问。(2)索引器

搜索引擎索引器是指从网页中取出关键字并将其存入索引数据库的软件。索引器的作用就是让根据内容查找网页的过程变得更为简单。例如,山地自行车网站的网页可能包含与自行车、装备、骑行和小径路线图有关的信息。可以协助为这些网页分类以便以后访问的关键词包括“山地”“自行车”“小径”“方向”“装备”“建议”“骑车出游”等。(3)查询处理器

搜索引擎的查询处理器会在搜索引擎索引化的数据库中查找搜索项,并返回相关网站列表。在响应搜索所生成的网站列表中,网站的顺序取决于相关度标准,如关键字匹配和链接流行度。为搜索所输入的单词可以叫做查询、搜索条件、搜索项或关键字。

如果搜索是基于多个关键字进行的,那么包含最多匹配词的页面会先被显示。链接流行度是度量从一个网页到其他网页的链接数量和质量的标准。带有流行网站链接的页面往往会获得更高的相关度评分。(4)页面排序

将网站添加到搜索引擎索引中的方法有多种。搜索引擎的爬网程序可以自动找到网站,而管理着许多网站的网站管理员可以向搜索引擎提交网站,也可以通过竞价排名的形式提交网站,或者以标题广告或弹窗广告的形式提交。

大多数搜索引擎都具有简单的网站URL提交过程,所以网站管理员不必等着爬网程序来找到他们的网站。手工提交的网站会被添加到爬网程序的可访问网站列表中,并最终被添加进索引。

一些不良网站的运营者会不时尝试谋划一些阴谋,如操纵网页的描述关键字,使得他们的网站移动到搜索引擎查询结果列表的上部。描述关键字(meta keyword)是指在制作网页时输入到网页头部中用于描述页面内容的文本。

关键字堆砌是一种通过操纵描述关键字以获得高的相关度排名的不道德行为。例如,网页中可能包括某个描述关键字,但实际上这个网页中几乎没有关于这个词语的信息。

对社会负责的搜索引擎网站要采取措施阻止操纵排名的行为,并且应该向用户制定付费广告的策略。在使用搜索引擎时,最好查看它的“关于”(About)页面以了解它的广告排名策略,并判断是否可以相信搜索结果是公正的。

一些搜索引擎接受付费广告,会将付费过的广告放在结果列表的上部。还有一些接受付费广告的搜索引擎,会将广告放在一个特别划定的区域中。1.2.4 形成搜索

多数搜索引擎处理的是关键字查询,在这些关键字查询中会含有与用户需要查找的信息相关的一个或多个称为“搜索项”的单词。例如,如果用户对蝙蝠侠(Batman)漫画很感兴趣,就可以直接输入“蝙蝠侠”进行搜索(见图1-11)。

图1-11 简单的查询有时可以产生无数个结果

在形成查询时,要记住以下简单指南:

①多数搜索引擎是不区分大小写的,所以在输入专有名称时不必使用【Shift】键。

②搜索引擎通常会忽略一些常用词,如英语查询时的and、a和the,所以在查询中不用输入这些单词。

③顶级的搜索引擎使用关联搜索技术,会查找所输入的关键字的复数形式或其他派生词,例如,如果输入diet,搜索引擎也会查找含有diets、dietary和dietician等词语的页面。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书

若在网站上没有找合适的书籍,可联系网站客服获取,各类电子版图书资料皆有。

客服微信:xzh432

登入/注册
卧槽~你还有脸回来
没有账号? 忘记密码?