2017年9月全国计算机等级考试《数据库工程师(四级)》复习全书【核心讲义+历年真题详解】(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-26 16:55:15

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

2017年9月全国计算机等级考试《数据库工程师(四级)》复习全书【核心讲义+历年真题详解】

2017年9月全国计算机等级考试《数据库工程师(四级)》复习全书【核心讲义+历年真题详解】试读:

第一部分 备考指南

第1章 考试概述

一、考试简介

全国计算机等级考试(National Computer Rank Examination,简称NCRE),是经原国家教育委员会(现教育部)批准,由教育部考试中心主办,面向社会,用于考查应试人员计算机应用知识与技能的全国性计算机水平考试体系。

计算机技术的应用在我国各个领域发展迅速,为了适应知识经济和信息社会发展的需要,操作和应用计算机已成为人们必须掌握的一种基本技能。许多单位、部门已把掌握一定的计算机知识和应用技能作为人员聘用、职务晋升、职称评定、上岗资格的重要依据之一。鉴于社会的客观需求,经原国家教委批准,原国家教委考试中心于1994年面向社会推出了NCRE,其目的在于以考促学,向社会推广和普及计算机知识,也为用人部门录用和考核工作人员提供一个统一、客观、公正的标准。

二、考试科目级科目代考试时考核课程代科目名称别码间码计算机基础及WPS 1490分钟114Office应用一计算机基础及MS Office1511590分钟级应用计算机基础及Photoshop1611690分钟应用120分C语言程序设计24201、224钟二级120分VB语言程序设计26201、226钟120分VFP数据库程序设计27201、227钟120分Java语言程序设计28201、228钟120分29201、229Access数据库程序设计钟120分61201、261C++语言程序设计钟120分MySQL数据库程序设计63201、263钟120分Web程序设计64201、264钟120分MS Office高级应用65201、265钟120分网络技术35335钟120分36336数据库技术钟三120分37337软件测试技术级钟120分信息安全技术38338钟120分嵌入式系统开发技术39339钟网络工程师4190分钟401、403数据库工程师4290分钟404、405四级软件测试工程师4390分钟401、40544401、403信息安全工程师90分钟嵌入式系统开发工程师4590分钟401、402

说明:

同次考试考生可报考多个级别或科目,但不允许重复报考同一个科目,具体要求请想所在省级承办机构进行咨询。

报考多个科目时需咨询考点,避免考场安排时冲突。如:考生同时报考了二级C、三级网络技术、四级网络工程师三个科目,结果通过了三级网络技术、四级网络工程师考试,但没有通过二级C考试,将不颁发任何证书,三级网络技术、四级网络工程师两个科目成绩,自考试结束之日起可保留半年(按月计算)。下一次考试考生报考二级C并通过,将一次获得三个级别的证书;若没有通过二级C,将不能获得任何证书。同时,三级网络技术、四级网络工程师两个科目成绩自动失效。

三、报考条件

1.考生不受年龄、职业、学历等背景的限制,任何人均可根据自己学习和使用计算机的实际情况,选考不同等级的考试。考生一次只能报考一个科目的考试。考生一次考试只能在一个考点报名。考生可以不参加考前培训,直接报名参加考试。

2.每次考试报名的具体时间由各省(自治区、直辖市)级承办机构规定。考生按照有关规定到就近考点报名。上次考试的笔试和上机考试仅其中一项成绩合格的,下次考试报名时应出具上次考试成绩单,成绩合格项可以免考,只参加未通过项的考试。

3.特殊人员报考条件:

现役军人可使用军官证报考NCRE考试,在其军官证号码前后各加入识别码,此办法也适用于没有身份证的未成年人,识别码的编码有统一格式,前6位后4位。国务院和中央军事委员会联合下发的510号令,已经公布《现役军人和人民武装**居民身份证申领发放办法》,该办法自2008年1月1日起实施,现役军人可以通过团以上单位集中向地方公安机关申请居民身份证。

无身份证的学生可携带户口本参加报名,身份证丢失者凭公安机关开具的身份证明,外籍人员凭护照参加报名。

四、报考方式

分为考点现场报名与网上报名。

考生在考点现场报名时,需出示身份证以及缴纳相关的考试费。考生一定要亲自到场,不能由任何单位、个人代劳。考生按要求进行信息采集,并逐一核实报名表上的个人信息:姓名、身份证号、照片、报考科目、报考类别(是否补考)等,发现信息不一致要立刻更改。报名完成后请妥善保管“考生报名登记表”防止阻碍准考证的领取。

考生采取网上报名方式,需先在所在省份的网上报名系统注册并填报相关基本信息、上传正面免冠电子近照,然后网上缴费或至指定地点缴费并确认身份信息,完成报名。

一般情况下,每次考试每个考生只能在一个考点完成报名。

考生报名时缴纳的考试费的具体金额由各省级承办机构根据考试需要和当地物价水平确定,并报当地物价部门核准。考点不得擅自加收费用。

注:报名时依据的身份证明包括:居民身份证、军人的证件、护照、户口本等。

五、报考时间

上半年报名一般在11月至第二年1月之间;下半年报名一般在5月至7月之间。每次考试报名的具体时间由各省(自治区、直辖市)级承办机构规定。

注:各地的报名时间由考生报考所在地的当地考试机构决定。

六、考试时间

NCRE以往每年开考两次,从2014年开始每年开考次数由两次增为三次。

2016年NCRE安排三次考试,考试时间分别为3月26日~29日、9月24日~27日、12月10,其中3月和9月考试开考全部级别全部科目,12月只开考一级和二级,由各省级承办机构根据实际情况确定是否开考12月的考试。

七、各级别考试介绍一级科一级WPS Office一级MS Office一级Photoshop目考试NCRE一级上机考试环境为Windows 7简体中文版环境考Photoshop CS5试WPS Office 2012办MS Office 2010软公软件(典型方式安装)件1.单项选择题,1.单项选择题,2020题,20分题,20分2.Windows操作系2.Windows操作系统统的使用,10分的使用,10分题3.Word操作,251.单项选择题,3.WPS文字的操型分55题,55分(含作,25分及计算机基础知识4.Excel操作,20分部分20分)4.WPS表格的操分值作,20分2.Photoshop操作比5.PowerPoint操题,45分5.WPS演示软件的例作,15分操作,15分6.浏览器(IE)6.浏览器(IE)的的简单使用和电简单使用和电子邮子邮件收发,10件收发,10分分1.考核内容包括计算机基础知识和操作技能两部分。2.各科目对基础知识的要求相同,以考查应知应会为主,题型为选择题,分数占全卷的20%(20分)。考3.办公软件类考试,操作技能部分包括汉字录入、Windows核系统使用、文字排版、电子表格、演示文稿、IE的简单应用及内电子邮件收发。容3.Photoshop考试,要求了解数字图像的基本知识,熟悉Photoshop的界面与基本操作方法,掌握并熟练运用绘图工具进行图像的绘制、编辑、修饰,会使用图层蒙版、样式以及文字工具。形完全采取上机考试形式,各科上机考试时间均为90分钟,满式分100分。获证总分不低于60分。条件参加NCRE“计算机基础及Photoshop应用”科目考生,可以在NCRE报名时自愿申请免试取得“Adobe Photoshop产品工备程师认证”证书,即:通过NCRE“计算机基础及Photoshop注应用”科目考试实现一次考试,可以同时取得全国计算机等级证书与“Adobe Photoshop产品工程师认证”证书,即“一考双证”。二级数据库程序办公软件高语言程序设计类设计类级应用MAVyC科JaVWcc办公软件高C语言FS+目vaBebes级应用PQ+sL考试NCRE 二级上机考试环境为 Windows 7 简体中文版环境NeNtBMeteay-nsVSV中FQBBVi国PLM6.easu教6.(S 0 nsal育0 C考A简Visual考简o试ccMS Office 中C体试体m软es2010国C++ 6.0+中版中m件s2教+ 文,文un01育6.专IE专ity0考0业6.业 5.试版0 版5.版及1620以)07上1.单项选择题,20分1.单项选(含公共基择题,40础知识部分题,40分10分)(含公共基础知识部分2.文字处题1.单项选择题,40题,40分10分)理题型(含公共基础知识部分10分)(Word),及2.程序填2.基本操作题,18分30分分空题,3小值空,18分3.简单应用题,24分3.电子表比格题3.程序改4.综合应用/操作题,18分例(Excel),错题,2个30分错误,24分4.演示文4.程序设稿题计题,18分(PowerPoint),20分二级定位为程序员,考核内容包括公共基础知识和程序设考计。所有科目对基础知识作统一要求,使用统一的公共基础核知识考试大纲和教程。二级公共基础知识在各科考试选择题内中体现。程序设计部分,主要考查考生对程序设计语言使用容和编程调试等基本能力,在选择题和操作题中加以体现。形完全采取上机考试形式。各科上机考试时间均为120分钟,满式分100分。获证总分不低于60分条件三级嵌入式系科数据库技软件测试信息安全网络技术统开发技目术技术技术术考试环1.NCRE三级上机考试环境为 Windows 7 简体中文版境2.数据库技术考核C语言程序设计,使用 Visual C++ 6.0与软件题型1.单选题,40题,40分及分2.综合题,40分值3.应用题,20分比例1.网络技术。网络规划与设计、局域网组网技术、计算机网络信息服务系统的建立及计算机网络安全与管理。2.数据库技术。数据库应用系统分析及规划、数据库设计及实现、数据库存储技术、并发控制技术、数据库管理与维护、数据库技术的发展及新技术。考3.软件测试技术。软件测试的基本概念、软件测试技术、软核件测试过程和管理方法。内容4.信息安全技术。信息安全保障概论、信息安全基础技术与原理、系统安全、网络安全、应用安全、信息安全管理、信息安全标准与法规。5.嵌入式系统开发技术。嵌入式系统的概念与基础知识、嵌入式处理器、嵌入式系统硬件组成、嵌入式系统软件、嵌入式系统的开发等相关知识和技能。形完全采取上机考试形式。各科上机考试时间均为120分钟,满式分100分。1.总分不低于60分,并已经(或同时)获得二级相关证书。2.三级数据库技术证书要求已经(或同时)获得二级数据库获程序设计类证书;网络技术、软件测试技术、信息安全技证术、嵌入式系统开发技术等四个证书要求已经(或同时)获条得二级语言程序设计类证书。件3.考生早期获得的证书(如Pascal、FoxBase等),不严格区分语言程序设计和数据库程序设计,可以直接报考并获得证书。参加NCRE“计算机基础及Photoshop应用”科目考生,可以在NCRE报名时自愿申请免试取得“Adobe Photoshop产品工备程师认证”证书,即:通过NCRE“计算机基础及Photoshop注应用”科目考试实现一次考试,可以同时取得全国计算机等级证书与“Adobe Photoshop产品工程师认证”证书,即“一考双证”。四级嵌入式系科网络工程数据库工软件测试信息安全统开发工目师程师工程师工程师程师考试NCRE四级上机考试环境为Windows 7简体中文版。环境题型及1.单选题,60题,60分分2.多选题,20题,40分值比例1.网络工程师。考核计算机网络、操作系统原理两门课程。测试内容包括网络系统规划与设计的基础知识及中小型网络的系统组建、设备配置调试、网络系统现场维护与管理的基本技能。2.数据库工程师。考核数据库原理、软件工程两门课程。测试内容包括数据库系统的基本理论以及数据库设计、维护、管理与应用开发的基本能力。考3.软件测试工程师。考核操作系统原理、软件工程两门课程。核测试内容包括软件测试的基本理论、软件测试的规范及标内准,以及制定测试计划、设计测试用例、选择测试工具、执容行测试并分析评估结果等软件测试的基本技能。4.信息安全工程师。考核计算机网络、操作系统原理两门课程。测试内容包括网络攻击与保护的基本理论与技术,以及操作系统、路由设备的安全防范技能。5.嵌入式系统开发工程师。考核操作系统原理、计算机组成与接口两门课程。测试内容包括嵌入式系统基本理论、逻辑电路基础以及嵌入式系统中的信息表示与运算、评价方法等基本技能。1.无纸化考试,考试总时间为90分钟,单课程考试没有时间要求。2.四级考试科目由五门专业基础课程中指定的两门课程组形成,总分100分,两门课程各占50分。式3.专业基础课程为计算机专业核心课程,包括:操作系统原理、计算机组成与接口、计算机网络、数据库原理、软件工程。两门课程分别达到30分及以上,并已经(或同时)获得三级获相关证书。证条2013年3月及以前获得的三级各科目证书,不区分科目,可以件作为四级任一科目的获证条件。参加NCRE“计算机基础及Photoshop应用”科目考生,可以在NCRE报名时自愿申请免试取得“Adobe Photoshop产品工备程师认证”证书,即:通过NCRE“计算机基础及Photoshop注应用”科目考试实现一次考试,可以同时取得全国计算机等级证书与“Adobe Photoshop产品工程师认证”证书,即“一考双证”。

·2015年NCRE继续实施2013年版考试大纲,教材参见全国计算机等级考试教材目录(2015年版)。

八、考试要求

1.掌握操作系统的基本概念、基本结构及运行机制。

2.深入理解进程线程模型,深入理解进程同步机制,深入理解死锁概念及解决方案。

3.掌握存储管理基本概念,掌握分区存储管理方案,深入理解虚拟页式存储管理方案。

4.深入理解文件系统的设计、实现,以及提高文件系统性能的各种方法。

5.了解I/O设备管理的基本概念、I/O软件组成,掌握典型的I/O设备管理技术。

6.了解操作系统的演化过程、新的设计思想和实现技术。

九、考试内容(一)操作系统概述

1.操作系统基本概念、特征、分类

2.操作系统主要功能

3.操作系统发展演化过程,典型操作系统

4.操作系统结构设计,典型的操作系统结构(二)操作系统运行机制

1.内核态与用户态

2.中断与异常

3.系统调用接口

4.存储系统

5.I/O系统

6.时钟(Clock)(三)进程线程模型

1.并发环境与多道程序设计

2.进程的基本概念,进程控制块(PCB)

3.进程状态及状态转换

4.进程控制:创建、撤消、阻塞、唤醒,fork()的使用

5.线程基本概念,线程的实现机制,Pthread线程包的使用

6.进程的同步与互斥:信号量及PV操作,管程

7.进程间通信

8.处理机调度(四)存储管理方案

1.存储管理基本概念,存储管理基本任务

2.分区存储管理方案

3.覆盖技术与交换技术

4.虚存概念与虚拟存储技术

5.虚拟页式存储管理方案(五)文件系统设计与实现技术

1.文件的基本概念、文件逻辑结构、文件的物理结构和存取方式

2.文件目录的基本概念,文件目录的实现

3.文件的操作,目录的操作

4.磁盘空间的管理

5.文件系统的可靠性和安全性

6.文件系统的性能问题

7.Windows的文件系统FAT,UNIX的文件系统(六)I/O设备管理

1.设备与设备分类

2.I/O硬件组成

3.I/O软件的特点及结构

4.典型技术:通道技术,缓冲技术,SPOOLing技术

5.I/O性能问题及解决方案(六)死锁

1.基本概念:死锁,活锁,饥饿

2.死锁预防策略

3.死锁避免策略

4.死锁检测与解除

5.资源分配图

十、成绩及证书

1.NCRE实行百分制计分,但以等第通知考生成绩。等第共分优秀、及格、不及格三等。90~100分为优秀、60~89分为及格、0~59分为不及格。一般在考后30个工作日内由教育部考试中心将成绩处理结果下发给各省级承办机构。考后50个工作日,考生可登录教育部考试中心综合查询网(chaxun.neea.edu.cn)进行成绩查询。部分省市如江苏、黑龙江等也可通过省市考试院或者人事考试中心进行查询。

2.NCRE成绩在及格以上者,由教育部考试中心颁发合格证书。考后45个工作日教育部考试中心将证书发给各省级承办机构,然后由各省级承办机构逐级转发给考生。考生证书若丢失,可登录教育部考试中心综合查询网补办合格证明书。补办合格证明书收费21元,其中制证、邮寄费用20元,银行收取手续费1元。

3.NCRE合格证书式样按国际通行证书式样设计,用中、英两种文字书写,证书编号全国统一,证书上印有持有人身份证号码。该证书全国通用,是持有人计算机应用能力的证明,也可供用人部门录用和考核工作人员时参考。

一级证书表明持有人具有计算机的基础知识和初步应用能力,掌握Office办公自动化软件的使用及因特网应用,或掌握基本图形图像工具软件(Photoshop)的基本技能,可以从事政府机关、企事业单位文秘和办公信息化工作。

二级证书表明持有人具有计算机基础知识和基本应用能力,能够使用计算机高级语言编写程序,可以从事计算机程序的编制、初级计算机教学培训以及企业中与信息化有关的业务和营销服务工作。

三级证书表明持有人初步掌握与信息技术有关岗位的基本技能,能够参与软硬件系统的开发、运维、管理和服务工作。

四级证书表明持有人掌握从事信息技术工作的专业技能,并有系统的计算机理论知识和综合应用能力。

第2章 复习技巧

一、备考指导

1.勇往直前

进入下午考试,也许有疲劳或不好的感觉,自信心就会下降;当看到题干很长,操作较复杂的题时,就有想回避或焦虑、急躁的情绪。这是典型的“两军未战,兵先屈”的败兴思绪。要知道两对手相遇勇者胜,勇者相遇智者胜。抛开所有不必要的想法,相信自己的实力,做到心无旁鹜,勇往直前。

2.审清题干

题干包含了整个题目的条件和要求,若题干比较复杂,就要注意将题干“分段”来阅读,前后注意衔接,必要时在草稿纸上记载下关键点。有时候题干很长,看似很复杂,让很多人望而却步。其实,这种题更好解,因题干长了则提示信息也就多了。主要是考你有没有勇气和耐心。

3.解读试题

首先,要翻阅一下全部试卷,注意试题的时间及分数的分配情况,做到心中有数。

其次,要确实弄清楚每道题的题意,搞清楚题目所给予问题,明确题目要求。因为考试要求可能与自己习惯的答题要求有所不同,所以一定要按题意和要求去回答。

最后,要特别注意题目中比较隐蔽的条件。一般而言,条件隐蔽的问题难度较大,考生必须看清有关的线索,找出隐蔽条件,问题才能迎刃而解。

4.相信自己

当题做得非常顺利时,心里不要太得意,因为越是看似容易的题目越是错的多,当然也不要逆向思维,觉得这题这么简单是不是做错了,要相信自己,说到底还是要审清题目的意思;

二、题型分析

1.选择题

选择题为单选题,是客观性试题,试题覆盖面广,一般情况下考生不可能做到对每个题目都有把握答对。这时,就需要考生学会放弃,即不确定的题目不要在上面花费太多的时间,应该在此题上做上标记,立即转移注意力,作答其他题目。最后有空余的时间再回过头来仔细考虑此题。但要注意,对于那些实在不清楚的题目,就不要浪费时间了,放弃继续思考,不要因小失大。

绝大多数选择题的设问是正确观点,称为正面试题;如果设问是错误观点,称为反面试题。考生在作答选择题时可以使用一些答题方法,以提高答题准确率。(1)正选法(顺选法):如果对题肢中的4个选项,一看就能肯定其中的1个是正确的,就可以直接得出答案。注意,必须要有百分之百的把握才行。(2)逆选法(排谬法):逆选法是将错误答案排除的方法。对题肢中的4个选项,一看就知道其中的1个(或2个、3个)是错误的,可以使用逆选法,即排除错误选项。(3)比较法(蒙猜法):这种办法是没有办法的办法,在有一定知识基础上的蒙猜也是一种方法。

2.操作题

上机考试重点考察考生的基本操作能力,要求考生具有综合运用基础知识进行实际操作的能力。上机操作题综合性强、难度较大。上机考试的评分是以机评为主,人工复查为辅的。机评当然不存在公正性的问题,但却存在呆板的问题,有时还可能因为出题者考虑不周出现错评的情况。考生做题时不充分考虑到这些情况,就有可能吃亏。

掌握好上机考试的应试技巧,可以使考生的实际水平在考试时得到充分发挥,从而取得较为理想的成绩。历次考试均有考生因为忽略了这一点,加之较为紧张的考场气氛影响了水平的发挥,致使考试成绩大大低于实际水平。因此每个考生在考试前,都应有充分的准备。总结以下几点供考生在复习和考试时借鉴:(1)对于上机考试的复习,切不可“死记硬背”

根据以往考试经验,有部分考生能够通过笔试,而上机考试却不能通过,主要原因是这部分考生已经习惯于传统考试的“死记硬背”,而对于真正的知识应用,却显得束手无策。为了克服这个弊病,考生一定要在熟记基本知识点的基础上,加强上机训练,从历年试题中寻找解题技巧,理清解题思路,将各类典型试题反复练习。(2)在考前,一定要重视等级考试模拟软件的使用

在考试之前,应使用等级考试模拟软件进行实际的上机操作练习,尤其要做一些具有针对性的上机模拟题,以便熟悉考试题型,体验真实的上机环境,减轻考试时的紧张程度。(3)学会并习惯使用帮助系统

大部分软件都有较全面的帮助系统,熟练掌握帮助系统,可以使考生减少记忆量,解决解题中的疑难问题。(4)熟悉考试场地及环境

尤其是要熟悉考场的硬件情况和所使用的相关软件的情况。考点在正式考试前,会给考生提供一次模拟上机的机会。模拟考试时,考生重点不应放在把题做出来,而是放在熟悉考试环境,相应软件的使用方法,考试系统的使用等方面。(5)做上机题时要不急不燥,认真审题

先分析,后操作。明白了问题是什么以后,先把问题在脑海里过一遍,考虑好如何操作后,再依思路从容做答。而不要手忙脚乱、毛毛躁躁、急于作答。对于十分了解或熟悉的问题,切忌粗心大意、得意忘形、而应认真分析,必须将题目给出的全部内容逐字看清楚后针对具体问题进行操作。

常言道“熟能生巧”、“打铁还得本身硬”,再好的方法与技巧若没有基础,是发挥不了作用的;如若有了一定的功底,再差的招式也会产生很大的威力,就像金庸小说中杨过的那柄钝剑。但是如果只看不练,不会有提高。建议大家多做模拟试题和历年试题,锻炼解题的能力与节奏。

第二部分 核心讲义

【数据库原理】

第1章 数据库原理概述

一、数据库技术基本概念

1.信息、数据与数据处理(1)信息(Information)

信息是现实世界事物的存在方式或运动状态的反映,信息具有特定的语义,具有可感知、可存储、可加工、可传递和可再生等自然属性,是社会上各行各业不可缺少的具有社会属性的资源。(2)数据(Data)

数据是描述现实世界事物的符号记录,是指用物理符号记录下来的可以鉴别的信息。物理符号包括数字、文字、图形、图像、声音及其他特殊符号。数据的各种表现形式,都可以经过数字化后存入计算机。(3)信息与数据的关联

数据是信息的符号表示,或称载体;信息是数据的内涵,是数据的语义解释。信息与数据是密切相关联的。构成一定含义的一组数据称为信息,信息通过数据描述,又是数据的语义解释。

例如:2012-12000  某校2012年学生入学人数为12000

数据 信息

尽管信息与数据两者在概念上不尽相同,但在某些不需要严格分辨的场合,也可以把两者不加区分地使用,例如信息处理也可以说成数据处理。(4)数据处理的基本环节

用数据表示原始信息,称为源数据。对这些源数据进行汇集、存储、综合、推导,从这些原始、杂乱、难以理解的数据中抽取或推导出新的数据,这些新的数据称为结果数据,它们表示了新的信息,是有价值、有意义的,提供给某些特定的人使用,可以作为某种决策的依据或用于新的推导。这一过程通常称为数据处理或信息处理。

信息是有价值的,信息的价值与它的准确性、及时性、完整性和可靠性有关。信息的价值必须通过使用信息的决策者的行为结果来体现,要用科学的方法来管理用于表示信息的数据,这种科学的方法就是数据库技术。

2.数据库、数据字典、数据库管理系统、数据库系统(1)数据库(Database,DB)“数据库”可理解为是在计算机存储设备中按一定格式存放数据的仓库。

数据库是按一定结构组织并可以长期存储在计算机内的、在逻辑上保持一致的、可共享的大量相关联数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为在一定组织范围内的各种用户所共享。(2)数据字典(Data Dictionary,DD)

数据库中的数据通常可以分为用户数据和系统数据两个部分。用户数据是用户使用的数据;系统数据也称数据字典,包括对数据库的描述信息、数据库的存储管理信息、数据库的控制信息、用户管理信息和系统事务管理信息等。所以,数据字典也称系统目录或元数据。(3)数据库管理系统(Database Management System,DBMS)

数据库管理系统是位于用户与操作系统之问的一个定义(Defining)、操纵(Manipulating)、管理(Managementing)、构建(Constructing)和维护(Maintaining)数据库的系统软件,是数据库和用户之间的一个接口,并为不同用户和应用程序共享(Sharing)数据库提供便利。在DBMS的支持下,用户可以方便地定义数据库中的数据;可以对数据库的数据执行查询、插入、删除、更新等基本操作;统一管理和控制数据库的建立、运行和维护,以保证数据库中数据的安全性、完整性、多用户对数据的并发使用、发生故障后的系统恢复、事务支持;数据库的重组织和性能监视、分析;等等。(4)数据库系统(Database System,DBS)

数据库系统是指在计算机系统中引入数据库后的系统,如图1-1所示,一般由用户数据库、操作系统、数据库管理系统、应用开发工具、应用系统、数据库管理员和数据库用户构成。应当指出的是,数据库的建立、使用和维护等工作只靠一个DBMS远远不够,还要有专门的人员来完成,这些人被称为数据库管理员(Database Administrator,DBA)。

在一般不引起混淆的情况下常常把数据库系统简称为数据库。图1-1  一个简化的数据库系统示意图

①数据库系统中的硬件平台

a.硬件组成

包括计算机和网络设备。

计算机是硬件的基础平台,常用的有微型机、小型机、中型机、大型机和巨型机;

网络设备结构形式主要有单机集中方式、客户机/服务器方式、浏览器/服务器方式及分布方式。

b.数据库系统对硬件资源要求

有足够大的内存存放操作系统、DBMS的核心模块、数据缓冲区和应用程序。

有足够大的磁盘等直接存取设备存放数据库,有足够的进行数据备份的设备。

系统有较高的通信能力,以提高数据传送率。

②数据库系统中的软件平台

DBMS:为数据库的建立、使用和维护而配置的软件。

支持DBMS运行的操作系统(OS)或网络操作系统(NOS)。

具有与数据库接口的高级语言及其编译系统,便于开发应用程序。

以DBMS为核心的应用开发工具。

为特定应用环境开发的数据库应用系统。

③人员

数据库系统中的人员包括:数据库管理员、系统分析员和数据库设计人员、应用程序员和最终用户。不同的人员涉及不同的数据抽象级别,具有不同的数据视图。

3.数据库系统中的人员

不同的人员涉及不同的数据抽象级别,具有不同的数据视图,如图1-2所示。图1-2  数据库系统中各类人员的数据视图(1)数据库管理员(Database Administrator,DBA)

数据库管理员的职责包括:

①确定数据库中的信息内容和结构。

②确定数据库的存储结构和存取策略(选择索引)。

③定义数据的安全性要求和完整性约束。

④监控数据库的使用和运行。

⑤数据库的性能改进。选择创建及维护哪些索引,属于物理数据库设计与调优的范畴,这也是DBA的职责之一。

⑥定期对数据库进行重组或重构,以提高系统的性能。(2)系统分析员和数据库设计人员

系统分析员的职责包括:

①负责应用系统的需求分析和规范说明。

②确定系统的硬软件配置并参与数据库系统的概要设计。

数据库设计人员具体的职责包括:

①参加用户需求调查和系统分析。

②负责数据库中数据的确定、数据库各级模式的设计。

在一般情况下,这两种工作可都由数据库管理员担任。(3)应用程序员

应用程序员负责设计和编写应用系统的程序模块,并进行调试和安装。(4)用户

指最终用户(End User),他们通过应用系统的用户接口使用数据库。常用的接口方式有浏览器、菜单驱动、表格操作、图形显示、报表书写等。

二、数据管理技术的产生与发展

数据管理技术是指对数据的分类、组织、编码、存储、检索和维护的技术。数据管理技术是应数据管理任务的需求而产生的。数据管理技术的发展和计算机技术及其应用的发展联系在一起,经历了人工管理、文件系统和数据库系统三个阶段。表1-1对数据管理技术发展的三个阶段进行了比较。表1-1  数据管理技术发展的三个阶段的比较人工管理阶文件系统阶段数据库系统阶段(20段(20世纪(20世纪50年世纪60年代后期以50年代中期代后期到60年来)以前)代中期)应用科学计算、数科学计算大规模管理背景据管理背硬件无直接存取大容量磁盘、磁盘阵磁盘、磁鼓景背景存储设备列软件没有操作系有文件系统有数据库管理系统背景统特处理联机实时处联机实时处理、分布批处理方式理、批处理处理、批处理点数据用户(程序的管文件系统数据库管理系统员)理者数据面向某一应用程现实世界中的某个部某一应用的对序门、企业、组织等象数据的共无共享、冗共享性差、冗共享性高、冗余度小享程余度极大余度大度数据不独立,完具有高度的物理独立的独全依赖于程独立性差性和一定的逻辑独立立性序性整体结构化,用数据数据记录内有结模型的结无结构构、整体无结构化构描述由数据库管理系统提数据应用程序自应用程序自己供数据安全性、完整控制己控制控制性、并发控制和恢复能力能力

为了解决多用户、多应用共享数据,使数据为尽可能多的应用服务,一种新的数据管理技术——数据库技术应运而生,并发生了对数据库技术有着奠基作用的三件大事:

①1968年美国的IBM公司推出了第一个数据库管理系统IMS,它是基于层次模型的数据库管理系统。

②1969年美国数据库系统语言协会(CODASYL)的数据库任务组(DBTG)发表了网状数据模型的DBTG报告。

③1970年美国IBM公司的高级研究员E.F.Codd提出了关系数据模型及其相关概念,奠定了关系数据库的理论基础。

三、数据库方法与文件系统方法

1.数据库方法的优势

与人工管理方法和文件系统方法相比较,数据库方法具有如下优势:(1)数据库系统自描述特点

数据库系统不仅包括数据库数据本身,还包括定义和说明数据库数据的结构和约束条件。这些定义和说明称为数据字典或元数据(Meta Data),被保存在系统目录中。(2)数据结构化

数据库使用数据模型来描述整个组织的数据结构,在描述数据时不仅描述数据本身,还要描述数据之间的联系,隐藏了大多数数据库用户并不关心的数据存储和实现的细节。(3)数据共享性高、冗余度小、易扩充

数据库数据不再是面向某一应用,而是面向整个系统,为用户提供更广泛的数据共享,并大大减小数据的冗余度,避免数据之间的不相容性和不一致性,使得数据库系统具有弹性大、易扩充的特点。(4)数据独立性高

在数据库方法中,存储在数据库的数据字典中的数据文件结构与访问它的程序之间是相互分离的。当程序访问数据库数据时,由DBMS通过查询数据字典确定被访问的数据。通常把这种性质称为程序-数据独立性,简称数据独立性。(5)由DBMS进行统一的数据管理和控制

数据库对系统中的用户来说是可以同时存取(并发)共享的资源,它由DBMS进行统一的数据管理和控制。为此,DBMS还必须提供以下各方面数据控制功能:

①提供数据库数据的安全性(Security)保护,限制非授权的访问。

DBMS提供安全和权限管理子系统,由DBA给不同用户授予不同访问数据库的权限,维护数据库的安全性。

②提供数据库的备份(Backup)和恢复(Recovery)功能。

DBMS提供备份和恢复子系统,具有从硬件和软件的故障中进行恢复的能力。

③提供定义和确保数据库完整性(Integrity)检查。

大多数数据库应用程序都需要为自己持有的数据,根据自己业务规则的需要以及根据数据模型的内在规则,建立某些完整性约束(Integrity Constraints)。DBMS应该具有提供定义和确保这些约束检查的能力。

④提供并发控制功能。

当多个用户同时对数据库中数据进行存取或修改时,可能会发生相互冲突和干扰而产生错误结果,并有可能破坏数据库的完整性。因此DBMS必须对多个用户的并发操作加以控制和协调。

⑤提供高效的数据查询处理与优化(Query Processing and Optimization)。

DBMS的查询处理与优化模块基于现有的存储结构,负责为每个查询选择一种有效的查询执行方案。

⑥提供多用户界面。

因为数据库用户有各种类型,而且他们所具有的技术知识层次也各不相同,因此,DBMS就应该提供各种不同类型的用户界面。这些界面通常包括为偶尔访问的用户提供的查询语言、为应用程序开发人员提供的编程语言界面、为简单参与用户提供窗体和命令代码、为独立用户提供菜单驱动界面和自然语言界面。窗体风格界面和菜单驱动界面被称为图形用户界面(Graphical User Interface,GUI)。有许多专用的语言和应用环境可以指定GUl。现在数据库提供Web GUl界面的功能,即由数据库提供Web支持,正变得越来越普遍。

2.数据库与文件系统(1)使用DBMS增加额外开销的主要原因

①初期对硬件、软件和培训的高额投资;

②DBMS为了定义和处理数据而提供的普遍性导致的额外开销;

③为了提供安全性、并发控制、恢复和完整性功能而导致的额外开销。

如果数据库设计者和DBA没能正确地设计数据库,或是没能正确地实现数据库系统应用,还可能会出现另外的一些问题。(2)使用传统的文件方式处理数据更合适的情况

①数据库应用比较简单,易于定义并且一般不会发生变化;

②某些应用程序存在严格的实时性和专用性要求,而通用的DBMS对处理这样的应用开销过高,不合适;

③不需要多个用户访问数据。

四、数据库应用简史

1.使用层次和网状数据模型的早期数据库应用

许多早期数据库应用主要维护大型组织中的记录,如公司、大学、医院和银行等,存在着大量结构相似的记录。

早期层次和网状数据模型的数据系统的缺点:(1)数据记录的概念表示与其在磁盘上的物理存储位置混淆不清

尤其是当新的查询需要不同的存储组织以便有效处理时,这种新的查询将难以有效实现。(2)仅提供编程语言界面

这使得实现新查询和处理不仅费时而且代价不菲,这是因为必须编写、测试和调试新的程序。早期系统的主要类型基于三种主要范型:基于层次模型和网状模型的数据库系统以及倒排(inverted)文件系统。

2.关系模型数据库提供应用灵活性

关系模型是数学化的模型,它将数据的概念表示与其物理存储分离开来。引入了高级查询语言,可以作为编程语言界面的一种替代,快速编写新的查询。数据的关系表示类似于一张二维表。

20世纪70年代末开发了早期的实验性关系系统,在80年代初出现了商业关系数据库管理系统(Relational Database Management System,RDMS),随着新的存储和索引技术以及更好的查询处理与优化技术的发展,关系数据库成为传统数据库应用的主流数据库系统。现在,关系数据库几乎存在于所有类型的计算机中,从个人计算机到大型服务器。

3.面向对象数据库的应用

20世纪80年代面向对象编程语言的出现以及存储和共享复杂结构对象的需求,带来了面向对象数据模型数据库的发展。面向对象数据库结合了许多有用的面向对象的范式,如抽象数据类型、操作的封装、继承以及对象标识等。由于面向对象数据模型的复杂性以及早期缺少标准,现在主要用于特定应用,例如工程设计、多媒体出版以及制造业系统等。

4.在Web上交换数据实现电子商务

20世纪90年代,电子商务(E-Commerce)作为Web上的一个主要应用蓬勃兴起。人们开发了多种技术以支持在Web上交换数据。目前,扩展标记语言(eXtended Markup Language,XML)被认为是在各种类型的数据库和Web页面之间交换数据的主要标准。XML把文档系统中使用的模型概念与数据库建模概念结合在一起。

5.为新应用扩展数据库功能(1)数据库的新应用示例

①科学应用

存储在某些领域的科学实验中所产生的大量结果数据,如高能物理或者人类基因组图谱等。

②图片的存储和检索

例如x光透视或磁共振成像(Magnetic Resonance Imaging,MRI)。

③视频的存储和检索

例如电影,或者来自新闻或者个人数码相机的视频片段。

④数据挖掘应用

这类应用分析海量数据,查找特定的模式或联系。

⑤空间应用

这类应用存储数据的空间位置,例如地理信息系统中使用的气象信息或地图。

⑥时间序列应用

这类应用在定期的时间点存储如经济数据等信息,例如每日销售信息或每月的国民生产总值数据。(2)后端数据库

大多数大型组织使用多种软件应用包与后端数据库(Database Back-ends)紧密协同工作。后端数据库表示一个或多个数据库,可能由不同的厂商以不同的数据模型来维护数据,由这些软件包操纵数据库以支持事务处理、报告生成以及回答特定的查询。

企业资源规划(Enterprise Resource Planning,ERP就是最常用的系统之一,它用来合并一个组织中的各种功能领域,包括产品生产、销售、分发、市场、财务和人力资源等。

客户关系管理(Customer Relationship Managemer,CRM)软件,其横跨订单处理、市场及客户支持等功能领域。

这些应用都是可以在Web上实现的,无论是内部或外部用户都可以通过多种Web门户(Webportal)界面来与后台数据库进行交互。

6.数据库技术与信息检索

信息检索(Information Retrieval,IR)处理图书、手稿以及各种形式的基于图书馆的文献,非常需要应用多种信息检索技术来处理Web上的这些数据。Web页面上的数据一般包含图片、文本以及动态变化的活动对象。Web上的信息检索是一个新的问题,需要多方面创新地联合应用数据库技术与信息检索技术。

五、数据库技术的研究领域

1.数据库管理系统软件的研究

数据库管理系统软件的研究,包括研究和实现DBMS本身以及以DBMS为核心的一组相互联系的软件系统。DBMS是数据库系统的基础,新型的DBMS应具有分布性、开放性、异构系统的互连性、可扩充性和国际标准化。

研究和实现以DBMS为核心的一组支持软件,开发全过程的系统工具软件和中间件,如数据库分析设计工具、数据库运行维护工具,以及支持多种语言、多种数据库互联等。

研究的目标是提高系统的性能和提高用户的生产率。

数据库安全要求创建的数据库既具有共享性又具有良好的安全性,数据库的安全性问题也源自数据库的共享性。据库的安全理论和技术的研究成为数据库管理系统软件研究的重要组成部分。

2.数据库设计技术和方法的研究

数据库设计的主要任务是在DBMS的支持下,按照应用的要求,为某一部门或组织设计一个结构合理、使用方便、效率较高的数据库及其应用系统。

主要的研究方向是数据库设计方法学和设计工具,包括数据库设计方法、设计工具和设计理论的研究,数据模型和数据建模的研究,计算机辅助数据库设计方法及其软件系统的研究,数据库设计规范和标准的研究等。

数据模型是数据库系统的基础,新的应用中出现的复杂处理对象,如图形、图像、视频、音频等多媒体数据,三位空间数据,时态数据,超媒体超文本数据等,要求具有更加丰富的数据表示能力的新的数据模型。

3.数据库理论的研究

数据库理论的研究主要集中于关系的规范化理论、关系数据理论等。数据库的许多概念、技术内容、应用领域,甚至某些原理都有了重大的发展和变化,建立和实现了一系列新型数据库系统,如分布式数据库系统、并行数据库系统、知识库系统、多媒体数据库系统等,它们共同构成了数据库系统大家族,使数据库技术不断地涌现出新的研究方向。

第2章 数据模型和数据库系统的模式结构

一、数据模型和数据模型组成的要素

1.数据模型的概念

数据模型(Data Model)是用来描述数据库数据的结构、定义在结构上的操纵,以及数据间的约束的一组概念和定义,它描述了数据库的静态特征与动态行为,为数据库的表示和操纵提供框架。

数据模型应满足三点要求:(1)能比较真实地模拟现实世界;(2)容易为人们所理解;(3)便于在计算机上实现。

在数据库系统中针对不同的使用对象和应用目的,采用不同的数据模型。

数据模型是数据库系统的核心和基础。

2.数据模型组成的要素

任何一种数据模型都是严格定义的概念组合。这些概念必须能够精确地描述系统的静态特性、动态特性和数据约束条件。(1)数据结构

数据结构描述数据模型的静态特性,是数据模型的基础。它以一种统一的方式描述基本数据项的类型与性质以及数据与数据间的关联。数据结构是刻画一个数据模型性质最重要的方面。通常按照数据结构的类型来命名数据模型。例如,层次结构、网状结构、关系结构的数据模型分别命名为层次模型、网状模型和关系模型。(2)数据操作

数据操作表示数据模型的动态行为,是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关操作规则。数据库主要有检索和修改(包括插入、删除、更新)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则以及实现操作的语言。(3)数据约束

数据约束描述数据结构中数据间的语法和语义关联,以保证数据的正确性、有效性与相容性。数据约束包括数据完整性约束、数据安全性约束以及并发控制等约束,数据约束既刻画了数据动态特征,也表示了数据动态行为规则。

数据模型提供的数据约束应包括:

①反映和规定本数据模型必须遵守的基本的通用的数据约束,特别是数据完整性约束。例如,在关系模型中,任何关系必须满足实体完整性和参照完整性这两类约束。

②定义数据约束的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束。

二、数据模型的分类

根据抽象的层面不同,数据模型可分为:

1.概念层模型

概念层模型简称为概念模型(Concept Model)。它是现实世界到信息世界的语义抽象,主要用于数据库设计中的概念设计。它从用户观点对数据和信息建模,是数据库设计者与用户之间交流的工具,是数据库逻辑模型的基础。它表示简单、易于理解且具有较强的语义表达能力。

实体联系模型(Entity-Relationship Model)简称E-R模型,是最常用的概念模型。在E-R模型基础上增加概括、聚集等语义描述,形成扩充的实体-联系模型(Extended Entity-Relationship Model),简称EER模型。它们可以看做是基于客观对象的模型。此外还有面向对象模型、谓词模型等。

2.逻辑层模型

逻辑层模型简称为逻辑模型(Logical Model),用来描述数据库数据的整体逻辑结构,所以也称为结构数据模型。逻辑模型是从数据库实现的角度对数据建模,独立于具体的系统物理平台。它是面向数据库管理系统的模型。逻辑模型主要描述数据的逻辑存储结构、数据操作和完整性约束。(1)传统的逻辑模型

传统的逻辑模型是基于记录的模型,包括:

①层次模型

该模型中数据用记录的集合表示,数据间的联系用链接表示,其记录被组织成树状结构。

②网状模型

该模型分别用记录和链接表示数据和数据间的联系,其记录被组织成网状结构。对于描述实体之间多对多的联系,网状模型比层次模型更方便。

③关系模型

该模型用二维表存储数据,通过记录的值建立起表间的联系。关系模型有很好的数学基础,它用关系代数、关系演算等语言描述数据操作,用数据间依赖关系描述数据间的完整性约束,根据关系模式中数据依赖关系的复杂程度定义关系模式的规范级别。(2)面向对象数据模型

基于面向对象概念在逻辑层面上对数据建模,它将客观世界的实体抽象为对象,通过对对象、对象标识、类、继承性等概念的刻画,以支持面向对象概念和机制。(3)对象-关系模型

该模型由关系模型与面向对象模型相结合所组成。

3.物理层模型

物理层模型简称为物理模型(Physical Model),描述逻辑模型的物理实现,是数据库最底层的抽象,它确定数据的物理存储结构、数据存取路径以及调整、优化数据库的性能。物理模型的设计目标是提高数据库性能和有效利用存储空间。

三个层次的数据模型间相互独立而又存在着关联,特别是概念模型与逻辑模型之间有必然联系,如E-R模型一般与关系模型关联,EER模型与对象-关系模型关联,面向对象模型的概念模型与逻辑模型则基本一致。

基于不同的数据模型可以构建不同的数据库系统以适应不同的应用需求,它包括通用的数据库系统(如层次数据库系统、网状数据库系统、关系数据库系统、面向对象数据库系统和对象-关系数据库系统等)以及特定的数据库系统(如演绎数据库系统、知识库系统、时态数据库系统、空间数据库系统等)。

三、概念数据模型——E-R模型

1.概念数据模型的产生和基本概念(1)概念数据模型的产生

概念数据模型的初始模型为实体-联系模型(E-R模型),此后提出了扩充实体-联系模型(EER模型),又出现了面向对象模型及其他多种语义模型。目前概念模型已成为数据库的一种基础模型。

概念模型用于信息世界的建模,与具体的DBMS无关。为了把现实世界中的具体事物抽象、组织为某一DBMS支持的数据模型,常常首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界,这一过程如图2-1所示。概念模型是现实世界到机器世界的一个中间层次。图2-1  现实世界中客观对象的抽象过程(2)信息世界中的基本概念

①实体(Entity)

客观存在并可相互区别的事物称为实体。

实体可以是具体的人、事、物,也可以是抽象的概念或联系,例如,一个供应商、一个学生、一个职工、一门课、一个部门、学生的一次选课、部门的一次订货等都是实体。

②属性(Attribute)

实体所具有的某一特性称为属性。

一个实体可以由若干个属性来刻画。例如,学生实体可以由学号、姓名、性别、出生日期、系等属性组成,这些属性组合如(20080011,周志平,男,1983,计算机系),表征了一个学生。

③码或键(Key)

唯一标识实体的属性集称为码或键。例如,学生号是学生实体的码或键。

④域(Domain)

属性的取值范围称为该属性的域。例如,学生号的域为8位整数,姓名的域为字符串集合,年龄的域为小于120的整数,性别的域为(男,女)。

⑤实体型(Entity Type)

具有相同属性的实体必然具有共同的特征和性质。用实体名及属性名集合来抽象和刻画同类实体,称为实体型。例如,学生(学号,姓名,性别,出生日期,系)是一个实体型。

⑥实体集(Entity Set)

同型实体的集合称为实体集。例如,全体学生就是一个实体集。

⑦联系(Relationship)

在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体内部的联系和实体之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。(3)两个实体型之间的联系

两个实体型之间的联系可以分为三类。

①一对一联系(1:1)

如果对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。

②一对多联系(1:n)

如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B具有一对多联系,记为1:n。

③多对多联系(m:n)

如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体集B具有多对多联系,记为m:n。

实际上,一对一联系是一对多联系的特例,而一对多联系又是多对多联系的特例。

实体型之间的这种一对一、一对多、多对多联系不仅存在于两个实体型之间,也存在于两个以上的实体型之间。

同一个实体集内的各实体之间也可以存在一对一、一对多、多对多的联系。

2.概念模型的一种表示方法——E-R图

概念模型最常用也是最著名的是实体-联系图(Entity-Relationship Diagram),简称E-R图,是数据库概念设计的最一般模型。(1)E-R图表示

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载