医学文献检索(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-14 01:45:30

点击下载

作者:靳小青

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

医学文献检索

医学文献检索试读:

前言

曾几何时,文献检索、信息检索还是陌生词汇。如今随着Internet的普及,人们已普遍意识到信息检索是人们有效参与信息社会的一个先决条件,是终身学习的必须,是实现创新能力的基础。早在1984年,教育部就提出在大学基础教育中开设“文献检索与利用”课程,20多年过去了,人们从手工检索工具为主逐渐过渡到以Internet为主的数据库检索,检索手段发生了巨大变革,但检索目的一如既往,并随着时代的变迁,赋予“文献检索与利用”课程新的内涵。本书主要针对普通高校本科学生层次,适当兼顾研究生、专科生及研究人员。

与其他同类教材相比,本书理论与实践相结合,内容新颖、实用性强。主要具有以下几大特点。(1)各章之间既有独立性又有关联性,每章开头有引言,结尾有小结,最后附有

练习题

。(2)全书以网络数据库为主,适当兼顾手工检索工具。(3)全书图文并茂,尽量使用图、表格等表现形式,展示检索方式、归纳检索语言。(4)为增加本书的可读性和趣味性,各章中一般都设有“重要提示”、“案例分析”或“阅读材料”等小栏目。(5)各章案例选材新颖、实用,紧贴文科类专业,彰显其专业特色,对章后练习题有启发、指导作用。(6)针对医学类学生的需求,介绍了PubMed和Pharm Web这两个重要的医学类数据库。(7)获取原始文献是信息检索的目的,本书不仅介绍了众多全文数据库,还介绍了CASHL和NSTL两个能提供外文期刊全文传递服务的一站式网站。建议学时分配表

本书可作为普通高等院校文献检索、信息检索等课程教材,也可作为科技人员进行信息检索的指导书和图书信息部门的参考书。

本书由靳小青任主编,郭莉娟、孙思云,王晓燕任副主编。本书在编写过程中,参考和借鉴了大量的中外文献和网站资料,由于篇幅所限,未能在参考文献中一一列举,在此特向有关作者致歉并表示衷心的感谢。另外,在编写过程中,还使用了许多国内外检索工具和数据库,在此也一并向这些出版部门表示诚挚的谢意。

由于编者水平有限,书中难免存在不足之处,恳请广大读者给予批评指正。编者2010年7月

第1章 信息及信息检索概述

进入20世纪,信息与物质、能量构成现代社会的三大资源,成为社会发展的巨大推动力。在信息化高度发展的今天,信息匮乏的日子一去不复返,但信息泛滥又使我们陷入另一种尴尬的境地。在尽可能短的时间内全、快、准地查找所需的信息,这是时代赋予信息检索的职责。俗话说,磨刀不误砍柴工,工欲善其事,必先利其器。抓住信息检索这把利器,可以帮助我们从茫茫的信息海洋中找出精华、去除糟粕。千里之行,始于足下,本章将带读者进入信息检索的大门。

1.1 信息与信息检索的基本概念

信息化社会谈论最多的就是信息,那么什么是信息呢?信息检索又是什么意义呢?本节将会帮助读者找出答案。

1.1.1 信息与信息检索的定义

1.信息

信息簇拥着整个世界,信息环绕着人们生活,信息已成为象征着21世纪的标志。那么什么是信息呢?一个世纪以来,信息的定义经历了百年演义,不断地与时俱进。人们从不同的研究领域,提出了多种信息定义。如美国数学家、信息论的创始人仙农(C.E.Shannon)在题为“通讯的数学理论”一文中指出:“信息是用来消除随机不定性的东西”。钟义信的信息定义:信息是被反映的物质属性。逆仙农的信息定义:信息是确定性的增加。通信经济学中给出的定义:信息是世界上一切事物的状态、特征和变化的反映,其最高形式是人类的思想理论。从哲学的角度说,信息是事物运动的存在或表达形式,是一切物质的普遍属性,实际上包括了一切物质运动的表征。传播学研究的信息是在一种情况下能够减少或消除不确定性的任何事物,它是人的精神创造物。我国情报学家严怡民对信息的定义为:生物以及具有自动控制系统的机器,通过感官器官和相应的设备与外界进行交换的一切内容。国家标准GB4894-85《情报与文献工作词汇基本术语》对信息的定义是:物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。

综上所述,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。它反映了物质客体及其相互作用、相互联系过程中表现出来的种种状态和特征。例如,事物发出的消息、信号及信号中的指令,就可通过一定的物质形式(声波、电磁波)传送给人或动物某种信息。不同的事物,具有不同的状态和特征,因此会产生出各种不同的信息,人类就是由大脑经感觉器官来接受自然界和社会中的种种信息来区别各种事物,从而认识世界和改造世界的。2.信息的特征

信息一般由信息源、内容、载体、传输和接受者几部分构成。因此,信息具有以下几个主要特征。(1)普遍性

信息源于自然界、人类社会以及人类的一切思维活动,可谓信息无处不在、无时不有、无人不用。因此,信息可被看成是物质的一种普遍属性,是物质存在的方式、运动状态的体现。(2)存储性

信息可以用不同的方式寄存在不同的介质上,即信息必须依附物质才能存在。大脑本身就是一个天然的信息载体存储器,纸张、图像、摄影、录音、光盘、计算机存储器等都可以进行信息存储。(3)可识别性

信息是客观事物经过感知或认识后的再现,狭义的“认识论信息”认为,那些信息接受主体感觉不到的“某个事物状态及状态的变化方式”,或者感觉到了但不能理解的东西,都不叫信息。因此信息还必须具有可识别性,识别又可分为直接识别和间接识别,直接识别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。(4)传播性

发出信息与接受信息就是信息的传播。信息的传播性是信息最本质的特征。信息如果不能传播,信息的存在就失去了意义。信息只有经过传播才能被接受和利用,语言、表情、动作、报纸、书刊、广播、电视、电话、传真和网络等是人类常用的信息传播方式。(5)共享性

信息具有扩散性,同一信源可以供给多个信宿,因此信息是可以共享的。(6)时效性

信息具有很强的时效性是毋庸置疑的,及时的信息可以产生积极的效果,过时的信息则可能贻误战机。(7)可塑性

任何信息,人们都可根据需要对其进行加工、整理、转换成另一种形态。如自然信息可转换为语言、文字和图像等形态,也可转换为电磁波信号或计算机代码。3.信息检索

信息检索一词最早来源于英语“Information Retrieval”,表示将信息按一定的方式组织和存储起来,形成各种“信息库”,并根据用户的需要,按照一定的程序,从“信息库”中找出符合用户需要的信息的过程。因此,广义的信息检索包括信息的存储与检索两个过程。

信息存储(标引)过程就是解决如何建立检索系统,编制、标引检索工具或数据库,这主要由专业信息标引人员、图书情报部门的专职人员依据检索语言进行编制、标引。一般图书情报部门都把这部分编制、标引出的“信息库”,放在图书馆的检索室或图书馆的服务器中。表1-1为国内常见的检索工具,表1-2为国内常见的数据库。表1-1 常见检索工具一览表表1-2 常见数据库一览表

信息检索(检出)过程则是根据已知的检索工具和数据库,按照一定的检索规则(检索语言)将所需的文献资料查找出来的过程。

狭义的信息检索则仅指信息的检出过程。

因此,信息检索主要讲解怎样利用检索工具和数据库查找信息资料。当然随着Internet的发展,网络信息空间得到了极大的拓展,在信息检索中也占有很重要的位置。

1.1.2 信息检索类型

信息检索的种类很多,在此仅按其检索对象和检索手段两种方式进行描述。1.按检索对象划分

根据检索对象的不同,信息检索可归纳为以下3种类型。(1)数据检索(Data Retrieval)

数据检索是指以各种数据或数值为检索对象,从已有的“信息库”中查找出特定数据的过程,其检索结果是数值性数据。例如,查天气预报、股票价位、本专业学位论文的UDC三级分类号、西安大雁塔有多高等即为数据检索。(2)事实检索(Fact Retrieval)

事实检索是指以某一客观事实为检索对象或对已有的数据进行处理(逻辑推理)后得出新的事实过程,其检索结果是数值性数据和相关的资料。例如某同类产品中,哪种型号的汽车最省油?本学年成绩优秀的学生有多少?(3)文献检索(Document Retrieval)

文献检索是指以文献为检索对象,从已有的“信息库”中查找出特定文献的过程,其检索结果是文献资料。凡是查找某一课题、某一著者、某一地域、某一机械、某一事物的有关文献,以及这些文献的出处和收藏处所等,都属于文献检索的范畴。例如“关于儒家文化对韩国经济的影响”都有些什么参考文献?

文献检索是要检索出包含所需要信息的文献,是一种不确定性的检索,其检索结果是与某一课题有关的若干篇论文,书刊的来源出处以及收藏地点等。因此,文献检索一般使用文摘、目录、索引、全文等检索工具及其相对应的数据库和网络资源。数据和事实检索是要检索出包含在文献中的具体信息,是确定性的检索。其检索范围包括:各种数值、要领、事项、科技成果、市场动态、统计数据、人物传记、机构名录以及各种公式、规格、标准等。因此事实和数据检索,使用的工具主要有百科全书、字典、辞典、年鉴、手册、人名录、地名录、机构指南及其相对应的数据库和网络资源等。

以上3种检索中,文献检索是最典型和最重要也是最常利用的信息检索,所以本书重点介绍文献检索。2.按检索手段划分(1)手工检索

手工检索简称手检,是指无须借助任何辅助设施即可使用的检索工具。这类工具都是些传统的印刷型检索工具,如文摘、目录、索引。因此用户使用起来直观、便于阅读、检准率高,但漏检严重、检索速度慢。(2)计算机检索

计算机检索简称机检,是指借助计算机、通信设施、数据库及其他辅助设备进行检索的统称。计算机检索包括联机检索、光盘检索和网络检索。机检与手检相比,检索效率高、速度快、范围广、查全率高,但检索费用高、查准率低。随着计算机技术、网络通信技术的发展,计算机检索正在逐步取代手工检索,成为信息检索的主要形式。

1.2 信息素养与创新能力

何为信息素养?它与创新能力又是什么关系?布拉格宣言给我们做了很好的诠释:信息素养是人们有效参与信息社会的一个先决条件,是终身学习的一种基本人权。本节的内容将会作出更好的解答。

1.2.1 信息素养的内涵

信息素养(Information Literacy,IL),是1974年美国信息产业协会(IIA)主席保罗·泽考斯基(Paul Zurkowski)在提交给全美图书馆学和信息学委员会(NCLIS)的一份报告中首次提出了这一概念,他当时把信息素养解释为“利用大量的信息工具及主要信息源使问题得到解答的技术和技能”。进入20世纪80年代后,随着计算机技术的发展和普及,信息素养的含义不断深化,涉及领域更加广泛。1989年,美国图书馆协会(ALA)下设的IL主席委员会发表的一份有关IL的权威报告对IL的定义是至今使用最为广泛的一种:“具有信息素养的人必须在需要时能够识别、查找、评价和有效地使用信息”。1997年9月,美国纽约州立大学图书馆馆长理事会对信息素养的定义表述为:“能清楚地意识到何时需要信息,并能确定、评价、有效利用信息以及利用各种形式交流信息的能力”。

2003年9月20至23日,联合国教科文组织(UNESCO)和美国图书情报学委员会(NCLIS)在捷克首都联合召开的信息素养专家会议(Information Literacy Meeting of Experts,Prague, The Czech Republic)发布了布拉格宣言:走向具有信息素养的社会。这次会议共有来自世界23个国家的40位代表讨论了信息素养问题。会议认为如何使人们从Internet时代的信息和通信资源及技术中受益是当今社会面临的重要挑战。会议将信息素养定义为一种能力,它能够确定、查找、评估、组织和有效地生产、使用和交流信息,并解决面临的问题。

布拉格宣言宣称信息素养是人们有效参与信息社会的一个先决条件,是终身学习的一种基本人权。

总之,信息素养是一种综合信息能力。即在信息社会中,人们所具备的信息觉悟、信息处理所需的实际技能和对信息进行筛选、鉴别、传播和合理使用的能力。具体包括以下内容。1.信息意识

信息意识是人们利用信息检索系统获取所需信息的内在动因,是人的大脑对信息存在的反映,具体表现为对信息需求的意念、洞察信息的敏感性、寻求信息的兴趣和对信息的判断捕捉能力及消化吸收能力等。信息意识是信息素养的前提,含有信息认知、信息情感和信息行为倾向3个层面。2.信息知识

信息知识指一切与信息有关的知识和方法,既包括信息理论知识,又包括信息技术方面的内容,如对图书信息知识的了解程度,对检索技术、计算机技术及相关学科的掌握程度等。它是信息素养的基础,不具备一定的信息知识,信息素养也就无从谈起,只会成为空中楼阁。3.信息能力

信息能力是指人们有效地利用信息存储机构,如图书馆、Internet等系统获取、分析、评价、处理、创新和传递信息的能力。具体包括:优选信息源、信息媒体,掌握检索语言、熟练使用各种数据库的能力、对检索效果进行判断和评价的能力、加工提炼信息的能力、整合创建信息的能力、交流传播信息的能力等。信息能力是信息素养的核心。没有信息能力,信息素养也就难以实现。4.信息道德

信息道德是指个人在信息活动中的道德情操及行为规范。包括学习了解信息与信息技术相关的法律、道德伦理、经济法规,摘取利用信息资源时能够合法、合情、合理地使用信息,并遵守一些约定俗成的规则等。总之信息道德是对信息创造者、信息服务机构和信息用户之间相互关系的行为规范进行约束之准则。

1.2.2 信息素养与创新能力

创新能力是人们运用知识和理论,在科技和实践活动中除旧立新、创造具有经济价值、社会价值的新思想、新理论、新方法和各种新发明的能力。创新能力一般都有发现问题、分析问题、提出假设、论证假设、解决问题的过程,对事物勇于批判、敢于质疑。创新能力构成的基本要素有创新意识、创新智能、科技素质和创新环境等。创新意识是创新的前提,是激发创新能力的动因,创新智能(包括观察能力、思维能力、想象能力、操作能力)决定了创新的成功和水平,科技素质是创新的基础,创新环境则为创新营造氛围,是提高创新能力的重要条件。

创新能力是民族进步的灵魂、经济竞争的核心。当今社会的竞争,与其说是创新能力的竞争,不如说是人才的竞争。众所周知,大学生是国家创新人才的栋梁,是未来创新国家的希望。21世纪需要的是有创新意识、具有创新精神和创新能力的人才。为了培养创造型人才,教育必须创新。目前高校实施的信息素养教育则是孕育创新能力的沃土,正像布拉格宣言宣称的那样,信息素养是人们有效参与信息社会的一个先决条件,是终身教育和终身学习的一种基本人权。信息素养教育主要是培养大学生主动获取各种信息的意识,掌握信息获取和利用的能力,恪守信息道德,构建终身学习环境和氛围,为创新能力的培养夯实基础,这样才能不被时代抛弃,顺应未来社会的发展。

信息素养和创新能力的培养与提高不是一蹴而就的,需要进行长期、有计划、有步骤地训练。培养和提升大学生的信息素养既是个人终身发展的要求,也是信息时代对高等教育的必然要求,关系着国家的前途和发展。我们应借鉴“美国高等教育信息素养能力标准”,以信息技术教育为基础,以信息能力和创新能力的培养为核心,注重大学生信息道德、文化、社会责任感等方面的发展,为全面建设小康社会培养大批高素质的优秀人才。

小结

本章主要讲述了信息及信息检索的定义、信息检索的类型及信息检索的目的:培养学生的信息素养,提高学生的创新能力。练习题

1.什么叫信息?信息有哪些特征?

2.信息检索分为哪几类?

3.信息素养包括哪几方面的内容?

第2章 信息检索系统

为了掌握信息检索,要先从信息检索的源头入手,了解信息检索系统中的“基本组件”,以便为后续章节内容打下扎实的基础。

2.1 信息源与信息媒体

本节从信息产生的“源头”开始追溯,主要介绍承载信息源的两种文献型信息媒体。

2.1.1 信息源的概念

顾名思义,信息源就是获取信息的来源。联合国教科文组织(UNESCO)出版的《文献术语》对其定义为:组织或个人为满足其信息需要而获得信息的来源,称为“信息源”。从绝对意义上看,只有信息产生的“源头”,才能称为信息源。但信息源是一个相对的概念,凡能产生、拥有和传递信息的所有物质皆谓信息源。由此看来信息源内涵丰富,它不仅包括各种信息载体,也包括各种信息储存、传递、生产机构。但在图书情报界则认为:人们在科研活动、生产经营活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的产品都可称为信息源。因此又有口头型信息源、实物型信息源和文献型信息源之说。

2.1.2 信息媒体

信息媒体是指信息传播的介质、信息表示的载体,也称为信息媒介或信息载体。这些信息媒体可以是文字、图形、图像、动画、声音、视频等信息表示形式,也可以是扬声器、磁盘阵列服务器、电视机等信息的展示设备,还可以是传递信息的光纤、电缆、电磁波等中介媒质,以及存储信息的缩微胶卷、磁盘、光盘、磁带等存储实体。而在图书情报界则从文献型信息源的研究视角出发,将信息媒体大致划分为传统文献信息媒体和电子文献信息媒体两大类。

文献信息媒体是将人类知识用文字、图形、符号、声频、视频等手段在物质载体上记录下来的用于交流传播的信息载体。而文献是记载着知识内容的物质载体。具体来说,凡是用文字、图形、符号、声频、视频等手段在物质载体上记录下来的知识,都可称为文献。1.传统文献信息媒体

传统文献信息媒体主要是指传统图书馆收录的各种文献信息媒体总汇。若把传统文献信息媒体再进行细分,又可分为多种类型。(1)按文献信息载体形式划分

①印刷型:指以纸张为载体的文献记录形式,也是目前使用的主要形式,包括油印、铅印和胶印。优点是阅读方便、便于流通,缺点是笨重、占空间大、存储密度低、管理困难。

②缩微型:以感光材料为载体、缩微照相为记录手段的文献记录形式,包括缩微胶卷、平片等。优点是体积小、重量轻、存储密度高、便于保存转移,其缺点是不能直接阅读,必须借助专门的阅读设备。

③机读型:即计算机可读型。是以磁性材料为存储介质、通过编码和程序设计,把文献资料转换成机读语言,成为供计算机使用的新型载体,包括磁带、磁盘和光盘等。优点是存储密度高、存取速度快、原有记录可改变更新,缺点是需要计算机才能使用、价格高、技术要求高。

④声像型:又称视听型。以磁性或感光材料为存储介质,采用录音、录像或摄影技术为手段直接记录声音、视频图像而成的一种文献信息。如唱片、录音带、录像带、电影等可直接脱离文字记载,听其声、观其形、给人以生动直观的感觉,尤其对科学家观察、启迪思路有其积极的作用,缺点是需要专用设备、成本高。(2)按文献信息媒体内容特征或加工程度分

①零次文献:是绝对意义上的原始文献,主要指尚未载入正规载体上的一类文献总称,如书信、手稿、患者病历、生产日记、会议记录等。

②一次文献:又称原始文献,但是相对意义上的原始文献。是指以作者本人的生产或科研工作成果为依据而创作的文献并且载入正规载体上的一类文献,如期刊论文、专利说明书、学位论文、会议文献等。

③二次文献:将一次文献按一定方法进行加工、整理、浓缩、组织成为系统的便于查找的检索工具即二次文献。如各种目录(题录)、索引、文摘,这些文献专供了解或查找一次文献而用。

④三次文献:是在合理利用二次文献的基础上,选用一次文献的内容,根据一定的需要和目的,进行深入分析、研究之后,综合概括而成的文献,如专题述评、综述及各种参考工具书等。(3)按文献信息媒体的内容形式划分

①图书:是用于全面而系统地阐述某一方面或学科的科学理论或发展,传授科学技术以及查阅某些知识的文献形式。一般来说,图书的内容比较系统、全面、成熟、可靠,缺点是出版周期长、新颖性欠佳。图书按使用功能可分为以下两类。

·阅读型图书:教科书、专著、科普读物。

·查阅型图书:参考工具书、检索工具书。

②连续出版物:采用统一名称定期或不定期连续性发行的出版物,主要指报纸、期刊和年度出版物。连续出版物一般有连续的卷期或年月日顺序号,出版周期短、报道文献快、内容新颖、信息量大,特别是报纸、期刊现已成为广大民众和科研人员阅读量最大的信息媒体。

③会议文献:一般是指国内外各个科学技术学会、协会及有关主管部门召开的学术会议或专业会议上提交、宣读或交流的论文或报告。因此会议文献代表着一门学科或专业的最新研究成果,反映着当时的发展水平或动态。会议文献通常有会前预印本,会后会议录、论文集、期刊等出版形式。因此会议文献也是科研人员利用率最高的信息媒体之一。

④专利文献:主要指专利说明书,也包括各种专利检索工具、专利公报及专利法律文件等。专利文献具有新颖性、创造性和实用性的特点,并具有垄断性、地域性、时间性、公开性和法定性的特征,因此专利文献是一种集技术与法律于一体的实用性很强的文献信息媒体,且重复率很高。

⑤科研报告:是指科研工作成果的正式报告或是对科研进展情况的实际记录。其特点是连续出版,刊有机构名称、报告号、自成一册,在内容上专深具体,往往是最新成果,比期刊论文详尽、数据也比较完整。世界上许多国家出版各自的科技报告,其中美国政府出版的科技报告数量较大、较系统,最有名的四大报告为军事系统的AD报告、政府部门的PB报告、能源部的DOE报告和美国宇航局的NASA报告。所以,科技报告对了解国内外军事、国防工业及尖端技术等方面的情况特别重要。我国出版的《科技研究成果报告》分为内部、秘密、绝密3个级别,一般为内部控制使用。

⑥标准文献:是指对工农业产品、卫生教育、行政机关和工程建设的质量、规格、检验方法及管理等所做的技术规定,是人们从事管理、设计、生产和检验的一个共同技术依据。标准作为一种规章性的技术文献,具有一定的法律约束力。

⑦学位论文:这是高等学校或研究机构的毕业生作为评定各级学位而撰写的论文。目前多数国家的学位分为学士、硕士和博士三级。学位论文质量参差不齐,但带有一定的独创性和新颖性,特别是博士论文具有较高的专业水准、参考价值较大。

⑧政府出版物:一般是指由各国政府部门及其专设机构所发表出版的配合政府工作的行政性文件和科技文献,如法律法规、统计、科普资料和技术政策等。

⑨产品目录与样品:是指厂商为推销其产品而印发的宣传性资料。通常对产品的性能、构造、用途、使用方法及产品规格都有详细介绍。技术上较成熟,数据较可靠,并有外观照片、结构图等,直观性强。因此对产品推广、制造和设计具有一定的参考作用,颇受消费者和设计人员的青睐。

⑩技术档案:是指记录和反映一个单位或部门在行政管理、生产建设和科学研究等活动中所形成的有一定保存价值的具体工程对象或项目的技术文件、图样、图表、照片、原始记录的原件及复印件。技术档案是生产建设和科研工作中用以积累经验、吸取教训和提高质量的重要文献。技术档案一般具有保密和内部使用的特点。2.电子文献信息媒体

电子文献信息媒体是指以数字编码的形式,把文字、图像、动画、声音、视频等信息存储在磁光等介质上,通过计算机和其他辅助设备阅读使用的一种新型文献信息媒体,实质是一种机读型信息媒体。电子文献信息媒体是信息技术发展的产物,它的产生、发展和应用给人们展示了一个全新的虚拟世界。电子文献信息媒体种类繁多、划分多样。(1)根据载体的存储形态划分

①光盘文献信息媒体:是以光盘作为信息存储载体和检索对象的有形文献信息媒体,它对电子文献信息媒体作出了巨大贡献。光盘文献信息媒体的检索方式有单机版、网络版和与联机检索系统联网的联机检索形式。由于光盘文献信息媒体储存能力强、介质成本低、数据可靠、便于携带、检索费用低等优点,因此许多常用的联机数据库都配备其相应的光盘产品,如EI CompendexWeb等。但目前光盘文献信息媒体多用在镜像站和数据备份上。

②联机文献信息媒体:是指联机检索系统提供的那些文献信息媒体,如DIALOG、STN、OCLC等。目前联机检索和网络检索都是通过Internet进行检索,但联机数据内容全、准确、权威,收费也高。

③网络文献信息媒体:以Internet形式向全世界发布的各种各样的文献信息媒体,如搜索引擎、主题网关、经济、医学、教育、科研、军事、商业、新闻、企业公司的网站网页、网络书刊、报纸、专利、标准、电影、音乐、博客、RSS、网上论坛、新闻组等,它是目前世界上最大的文献信息媒体,使用方便快捷、免费信息居多,颇受用户喜爱。但信息杂乱、可靠性差。(2)根据数据库的检索对象进行划分

①参考数据库:只为用户提供信息线索的数据库,用户使用此类数据库后,一般还需依据其文献出处进一步索取原文。参考数据库包括书目数据库和指南数据库。

书目数据库包含文摘、目录、题录、索引等数据库,实为印刷型二次文献即检索工具的电子化产物。书目数据库的数据结构简单,记录格式比较固定。

指南数据库是有关机构、人物等相关信息的简要描述,包括各种机构名录数据库、人物传记数据库、产品信息数据库等。

②源数据库:指能直接获取原始资料或具体数据的数据库。源数据库包括数值数据库、文本——数值数据库、全文数据库、术语数据库、图像数据库和多媒体数据库等。(3)根据网络传输协议进行划分

网络信息媒体是指借助计算机网络进行传递的文本、数值、声频与视频等各种信息媒体的总合。随着Internet的发展,这部分信息媒体在时间和空间上将得到了极大地拓展。网络信息媒体的种类繁多。

①WWW信息媒体:WWW是广域网(World Wide Web)的简称,也称万维网或Web。WWW是一个基于超文本传输协议(Hypertext Transfer Protocol),在客户机和服务器之间展现和传递各种媒体信息,并以直观的图形页面为用户提供服务的信息检索系统。WWW能够将位于Internet上不同地点的信息有机地编织在一起,提供一种非常友好的信息查询接口:用户仅需提出查询要求,而到什么地方查询及如何查询则由WWW自动完成。WWW是由欧洲粒子实验室(CERN)20世纪90年代初研制的,一经推出就吸引了学术界、政界和商界的广泛关注,现已成为Internet上发展最快,信息最丰富的一种检索方式,被公认为是Internet的代名词。

②FTP信息媒体:FTP是文件传输协议(File Transfer Protocol)的简称。它的主要功能正如其名所示,在Internet上完成从一个计算机系统到另一个计算机系统的文件传输,既可以从远程计算机上下载信息到本地计算机,也可以从本地机上载信息到远程机。

③Telnet信息媒体:Telnet是Internet远程登录协议,只要用户在本地计算机上输入用户名和密码,成功登录后变可作为Internet的远程终端实时访问主机,来共享远程主机中对外授权的各种信息资源,包括硬件资源和软件资源。目前,许多图书馆、商用数据库都是通过Telnet对外开展服务的,如OPAC、DIALOG、OCLC。

④Gopher信息媒体:Gopher是一种基于菜单的网络服务,其服务形式类似于WWW的分布式客户机/服务器,但不像WWW那样展示给用户的是一幅幅直观性很强的页面,而是令人费解的一些菜单说明。

由此可见,人们在获取信息时,信息媒体的来源渠道是至关重要的。因为种种原因,同一条信息需求的内容在不同的信息媒体中可能会存在差异。这时用户应以信誉度高的信息媒体为主,但必须对其他相关信息媒体进行考查,以识别信息的真伪。

2.2 信息检索原理

任何事情掌握了原理,就会得心应手,同样,信息检索也是如此。

信息检索原理可从信息检索过程得到很好的诠释,如图2-1所示,用户在检索时,检索系统一方面接受用户的检索提问,另一方面从数据库(检索工具)中接受文献记录,然后在两者之间进行匹配运算,即将检索提问与数据库(检索工具)中文献记录标识进行比较,如果比较结果一致或数据库(检索工具)中的文献记录标识包含了检索提问标识,那么具有该标识的信息可能就是用户所要的命中文献;如果比较结果不一致,则要重新提交检索提问。图2-1 信息检索原理示意图

2.3 检索语言

检索语言是人们组织、存储与检索文献信息的重要依据,有了检索语言,标引人员才能按规则组织、存储文献信息,检索人员才能按规则检索、获取文献信息,这样存进去的文献信息才能被有效地揭示、检出。

2.3.1 检索语言分类

检索语言是根据文献标引与检索的需要,在自然语言的基础上规范化了的人工语言,它贯穿于文献存储与检索的全过程,是沟通标引人员和检索人员双方思想的约定语言,也有人称为“标定符号”或“标识系统”。

检索语言的种类颇多,其中按描述文献信息的特征进行划分是目前最常见的一种,如表2-1所示。表2-1 检索语言分类

由于描述文献信息外表特征的检索语言,其文献标识与检索依据简单明了,如书名、著者、号码等不必再另行制定符号加以标注,因此通常所称的检索语言实际上是按描述文献信息内容特征的检索语言即分类语言和主题语言。

2.3.2 分类语言

分类语言是将文献信息按学科、事物性质的等级体系加以排列,用分类号来表达文献主题概念的检索语言。分类语言的具体表现形式就是分类表(法)。分类法(表)是类分和组织文献信息以及用户检索文献的共同依据。

分类语言有3种,最常用的是体系分类语言。体系分类语言以文献内容的科学性质为对象,从学科分类观点出发,运用概念划分的方法,将知识分门别类地按逻辑次序,从总到分、从一般到具体、从低到高、从简到繁进行层层划分、层层隶属,逐级展开一个层类制的等级结构体系。《中图图书馆分类法》(简称《中图法》)、《中图科学院图书馆分类法》(简称《科图法》)、《杜威十进制分类法》(简称DDC)、《国际十进制分类法》(简称UDC)都是比较典型的体系分类语言。

现在以《中图法》为例说明其构成,《中图法》自1973年在我国使用以来,不断修订,现已成为国内图书情报部门统一使用的一部分类法。目前正在使用第4版。《中图法》将全部知识分为5个基本部类,即马列主义、毛泽东思想、邓小平理论,哲学,社会科学,自然科学和综合性图书。在5大部类下又展开为22个基本大类(一级类目),如表2-2所示。表2-2 《中图法》基本大类《中图法》的标记符号采用汉语拼音字母、阿拉伯数字和圆点相结合的混合制号码作为分类号,用字母表示基本大类(一级类目),在字母后用数字表示基本大类下类目的划分,唯独工业技术大类下用两位字母表示二级类目。《中图法》的分类号越长,代表的内容越具体,检索出的文献越精准,如图2-2所示。图2-2 《中图法》2-5级类目图

分类法按学科或专业集中文献,能够较好地满足族性检索要求,查全率较高;其次分类法采用概念划分的方法,具有等级结构,调整检索范围收缩自如,如要查找钓鱼岛问题,若按D815.3查找的文献太少,可改用其上位类D815查找;另外,分类法用字母和数字表示类目,简单明了,便于组织图书资料排架及目录系统。但分类法的缺陷也随之显现,因用号码语言作检索标识,专指度不高也不直观,在检索文献时,容易产生差错造成误检或漏检;此外,分类法是一种先组式标引语言,增加新类目困难,不适应新兴学科和边缘学科的查找,所以分类法都要不断地进行修订。

2.3.3 主题语言

主题语言是直接用自然语词作主题概念标识,并用字顺排列标识和参照系统等方法来间接表达各种概念之间的相互关系的一种检索语言。主题语言的具体表现形式是主题词表,主题词表也像分类表一样是文献标引人员与用户检索文献的共同依据。

主题语言根据构成原则与编制方法不同,可分为以下4种。(1)标题词语言(标题词法)(2)单元词语言(单元词法)(3)叙词语言(叙词法)(4)键词语言(关键词法)

它们可统称为主题法系统。其中标题词法、单元词法、叙词法是用规范化名词标引和检索文献的主题概念语言,按这些规范化名词的字顺编排为词表分别称为标题词表、单元词表和叙词表;关键词法是指直接选自文献标题或内容中具有实质意义的自然语言作为标引和检索文献的语言。因此,关键词法是未经规范化处理的自然语言,无受控词表,下面分述这几种语言的特点。1.标题词法

标题词法是用规范化的自然语言作为文献主题标目和检索依据,并以事先固定的词表组配方式进行标引和检索的一种主题语言。标题词法属先组式主题语言,标题词预先确定组配关系是其主要特征,如美国EI在1993年以前就是使用标题词语言标引和检索文献的典型检索工具。2.单元词法

顾名思义是以不能再分解的概念单元的规范化名词作为文献主题概念的标识。它不选用词组或短语去表达复杂的概念,这是与标题词法的主要区别。例如,对于“制冷材料”这一概念,按单元词法是通过“制冷”和“材料”这两个元词组配来表达该概念,而标题词法则直接选用“制冷材料”这个词组来表达它。实际上,表达事物概念,除了单一概念外,还有许多的复合概念。随着科技的不断发展,单元词法已被更先进的叙词法所取代。3.叙词法

叙词法是以规范化的自然语言词汇为基础,以概念组配为基本原理来对文献的内容特征进行描述的后组式标识系统。叙词法是主题法的最高级形式,它综合了多种检索语言的原理和方法,扬长避短,这主要体现在以下几方面:吸取了单元词语言后组式特点;采用了组配分类法的概念组配来代替单元词法的字面组配,并适当采用标题词法的预先组配的方法;吸取和继承了分类法的基本原理编制范畴索引和词族索引;借鉴了关键词法的轮排方法;采用了标题词法的参见系统并加以完善,以及直接引入体系分类表或分面分类表。例如,美国国防部和工程师联合会协作编制的《工程和科学术语叙词表》(Thesaurus of Engineering and Scientific Terms,TEST)、英国电气工程师学会编辑出版的《INSPEC叙词表》以及我国编辑和出版的《汉语主题词表》等都是使用叙词语言标引和检索文献的典型词表。4.关键词法

关键词是直接从文献的篇名、正文和文摘中抽选出来的,用以揭示文献内容特征的具有实际意义的自然词汇。

关键词法无须像标题词法、单元词法、叙词法那样有受控词表,它比起主题法系统里的其他几种语言选词方便、简单迅速,尤其是使用计算机进行检索,就更加显示出了优越性,可快速帮助用户了解最新信息。但用关键词法编制的检索工具的质量比较粗糙。

主题语言比分类语言表达概念准确、灵活、专指度高,便于读者检索,特别是对一些新兴学科、边缘学科的查找尤其方便。此外主题语言还可打破传统的学术分类的框框,把分散于各个学科里的有关某课题的文献集中于同一主题之下,有利于综合性研究。

2.4 信息检索方法、途径和步骤

进行任何一项工作都要讲究方法、途径和步骤,如果使用不当,费工费时。同样,信息检索也有其独特的一套操作程序。

2.4.1 信息检索方法

信息检索方法应据课题的目的、性质和检索工具的现状灵活选定。一般来说,可以从手工检索和计算机检索两方面分别叙述。1.手检方法(1)常用法

常用法是信息检索中最常用的一种方法,因为是利用检索工具来查找,故又称为工具法。其按查找时间的顺序不同又可分为顺查法、倒查法和抽查法3种。

①顺查法:顺查法是一种按照时间顺序由后向前的查找法。如接过某一课题,先要摸清课题的起始年代,然后再逐年依次由远向近进行查找,直到认为文献够用为止。顺查法检索全面、不易漏检,但费时费力,适于撰写综述性文章。

②倒查法:倒查法是一种逆着时间顺序由前向后的查找方法。该法多用于一些新课题新内容的查找,因此是由新向旧去查找,直至找到所需资料够用为止,不必逐年的资料都查。该法查询近期文献,效率高、省时省力,但有可能漏检。

③抽查法:抽查法是针对某一学科在某一段时间里发展迅速,如正值该学科处于鼎盛时期的文献为主,单独抽出这一时期,利用检索工具进行查找。该法重点检索某一时期的文献,检索效率高,但必须在熟悉学科的发展特点下进行,所以也易漏检。(2)追溯法

追溯法又叫回溯法,是以某一篇论文末尾所附的参考文献为依据,逐一追踪地检索方法。该法的连锁反应,可查到有关某一专题的大量参考资料。该法直观、方便,在不备检索工具的情况下,是一种扩大情报源的最好办法,但检索效率低、漏检率高。如果能使用有关的引文检索工具(见3.3节“美国《科学引文索引》”和4.5节“中国社会科学引文数据库”),则可获得较好的效果。(3)分段法

分段法是交替使用以上所提的两种方法,因而又叫循环法。具体来说,就是先使用检索工具查找某课题几年内的资料,再利用该资料末尾所附参考文献追溯查找。一般5年之内的文献被引用参考的较多,因此可以只追溯5年左右的时间,然后再用检索工具查出一批文献进行追溯,这样分批分段地交替进行,如此循环,直至认为够用为止。2.机检方法

随着信息技术的发展,计算机检索将逐步占有主导地位。计算机检索方法也称检索方式或检索界面,目前参差不齐。一般有专门机构维护管理的数据库都提供各种各样的检索方法,而多数的网站网页则不提供检索方法,只能浏览。但无论如何计算机检索方法没有固定模式,主要可归纳为以下几种。(1)基本检索

基本检索是一种最简单的检索方法,多数数据库只提供一个检索框且只能输一词或一个词组检索,但也有的数据库可对两词或多词进行逻辑组配检索。(2)高级检索

在高级检索中,用户可通过点选检索系统给定的检索算符对多词进行逻辑组配检索。高级检索提供的检索框也较多,一般一个检索框只能输一词或一个词组,检索框多控制在2~5个。(3)专业检索

专业检索一般只有一个大检索框,要求用户自己输词、字段、检索算符进行组配检索。专业检索要求用户有熟练的检索技术。(4)分类检索

一般按分类表进行限定检索,或按学科进行一级一级浏览。(5)二次检索

二次检索是在以上单项检索的基础上,进一步选用新词进行缩小范围的检索。

2.4.2 信息检索途径

检索途径通俗地讲就是查找文献信息的入口,在手检中,检索入口取决于检索工具提供的索引的多少,在机检中,检索入口取决于数据库提供的检索字段(手检中文献的著录项目)。但是检索工具提供的索引有限,而数据库提供的可检索字段几乎覆盖了组成文献的全部著录项目。因此,机检比手检的检索入口宽泛了许多。本书仅介绍以下几种主要的检索途径。1.文献名称途径

文献名称途径是根据书刊篇名名称途径进行查找的一条途径。如各种题名字段、书名目录、篇名索引、刊名一览表等检索工具皆是用此途径检索。它是把文献名称按照字顺编排起来的检索系统。使用时,与查字典相似。2.著者途径

著者途径是以著者姓名为线索的检索途径。这里的“著者”包括个人著者、团体著者、专利发明人、专利权人、合同用户、学术会议召集单位等。著者姓名途径主要是利用著者字段、著者目录、著者目录(索引)、团体著者目录(索引)、专利权人索引、机构字段、机构索引等。这些字段、目录(索引)都是按其姓名字顺编排,在已知著者的前提下,很快就可查到所需文献。但要注意外国与中国著者书写上的区别。3.号码途径

号码途径是利用文献信息自身的编号检索文献的一条途径。许多文献有固定的注册编号,如报告号、标准号、专利号、合同号、馆藏号、索书号等,一般都是按字母和数字顺序排列。4.分类途径

分类途径是按照文献信息的知识内容及所属学科性质而类分和检索文献的途径。常用的工具有分类字段、分类目录和分类索引等。分类途径的检索依据是分类法或称分类表也称分类语言(见2.3.2小节“分类语言”),使用这种检索途径的关键是熟悉和掌握分类表。对于文献信息的学科分类,世界各国都有自己的分类法,此外对于不同的文献,可能要采用不同的分类法。如专利文献要使用专利分类法,标准文献要采用标准分类法等。5.主题途径

主题途径是通过代表文献信息内容的主题词来检索文献的一条途径。常用的工具有主题字段、关键词字段、主题索引、叙词索引、关键词索引等。主题途径的检索依据是主题语言(见2.3.3小节“主题语言”),使用这种检索途径的关键是熟悉和掌握主题词表。

2.4.3 信息检索步骤

信息检索步骤即检索过程,一般可归纳为以下5个步骤。1.分析研究课题

分析研究课题是整个检索过程的关键,只有对研究课题进行全面的调查了解,才能做到心中有数。分析课题应从信息需求的目的和意图入手,明确该课题检索的目的是属科研立项、科技成果查新,还是进行专利申请、撰写学位论文;是设备论证,还是引进消化;是查找统计数据、具体事实,还是查找医疗信息;是查找某一企业状况,还是查找某一技术攻关等。2.选择检索工具或数据库

一般情况下,检索工具或数据库的选择应从课题的学科范围、语种范围、时间范围、文献类型、经费支持、检索功能、服务方式等多方面考虑,总之要选择专业对口的、信誉度高的检索工具或数据库。此外,选好检索工具或数据库后,还应在一定的范围内试查一下,看是否合适。3.确定检索途径(检索字段)及检索方法(检索方式),形成检索标目(构造检索提问式)

如前所述,检索途径包括分类、主题、著者、序号等,选择哪一种,一要根据研究课题的已知条件,二要根据所选检索工具或数据库。手工检索工具正文只提供一条途径,索引可补充其他途径。检索方法也有3种,各有特点:分段法适用馆藏不多,检索工具缺藏的情况;如检索工具齐全,又具备检索能力,应采用常用法;对不熟悉图书馆的读者,一般只能采用追溯法和浏览法。检索标目是在对课题分析的基础上,找出检索线索,形成能代表文献特征的检索标识。若课题的已知条件是某一作者或文献编号或书刊名称等,那么检索者只要用相应的名称、号码做检索标目即可;若课题的已知条件仅仅是课题内容,那么只能对课题内容进行主题分析,核对主题词表或分类表,确定检索标目。

对于计算机检索来说,就是确定检索方式、检索字段、构造检索提问式。所谓构造检索提问式就是用各种检索算符将简单概念的检索词进行组配成能表达课题需求的复杂概念的检索提问式。其中检索词的选择至关重要,一般采用“聚类组合法”即对检索课题按序实施如下7项操作:切分、删除、替换、聚类、补充、增加和组合,从而生成检索式的方法。(1)切分

切分就是对课题语句进行切分,以词为单位划分单词或词组。切忌眉毛胡子一把抓,不假思索地把整个课题照搬。如查“儒家文化对韩国经济的影响”,用中文科技期刊数据库,不可直接照搬检索,必须先进行切分:儒家文化韩国经济影响。(2)删除

删除是指对不宜做检索词的词进行剔除,且避免使用一般概念性的词做主题词,如研究、状况、合成、应用、性能、发展、影响等。如对上例进行切分后,还要删除:影响。(3)替换

替换用更具体、明确的词替换掉某些表达欠佳的词。如在EBSCO库中可用更专指或更专业的检索词fashion show替换apparel show、clothing show、garment show三词。(4)聚类

如从文献的外部特征上聚类,可将彼此“非常相关的词”归于一类。如常把folk-custom和folklore合并起来使用。(5)补充

补充就是对缩略词组进行还原作为补充。(6)增加

通过逻辑“或”增加同义词,逻辑“与”、“非”增加限义词,避免由于检索词一词多义造成的误检问题。(7)组合

组合就是使用布尔逻辑算符、全文算符、截词算符及字段算符等将以上“聚类组合”过的课题构造成合乎需要的检索提问式。

在构造检索提问式时,要注意各种算符的运算顺序,位置算符、截词符等的使用方法,还要考虑各个检索项的限定要求及输入次序等。4.实施检索

在分析课题的基础上,选择好检索工具或数据库后,即可按照一定的检索途径(检索字段)和检索方法(检索方式)实施检索。经过阅览便可决定取舍,凡符合课题要求的应随时记录其文献出处,以便查考原文备用。

但在实际的课题检索当中,经常是首次输入的检索提问式的检索效果,并不一定就完全符合用户的要求,此时就需要及时采取措施、调整检索策略。有关调整检索策略的内容见3.5节“检索策略的制定与调整”。5.索取原始文献

索取原始文献看似简单,但实际操作起来并非易事。对于手工检索,在索取原文之前,必须要解决以下两方面的问题。(1)识别文献类型

检索工具著录的文献出处款目项中,一般对文献类型不加说明,需用户自己识别,若不会识别,就无法找到收藏原文的处所。检索刊物所收藏的文献大致有图书、期刊、会议文献、科技报告、学位论文及专利文献等,均可以从“文献出处”款目项中加以判断,这对用户按不同的文献类型去查找不同的馆藏目录、索取原文具有实用价值。下面举例说明各种文献的著录特征。

①图书:图书的著录特征除著者、书名外,还有出版社、出版地、出版时间、图书总页数、国际标准书号等。

②期刊:期刊出处的著录一般包括刊名、年、卷(期)、页次等,如Compu.Wld.J.2003, 19(2),125—31,不过这里的刊名采用缩写著录。

③会议文献:会议文献的著录出处要掌握三要素:会名、会址和会期。

④科技报告:科技报告出处的著录特征主要为报告号,如ESA106879。

⑤学位论文:学位论文出处的著录特征主要有学位名称、颁发学位的大学名称、地点及授予学位的时间。例如Master Thesis Dissertation,Stanford Univ.,Stanford,CA,1985。

⑥专利文献:专利文献出处的著录特征主要有国别代码、专利号及专利的法律状态,如CN1015681B。但日本的专利著录有些特殊,例如在CA中:Jpn.Kokai Tokkyo Koho(专利类型)、JP6001,427[8501,427](国别及专利号)、(CL.D0607/00)(国际专利分类号)。(2)缩写刊名还原

国外的大部分检索工具中,为了压缩篇幅,其文摘著录的刊名出处中,一般采用了缩写著录。因此,还必须将缩写刊名转换成全称,才能索取原文。其方法如下。

①西文期刊的缩写转换全称,可利用检索工具中的“期刊表”对照转换,如EI可使用“Publication List”还原,CA可利用“Chemical Abstracts Service Source Index”转换等。

②对于非拉丁语系的国家,如日文、俄文的刊名缩写的还原比较麻烦。因为这些文种的刊名在用英文书写的检索工具中一律采用拉丁文音译缩写著录,因此首先应使用检索工具中提供的“期刊表”将其缩写刊名变成全称,而后再借助“俄文字母——拉丁字母音译对照表”及“黑本式拉丁字母——日文字母音译对照表”将检索工具中的拉丁字母转换成相应的日文、俄文刊名,最后便可索取原文。

③对于中文出版的期刊,在用英文书写的检索工具中既有按汉语拼音音译的,如Zidonghua Xuebao,也有按英文意译的,如Chinese Journal of Lasers,但港台期刊多采用威妥码拼音著录,如Hsin Hsien Wei。因此在使用时应特别注意,切忌把音译刊名直接当成英文刊名去查找原文。

对于计算机检索,若是全文库或网络信息检索,一般都能看到原文;若是文摘题录库,可记录其论文题名和文献出处,使用CASHL或NSTL机构的原文传递功能索取全文,可详见5.4节“CASHL网站”和5.5节“NSTL网站”相关内容的讲解。

2.5 信息检索系统与检索工具

信息检索系统和检索工具是信息检索的利器,随着时代的变迁,检索系统和检索工具也在不断地升级换代。本节分别从手工检索和计算机检索两方面加以解析。

2.5.1 信息检索系统

信息检索系统是集信息收集、加工、存储、检索和管理于一体的信息服务系统。一般来说,组成信息检索系统的基本要素有:文献信息、检索设备、检索语言、信息存储方法与检索方法、系统管理维护人员和用户。这几大要素的运行情况直接反映着信息检索系统的服务效果。信息检索系统按其检索方式可分为手工检索系统和计算机检索系统。1.手工检索系统

手工检索系统由手工检索设备(目录、题录、文摘、索引、卡片等)、检索语言及文献库等组成。该检索系统检准率高、成本低,但检索速度慢、效率低。2.计算机检索系统

计算机检索系统由计算机检索设备(光盘检索设备、联机检索设备、网络检索设备等)、检索语言及数据库等组成。该检索系统检索效率高、检索范围广、内容全,但检索费用高、灵活性差。

2.5.2 检索工具

从整个文献检索过程来看,无论是存储还是检索,都离不开检索工具。那么什么是检索工具呢?

检索工具是按照一定的学科或主题范围、将所收录文献的条目和检索标识依据一定的规则(检索语言)编排组织在一起的二次文献。其中文献条目指描述文献外部特征(题目、著者、出处)和内容特征(主题词、分类号)的记录单元。被标引了的文献特征叫检索标目(检索标识),它是存储和检索文献的入口词。只是在机检中文献条目称字段,且所有字段都可作为检索入口词。

其实广义的检索工具与检索系统是一致的,只是在手检中习惯称检索工具,在机检中多数称为检索系统或数据库。检索工具的类型众多,本书仅按检索手段划分,将其分为手工检索工具和计算机检索工具两大类。1.手工检索工具

手工检索工具是指无须借助任何辅助设施即可处理和查询的检索工具,多指那些传统的印刷型检索工具。手工检索工具主要通过“手翻、眼看、大脑判断”方式进行浏览、检索,因此,检准率高,但检索速度慢、效率低。若按其著录内容细分,可划分为以下3种。(1)目录(题录)

目录是描述文献外部特征的文献条目,并按一定的次序编排起来的集合体。文献的外部特征包括题名、著者、出处、文种等,其特点是报道及时且量大,但揭示文献深度不够。

目录的著录对象可以是整本文献,也可以是单篇文献(题录)。我国出版的题录性检索工具有《中国社会科学文献题录》,外国的有美国的《Chemical Title》等。(2)文摘

文摘是除题录外还对文献内容做实质性描述的文献条目,即比目录(题录)式检索工具多一项内容摘要条目。因此文摘性检索工具在揭示报道文献的深度及实用性等方面都优于题录,有时甚至能代替原文,从而可大大节省查阅时间、起到事半功倍之效。文摘是检索工具的主体。

文摘有报道性文摘、指示性文摘和评论性文摘3种。文摘性检索工具很多,如《管理科学文摘》、JEL、EI、PROMT等。(3)索引

索引是将事物标识(著者、关键词、主题、分类等)及其有关指引线索,按照一定的顺序加以排列,并注明其所在文献中的位置(页码或文摘号等),以便检索相应文献的检索工具。它的特点是用户利用简单、方便,但也和目录一样未能反映文献内容。

索引比目录和文摘性检索工具应用更广,不仅有正式出版的索引刊物(独立的索引刊物),如人民日报索引、计算机公司名录索引等,还有许多的文摘、目录刊物之后附有各种辅助索引,如主题索引、著者索引、关键词索引等。尤其是辅助性索引应用更广,现已成为检索工具不可分割的组成部分。2.计算机检索工具

计算机检索工具主要分为以下3种。(1)光盘检索

光盘检索是采用计算机作为手段、以光盘作为信息存储载体和检索对象进行的信息检索系统。(2)联机检索

联机检索是一台主机带多个终端的计算机信息检索系统,它具有分时操作能力,能使许多相互独立的终端同时进行检索。这种检索是用户使用计算机终端设备通过通信线路,直接与主机对话,用户可输入提问表达式并马上得到答案。联机检索系统一般都设有数百个数据库,而每个数据库又包括几十万、几百万条数据信息。(3)网络检索

该系统同联机检索系统的主机和用户终端的主从关系不同,网络检索是基于客户机/服务器的网络支撑环境的,客户机和服务器是同等关系,只要遵守共同协议,一个服务器可被多个客户访问,一个客户也可以访问多个服务器。Internet便是该系统的典型。网络信息检索是基于Internet的分布式特点开发和应用的,用户只要通过网络接口软件,即可在任一终端机上查询世界各地上网的信息资源。随着信息技术的发展,网络将成为信息源传递的主要渠道。

目前,联机检索和网络检索都是通过Internet进行检索,只是联机数据库由专门机构管理维护、数据内容全、准确、回溯年代长、具有权威性,在人们科研立项、项目鉴定等学术活动中起着举足轻重的作用,但收费也高。网络信息资源既没有统一的网络管理机构、统一的资源管理机构,也没有统一的信息索引标准,与联机检索相比,信息杂乱无序,可靠性查,但费用低、检索界面友好,颇受用户青睐。光盘数据库与联机数据库相比,虽然存在着更新时间慢、数据容量小、专业范围窄等缺点,但由于它使用时操作方便、易学易用、费用低廉,而且检索效果优于联机检索,发展速度及普及程度都相当惊人,很快便成为一个能够与联机检索平分秋色的竞争对手。因此3种检索各有特色,目前许多检索系统既有光盘检索、联机检索又有网络检索,可供用户选择。

2.6 数字图书馆

本节将从数字图书馆的由来入手,对数字图书馆的概念进行介绍。

2.6.1 数字图书馆由来

数字图书馆是相对传统图书馆而言的。众所周知,传统图书馆是一个人们看得见、摸得着、拥有一定数量馆藏和管理人员的一个物理建筑,是一个集收集、整理、保存、传递文献信息于一体的社会文化教育机构。在传统图书馆中,可通过以手工操作为主的工作人员,利用馆内的各种文献信息,为一定范围的读者提供服务,如外借服务、阅览服务、参考咨询、文献检索等各种服务。随着信息技术的发展,图书馆所收集信息的载体也发生了变化,由单一的印刷型发展成缩微型、机读型、声像型等几种形式并存,因此有人称其为电子图书馆。而网络技术的发展又使得图书馆打破了地域和时间的限制,使人们无论何时、何地都可以访问图书馆的信息,因而又有人称其为没有围墙的图书馆。鉴于这种图书馆是在网上访问的,而非现实当中存在的真实物理建筑实体,于是又有人称其为虚拟图书馆,由于其信息都是以计算机能识别的二进制的形式存储,因而又出现了数字图书馆的概念。

2.6.2 数字图书馆定义

那么,究竟什么是数字图书馆呢?可谓智者见智、仁者见仁、各抒己见,刘炜在《数字图书馆引论》一书中曾经做过统计,有关数字图书馆的定义接近百种,它们都从不同的角度反映了数字图书馆的某些特征。以下列出了一些国内外有代表性的定义。1.美国数字图书馆联盟(DLF)定义(1998)

数字图书馆是一个拥有专业人员等相关资源的组织,该组织对数字式资源进行挑选、组织、提供智能化存取、翻译、传播、保持其完整性和永存性等工作,从而使得这些数字式资源能够快速且经济地被特定的用户或群体所利用。2.WiIIiam Y.Arms定义

数字图书馆是具有服务功能的整理过的信息收藏,其中信息以数字化格式存储并可通过网络存取。该定义的关键在于信息是整理过的。3.孙坦定义

从社会需求和技术条件分析,数字图书馆的核心和本质是利用现代信息技术,以计算机网络为基础平台,构建一个有利于产生影响新知识的资源、工具和合作环境,这种作为环境的数字图书馆不仅仅局限于网络数字信息资源的开放利用,更是一个促进信息获取、传递、交流的知识网络。4.国家图书馆定义

数字图书馆为国家信息基础设施提供关键性信息管理技术,同时提供其主要的信息库和资源库。换句话说,数字图书馆是国家信息基础设施的核心。5.大英图书馆定义

利用数字技术获取、存储、存取、发布信息的图书馆。6.百度百科对数字图书馆定义的概括

通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。数字图书馆既是完整的知识定位系统,又是面向未来Internet发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组织的公众信息传播。

数字图书馆是对以数字化形式存在的信息进行收集、整理、保存、发布和利用的实体,其形式可以是具体的社会机构或组织,也可以是虚拟的网站或者任何数字信息资源集合。

由此可见,数字图书馆具有这样几个特征:数字化信息资源为基础,网络化传递为手段,多种信息技术为支撑,分布式的普遍存在,并提供个性化、人性化和动态化服务。

目前,国内知名度较高的商业化数字图书馆有超星数字图书馆、书生之家和北大方正的Apabi数字图书馆等。

2.7 结构化信息与非结构化信息

信息的种类繁多,按照不同的形式划分可有不同的称谓,本书2.1.2小节已详细介绍了文献型信息媒体,本节从存储信息的数据结构入手,对结构化信息与非结构化信息作一阐述。

2.7.1 结构化信息

数据分为结构化数据、半结构化数据和非结构化数据。

结构化信息是结构化数据的产物,是指经过严格的标引后的数据,一般以二维表的形式存在。也就是通常所说的可以数字化的数据信息,这些数据信息可以方便地通过计算机和数据库技术进行管理。如电子商务信息,多数出版商发行的各种文摘、数值、全文数据库皆属于此。也有人从信息的表现形式上称为显性信息,信息的性质和量值的出现的位置是固定的,有规律可循。本书所介绍的信息检索,主要是针对结构化信息而言。

2.7.2 非结构化信息

非结构化信息是非结构化数据的产物,是指各种看似相关性比较弱、无法用关系型数据库等结构化的方式来获取和处理的信息。通俗地说是没有经过人为处理的不规整的信息即无法完全数字化的信息,如文档文件、图纸资料、缩微胶片、多媒体信息、企业内外部的新闻邮件、合约、票据、文书处理、电子表格、简报档案、采购记录、Internet上的消息、BLOG、BBS等。也有人从信息的表现形式上称非结构化信息为隐性信息。这些信息中隐性包含了掌握企业命运的关键信息,隐含着诸多提高企业效益的机会。

非结构化信息有其自己的一些特点,其所有内容都是不可预知的,格式多样化,无统一标准,不像结构化数据一目了然。特别是多媒体数据中蕴涵着大量的非结构化信息。所以对非结构化信息的整合、存储、检索、发布等都带来了一系列的挑战。

据媒体和研究报告报道85%以上的信息都在“结构化”世界之外。它们在证券、银行、保险、工商、地税、图书馆等行业中得到广泛应用,因此如何有效的开发非结构数据,对其进行管理,提取当中的隐含信息,对决策进行支持成为当今亟待解决的主要问题。

小结

本章主要介绍了与信息检索有关的一些基本概念,如信息源与信息媒体、信息检索原理、信息检索系统与检索工具、数字图书馆、结构化信息与非结构化信息,重点讲述了检索语言、信息检索方法、途径和步骤。练习题

1.什么是题录、文摘和索引?

2.什么是检索语言?它有哪些类型?

3.利用分类和主题途径检索文献的关键是什么?

4.要查找日本三菱电子株式会社发明的专利,试问用什么途径查找?并写出该途径的检索入口词。

5.简述电子文献信息媒体的几种划分形式。

6.简述信息检索的步骤,在机检中构造检索提问式要考虑哪几方面的问题。

7.什么是结构化信息?什么是非结构化信息?

8.数字图书馆是只针对机构而言的吗?

9.什么是手检?什么是机检?

第3章 核心检索工具

尽管在信息化飞速发展的时代,多数人已将使用了几十年的印刷型检索工具淡忘。但温故而知新,只有了解过去,才能更好地把握今天、展望未来。本章介绍的几种国内外纸本核心检索工具,其目的是为了更好地学习后面的电子数据库,找出印刷型检索工具和电子版数据库之间的渊源联系。

3.1 中文及外文文献的检索工具介绍

在21世纪之前,印刷型检索工具曾是信息检索课的主导内容,本节仅介绍国内外著名的3种印刷型检索工具。

3.1.1 《全国报刊索引》

《全国报刊索引》是报道国内主要报刊信息的大型综合性题录式检索刊物。该刊创刊于1955年,前后经历了许多变革,1959年后改为上海图书馆编辑出版,1966年10月~1973年9月曾停刊,从1980年起分为哲学社会科学版和自然科学技术版两个分册出版,刊期为月刊。《全国报刊索引》系选自上海图书馆新近入藏的报刊1500余种,涉及所有哲学、社会科学、自然科学和工程技术领域。该索引正文采用《中图法》编排,在每期正文前有分类目录,正文后均附有个人作者索引、团体作者索引、题中人名索引及引用报刊一览表,各种索引均按其名称的汉语拼音顺序排列。案例分析检索2008年“K81传记”大类下的有关文献解析:由所给条件可知,本题属于《全国报刊索引》哲学社会科学版的内容,且只能使用正文查找,找到2008年的《全国报刊索引》的12期,查每期分类目录“K81传记”的具体页码,然后依据页码在“K81传记”大类下浏览所要的文献即可。以下是从2008年第9期“K81传记”大类下摘选的一条样例:K81传记①K815人物总传:按学科分②080918184③季羡林与泰戈尔④/(澳)班固志著⑤(澳大利亚悉尼大学)⑥;刘建译⑤//南亚研究(北京)。⑦-2008,(1)。⑧-84-88,90⑨著录格式说明:①中图法3级分类号、类名。②中图法4级分类号、类名。③顺序号。④文献题名。⑤/外国人用括号注名国家,责任者。⑥第一作者所属单位紧跟作者之后放在括号中。⑦//报刊名,出版地放在括号中。⑧-年,卷(期)。⑨-页码。若要查看原文,可根据⑦、⑧、⑨三项记录到图书馆报刊室、电子版数据库或委托《全国报刊索引》复印都可。

3.1.2 国家标准文献检索

标准是在一定地域或行业内统一的技术要求。标准不仅适用于企业,也适用于旅游、金融、科技服务、机关、教育及社会公益事业等行业,因此标准文献应用广泛。本小节仅介绍检索国家标准文献的几种印刷型检索工具。1.国家标准概念

所谓标准文献是指在有关方面的通力合作下,按照规定程序编制并经主管机关批准,以特定形式发布,为在一定的范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则、定额或要求的文件。标准一般以科学、技术和经验的综合成果为基础,以促进最佳社会效益为目的。

标准类型种种,按其标准化对象可分为技术标准、管理标准和工作标准;按其内容可分为基础标准、产品标准、检验标准、方法标准和安全标准;按其成熟度又可分为法定标准、推荐标准、试行标准和草案标准;按其属性可分为强制性标准和推荐性标准;按其使用范围可分为国际标准、地区标准、国家标准、行业标准、地方标准和企业标准。

国家标准是指对需要在全国范围内统一的技术要求的文件。国家标准由国家标准化管理委员会编制计划、审批、编号、发布。国家标准代号为GB和GB/T,其含义分别为强制性国家标准和推荐性国家标准,由国家标准汉语拼音字头缩写GB打头,后跟序号和年份,如GB 9353-88、GB/T 9353-1998。2.标准分类

2.3.2小节“分类语言”中提到的《中国图书馆分类法》只适用于书刊文献的分类,而对于我国的标准文献分类,要使用《中国标准文献分类法》(CCS)。CCS原则上把标准文献细分到二级类目。一级类目共设24个大类,用英文大写字母A-Z(除I和O)表示,见表3-1。二级类目用两位阿拉伯数字表示。例如,M通信、广播(一级类目)、M72音响、电声设备(二级类目)。表3-1 《中国标准文献分类法》一级类目3.国家标准检索工具

印刷型国家标准检索工具即指各单位收藏的纸本式标准汇编、标准目录等,这些检索工具提供的检索途径主要有标准号、分类和主题等几种。

目前能检索我国国家标准文献的手工检索工具主要有以下几种。(1)《中国国家标准汇编》《中国国家标准汇编》由中国标准出版社出版,收录了我国公开发行的全部国家标准全文。该汇编自1983年起按国家标准顺序号由小到大汇编成册、陆续出版,至今已出版了370多个分册。若知道标准号,则可很快用这种汇编标准查到所需的标准原文。(2)《中国国家标准汇编》修订本《中国国家标准汇编》修订本由于标准的动态性,每年都有相当数量的国家标准被修订。对修订的国家标准,原标准顺序号不变,只是把年号改为修订的年。为此我国从1995年起又新增出版被修订的国家标准汇编本。修订的国家标准汇编本的正书名、版本形式、装帧形式与已出版的《中国国家标准汇编》相同,不占总的分册号,仅在封面和书脊上注明“××× ×年修订-×”等字样,作为对《中国国家标准汇编》的补充。修订的国家标准汇编本按年分册出版,其中的标准仍按顺序号由小到大排列,但不连续。重要提示查我国国家标准原文应从两方面入手:①按《中国国家标准汇编》分册号查;②按《中国国家标准汇编》修订本查。(3)《中华人民共和国国家标准目录总汇》《中华人民共和国国家标准目录总汇》由国家质量技术监督局编辑,责成中国标准出版社每年出版一次。每年上半年出版新版,载入截止到上一年度批准发布的全部现行国家标准信息。该目录总汇正文按中国标准文献分类法(CCS)编排,每一大类列出二级类目分类号及类名,正文著录包括分类号、标准编号、标准名称、采标情况、代替标准5项内容,书后附有国家标准顺序号索引。(4)《中华人民共和国国家标准目录及信息总汇》《中华人民共和国国家标准目录及信息总汇》由国家标准化管理委员会编辑,中国标准出版社出版。每年上半年出版新版,载入截止到上一年度批准发布的全部现行国家标准信息,同时补充载入被代替、被废止国家标准目录及国家标准修改、更正、勘误通知等相关信息。该目录及信息总汇包括4部分内容:国家标准专业分类目录,被废止的标准,国家标准修改、更正、勘误通知信息及索引。其正文著录格式与《中华人民共和国国家标准目录总汇》相同。重要提示在使用“目录”式检索工具时要注意,某年的标准目录只收录到上年年底前所有的现行标准,如《中华人民共和国国家标准目录及信息总汇2005》只汇集了截至2004年年底以前我国公开发布的国家标准及有关信息,实际上它是上一年前的累积标准目录。因此检索时最好选择最新版本的标准目录。(5)《标准文献主题词表与分类法对照索引》《标准文献主题词表与分类法对照索引》由中国技术监督情报研究所与上海市技术监督情报研究所编辑、中国标准出版社出版,该对照索引是标准文献检索语言的综合性对照索引,它将《标准文献主题词表》、《国际标准分类法》和《中国标准文献分类法》进行分析对照,形成了标准文献主题检索语言和分类检索语言统一的对照索引。利用该对照索引可以实现3种检索语言的相互对照转换。该对照索引实际上是从标准文献主题词入手,查找国际标准分类号和中图标准文献分类法的一种索引。案例分析检索国家标准中面制食品中铝的限量标准近来媒体中报道面制食品中铝超标的信息不少,请用有关的国家标准确认一下面制食品中铝的限量标准应该是多少?解析:此题既可用分类途径也可用主题途径检索。用主题途径检索的具体步骤如下。(1)使用《标准文献主题词表与分类法对照索引》,据题意按主题字顺选:食品检验67.020食品工艺C53食品卫生其中食品检验为主题词,67.020食品工艺为《国际标准分类法》的分类号及类名,C53食品卫生为《中国标准文献分类法》的分类号及类名。(2)使用2006年的《中华人民共和国国家标准目录及信息总汇》,按分类号C53进行浏览:C53,GB 2762-2005,食品中污染物限量,代替GB 2762-1994,GB4809-1984等。(3)由以上信息可知,“食品中污染物限量”这件标准最新修订版是2005年,因此要使用《中国国家标准汇编》修订本,按修订年份和标准顺序号确定该标准的准确位置(2005年修订-2,437页),阅读原文,知道面制食品中铝限量指标为100mg/kg。用分类途径检索的步骤比主题途径检索少一步,即与后两步相同。

3.1.3 EI检索

EI与SCI(科学引文索引)、ISTP(科学技术会议录索引)并列为世界著名的三大综合科技类检索刊物。目前,许多单位都对这三大检索刊物收录论文的情况做统计排名,以此作为衡量学术水平的一个重要参考指标。本小节仅介绍EI的印刷版本检索。1.EI特色

EI是The Engineering Index(工程索引)的简称,最初由美国华盛顿大学土木工程系教授J·B·Johnson于1884年发起创刊,至今已有一百多年的历史。EI几经变迁,1998年又归属于爱思唯尔科学(Elsevier Science)出版集团的工程信息公司(Engineering Information Inc.,简称EI公司)出版发行。

EI名为索引,实为文摘。EI之所以会成为世界瞩目的检索刊物,是因为它具有以下几个特点。(1)收录文献范围广、报道文献内容全。

EI收录了世界上近50个国家的15种文字出版物,其中以英美的英文出版物为主,但近年来引用的日文出版物和我国出版物有增多的趋势,其中我国出版物已有100余种。

EI若按报道学科的范围则涵盖工程和应用科学领域的各学科,涉及核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等工程领域。

EI若从收录文献类型来看,以工程类期刊(3500种)、会议(1000种)为主,兼收图书、报告等刊物,共5000余种。(2)纯基础理论方面的文献资料不收,专利文献也不收,只在1969年以前收有少量专利。(3)出版形式多样化。

①EI月刊(EI Monthly):出版快、报道时差短、跟踪检索快、适宜查找最新资料。

②EI年刊(EI Annual):将EI本年度的各种索引辅表及月刊报道过的文摘按主题字顺重新汇集成册,每年出版一卷,进行追溯检索方便。

③EI累积版本(EI Cumulative):自1973年起开始编辑出版,把每3年的内容又重新汇集出版,特别适应回溯性检索。

此外EI还出版缩微胶卷(EI Microfilm)、磁带(EI Compendex)、光盘(EI Compendex Plus)及Web版(EI Engineering Village)等。(4)采用主题编排。

EI文摘正文按主题词编排,但1993年以前使用的是《工程标题词表》(SHE),由主、副两级标题词之分,且主、副主题词之间遵循一定的组配关系。1993年起,EI更新了其主题词表,改用叙词语言编制的《EI Thesaurus》。2.EI编排内容

EI出版形式多样,编排结构独特。但国内读者最常看到的是EI月刊和年刊两种形式。表3-2列出EI月刊和年刊编排内容。表3-2 EI月刊和年刊编排内容一览表3.EI检索途径

使用EI检索文献资料,主要有3条途径,如图3-1所示。图3-1 EI检索途径示意图案例分析查找1998年EI发表的有关论述股票价格动态方面的文献解析:由课题内容知,此题使用月刊、年刊皆可,既可从文摘正文入手,也可从主题索引入手。但最好用年刊,可一下找到全年的文献,且使用主题索引比从文摘正文检索标识多,因主题索引中的主题词由EI叙词和自由词两部分组成,而EI文摘正文只按叙词编排,检索时必须核对其叙词表选词。以下是用1998年年刊检索的具体步骤:(1)使用主题索引,按主题词字顺查找:STOCK PRICE DYNAMICS①Investigation of stock price dynamics in emerging markets.②A096966③M162591④年刊主题索引比月刊本著录内容详细,其中①主题词②论文题名③年刊文摘号,全年排通号④月刊文摘号。(2)依据年刊文摘号到1998年年刊中查文摘正文,其文摘正文的著录格式如下:MATHEMATICAL MODELS①096966②Investigation of stock price dynamics in emerging markets.③The emergence of stock markets in former centrally planned economies poses a significant problem to financial economists and policy makers in that price movements in these markets are not well explained by conventional capital theory. The opening of stock markets brings about a new equilibrium value P¯ for the firm. Shares are floated on an estimate of P¯, and buyers of these shares and individuals trading in the secondary market are also obliged to do so on the basis of their estimates of this magnitude. At any time, the market price of the firm’s shares then reflects the market’s best guess of what its value would be in the new equilibrium, and information on which to calculate estimates become more readily available as the stock market matures. This paper presents a stochastic price model which takes all of these factors into consideration. The model also provides a theoretical foundation underlying the pronounced trends of prices in emerging stock markets, and explains why they appear to be so volatile. (Author abstract)④12 Refs.⑤English.⑥Yeung, David W.K.⑦(Univ of Hong Kong, Hong Kong)⑧; Poon,Jessie P.H.⑦Appl Stochastic Models Data Anal v 14 n 2 Jun 1998⑨John Wiley&Sons Ltd,Chichester, Engl,⑩p 137-151.⑨说明:①叙词,黑体大写。②文摘号,每年从000001开始,但月刊和年刊顺序号不同。③论文题目,首字母大写。④文摘正文内容。⑤参考文献数。⑥原文语种。⑦著者姓名。⑧著者工作单位置于括号内,EI只对第一著者署名单位。⑨文献出处,其中刊名采用缩写且斜体著录。⑩出版商、地点、国家。(3)使用“出版物一览表”将缩写刊名进行还原。Appl Stochastic Models Data Anal-Applied Stochastic Models and Data Analysis。(4)索取原文。可根据文献出处等信息到图书馆外文期刊室或利用本馆订购的电子版数据库查看原文,当然还可通过文献传递服务索取原文。

3.2 引文索引相关概念

引文索引首先由美国情报学家加菲尔德博士(Dr.Eugene Garfield)提出,它一反其他检索工具通过主题或分类途径检索文献的常规做法,而是以期刊、会议、技术报告、学位论文等文献资料所发表的论文后所附的参考文献(引文)的作者、出处等项目,按照引证(来源文献)与被引证(参考文献)的关系进行排列而编制的索引,即从引文(文后参考文献)角度来设置独特的“引文索引”(Citation Index)。因此,引文索引是反映文献之间引用(来源文献)和被引用(参考文献)关系及规律的一种新型的索引工具。

根据引文索引,可将作者姓名(引文作者)为检索起点,检索该作者发表的论文都被哪些人(引用作者)、哪些文章(来源文献)引用过,并找出这些来源文献的内容和引用作者的单位。这样通过作者与作者、文献与文献之间的引用和被引用的关系,不仅能获得一定数量的相关文献,还能揭示旧文献对新文献的影响,新文献对旧文献的评价,展现新旧文献在学术研究中的依存关系,同时引文索引又打破了传统的学科分类界限,反映学科之间的交叉渗透的关系。因此,引文索引在信息检索、科学计量、期刊评价、科研规划等方面有着其他检索工具无法替代的独特作用。

本节就来明确以下与引文索引有关的几个概念。

3.2.1 引文、引文著者的概念

1.引文概念

引文文献,简称引文,即一篇文章后所附的参考文献。通过引文可追溯论文研究工作的背景和依据。

在实际使用中,也称被引用文献或被引文献。

因此,引文文献=参考文献=被引用文献=被引文献。

英文表示:Citation=Cited Document。

共引文献,也称同引文献,具有相同参考文献的两篇文献。如果共引文献数越多,说明两篇文献越相关。通过共引文献可追溯论文共同的研究背景或依据。2.引文作者概念

引文作者,即参考文献的作者。

在实际使用中,也称被引作者。

因此,引文作者=被引作者(Cited Author)。

3.2.2 来源文献、来源著者的概念

1.来源文献

来源出版物上刊载的文章称为来源文献。即现期期刊上发表的文章,只有在来源出版物上发表的文章才能在来源文献中查到,而被引文献则不受此限制。如用《清华大学学报(自然科学版)》做标识,在CSSCI(中文社会科学引文索引)来源文献中查不到,但在被引文献中则有。通过来源文献可反映论文研究工作的继承、应用、发展或评价。

在实际使用中,来源文献也有引用文献、引证文献或施引文献之称。

因此,来源文献=引用文献=引证文献=施引文献。

英文表示:Source Document=Citing Document。

来源出版物,是指刊载来源文献的期刊或专著丛书等。来源期刊是在一定的区域范围内,遵循文献计量学规律,采取定量与定性评价相结合的方法进行遴选的。如SCI每年从世界7万余种期刊中筛选出3000多种期刊为来源期刊,CSSCI则从我国3000种中文人文社会科学学术性期刊中精选出不到500种学术性强、编辑规范的期刊作为来源期刊,并从2005年开始每年调整一次期刊,实行动态管理。2.来源作者

来源作者,是指来源文献的作者,即现期期刊上的作者。

在实际使用中,来源作者也有引用作者、引证作者或施引作者之称。

因此,来源作者=引用作者=引证作者=施引作者(Citing Author)。

3.3 美国《科学引文索引》

美国科学信息研究所(Institute for Scientific Information,ISI)是美国情报学家加菲尔德博士(Dr.Eugene Garfield)1958年创立的私人机构,世界上知名度最高的三大引文索引均出自该机构,它们是科学引文索引(Science Citation Index,SCI)、社会科学引文索引(Social Sciences Citation Index,SSCI)和艺术与人文科学引文索引(Arts&Humanities Citation Index, A&HCI)。本节仅介绍SCI的印刷版本检索。

3.3.1 SCI简介

美国科学引文索引(Science Citation Index,SCI)创刊于1963年,以期刊目次作为数据源。SCI最初为印刷版,现已发展成印刷版、联机版、光盘版、网络版几种形式并存。印刷版和光盘版收录了世界上3500余种核心期刊,联机版和网络版收录了近6000种核心期刊。其内容主要涉及数、理、化、农、林、医、生命科学、生物科学、天文、地理、环境、材料、工程与计算机技术等学科,其中尤以物理、化学和生命科学所占比重为大。因此,SCI主要反映的是自然科学基础研究成果,在学术界被公认为最高水平的检索刊物。

3.3.2 SCI编排内容

SCI是通过设置引文索引来掌握所研究课题的来龙去脉,并迅速检索与其相关的研究文献。SCI印刷版为双月刊(6期/年),自1988年第5期起分为A、B、C、D、E 5个分册出版,正文设有引文索引(Citation Index)、来源索引(Source Index)、团体索引(Corporate Index)和轮排主题索引(Permuterm Subject Index)4部分内容。另附来源出版物目录。在此仅以印刷版为例,介绍一下SCI的编排格式。1.引文索引(Citation Index)

SCI的引文索引由著者引文索引、匿名引文索引和专利引文索引3部分组成。原为A、B两个分册,自1988年第5期起分为A、B、C 3个分册。

A分册为著者引文索引,是以引文作者(被引作者即参考文献中的作者)的姓名字顺排列的一种索引,均按姓氏用全称居前、名字用缩写步后的形式出现,引文作者仅列第一作者。引文索引中每条索引款目的著录格式又分被引文献和引用文献两项。被引文献项按被引作者姓名、被引文献发表年份和原文出处排列,且全部用黑体标注。引用文献项按引用作者姓名和文献出处排列。

同一引文作者下,按该作者被引用的文献出版年顺序排列,在同一年下按期刊缩写名称字顺排列。以下为著者引文索引的著录片段。

说明如下:

①被引作者姓名;

②被引文献发表年份的后两位数字;

③被引刊物名称缩写;

④被引刊物的卷和页码;

⑤引用作者姓名;

⑥引用刊物名称缩写;

⑦引用刊物的卷、页码和年份的后两位数字;

⑧引用文献类型代码。引用文献类型用英文字母表示,如B-书评,C-勘误,D-会议论文,E-编辑,I-个人事项,K-编年表,L-通信和快报,M-会议摘要,N-技术札记,R-评论目录,W-计算机书评,无字母标记的则为一般研究报告或论文。

B分册为匿名引文索引,匿名引文索引按期刊名称字顺排列。

C分册为专利引文索引,专利引文索引按专利号顺序排列。

由此看来,使用引文索引可以从引文作者入手找出引用者的姓名及来源文献出处,从而可以了解到该篇文献的最新研究进展情况,看到新文献对旧文献的传承、评价。另外还可以通过该索引来了解某人的文献都被哪些人引用、引用时间的长短等。2.来源索引(Source Index)

在引文索引中可以查到引用者的姓名及来源文献出处,但要了解其论文的题目,必须再查“来源索引”。SCI的来源索引位于D分册上,是根据引用作者(施引作者)的姓名字顺排列的一种索引,类似于一般检索工具中的“作者索引”。来源索引只报道前一年或当年在SCI来源出版物上发表的文献信息,每条索引款目的著录项目为来源文献的第一作者、合著者、文种、篇名、缩写刊名、卷期号和页次、年份、引用参考文献数量、ISI存取号码、作者地址等。来源索引只对第一作者著录全部来源信息,而对合著者,只能通过“See”引见第一作者获取详细著录信息。对著者姓名不详的,用匿名来源索引,该索引位于整个来源索引的最前面,用“ANON”代替著者姓名,按缩写刊名字顺排列。来源索引的著录片段如下。

SCHAFER M①

-RENEWABLE RESOURCES AND POLLUTION② EQ469③

MATH COMPUT MODELL 14:1177-1182④ 90⑤ 11R⑥

UNIV BUNDESWEHR HAMBURG HAMBURG 70 DE⑦

SCHAFER U⑧See SCHAFER M 9 4519 90⑨

说明如下:

①第一来源作者姓名,本例也是唯一作者,因此没有合著者;

②来源文献篇名;

③ISI期刊代码;

④文献出处;

⑤出版年;

⑥参考文献数;

⑦第一作者通信地址;

⑧合著者;

⑨参见第一作者。3.团体索引(Corporate Index)

团体索引也位于D分册上,利用该索引可以了解某一单位团体的研究动态和水平。团体索引由地理部分(Geographic Section)和机构部分(Organization Section)两部分组成。

地理部分是团体索引的主要部分,该部分按机构所在地的地名字顺进行编排。其中,美国按州名-城市名的字顺排在地理部分的前面,其他国家按国名的字顺排在美国各州之后。地理部分著录格式片段如下:

说明如下:

①国名;

②城市名;

③机构名;

④第一作者(来源作者)姓名;

⑤文献出处。

如果要了解文献题名等更多的信息,只能从第一作者(来源作者)姓名入手,转查来源索引。

机构部分是地理部分的辅助索引,如果知道了团体机构的确切地理位置,可直接使用上面的团体索引地理部分;如果对团体机构所在的地理位置不甚了解,则应先借助团体索引的机构部分确定准确的地理位置,然后再查团体索引的地理部分。机构部分著录格式片段如下。

说明如下:

①机构名;

②国名;

③城市名。4.轮排主题索引(Permuterm Subject Index)

轮排主题索引是从文献的主题入手检索引用作者姓名,以便通过来源索引进一步查找文献题名等其他信息的一种索引。该索引是从文献题名中选出关键词字顺轮排,每个关键词下都有说明语作为配合词并与关键词轮流组配,最后为引用作者姓名。

3.3.3 SCI检索方法

检索SCI,使用哪种方法要根据已知条件来定。如果已知课题内容,只能用主题法查找;如果从参考文献中获悉某一作者,则可以用引文法查找;如果知道某一引用作者或单位,则可以直接使用来源索引或用机构、地理查找法。具体检索途径示意图如图3-2所示。图3-2 SCI检索途径示意图

3.4 检索算符

如前所述,手检是靠“手翻、眼看、大脑判断”完成检索任务,而机检则是通过“选词、制定检索策略、机器匹配”来执行检索。其中制定检索策略的关键是构造检索表达式,用单一检索词检索,只适合一些简单的检索。对于复杂课题的检索,就需根据课题的要求找出两个或多个检索词用检索算符进行组配,形成完整的检索提问式。俗话说,“工欲善其事,必先利其器”,在计算机信息检索中,无论是数据或事实数据库、光盘数据库、联机数据库,还是搜索引擎、主题网关、专利、标准网站,都支持最基本的检索技术-逻辑检索;此外为使检索结果全面准确,多数检索系统还支持截词检索、全文检索(位置检索)、词表助检等辅助检索技术;另国际联机检索还可用指令进行检索。所以我们只要掌握“布尔逻辑检索、截词检索、位置检索、指令检索”这些基本检索规则,就可以在网络信息资源中遨游,至于在各种数据库、搜索引擎、主题网关及某些网站中可能会采用不同的标识符号表示,那只是个代号而已,关键是抓住代号所表示的含义。

3.4.1 布尔逻辑算符

逻辑检索是一种开发较早、比较成熟、比较流行的检索技术,目前信息检索系统大多都采用这种技术。

布尔逻辑组配是现行计算机检索的基本技术,主要使用的是布尔代数里的逻辑运算符“与”、“或”、“非”概念进行检索。1.逻辑“与”算符

逻辑“与”概念,多数检索系统用AND或“*”表示。这是一种用于交叉概念或限定关系的组配。使用该算符,可对检索词加以限定,使检索范围缩小,增强检索的专指度和特指性。

若A and B,则表示被检中的文献必须同时含有A和B这两个词,如图3-3中阴影部分所示。2.逻辑“或”算符

逻辑“或”概念,多数检索系统用OR或“+”号表示。这是一种用于并列概念或平行关系的组配。使用OR算符,相当于增加检索词的同义词与近义词,扩大了检索范围,即增加了检索的泛指性,避免文献的漏检。

若A or B,则表示被检中的文献含有二词之一或同时包含两词,如图3-4中阴影部分所示。但两者重复部分只计算一次。3.逻辑“非”算符

逻辑“非”概念,多数检索系统用NOT表示,有的系统里也可以用“-”号表示。这是一种用于排斥关系的组配,该组配用于从原来的检索范围中排除不需要的概念或影响检索结果的概念。NOT算符与逻辑“与”的作用类似,可使检索范围缩小,增强检索的正确性。

若A not B,则表示数据库中凡含有检索词A而不含检索词B的文献,才为命中文献,如图3-5中阴影部分所示。图3-3 A and B图3-4 A or B图3-3 A not B重要提示布尔逻辑算符的运算顺序,在不同的系统里有不同的规定。大多数系统采用的顺序是:NOT最先执行,AND其次执行,OR最后执行。若要改变运算顺序可用优先级算符小括号——()。案例分析用布尔逻辑算符构造规定的检索表达式要求用布尔逻辑算符构造检索表达式:查刑诉法典方面的资料,但不要法文的。解析:(1)选择能代表课题实质内容的检索词:刑诉法典法文(2)根据课题意思,构造检索表达式:刑诉AND法典NOT法文,或者:(刑诉AND法典)NOT法文

3.4.2 位置算符

尽管布尔逻辑算符为用户提供了较为理想的检索效果,但它所造成的误检率是很高的。例如,想查一下“中国股票市场经济学实验分析”方面的信息,采用布尔逻辑算符表示:中国AND股票AND经济学实验。

但可能会把“中国信息研究所关于英国的股票市场经济学实验分析“方面的信息也一并检出,显然文不对题。可见误组配①是布尔逻辑算符的最大缺陷。为了弥补其不足,检索系统又提供了另一检索功能,即位置检索算符,也称全文检索算符。它表示词与词之间的相互位置关系及前后次序,以增强选词的灵活性,从而大大降低误检率。

关于位置检索算符的符号很多,表3-3只列出了一些最常见的位置检索算符。表3-3 位置检索算符一览表重要提示字段位置算符(F)要比句子位置算符(S)的检索范围更宽泛,因为字段是指篇名字段、文摘字段、叙词字段、自由词字段等,而子字段是指一句话。案例分析位置算符查询选择输入A(N)B,计算机能否检出以下3种形式:①A-B ②A C B ③B A解析:A(N)B表示A、B两词之间不能插入任何其他词,但允许有一空格或标点符号,且A、B两词前后顺序不限。因此①和③可检出,②不能检出。

3.4.3 截词检索

截词检索是加在某些检索词的词干或不完整词形上,以表达对词的完整意义进行检索。如果用“?”作为截词符,主要包括非限制式截词(无限截断)、限制式截词(有限截断)和嵌入式截词(中截断)几种情形,如表3-4所示。表3-4 截词检索算符一览表

由此看来,截词检索可用来表示检索词的单复数形式,同一词词尾或词头的多种变化,同一词英美国家的不同拼法等,从而可简化输词过程、节省上机时间,获得较高的查全率,扩大检索范围。

3.4.4 限制检索

在许多联机检索系统中,为了提高检索的查全率或查准率,需要一些缩小或约束检索结果的方法,称之为限定检索。用这种方法可将检索过程限定在特定的范围(或字段)中进行。如在DIALOG系统中,为了对检索项目有一精确的输出,设置了基本索引和辅助索引。

基本索引是一种主题性质的索引,它将检索项限制在反映文献主题内容特征的那些字段中检索,如叙词(/DE,/DF)、标引词(/ID,/IF)、题目(/TI)和文摘(/AB)等字段,使用这些字段检索,要加后缀代码(/)且放在检索项后面。

辅助索引是一种非主题性索引,它是指将检索项限制在反映文献外表特征的那些字段中检索,如把某一检索项限制到某一作者、某种刊物、某一年份、某个会议等,辅助索引用前缀代码(=)表示,其前缀代码放在检索项前面。

例如:(Manage OR Control)/TI,DE

表示在题目和叙词中查找含有“Manage”或“Control”这两个词的文献。

输入AU=Chen,qing AND CS=(Peking()Univ?)

本例表示查作者(AU)为陈青同时作者机构(CS)为北京大学的文献。

3.5 检索策略的制定与调整

检索策略是对全部检索过程进行总策划而提出的全盘检索方案,因此检索策略的制定与调整对检索结果至关重要,本节就从检索策略的制定和调整两个方面加以阐述,并列举了两个检索策略调整的实例。

3.5.1 检索策略的制定

检索方案制订的如何,直接关系到检索的成败,故编制检索策略意义重大,检索策略一般包括以下几个方面。1.确定检索工具或数据库

参见2.4.3小节“信息检索步骤”中的“2.选择检索工具或数据库”。2.确定检索途径(检索字段)及检索方法(检索方式),形成检索标目(构造检索提问式)

参见2.4.3小节“信息检索步骤”中的“3.确定检索途径(检索字段)及检索方法(检索方式),形成检索标目(构造检索提问式)”。

3.5.2 检索策略的调整

制定好检索策略后,检索任务只能算完成了一半,因在实际检索过程中,并非一次检索就会获得满意的检索效果。此时就需要及时采取补救措施,调整检索策略。检索策略的修改和调整,在实际操作上主要指数据库的选择和检索表达式的编制,前者取决于现有的数据库资源,后者则直接反映检索目标。一般情况下,若检出结果过多,就应在提高查准率上下工夫,主要从缩小检索(简称“缩检”)入手;如果检出篇幅过少,就应在提高查全率上下工夫,主要从扩大检索(简称“扩检”)入手。1.扩检时,调整检索式的主要方法(1)选全同义词、相关词和近义词,并多用“OR”算符。

例如查找“中东地区的粮食产量”,输入:中东*粮食,检索结果为0。此时应该找出"中东地区"所代表的具体国家,改输:(巴林+埃及+伊朗+伊拉克+以色列+…)*粮食。(2)多选一些上位词或相关词,降低检索词的专指性。

例如,用EI的标题词表查苹果种植方面的文献,应用Fruit-Apple,不能直接用Apple。(3)采用分类号进行检索。

从揭示文献的广度和深度来看,依据分类体系检索恰到好处,它既能按文献的内容查找,又能把这一类文献收集齐全。

如查音响方面的标准,用M72可查找近40件有关音响方面的标准,如按“音响”的标准名称查找,只有10余条这方面的国家标准。(4)删除没有实际意义的概念组面。

删除没有实际意义的概念组面,即减少逻辑与(AND)和逻辑非(NOT)的运算。如:网络*诉讼*案件*研究,改为:网络*诉讼。(5)减少或去除某些过严的限制符。

如位置限制算符、字段限制符等。例如在Elsevier库中的高级检索:shakespeare W/15 biography,改输:shakespeare AND biography。(6)少使用位置算符,或调整位置算符,由严变松。

例如,在Elsevier库中的高级检索:shakespeare W/5 biography,改输:shakespeare W/50 biography。(7)使用截词技术。

如查找会计管理方面的文献,在Elsevier库的文摘字段输入accountant and manage,检出文献很少,如使用截词算符:accountant and manage*,则检出文献可观。

若采用以上扩检措施,检索结果仍不理想,则应该考虑更换检索工具或数据库。2.缩检时,调整检索式的主要方法(1)提高检索词的专指性,增加或换用下位词和专指性较强的自由词。

如用Google查找张五常关于交易费用方面的Word文档的论文:交易费用“张五常”论文,命中10500条;考虑论文的写作形式和格式,用关键词替换论文,并用DOC文件格式加以限定:filetype:doc关键词交易费用“张五常”,则检出215条。(2)增加AND算符,以便进一步限定主题概念的相关检索项,提高检准率。

如用Google查找张五常关于交易费用方面的Word文档的论文,在上题的基础上再加摘要一词:交易费用关键词摘要“张五常”filetype:doc,则检出109条;以及:filetype:pdf关键词摘要交易费用“张五常”,则检出124条。(3)用检索字段限制检索,如常限定在篇名字段和叙词字段中进行检索。

在用中国知网查“世界资本主义对中国经济的影响”,选资本主义、中国经济做主题词,限定在主题字段命中15352条;如限定在篇名字段,则命中45条。(4)利用文献的外表特征限制,如文献类型、出版年代、语种、作者等。

如在SOSIG主题网关中,用简单检索查找“civil law or criminal law”,命中340条,而在高级检索中,将其限定在期刊(全文)中查找,就命中12条。(5)用逻辑非NOT来排除一些无关的检索项。(6)适当的使用位置算符,或调整位置算符由松变严。

采取上述调整方法时,要针对所检课题的具体情况和所用检索系统的客观实际综合分析,灵活应用。3.检索策略调整实例(1)检索海信电视在西部的市场状况

检索表达式:海信*电视*西部*市场

为了提高检全率,实检后调整:海信*电视*(西部+四川+西藏+新疆+甘肃);考虑提高检准率,实检后调整:海信(2W)电视(S)(西部+四川+西藏+新疆+甘肃)。(2)查找“服装品牌设计”

检索表达式:garment*brand()design? ?

为了提高检全率,实检后调整:(apparel+clothing+garment+fashion)*brand()design? ?

考虑提高检准率,调整优化为:(apparel+clothing+garment+fashion)(s)brand()design? ?;

进一步调整优化为:(apparel+clothing+garment+fashion)(3n) brand()design? ?

小结

本章对《全国报刊索引》、标准文献、美国《工程索引》、美国《科学引文索引》的编排体例做了讲解,并重点描述了这些检索工具的著录格式,同时还讲述了有关引文索引的相关概念、计算机信息检索的几种重要技术支持和检索策略的制定与调整。练习题

1.用《全国报刊索引》(哲学社会科学版)的正文(分类途径),查找本专业的文献两篇,要求写出查找步骤和著录格式。

2.查“学位论文”方面的标准,浏览一下学位论文的组成部分,并将前置部分和主体部分的必写内容列出。

3.查找GB 2760-81、GB 2760-1996,要求写出具体的检索用书和标准名称。

4.按国家标准GB/T 7714-2005(文后参考文献著录规则)规定,把以下两篇文献作为参考文献,列出其电子版著录格式:(1)景新强发表的博士学位论文(2)邓小南发表的一篇期刊论文

5.利用EI查找有关经济学方面的文献,列出其中的一篇著录格式。

6.使用EI将下列机构组织的缩略代码或文献来源刊名缩写还原成全称。(1)UNESCO(2)IBM J Res Dev(3)Proc IEEE(4)Zhongguo Dianji Gongcheng Xuebao

7.什么是引文文献、引文著者?什么是来源文献、来源著者?

8.列出计算机检索的几种主要算符。

9.试比较截词和位置检索技术的主要功能。

10.使用布尔逻辑组配算符,列出以下课题的检索表达式:(1)唐代历史或经济(2)国外金融管理(只能用中国、金融和管理三词)(3)海湾战争及世界和平

11.各列出3种在扩检和缩检情况下,调整检索式的主要方法。

第4章 中文数据库检索

信息检索借助计算机和Internet这对翅膀,展翅高飞,迎来了电子化数据库的春天,使得信息检索又上了一个新台阶。本章就从读者熟悉的母语——中文数据库检索开始。

4.1 读秀学术搜索

超星数字图书馆是业界图书检索的品牌,读秀学术搜索不仅超越了超星数字图书馆的诸多功能,还突破了文献类型、文种的束薄,开创了集各种文献资源于同一平台下实现统一检索管理的先河,本节重点介绍读秀学术搜索的检索方式、获取全文的途径及超星阅读器的功能。

4.1.1 超星公司简介

超星公司成立于1993年,长期致力于数字图书馆技术开发及相关应用与推广,是我国专业的数字图书馆技术服务商和数字图书馆解决方案提供商,主要为世界各地用户提供图书查询服务。1997年首家提出并研发成功基于Internet的数字图书馆技术,并开通我国第一家在线数字图书馆:瑞得——超星数字图书馆。2000年创办“超星数字图书馆”品牌,并入选国家863计划中国数字图书馆示范工程。到目前为止超星数字图书馆已是全球最大的中文在线图书馆,有丰富的数字图书资源,目前有中文图书数百万册,涵盖中图法22个大类。其中2005年后的新书达到10余万种,基本涵盖了近几年新出版的所有图书。2007年,超星公司又推出了超星数字图书馆的姊妹库——读秀学术搜索库。

4.1.2 读秀学术搜索库

读秀学术搜索库以超星数字图书馆180万种图书(6亿页中文资料)为基础,不仅扩展了超星数字图书馆的许多功能,还把视角延伸到图书以外的多维信息资源中。其特色功能可概括为如下几个方面。(1)整合各种文献资源于同一平台,实现统一检索管理。(2)检索图书深入到章节和全文,实现基于内容的检索。(3)可为读者整合各种获取资源的途径,并提供多种阅读方式。(4)提供个性化服务,可定制流量统计系统、图书推荐系统和图书共享系统等特色功能,满足用户的管理需求和读者的阅读需求。

4.1.3 检索方式

读秀学术搜索与超星数字图书馆一样,提供远程包库、本地镜像和读书卡3种专业服务平台。远程包库、本地镜像方式主要适用于团体单位用户购买超星的数字资源。读书卡方式主要面向个人用户,可在超星公司的主页进行注册、充值使用。采用远程包库或本地镜像的高校用户,通过IP地址控制使用权限,凡隶属IP范围内的用户,既可通过“校园网图书馆”中的相应链接进入,也可直接输入其IP地址进入。

读秀学术搜索读书卡用户与远程包库、本地镜像用户的检索方式基本相同,均提供基本搜索和高级搜索两种检索方式,目前读秀学术搜索只支持逻辑与运算,算符用AND或空格表示。1.基本搜索

基本搜索就是读秀学术搜索主页上的默认检索界面,只有一个检索框,只要在检索框内输入要查找的关键词,轻松单击,即可在读秀提供的全文、图书、期刊、报纸、学位论文和会议论文、专利、标准和视频多维检索频道中任意搜索。例如,查有关美国著作权法方面的信息,可这样输入“美国AND著作权法”,系统默认状态下是在全文频道中搜索,读者也可根据需要选定在单一频道中搜索。基本搜索界面如图4-1所示。图4-1 读秀学术基本搜索界面2.高级搜索

读秀的“高级搜索”按钮隐含在搜索结果中(见图4-2),在主页中不出现。高级搜索设有更多的搜索框,如图书频道中设有书名、作者、主题词、出版社、ISBN号5个搜索框,另有图书分类和出版年代的选项。因此,利用高级搜索比基本搜索的目的性更强,能一下满足读者的多条件搜索。图4-2 高级搜索界面

4.1.4 检索结果处理

1.结果显示

检索结果以列表的形式显示,最多有3栏列表。图4-3中栏为锁定在图书频道中的题录信息,可把与检索词相关的图书全部列出,使用左栏资源列表可进一步“缩小检索范围”,利用右栏资源列表则可“扩大检索范围”,实现知识点多角度检索,把与检索词相关的词条、人物、(图书)期刊、报纸、学位论文、会议文献、专利、标准、网页等多维信息全面地展现出来。图4-3 检索结果显示界面2.查看图书详细信息

单击检索结果显示界面中栏的某本图书封面或书名可进入图书详细信息页面(见图4-4),图书的封面、作者、内容提要、主题词等信息将被全面展示,并可以实现以下功能。图4-4 图书详细信息界面(1)图书试读

单击“试读”右侧的不同选项,可对图书版权页、前言页、目录页、正文部分页进行试读。(2)查看馆藏信息

搜索结果页面左上方将显示图书馆中的纸质图书和电子图书的馆藏信息。单击进入,读者可以直接借阅馆藏或者阅读馆内电子图书全文,从而实现了电子图书与纸质图书的整合。(3)多种获取途径

不仅能阅读本馆电子图书全文、借阅本馆纸质图书,还能通过图书馆文献传递中心以及其他图书馆的馆藏信息、文献互助获取图书全文。(4)图书馆文献传递中心

如果在本馆无法解决所要的书,可以启用读秀的图书馆文献传递中心,该中心就相当于为读者建立了一个在线馆际互借平台,读者只要提交咨询申请表,立刻就可到邮箱中获取所需要的图书资料,及时便捷、无须等待,因为读秀的文献传递是通过机器自动进行。重要提示读秀以图书为主,对于图书既可检索又可阅读、试读全文或链接到本馆纸质图书借阅。而对其他类型的文献,可免费检索,但能否阅读全文,要根据你所在图书馆的权限和Internet开放程度而定。尽管读秀可对其他类型的文献进行检索,但检索效果可能与单一文献类型的数据库不可同日而语。3.超星阅读器

超星提供两种阅读图书的方式,一种是专门用来打开PDG格式的专用阅读器阅读,必须事先下载超星阅读器(SSReader),才能进行阅读图书全文。另一种是基于IE浏览的在线阅读,无须下载阅读器。

超星公司自主研发的超星阅览器4.0是国内目前技术最成熟、创新点最多、使用群最广、下载率最高的专业阅览器,是专门针对数字图书的阅览、下载、打印、版权保护研究开发的,在超星公司的相关网站上均可免费下载。SSReader界面由菜单栏、功能选项卡和工具栏等组成(见图4-5),使用SSReader4.0可以实现以下功能。(1)阅读书籍

阅读时,可利用图书左栏的章节导航选择阅读,单击上下箭头按钮或使用滚屏功能,可完成翻页操作。单击工具栏上的“缩放”按钮,可以调整字体大小,方便阅读。阅览器还支持多文档同时阅读。(2)下载图书

在线阅读有时会受网络速度的牵制,不如把需要的图书先“下载”到机器上,以备过后脱机阅读,可单击鼠标右键选择“下载”功能。(3)版权加密技术

超星阅读器采用先进的数字版权保护技术,限制打印、摘取文本、传播和永久下载。但考虑到当前Internet带宽问题,允许读者下载到本地阅读,但下载到本地硬盘的资料是加密资料,只能读者本人在下载机器上阅读,不能传播。图4-5 超星阅览器界面重要提示使用超星阅读器下载资料和图书馆文献传递中心下载和传递的图书全文,在单位取消订购(个人读书卡过期)或指定时间后自动失效,相当于传统图书馆的借阅和归还,读者对资料不拥有永久所有权。(4)主要图标

超星阅读器工具栏上有几个重要图标,需要重点介绍一下。

①手形图标:阅读器的默认图标,可上下快速移动鼠标光标。

②选取文字图标(大T图标):用于摘取文本。读秀学术搜索库中有图像图书和文本图书两种格式,大T图标按行方式选取文字。对于图像图书,使用时,选中大T图标后,超星阅读器就自动启动OCR识别文字插件程序,将选中文字识别后在一新框中显示,可根据需要保存到某一文件中进行编辑。对于文本图书,使用时,选中T图标,拖动光标选中的文字会变蓝色,单击鼠标右键在弹出的快捷菜单中选择“复制”命令,就可摘取到你所要的文本加以保存编辑即可。

③选取文字图标(小T图标):按区域摘取文本时用,尤其适用图片采集,用法同大T图标。图4-5所示为按区域摘取文本图书的示例。

④刷子头图标:属于图像快照式的摘取文本。对选择的区域,可按原样保存,但不能进行编辑。

⑤图书标注图标:只适用图像图书,文本图书暂时不支持标注功能。如《著作权法》这本书。标注功能有阅读、批注、随意画线、画圈、高亮、链接等(见图4-6)。

⑥书签图标:读者利用添加书签可以方便地管理图书、网页。图4-6 超星阅览器图书标注界面案例分析查一下“孔子登东山而小鲁”的出处使用读秀的知识检索频道,找到相关的条目约1902条,有相关词条、图书、视频、网页及更多相关信息。读秀全面、发散式的搜索是一大创新,不仅能围绕单一文献的关键词检索,还能把与关键词相关的各类文献中所包含的同一内容知识检索出来,从而为研究型读者提供了便捷的知识获取通道。打开主栏目中的“本页阅读”链接可看到更详细的信息,如“孔子登东山而小鲁”的后半句话、注解、译文及本页来源出处等,实现了古人集千书于一书的梦想,使得任何一句诗词、一句古文、一句名言,均可在读秀中找到出处、前后语(见图4-7),使用起来得心应手。图4-7 超星阅读器图书标注界面

4.2 中国学术期刊网络出版总库

中国学术期刊网络出版总库(CJFD)是专门针对期刊检索而言的,据统计期刊是科研人员利用率最高的信息媒体,为使文理科使用方便,CJFD还专门划分出了中国学术期刊网络出版总库(社科)和中国学术期刊网络出版总库(自科)两个版本,本节将介绍综合版本的使用。

4.2.1 数据库简介

中国学术期刊网络出版总库(CJFD)是中国知网即国家知识基础设施(National Knowledge Infrastructure,CNKI)的系列数据库之一,国家知识基础设施(CNKI)的概念,首先由世界银行于1998年提出,后由清华大学光盘国家工程研究中心、清华同方光盘股份有限公司等单位发起,于1999年6月开始实施。目前CNKI已建成了十几个系列知识数据库,而中国学术期刊网络出版总库是目前世界上最大的连续动态更新的中国学术期刊全文数据库。

CJFD收录我国自1915年以来国内出版的7500余种学术期刊,内容涵盖十大专辑:基础科学、工程科技Ⅰ、工程科技Ⅱ、农业科技、医药卫生科技、哲学与人文科学、社会科学Ⅰ、社会科学Ⅱ、信息科技、经济与管理科学。该库既有浏览功能又有检索功能,还有引文链接功能,及对个人、机构、论文、期刊等方面的计量与评价功能,并能共享CNKI系列数据库的各种服务功能。

目前高校是采用网上包库或本地镜像的形式购买中国学术期刊网络出版总库,校园网内的用户既可通过图书馆中的相应链接进入,也可直接输入其IP地址(www.cnki.net)进入,只有登录成功的用户才可下载期刊全文,而CJFD题录库在网上没有任何限制,可免费检索。

4.2.2 检索方式

在CNKI系列数据库中,各数据库页面及功能相似,中国学术期刊网络出版总库(CJFD)现设有快速检索、标准检索、专业检索、作者发文检索、科研基金检索、句子检索,此外还有来源期刊导航。

在CJFD中,所有的检索界面均由左右两栏组成,左栏为学科分类导航,默认状态下为十大专辑,也可根据需要选择;右栏又分上中下三部分,中下两部分为CJFD专辑文献统计分析报表和数据库介绍信息,因此检索界面的区别主要在右栏的上面部分,如图4-8所示。

该库共提供18个检索项(检索字段),分布在不同的检索方式中,检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合(项间组合即检索项之间的逻辑组合),同一检索项中还支持相应的位置检索算符,此外还支持二次检索。1.快速检索

快速检索是一种简单检索,简洁方便,其右栏的最上面只有一个检索框,可输单词或一个词组检索,并支持二次检索,但不分字段,因此查全率较高、检准率较低,如图4-8所示。图4-8 CJFD快速检索界面2.标准检索

标准检索是CJFD上的默认检索界面,其右栏的最上面由输入检索控制条件和输入内容检索条件两部分构成。检索控制条件是指期刊年期、来源期刊、来源类别、支持基金、作者、作者单位等检索项,内容检索条件是指主题、篇名、关键词、摘要、全文、参考文献和中图分类号这7个检索项。

标准检索是一种比快速检索复杂一些的检索方式,它既支持单词检索又支持多项双词逻辑组合检索:多项是指可选择多个检索项,可通过单击前方的“+、-”来增减检索项;双词是指一个检索项中可输入两个检索词,每个检索项中的两个词之间可进行3种检索位置算符组合:并且包含、或者包含和不包含;逻辑是指检索项之间可使用逻辑与(并且)、逻辑或(或者)和逻辑非(不包含)进行项间组合。例如要查找季羡林与梵文或巴利文有关的一些论述,如图4-9所示。图4-9 CJFD标准检索界面3.专业检索

专业检索比标准检索功能更强大,但需要用户根据系统的检索语法编制检索式进行检索,适用于熟练掌握检索技术的专业检索人员。单击CJFD中的专业检索即可进入该页面,如图4-10所示。图4-10 CJFD专业检索界面重要提示(1)专业检索中,表达式的符号要在半角(英文)状态下输入,如小括号、等号等。(2)专业检索中,同一字段的检索词之间可用“*、+、-”构造检索表达式,检索词与算符之间是否空格无所谓;若不是同一字段的检索词之间就要用“AND、OR、NOT”构造检索表达式,且检索词与算符之间要空一格。

专业检索提供18个可检字段:

SU=主题,TI=题名(篇名),KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一责任人(第一作者),AF=机构(单位),JN=中文刊名&英文刊名,RF=引文(参考文献),PT=发表时间,YE=年,FU=基金,CLC=中图分类号,SN=ISSN,CN=统一刊号,IB=ISBN,CF=被引频次。4.期刊导航

期刊导航展现了CJFD收录的全部期刊,读者既可直接浏览期刊的基本信息,又可按期查找期刊文章,如图4-11所示。为了满足不同读者的需要,期刊导航提供了10条导航路径。

主要导航路径解释如下。

①专辑导航:按照期刊内容知识进行分类,分为10个专辑,178个专题;

②世纪期刊:专门回溯1994年之前出版的期刊;图4-11 CJFD期刊导航界面

③核心期刊:现收录2008年最新版“中文核心期刊要目总览”的期刊,并按核心期刊表进行分类排序;

④数据库刊源:按期刊被国内外其他著名数据库收录情况分类,如SCI来源期刊、EI来源期刊、中国科学引文数据库(CSCD)、中国人文社会科学引文数据库(CHSSCD)等。案例分析检索杜泽逊发表论文的题名中含有四库及总目的文献由题目内容可知,本题是要查找杜泽逊发表的论文题名中含有四库或含有总目的论述,该题使用专业检索或标准检索较好,其使用专业检索的表达式、检索结果如图4-10(主题=四库+总目AND AU=杜泽逊)、图4-12、图4-13和图4-14所示。重要提示CJFD中的主题字段并非仅指单一的主题词,而是题名、关键词和摘要3词的总称。图4-12 CJFD检索结果界面图4-13 CJFD引文网络界面图4-14 PDF全文界面

4.2.3 检索结果处理

1.结果显示

CJFD检索结果界面可看到检索命中文献记录总数,并以“序号、篇名、作者、刊名、年/期、被引频次、下载频次、浏览频次”的题录形式将命中结果加以显示,如图4-12所示。如想看到文章摘要、关键词、知网节等信息,要单击篇名链接,如图4-13所示;若要看全文,则要单击CAJ或PDF图标,下载原文,如图4-14所示。案例分析CJFD的最大创新——引文网络即知网节知网节是一条知识链接的纽带,通过这条纽带,研究人员可找到一批相似文献、相关机构、相关作者。借助参考文献、二级参考文献可追溯课题的发展历史、研究背景,借助共引文献、同被引文献可了解课题的研究现状、目前进展,借助引证文献、二级引证文献可展望课题的发展方向、后继研究。2.全文阅读浏览器

CJFD的全文显示格式有CAJ和PDF两种,第一次阅读全文必须下载安装CAJ或PDF全文浏览器,否则无法阅读全文。(1)CAJ浏览器

CAJ浏览器是中国知网自己研发的专用检索浏览全文的阅读器。它功能齐全,有查找字符串、打印全文功能,且能按原版显示效果打印。并能从CAJ上抓取文章内容,进行文本、图像摘录、保存、编辑。(2)PDF格式

PDF(Portable Document Format)格式是电子发行文档的事实上的标准,而Adobe Reader或Acrobat Reader是查看、阅读和打印PDF文件的最佳工具,且在网上可免费下载。由于PDF文档通常是一些图文并茂的综合性文档,因此在学术论著中广泛使用。目前出版商发行的数据库大多采用PDF格式。PDF工具栏上几个重要图标的解释如下。

①手形图标:阅读器的默认图标,可上下快速移动光标,调整页面位置。

②放大和缩小图标:可更改文档的放大率和缩小率,调整字体大小。

③文本选择图标:可选择PDF文档中的文本或文本块,利用“复制”和“粘贴”命令将选定的文本复制到其他应用程序。图4-14右栏描黑部分即为选中要摘录的文本块。

④保存副本图标:选择该图标可下载全文,也可以附件的形式将其保存在某一文件中,发送到邮箱中进行保存。

4.3 中文科技期刊全文数据库

中文科技期刊数据库是中文光盘创始者,本节将系统地介绍其检索体系,重点讲解传统检索。

4.3.1 数据库简介

中文科技期刊数据库由中科院西南信息中心重庆维普资讯有限公司于1994年研制出版,该库是国内最早的中文光盘数据库,也是目前国内最大的综合性文献数据库。收录中文期刊8000余种,时间跨度为1989年至今,学科遍布理、工、医、农及社会科学(文、史、哲、法,现回溯到2000年)。该数据库数据每季度更新一次。

目前国内数据库一般都提供远程包库、本地镜像和个人读书卡3种服务形式。大凡团购的高校用户要么采用远程包库要么采用本地镜像或两者并存的方式,在校园网内提供资源共享,凡隶属IP范围内的用户,既可通过“校园网图书馆”中的相应链接进入,也可直接访问相应的IP地址,如图4-15所示。同时网上提供免费的题录检索库,其网址为http://www.cqvip.com或http://oldweb.cqvip.com。图4-15 中文科技期刊数据库主页

4.3.2 检索方式

中文科技期刊数据库自研制出来以后,其检索界面不断修改,以期更适合用户检索。自2005年版开始,一直沿用目前的界面,可提供传统检索、高级检索、分类检索、期刊导航和快速检索5种检索方式,如图4-15所示。该库支持逻辑与、或、非和二次检索,此外还可以选择模糊和精确匹配检索方式。1.快速检索

快速检索为中文科技期刊数据库的默认检索方式,在此选好检索字段并输入相应的检索词或检索表达式即可实现快速检索,如图4-15所示。2.传统检索图4-16 传统检索界面(1)限定检索范围

限定检索范围包括导航系统、期刊范围、年限、最近更新、同义词、同名作者等。

导航系统位于传统检索的最左侧,可分为专辑导航和分类导航。分类和专辑导航均为树状结构。分类导航按《中图法》的前21个大类进行划分,专辑导航可分为社会科学、经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生和工程技术8个部分。无论何种导航,每个类目或专辑都可以进一步细分。选中某学科结点后,任何检索都会被锁定在此类目学科下进行。

期刊范围、年限、最近更新、同义词和同名作者等位于传统检索的最上端。期刊范围、年限、最近更新和选择选项默认状态如图4-16所示,当然也可通过其右边的小箭头进行选择。

同义词和同名作者库功能只有在选择了关键词、作者、第一作者检索入口时才生效,这两库均是默认为关闭,选中则打开。用户可根据课题需要进行相关限定。(2)检索区域

检索区域是用户查找资料的关键,该区域位于传统检索的第2栏,包括以下几部分。

①检索入口。可通过其下拉菜单,提供14个选择字段:M=题名或关键词、K=关键词、J=刊名、A=作者、F=第一作者、S=机构、T=题名、R=文摘、C=分类号、Z=作者简介、I=基金资助、L=栏目信息、U=任意字段和Y=参考文献。其中,U=任意字段是指在全部字段内进行。与此同时,要在检索式输入框中输入相应的检索表达式。

② 检索表达式。分为简单和复合检索两种。简单检索是直接输单一词进行检索,单击按钮即可。复合检索又分二次检索和复合检索式。

二次检索可能会使检索冗余,可以在一次检索的基础上进行二次检索,缩小检索范围。二次检索可多次使用,以达复合检索之效,二次检索要通过下拉菜单“与、或、非”并单击按钮实现。

如果想一次性达到比较理想的检索效果,可在检索式输入框中用检索字段代码、逻辑与或非(*、+、-)算符和检索词构造复合检索表达式。例如M=旅游*(M=管理+营销)*J=旅游学刊,如图4-16所示。

匹配检索是指“检索式”输入框右侧下拉菜单中的“模糊”和“精确”两种限定检索方式。系统默认为“模糊”检索,用户也可选“精确”。如选“K=关键词”字段,输入“纳米技术”一词,在“模糊”检索方式下,可把关键词字段中含有“纳米生物技术”、“纳米科技与生物技术”、“纳米级定位技术”和“纳米技术”等的相关文献都检出;而在“精确”检索方式下,就只能检出含有“纳米技术”一词的相关文献。3.高级检索

高级检索链接随处可见,单击即可进入高级检索界面,如图4-17所示。高级检索分表框检索和直接输入检索式两种检索界面,表框检索可针对13个检索字段使用逻辑算符并且(逻辑与)、或者(逻辑或)和不包含(逻辑非)进行组配检索,表框检索一次最多可以进行5个检索词的逻辑组配检索;直接输入检索式等同于传统检索中的复合检索式。至于时间条件、专业限制和期刊范围等的检索限定隐含在扩展检索条件按钮中。图4-17 高级检索界面4.分类检索

单击链接,即可进入分类检索界面。分类检索实际是配合其他检索的辅助手段。其方法为:首先在左边的分类表中选择分类,将勾选的分类添加到右边“所选分类”方框中;如果要删除右边某一所选分类,可双击该分类类目;另外必须在下方的检索框处选择检索入口,输入检索词,才能将检索限制在所选分类中进行。图4-18 所示即为在F590.1 下检索有关旅游保险或安全方面的文献。图4-18 分类检索界面5.期刊导航

单击链接,即可进入期刊导航界面,如图4-19所示。图4-19 期刊导航界面

期刊导航有3种查询方式:期刊搜索、按字顺查询和按学科查询。

期刊搜索既可按国际标准期刊号(ISSN)检索,又可按刊名的关键词检索;按字顺查就是按期刊刊名的汉语拼音字顺查询;按学科查实际上是先按大类,再按学科层层展开检索。

期刊导航不仅可检索某种杂志上的文献,还是读者投稿的指南,可帮助读者了解期刊主办信息、期刊的主要栏目及与编辑部联系等信息。案例分析检索旅游学刊上发表的有关旅游管理或旅游营销方面的文献资料由题目内容可知,本题是要查找在旅游学刊杂志上论述有关旅游管理或旅游营销方面的文献资料,该题无论使用何种检索方式都可完成,但使用传统检索中的复合检索式最简单,选中U=任意字段及相应的限定条件,在检索式文本框中输入表达式:M=旅游*(M=管理+营销)*J=旅游学刊,如图4-16所示。检索结果如图4-20和图4-21所示。图4-20 检索结果界面图4-21 全文显示界面

4.3.3 检索结果处理

中文科技期刊数据库检索结果界面多数可显示检索条件、检索命中文献总篇数,并将检索命中结果以“序号、全文下载、标题、作者、出处”的题录形式加以显示,如图4-20所示。

中文科技期刊数据库的全文显示格式有维普浏览器OCR和PDF两种,第一次阅读全文必须下载安装维普浏览器OCR或PDF全文浏览器。否则无法阅读全文。

维普浏览器是中文科技期刊数据库自己研发的专用检索浏览全文的阅读器。图4-21所示为PDF全文显示界面,只要单击图4-20中的图标,即可下载全文。

4.4 人大复印报刊资料全文数据库

人大复印报刊资料全文库是公认的社科研究领域的精品文献库,但该库没有报刊等级之分,只注重论文品质。本节将带领读者去了解精品库。

4.4.1 数据库简介

人大复印报刊资料全文库由中国人民大学书报资料中心编选,并委托浙江天宇信息技术有限公司加工建库(天宇分布式全文检索系统CGRS 5.1),该库精选了1995年以来的社会科学、人文科学及数理化科学方面的资料。最初只按政治、经济、教育和文史语言4大类出版;2006年开始细划为“马列、哲学、政治、法律、社会总论,经济类,文化、教育、体育类,语言文字、文学、艺术、历史、地理、其他类”新四大类出版;2007年又增设了数学、物理、化学大类,所有文献按季度更新。另回溯增补了1978年~1994年的中国古代、近代文学研究专题。

凡订购全文数据库的高校用户均采用IP地址控制访问权限,网内的用户既可通过校园网中的相应链接进入,也可直接登录该库的IP地址,但无论何种方式,人大复印报刊资料全文库都需要用户标识和用户密码进行登录,只有登录成功的用户才可检索下载报刊资料。

4.4.2 检索方式

1.检索技术

人大复印报刊资料全文库可提供6种检索算符:逻辑与(*)、逻辑或(+)、逻辑非(-)、优先级( )及位置检索算符。其中位置算符“?”,用“?”的个数表示两词(字)之间允许间隔字的个数,最多允许出现9个“?”,如输入“中国???啤酒”,可检出“中国的青岛啤酒”、“中国牌子的啤酒”及“中国卷烟、啤酒”等;位置算符“!”,用“!”的个数表示两词(字)之间最多允许间隔字的个数,系统最多允许出现9个“!”,如输入“中国!!!啤酒”,不但能检出:“中国???啤酒”的各种情况,还可检出“中国啤酒”、“中国的啤酒”、“中国人对啤酒”等。2.检索方式

人大复印报刊资料全文库设有分类、任意词和高级3种检索方式,无论哪种方式,都可进行二次检索。(1)分类检索

分类检索实际上是按学科专题检索,可分5大类:马列、哲学、政治、法律、社会总论,经济类,文化、教育、体育类,语言文字、文学、艺术、历史、地理、其他类,数学、物理、化学。分类检索是任意词和高级检索的基础,准确地说是分类浏览或选库浏览。

分类浏览即为系统默认状态的主页界面(见图4-22),该界面分为资源列表区(数据库列表区)、数据库命中结果区、检索区和检索结果显示4个区。

分类浏览(选库浏览)首先是按年编排,其次按大类组织专题库,1995~2004年是每年按大类组织4个专题库,而2005年后是按季度组织4~5个大类专题库,这样一年就是16~20个专题库。分类浏览有以下两种方法。

①直接单击左侧可查询资源(资源列表区)某年份的名称,可以直接在检索结果显示区中显示该年份下按大类组织的所有专题库的信息。

②单击左侧可查询资源前面的“+”,可以展开显示该年份下按大类组织的所有专题库的结点信息,然后根据需要单击某一专题库的名称,在检索结果显示区中即可显示某一专题库上所有的文献名称,如图4-22所示。图4-22 人大复印报刊资料全文库主页(2)任意词检索

任意词检索界面与分类浏览界面绑定在一起,更确切地说就是分类浏览界面中的检索区,用户在此输词检索。任意词检索,由于不分字段,检全率较高,但检准率较差。例如,要查2008年以来儒家文化对韩国、新加坡和日本经济的影响,如图4-23所示。图4-23 任意词检索界面重要提示对人大复印报刊资料全文库来说,所有的检索必须先选数据库,然后才能检索,在资源列表区中每一项数据库前面都有一个空白框供用户选库之用。(3)高级查询

如果想同时在几个字段中查找文献或检索某些著者发表的文献,最好使用高级查询。高级查询可在原文出处、原刊地名、分类号、分类名、复印期号、标题、作者、正文和任意词等24个字段进行检索,高级查询的针对性强,因此比其他检索更易锁定目标、检准率高。

单击按钮,可以打开高级查询对话框。同样打开高级查询对话框之前,一定要先选好数据库。

高级查询可在各个字段中输入用户想要检索的相应的内容,单击按钮;再单击按钮,即可显示查询结果。有些字段输入域后面有按钮,用户可单击“帮助”按钮来获得更多的信息。案例分析检索刘怀荣自1978年以来在J2大类下发表的论文本题使用分类检索,只能按J2大类一年一季度地浏览,属于马拉松检索,效率太低;任意词检索不分字段,无法锁定作者,容易造成误检。因此本题最好使用高级检索,首先选中全部数据库,然后分别在高级检索的分类号和作者字段中输入J2、刘怀荣,再单击、按钮即可,如图4-24所示。其检索结果如图4-25和图4-26所示。图4-24 高级查询界面图4-25 检索结果界面图4-26 全文显示界面

4.4.3 检索结果处理

人大复印报刊资料全文库检索结果界面可显示检索命中文献记录总数,并把检中结果以“序号、库名、库中文献数、命中篇数、查阅否”的形式加以显示,如图4-25 所示。此外还有一些对检索结果的操作,如多篇显示、标题定制、全文定制、检索历史信息等。单击可看全文,也可打开控制面板进行打印、下载和定制,如图4-26 所示。

4.5 中文社会科学引文索引数据库

中文社会科学引文索引(CSSCI)一反其他检索工具通过主题或分类途径检索文献的常规做法,而是以论文后所附的参考文献(引文)来设置独特的“引文索引”,引文索引是反映文献之间引用和被引用关系及规律的一种新型的索引工具。

4.5.1 数据库简介

中文社会科学引文索引(Chinese Social Sciences Citation Index,CSSCI)由南京大学中国社会科学研究评价中心开发研制,是南京大学承担的教育部重大研究项目,CSSCI是我国社会科学重要文献引文统计信息查询与评价的主要工具。该库以中文社会科学登载的文献为数据源,通过来源期刊文献的各类重要数据及其相互逻辑关联的统计与分析为社会科学研究与管理提供科学、客观、公正的第一手资料。

目前,教育部已将CSSCI作为全国人文社会科学重点研究基地评审、研究成果评奖、科研项目结项、高级人才培养等方面的重要评审依据。许多高校已启用CSSCI作为人文社会科学文献引文统计、信息查询与评价的重要工具。

CSSCI来源期刊的遴选遵循文献计量学规律,采取定量与定性评价相结合的方法从全国近3000种中文人文社会科学学术性期刊中精选出不到500种学术性强、编辑规范的期刊作为来源期刊,从2005年开始每年调整一次期刊,实行动态管理。其覆盖范围涉及我国人文社会科学各学科及有关交叉学科的各个领域。目前已完成1998~2007年10年的光盘和网络版数据(包括网上服务)。

CSSCI 数据库向社会开展网上包库服务。凡订购网上包库的高校采用IP地址控制访问权限,网内的用户既可通过校园网中的相应链接进入,也可直接登录该库的IP地址http://202.119.47.137,单击按钮进入。图4-27 所示为CSSCI主页。图4-27 CSSCI主页

4.5.2 检索方式

CSSCI数据库既有检索功能,又有评价功能。该库从来源文献和被引文献两个方面向研究人员提供相关研究领域的前沿信息和各学科学术研究发展的脉搏。从其构成可看出引文索引具有“回溯历史、展示未来”之功效,使用来源文献可追溯到某一课题(某篇文章或某学科)的源头,使用被引文献可了解某一课题(某篇文章或某学科)的最新研究进展情况。

CSSCI提供多种信息检索途径(字段),共有20多种检索字段,可以实现逻辑“或”和“与”的组配检索,系统还支持截词检索、精确检索和二次检索等多种优化检索功能。1.来源文献检索

单击图4-27最下方的“来源文献”按钮即可进入。来源文献检索主要用来查询本索引所选用的源刊文章中的作者(所在单位)、篇名、参考文献等。其检索字段有:篇名(词)、关键词、中图类号、学科类别、学位分类、文献类型、所有字段、作者、作者机构、作者地区、期刊名称、年代、基金类别、基金细节14项,如图4-28所示。例如,在“作者机构”中输入“青岛大学”,从学科类别下拉菜单中选择“应用经济学”。图4-28 来源文献检索界面(1)作者检索

若要查找某一学者的发文情况,可在图4-28“作者”栏中输入该学者的姓名,然后单击“检索”按钮即可。在作者检索中,可采取精确检索或第一作者的方式进行,也可使用截词检索,但截词检索易造成误检。(2)机构检索

机构检索是为了解某一机构发表文章的情况。在机构检索中,可用第一机构进行限定检索,也可使用截词检索。例如,用“农业大学”则可把各种含有“农业大学”的机构都检出。(3)关键词检索

关键词是用来反映论文主题内容的词汇,因此使用关键词检索可以索取到一批含有该关键词的相关论文。(4)刊名检索

主要用于对某种期刊发表论文的情况进行查询。若欲查看在《中国社会科学》上发表的论文,可以在刊名录入框中,输入:中国社会科学,但会发现命中文章中还包括《中国社会科学院研究生院学报》上发表的论文,若只想看到《中国社会科学》上发表的论文,选中期刊名称字段后面的“精确”即可。(5)篇名(词)检索

篇名(词)检索主要是为用户提供用篇名中词段进行检索的手段。可以在篇名录入框中输入整个篇名,也可以输入一个词,甚至一个字或几个词的检索表达式,如输入“网络*参考文献”。(6)基金检索

对来源文献的基金来源进行检索,包括基金类别和基金细节,可从基金下拉菜单中选择国家自科基金、国家社科基金、国家级其他基金、教育部基金、其他部委级基金、中科院基金、社科院基金、省(市)级基金、其他基金共9种基金,进行检索。(7)年代卷期检索

在相应的输入框中输入阿拉伯数字即可,将检索结果控制在划定的时间范围内。(8)作者地区检索

可将检索结果限制在指定地区或者非指定地区中进行,注意输入地名的规范性。(9)文献类型检索

可对论文、综述、评论、传记资料、报告5种文献类型进行限制检索。(10)中图类号检索

按中国图书馆图书分类法(简称中图法)指定的分类号进行检索,如J212,F270.7。(11)学科类别检索

将检索结果控制在指定学科类别上进行检索,这些学科类别有管理学、马克思主义、哲学、宗教学、语言学、文学、外国文学、中国文学、艺术学、历史学、考古学、经济学、政治学、法学、社会学、民族学、新闻学与传播学、图书馆、情报与文献学、教育学、体育学、统计学、心理学、社会科学总论、军事学、文化学、人文、经济地理、环境科学和其他科学。(12)学位分类检索

将检索结果控制在指定的某一学位分类上进行,这些学位分类有哲学、理论经济学、应用经济学、法学、政治学、社会学、民族学、教育学、心理学、体育学、中国语言文学、外国语言文学、新闻传播学、艺术学、历史学、环境科学与工程、军事思想及军事历史、战略学、战役学、战术学、军队指挥学、军制学、军队政治工作学、军事后勤学与军事装备学、管理科学与工程、工商管理、农林经济管理、公共管理、图书馆、情报与档案管理和其他。2.来源文献检索结果

在来源文献检索结果显示窗口中可显示检索的命中篇数、检索表达式、来源作者、来源篇名、期刊、年代卷期等,如图4-29所示。如果单击“来源篇名”链接,则可看到该篇文章的学科类别、中图类号、关键词、引文(参考文献)列表等更多的信息,如图4-30所示。图4-29 来源文献检索结果显示界面图4-30 来源文献检索结果详细显示界面案例分析按要求检索伍海华老师的文献检索青岛大学学者伍海华老师在2001~2006年发表的有关应用经济学方面的文献。解析:(1)按年选库:2001—2006。(2)在图4-28来源文献检索界面的作者和作者机构框中分别输入:伍海华、青岛大学从学科类别下拉菜单中选择“应用经济学”,然后单击“检索”按钮,即可在结果显示窗口中显示本次检索的命中篇数、检索表达式、来源作者、来源篇名、期刊、年代卷期等,如图4-29所示。(3)若选中左下方的“选择所有”并单击“显示”按钮,则可看到伍海华老师这10篇文章除全文以外的详细情况,其引文(源头文献)共为122篇。若只想了解某篇文章的详细情况,则可单击某篇文章“来源篇名”的链接,就能看到该篇文章的详细列表,包括该篇文章的引文列表,如图4-30所示。由此看来,使用来源文献可追溯到CSSCI收录伍海华老师在应用经济学方面源头部分的122篇文献。3.被引文献检索

单击图4-27最下方的“被引文献”或其他界面中的“数据库选择页”即可进入。被引文献检索主要用来查询作者、论文、期刊等的被引情况。其检索字段有:被引文献作者、被引文献篇名(词)、被引文献期刊、被引文献年代、被引文献类型、被引文献细节和所有字段7项,如图4-31所示。该种检索可以给出论著被引用的详细信息,包括引用文献的作者、篇名、期刊出处等。图4-31 CSSCI被引文献检索界面(1)被引作者检索

通过此项检索,可以了解到某一作者在论著发表后,被CSSCI引用的情况。(2)被引篇名检索

被引篇名的检索与来源文献的篇名词检索相同,可输入被引篇名、篇名中的词段或逻辑表达式进行检索。(3)被引文献期刊检索

被引文献期刊检索主要用于查询期刊被引情况。在此框中输入某刊名,可得到该刊在CSSCI中所有被引情况。(4)被引文献年代检索

被引文献年代检索,主要是配合以上几种检索的辅助手段,通常作为某一出版物某年发表的论文被引用情况的限制。(5)被引文献类型检索

被引文献类型检索也是配合以上前3种检索的辅助手段,主要用于将查询的被引文献限定在某一类型文献中进行,这些文献类型为期刊论文、图书、报纸、会议文献、学位论文、信件、汇编(丛书)、报告、标准、法规、电子文献和其他。(6)被引文献细节检索

该检索具有较强的灵活性,可对文献题录信息进行检索,如输入某人的名字,既可以对作者为某人的文献进行检索,也可以检索篇名(词)中提到某人的文献信息。4.被引文献检索结果

在被引文献结果显示窗口中按年依次显示检索的命中结果、总计被引篇次、检索表达式、被引作者、被引文献篇名、被引期刊、被引文献出处、被引次数等,当然还可进行二次检索,如图4-32所示。如单击“被引文献篇名”链接,则可看到该篇文章的来源文献的更多信息,如图4-33所示。图4-32 被引文献检索结果显示界面图4-33 被引文献检索结果详细显示界面案例分析检索“网络参考文献的标引”被期刊论文引用的情况检索2002年情报学报上发表的题名为“网络参考文献的标引”这篇论文被期刊论文引用的情况。解析:(1)按年选库:2002年以来的数据库;(2)在图4-31被引文献界面的被引文献篇名(词)框中输入“网络参考文献的标引”从被引文献类型下拉菜单中选择“期刊论文”,然后单击“检索”按钮,即可在结果显示窗口中按年显示本次检索的命中结果2篇、总计被引4篇次、检索表达式、被引作者、被引文献篇名、被引期刊、被引文献出处、被引次数等,如图4-32所示。(3)选中图4-32左下方的“选择所有”并单击“显示”按钮,则可依次看到按年被引的“网络参考文献的标引”后来被谁引用(来源文献)的详细情况,共被4人次引用过,如图4-33所示。若只想了解该篇文章某年被谁引用的详细情况,则可单击该篇文章某年下的“被引文献篇名”的链接,就能看到该篇文章被谁引用的详细列表。重要提示CSSCI不同检索字段之间可通过点选检索逻辑关系中的“或”和“与”实现逻辑检索,但多词同一检索字段之间则用“+”(逻辑或)和“-”(逻辑与)实现逻辑检索。

由此看来,使用被引文献则可了解到CSSCI收录某篇文献的最新研究进展情况。换句话说,使用被引文献可以看到新文献对旧文献的传承、评价。

因此,引文索引是利用文献之间的相互引证关系来检索评价文献的。从引文索引中查一批所需的文献后,再利用这些文献的引文查找一批新的文献,这样不仅能获得一定数量的相关文献,还能揭示旧文献对新文献的影响,新文献对旧文献的评价,展现新旧文献在学术研究中的关系。

有关引文索引的相关概念,可参见3.2节中的讲解。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载