新编信息检索与利用(第四版)(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-04 12:40:04

点击下载

作者:徐庆宁

出版社:华东理工大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

新编信息检索与利用(第四版)

新编信息检索与利用(第四版)试读:

版权信息书名:新编信息检索与利用(第四版)作者:徐庆宁排版:汪淼出版社:华东理工大学出版社出版时间:2018-03-02ISBN:9787562853510本书由华东理工大学出版社有限公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —第1章导 论

在我们的日常工作、学习、研究及生活中,无处不存在信息。为了从事各种活动,人们不仅有获取信息的需求,更有传播信息、利用信息、发布信息的渴望,可以说信息与人类的一切活动密切相关。随着信息资源和技术的迅速发展,人们进行信息检索的频率、手段、方法等也都在迅速提高和改进。如何在纷繁复杂的现代信息环境中分辨出资源质量的优劣高下;如何在信息检索的过程中以最短的时间、最经济的手段、最专业的方法,获得最全面、最权威、最准确的信息,来满足我们不同的信息需求,从而提高我们开展各种活动的价值和效益;如何进一步促使我们从单一的信息用户身份,转变为信息资源的传播者、创造者、净化者等信息社会更为需要的各种角色;这些正是我们将要系统学习信息检索与信息利用相关知识及技能的原因和目的。1.1 信息环境问题及解决方案

近半个世纪以来,随着人类科学技术与文化经济的飞速发展,当代信息环境出现了以下显著特征:

(1)全球信息资源极大地丰富,人们的视野得到了前所未有的开拓。所谓“眼观六路,耳听八方”的神话世界里神仙才能做到的事情,现在几乎已经成为普通大众的日常之举。

(2)信息技术一日千里,社会的信息化程度随之迅猛提高。在家里办公、在虚拟世界中做买卖、在图书馆里看戏文和足球赛、在任何时段任意地选择和接受著名大学教授的课堂教学内容……人们的生活方式甚至生存方式有了巨大的改变。

(3)信息交流及传播渠道、信息沟通与流动方式等,都呈现出多样化、直面化、虚拟化、便利化状态及发展趋势。

所有的这一切都给人们的工作、学习、研究及生活提供了更多的机会与便利。但同时也使人们明显地感受到了社会信息流动总量已经大大超出人们的信息接受和处理能力。另外,信息内容的复杂性也大大超过了以前所有社会发展阶段的情形。因此“社会信息环境问题显得日益突出,成为全球性问题,主要表现在:信息超载严重,信息差距扩大,信息资源分布不平衡,信息失衡明显,信息泛滥成灾,信息污染严重,信息障碍加剧,信息犯罪增多,全球信息冲突更加激烈,争夺信息控制权白热化等”问题日趋严重。

1.信息环境问题表现形式

(1)信息超载严重

信息超载又称信息泛滥或信息爆炸。它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪声化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。

实质上,信息超载表现为一种矛盾。一方面,信息量在迅速增加,信息质量却在下降。这具体表现为:信息的过多重复、信息的费解(行话、陌生的符号等使人理解困难)、无关性和不适应性(信息与需要无关或对需要不适合)、过于复杂、信道拥挤、伪信息(无用信息、劣质信息与有害信息等)。正如美国著名社会学家理查德·沃尔曼所指出的那样:信息时代不是“信息爆炸”,而是“非信息的爆炸”,或者是“数据爆炸”。另一方面,人们搜寻、获取和消化利用信息的能力虽有一定提高,但它还远远不能跟上信息增长和复杂化的需要,人们经常处在信息的压力下,并可能会导致种种信息病的出现——信息焦虑症、信息消化不良症、信息紧张症、信息孤独症等。

(2)信息失衡明显

所谓信息失衡是指受各国经济水平、科技水平和其他多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的现象。当今世界,由于信息资源分布不均,已经出现了信息富国和信息穷国、信息富人与信息穷人的两极分化,而且这种分化还会因“马太效应”的作用而进一步加大。

(3)信息污染严重

信息污染是指社会信息流中充斥或伴随着许多不利人们健康而有效进行工作、学习、生活的不良信息,危害人类信息环境、影响人们对有效信息予以及时而正常地吸收及利用的社会现象。主要包括:

①陈旧信息(又称为过时信息)。由于信息未能及时更新,产生老化现象,造成信息内容陈旧、无用的现象。据中国互联网络信息中心2012年1月的统计数据表明,能做到经常性、及时性更新信息的网页并不尽如人意,陈旧、过时的信息在网上可谓比比皆是,这增加了人们对有效信息筛选的负担。

②重复信息。重复信息是指同一内容的信息,被以相同的形式或不同的形式(如改变名称或作者等方式)反复出现于各种媒体(包括传统印刷型媒体与现代化的电子媒体)之上,造成大量的信息重复现象,而重复信息会造成有用信息的淹没。接收过多的重复信息,会导致对有用信息的不敏感,影响对有用信息的吸收和利用。

③干扰信息。干扰信息又可称之为噪声信息。它是指存在于信息资源及信息流中干扰信息接收者做出正确判断或影响系统正常运行的种种无意义信息、病毒信息等,它能降低信息用户的工作效率、使信息系统工作缓慢甚至瘫痪。

④虚假信息。虚假信息实际上就是无中生有、捏造和杜撰产生的信息。一般多是指企业为了赢得竞争优势、克服不利因素而散布的关于企业产品计划开发方向、财务状况和生产能力等方面的不准确信息,其目的在于诱导竞争对手做出错误判断,导致竞争对手情报分析乃至企业决策发生错误,从而赢得时间、机遇和市场。

⑤错误信息。错误信息是指与事实真相完全相反,信息用户因听信或采用而深受其害并导致错误决策、失败行为的信息。错误信息产生的原因主要有两方面:第一是信息在被收集、传递及处理过程中出现失误,如计算错误、分析方法错误等;第二是出于某种目的(如为了获得某种资格或非法利益),某些个人或组织故意制造的、与事实相违背的信息。如某些不负责任的广告信息等充斥网络,极易对信息用户产生误导。

⑥有害信息。有害信息多指各种淫秽色情信息、暴力信息、低级趣味信息以及各种反动信息(如反政府、民族主义、种族歧视、恐怖主义、破坏民族团结、威胁国家安全、煽动种族冲突等信息)。有害信息将对信息用户乃至国家和民族的利益造成损害,属于一种特殊形式的信息污染。虽然可以采用过滤的办法将一些站点屏蔽掉,禁止某些站点的信息进入本国领域,但是基于信息内容的检查方法在技术上还无法很好地实现,导致大量恶意信息仍然到处散播。

(4)信息安全堪忧

表1.1、表1.2、表1.3、表1.4均来自2017年1月由中国互联网信息中心所作的“第39次中国互联网发展统计报告”。显然,信息安全已经成为一类比较严峻的社会问题。不法分子运用信息技术实施的各种违法活动,严重危害社会、危害公民合法权益并给受害人带来了精神、经济、财产甚至人身安全等诸多的问题和危机。信息骚扰与诈骗行为是有意识的,破坏性的,甚至是反社会的活动,其危害极其严重。信息骚扰与诈骗具有智能性、隐匿性、跨国性、严重性、社会危害性等特点。

2.解决问题的对策及措施

面对信息环境的种种严峻现实,国内外众多有识之士对信息环境问题的治理与社会控制展开了积极的对策研究并提出了各种解决问题的方案和措施。这方面的举措归结起来,主要有以下几点:

(1)政策导向。对现代信息环境从政策与法规方面予以调节和控制。通过对信息政策与信息法规的制订与不断完善,对信息环境中出现的各种问题进行引导、协调、控制和管理,引导信息环境变动的方向,调控由于信息环境变动而引起的各种矛盾,对信息产业的各个环节进行科学而严格的管理,对从事信息搜集、存储、加工、传播、利用、创作等各种活动的个人和组织行为从法律法规方面予以规范。

(2)舆论导向。宣传并教育人们树立正确的信息伦理及信息道德观念,促使人们在信息开发、信息传播、信息管理和信息利用等方面自觉遵守正确的伦理要求、伦理规则,认识和理解与信息技术相关的文化、伦理和社会等问题,负责任地使用信息技术。

(3)技术措施。强化技术手段以保障信息安全及净化信息环境。借助高新技术,如各种加密技术、认证技术、防病毒技术、防火墙技术、过滤技术等,使信息环境问题得以有效地预防与治理。

(4)倡导创新。鼓励人们积极创作,丰富人类精神文明资源,大力推进先进文化的传播,净化信息环境,努力消除不文明、不健康、不利于人们接受有益信息或降低人们信息利用效率的任何信息垃圾,消除信息污染。

(5)加强教育。提高信息素质教育水平,促进人的素质的全面提升。改善信息用户素质,提高人们信息检索、获取、辨别及利用的意识、技能及相关的道德观念,是应对现代信息环境、防范与治理信息污染的重要内容。

(6)打击不法行为。对利用信息技术及网络开展反人类、反社会等危害公众利益、败坏社会风气的人和事,采取严厉的打击措施。同时,及时制止和处罚不利于信息环境优化与健康发展的各种倾向与行为。1.2 信息检索及社会功用

鉴于信息对人类活动的重要支持、影响,以及信息激增、信息环境严峻给人们利用信息带来的不便和困难,面对文献信息的汪洋大海,要想及时、准确而系统地掌握某一专题或某一方面的具体情况(背景、现状、趋势)以促进事物的良性发展,信息检索活动显得尤为重要。信息检索的社会功用主要表现在下面几点:

(1)开阔视野,正确决策。通过对信息进行全面、细致地搜索,能够系统地了解前人的工作经验与成果,及时掌握事物的最新动态及发展趋势,开阔视野,启发思路,在现有的科技开发、学术研究基础上不断创新,取得最快、最有效的进展。

(2)提高功效,事半功倍。高效开展信息检索活动,能节省人们对有用信息进行搜集利用的时间及精力,提高工作效益,做到事半功倍。同时还能培养人们的自学能力、科学研究能力及鉴赏能力。

(3)规避风险,维护权益。及时准确地开展信息检索,可以对将要开展研究的课题或项目通过全面的文献信息调研,得到其研究背景、现状及趋势方面的准确信息,使人们减少盲目开题、草率上马、无效投入、重复劳动等风险,从而少走弯路、提高决策的科学性,保证相关活动的正常进行,以达到预期的目的。

(4)学习借鉴,推动创新。信息检索活动也是促进对信息资源的开发、利用及进一步丰富和繁荣的基础。它不仅促进了信息用户对现有学术及研究成果的学习和借鉴,促进了人类知识宝库作用的发挥,同时也对于全面提升人们的综合素质,创作出更多、更优秀的文献信息是一种强大的推动力。

(5)科学评价,知己知彼。信息检索活动一直以来就是人们开展学术研究及与相关活动的重要组成部分。它贯穿于研究项目开题立项前的文献调研、进行过程中的动态跟踪、完成研究后的成果评价等全部环节之中。同时,在国家军事、经济贸易、生产开发、企业竞争以及个人求职升迁等活动中,作为及时了解竞争对手、把握市场需求和相关情况的重要手段,发挥着不可忽视的重要作用,所谓“知己知彼,百战不殆”就是古人对信息搜集与利用价值的高度总结。以下几方面是信息检索评价功用的主要体现。

①科研课题立项信息检索,也叫科技查新,是科技部为避免科研课题重复立项和客观正确地判别科研成果的新颖性而设立的一项工作。通过查新检索:(a)证明即将开展的研究是否具有必要性,能否成为有研究价值的科研课题项目。(b)获得科研项目的背景材料及相关资料,使研制者对所确定的科研项目心中有数,在现有成果的基础上进行具有开创性的工作。科研课题立项信息检索一般由具有科技查新资质的查新机构承担完成(图1.1)

②科技成果鉴定信息检索是对已经完成并准备申报成果(奖励)的研究项目进行系统而全面的信息检索。旨在通过客观、准确地判别科技成果的新颖性、创造性,而证明所鉴定成果的级别、档次、水平。

③经营、产品、决策信息检索是企业所必需的对于生产经营实践活动中的项目筹划、企业管理、发展计划与组织活动等方面的相关信息的检索。

经营信息包括客户资料、资源情报、招图1.1 教育部科技查新服务平台

投标文件、营销计划、经营决策和策略等;产品信息是关于产品从设计、制造工艺、性能价格、销售及市场的一系列信息,包括产品图片、产品类型、产品名称、产品规格等详细资料;决策信息是指决策者在做出某项决策前能够对其起到参考、帮助、指导等作用的各种信息,是实现正确决策的基础。对经营、产品、决策信息进行及时有效的检索,旨在使企业掌握全面信息,在激烈的竞争中始终立于不败之地。

各种应聘及谈判活动信息检索。应聘信息是指关于招聘者自身特点及对应聘者的要求、取向等方面的信息,诸如招聘单位名称、性质、规模、主要业务、资产情况、招聘职位、招聘要求等;谈判信息包括技术引进谈判、商品贸易谈判以及政治、军事谈判等活动中关于“敌”我双方的各种信息。应聘信息和谈判信息有些类似,如果在应聘及谈判活动前能尽可能多地掌握对方的相关信息及把握自身的特点,则能做到胜券在握、如愿以偿。

学术水平评价与鉴定信息检索是指具有某种权威性的单位(机构)为了客观地考察、评价或奖励在学术研究方面做出贡献的个人或组织,借助国际国内公认的著名检索系统(如《中国科学引文索引》《中文核心期刊目录》、SCI、EI等),对一定时限内某地区、某组织及有关个人所撰写的研究论文进行全面检索,以便从一定的层面上反映和评判相关地区、组织及个人的学术水准、研究能力、学术影响力等。这一检索活动更是促进了人们对国内外著名检索系统的认知和利用,一定程度上也刺激了人们学术创作的积极性。1.3 信息素质教育与终身学习

1.什么是信息素质

美国图书馆协会对信息素质的定义是:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。这一定义已经得到了普遍的认同,我国清华大学学者孙平老师领导的关于“北京地区高校信息素质能力指标体系”研究课题得出的研究结论与之基本一致。

信息素质的内涵实际包含了三大方面的内容:信息意识、信息能力、信息道德。其中信息意识是指人对各种信息自觉的心理反应(包括对于信息科学正确的认识及对自身信息需求的意识);信息能力包括信息技术应用能力,信息查询、获取能力,信息组织加工、分析能力,信息的有效利用、评估、传播能力等;信息道德是指整个信息活动中的道德规范,无论是信息生产者、加工者、传递者还是使用者都必须自觉遵守和维护信息道德规范。当代大学生,应该对我们所处的信息社会及其特征有充分的了解和把握,努力提高自身的信息素质,以适应社会不断发展、前进的需求。

2.

信息素质教育的内容与目标

(1)

信息素质教育内容第一,信息观念及意识的培养。信息观念指人们对于信息的看法,对待信息的态度,对信息本质、特征和价值的认识。信息意识指对客观存在的信息及信息活动的能动反映。通过充分了解信息、信息资源、信息技术、信息产业、信息社会等基本概念,了解信息化的发展速度、趋势及影响,理解信息的社会功能及信息资源、信息技术对社会变革、经济增长、文化发展所起到的巨大作用,树立起信息就是资源、信息就是财富的观念,从而在实际工作和生活中,能够意识到自身信息需求的存在,对信息敏感、关心,对在实际工作、学习及生活中遇到的问题,通过及时获取并利用相关信息来解决。

第二,信息知识充实与能力的提高。信息知识是对信息从产生分布、组织加工、传播流通、检索利用等各个环节的原理、现状、规律的不断总结和提炼。只有具备并不断更新信息知识、积极开展各种信息利用实践活动的人,才可能具备现代社会所要求的信息能力。具体而言包括信息检索能力、信息识别能力、信息处理能力、信息组织能力、信息评价能力、信息吸收与利用能力及信息创造能力。

第三,道德及法治的教育。信息道德是指整个信息活动中的道德规范,它是调节信息创造者、信息服务者、信息使用者之间相互关系的行为规范的总和。它的目的是促使社会个体成员遵循一定的信息伦理与道德准则来规范自身的信息活动行为。学习在信息活动和应用信息技术过程中应当遵循的法律法规,做到尊重他人的学术成果,尊重知识产权、合理使用文献信息,自觉抵制违法信息。同时,还要学会在信息活动中的具有团队精神,能够与他人共享知识和信息,在查找信息、生产信息和评价信息的过程中能与他人合作。

(2)

信息素质教育的目标——终身学习终身学习是现代社会文化、科技和经济发展的趋势,也是一个有理想、有文化、懂生活、有追求的年轻人不断完善自我、寻求自身发展的内在要求。作为信息时代的社会成员,一般都要经历婴幼儿教育、学前教育、小学教育、中学教育、大学教育以及职业教育等阶段。不断学习新的知识和技能、不断丰富自己的思想和人生阅历,是人生旅途中永恒的主题。

信息检索能满足人们把握各种信息的需求,信息利用则是人们掌握知识、消化知识、创造知识的一系列过程。信息检索的目的是信息利用。信息利用能力的强弱,直接关系到人们终身学习能力的高低,亦即一个人的信息素质在一定程度上能够反映其终身学习的能力,以及其成长、发展的空间。

信息素质教育的目标就在于提高人们自觉学习、自助学习、自主学习的意识和能力,使得终身学习成为我们自觉自愿的行为和良好的生活方式。1.4 文献信息资源及其构成

信息资源来源广泛、包罗万象、良莠不齐、分类不同、用途各异。它既没有统一的组织管理机构及质量鉴定部门,也没有统一的目录索引可查可控。考虑到读者在学习及研究活动中,主要接触和使用的大多为信息资源中比较核心的内容即文献信息资源,在此不准备对信息资源总体情况做全面和细致的描述,而只是针对文献信息资源的构成情况及其特征进行必要的介绍,旨在帮助大家更加有效地利用它们。“文献是记录知识的一切物质载体”(GB3792.1—83)。我们把来自各种渠道、表现出各种特征的文献信息的总和称为文献资源。为了全面正确地了解认识、把握利用文献资源,我们将从不同的角度或层面对文献资源的构成及特征予以描述和划分。

1.按文献信息的物质载体划分

之所以要按文献信息的物质载体特征来把握文献资源的构成,是因为我们常见的文献资源的物质表现形式可以归结为四种形态:印刷型文献、缩微型文献、声像型文献、机读型文献。

(1)印刷型文献

印刷型文献是指以纸张为存储介质,以印刷技术为记录手段而产生的一种文献形式。它具有易于携带、方便阅读、经济实用等其他文献载体所无法比拟的特点。尤其是对这类文献的使用符合人类长期以来形成的阅读习惯,即便是在今天数字化文献已经被人们广泛接受、普遍使用的情形下,这种载体的文献仍然是人们用于学习、研究活动的主要选择对象,是各级各类图书馆重点收藏和提供服务的基础内容。

(2)缩微型文献

缩微型文献是一种以感光材料为存储介质,以缩微照相技术为手段而产生的一种文献形式。缩微型文献通常有缩微平片(microfiche)、缩微胶卷(microfilm)两种形式。它主要用于保存过期文献,如报纸、档案、银行票据等,也有部分文献直接以缩微形式出版。其主要优点是:与印刷型文献相比占用的收藏空间小、质量轻,传递方便而且信息储存量大。由于这类载体的文献的查阅利用,需要借助于专门的仪器设备,在我国一般只有省级以上的图书馆有收藏。

(3)声像型文献

声像型文献是以磁性材料和感光材料为存储介质,利用专门的机电设备直接记录声音信息或图像信息而产生的一种文献形式。声像型文献又称为视听资料,它包括磁带、唱片、录音带、幻灯片、电影片、录像带等,其特点是将知识、信息表现为声音、图像、动画、视频(sound,image,animation,video)等信号,给人以直观易懂、生动形象的感受,让人喜闻乐见。因此,视听资料在语言学习、音乐学习、建筑设计、工程设计以及描述自然现象和实验现象、动态见闻等方面,具有独到之处。随着人们生活水平的不断提高,这类文献资料不仅在图书馆等文献机构广泛受人关注,在平常百姓家中也时常可见。

(4)机读型文献

机读型文献又称为数字化文献,是伴随着计算机的问世和普及使用,在信息技术、网络技术飞速发展的基础上产生的一种文献形式,主要是指通过计算机对各种信息、数据的存取与处理,完成文献信息的数字化(digitalizing),形成的电子化文献及形形色色的电子出版物,如各种电子化的图书、期刊、学位论文、专利文献、会议资料等。这是一种必须通过各种电子设备来进行阅读、浏览、获取(下载)的文献形态。其特点主要表现在:检索方便、传递迅速、利用便利,大大地拓展了人们了解、掌握各种信息的空间和范围,已经成为现代图书馆重要的馆藏建设对象,成为广大文献信息用户不可或缺的重要文献资源形式。

2.按文献信息的表现形式划分

根据我们常见的文献信息的出版、发布及外在表现形态特征,可以把文献资源归结为11大类:图书、报刊、科技报告、会议文献、政府出版物、学位论文、标准资料、产品资料、专利文献、档案资料、网络文本等。以下我们对这11种类型的文献及其特征进行简要介绍。

(1)图书

图书是一种最为传统的文献表现形式,它具有内容系统、全面、成熟、可靠等特点,但传递信息的新颖性、快捷性不如期刊、会议文献等类型。图书可以帮助人们比较全面系统地学习各种知识、提高文化水平。从图书揭示和反映文献内容的详略程度来看,通常还可以把它区分为阅读性图书和工具性图书两种情形:

①阅读性图书。包括各种教科书、学术专著、文集等。教科书主要介绍基础知识和公认的见解;学术专著是专门就某一课题或研究对象进行比较全面深入论述的学术性文献;文集是由各种文章(论文、报告等)汇编而成的一种出版物。人们必须通过整节、整章甚至整本书的阅读才能达到利用目的,阅读性是这类图书的特点。

②工具性图书。包括各种百科全书、大全、年鉴、手册、辞典、指南、名录、统计、图谱等,又称为工具书。其内容可以是数据、事实、表格、图解、人名等,也可以是内容短小精悍的文章;所有内容按一定特征顺序编排,有些还配有多种检索途径的索引,以便人们在需要之时,迅速从中查检到特定的内容,供人们学习研究、生产实践活动参考之用。

(2)报刊(报纸、期刊)

报刊主要反映各种新闻、观点、学术论文、最新研究成果等,是定期或不定期、具有连续出版编号(卷、期、年、月、日)的出版物。尤其是集中反映各学科研究论文、学术争鸣等专业性期刊,具有品种繁多、信息量大、出版周期短、报道速度快、提供内容新、能及时反映当前科技发展趋势等特点。这类文献是人们及时把握信息、掌握动态、开阔视野、增长知识、开展创新活动最重要的资源之一。

(3)学位论文

学位论文是高等院校学士、硕士或博士毕业生为申请学位而提交的毕业论文。现代高校学生的学位论文,一般具有密切结合社会实际与工农业生产所需,或以某个级别的科研课题为背景展开实际研究、设计等现实意义的特征,特别是硕士、博士学位论文,所探讨的问题比较专深,在某些方面往往提出了独到的见解和观点,对研究工作有较大的参考价值。因此,学位论文是构成文献资源的重要部分之一。

(4)专利文献

专利文献是指一切反映专利发明信息、发明内容等的文献类型。由于专利制度的规定,专利文献具有新颖性、实用性、创造性的突出特点。专利文献既是科技文献,又是一种法律文件。在技术创新、开发设计等活动中专利文献扮演了极其重要的角色。

(5)会议文献

会议文献是指在学术会议上宣读或交流的书面论文。其形式可以是单行本式的会议预印本,也可以是正规出版的会议论文集。会议文献的特点是:主题鲜明、内容新颖、专业性强、学术水平高,能反映出一个国家、一个地区、一个行业或专业/学科领域当前或某时期,在某一科学技术领域的最新研究成果、讨论热点、发展趋势。及时掌握相关领域的会议文献,是及时掌控相关信息与动态的重要渠道和手段。

(6)标准资料

标准资料主要是指相关机构,为促进科研、文化、生产、经济等社会活动高效、有序进行,对工农业产品和工程建设的质量、规格及其检验方法等方面所做出的技术规定或制定的具体标准,是从事研究、生产、开发及工程建设等活动所必须共同遵守的技术指标及范式。

(7)科技报告

科技报告是各国政府系统或科研及生产单位关于某项研究成果的总结报告,或者是研究过程中每个阶段的进展报告。在内容上,科技报告比较新颖、详尽、专深;在形式上,科技报告每份自成一册,篇幅长短不一,编有机构代号和连续顺序号组成的报告号,多数采用简装式印刷品或缩微胶片发行,印数一般不多;在流通范围上,不少科技报告属于保密的或限制发行的,但公开的和解密的也占一定比例,因此,它的获得不如其他类型的文献容易。尽管如此,它仍是一种重要的文献资源。

(8)产品资料

产品资料是产品的制造者、销售方为了宣传推销其产品而印刷或发布的以介绍产品性能为主的资料,如产品目录、产品样本、产品说明书、产品价格表、产品使用手册等。其内容多为已有产品的外观造型、性能用途、使用方法、操作规程和产品规格等。这类文献的特点是:技术成熟可靠,图文并茂、形象直观、传播广泛、商业性强。它对于相关产品的研发、生产、销售、使用等具有重要参考价值。

(9)档案资料

档案资料是指某级或某个组织、机构,在相关工作和生产中形成的各种文书材料、政策文件、技术文件、影片照片、录音盘片等,遵循一定的立卷归档制度而集中保管起来的材料。档案资料的特点在于完整、全面地记录和反映了某工作或活动的全部数据及结果,是一种客观的历史记录,对真实而详细地了解相关方面的情况提供了最好的依据。随着国家信息政策及信息法规的不断完善,公民对档案资料的利用范围和空间将逐渐拓宽、深入。

(10)政府出版物

政府出版物是各国政府部门及其设立的专门机构所发表、出版的各种文件。涉及的内容非常广泛,但大致可分为行政性文件(如法令、统计等)和科技文献两大类型。政府出版物由于全面系统地反映了一个国家(地区、部门等)在政治、经济、军事、文化、教育等方面的思想、方针、政策及措施等,对人们了解、掌握上述情况,做出相应的决策、采取适当的行动等都具有指导性意义和重大的参考价值。

(11)网络文本

网络文本是指那些大量存在于虚拟世界——网络信息资源中不属于上述任一类型文献(即不属于上述各类文本的数字化形态)、但又具有它们中的一些相应作用的网上文献。这类文献的特点是:形式多样、图文并茂、内容广泛、质量不一、获取方便、摘录容易、新旧混杂、可信度不定、作者身份难辨,信息渠道复杂。因此,对于这类文献,一方面可以作为相对便利加以使用,但不作为主要的文献信息资源加以利用。同时,还要对它们的真实性、可靠性做更多的辨识和佐证。

3.按文献信息的加工程度划分

人们在利用文献以及传递信息的过程中,为了及时报道和揭示文献、有效管理和控制文献,对文献进行了不同程度的加工。我们按照对文献进行加工的程度划分,可以将文献分为:零次文献、一次文献、二次文献和三次文献。

(1)

零次文献零次文献又可称为灰色文献,是指未以公开形式或非正式发表及出版形式进入社会流通使用的文献,具体可以包括:①不公开、不刊登在报刊上的会议文献;②非公开出版的政府文献;③未公开的学位论文;④不公开发行的科技报告;⑤技术档案;⑥工作文件;⑦不对外发行的产品资料;⑧企业文件;⑨内部刊物,即内部征订或部分赠阅、交换的定期或不定期出版物;⑩未刊稿,包括手稿、译稿,以及学术往来函件;1000cb10004a100054贸易文献,包括产品说明书和市场信息机构印发的动态性资料等。零次文献因未正式发表或出版,按照我国著作权法的相关规定,一般不得在正式的论文或出版物中加以引用。

(2)

一次文献

一次文献是指作者(包括团体作者)以本人生产与科研工作成果为依据,创作、撰写而形成的已经公开发表或出版的文献。如期刊论文、科技报告、会议论文、专利说明书及各种专著等不仅已经发表而且未有人予以任何重新组织、加工过的文献。一次文献的特点在于内容新颖、翔实、具体,一般来说它是文献信息检索的终极目标。

(3)

二次文献二次文献是指对一次文献信息进行加工、提炼、浓缩而形成的工具性文献。它主要包括通过对大量分散无序的一次文献的收集与组织——按照一定的方法进行整理、加工,使之有序化、系统化——形成的各种书目、题录和文摘数据库。二次文献是人们对一次文献进行有效的管理、控制和利用的工具,它提供了一次文献的线索及概貌。

(4)

三次文献三次文献是指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩、评述等深加工而形成的文献。如综述、述评、词典、百科全书、年鉴、指南数据库等。三次文献的内容综合性强、信息量大,为人们提供了所需了解的事实与数据,具有重要的参考、借鉴和利用价值。

了解和掌握以上内容的目的,主要在于扩充对于文献信息的全面掌控、重点选择与有效利用的能力和知识。1.5 文献检索系统与分类

丰富的文献资源,为我们开展各种活动和不断寻求发展提供了优越的先决条件和牢固的物质基础,应运而生的文献检索系统则为我们改善活动效率、提高发展速度起到了强大的催化效应和支持作用,更是我们创新知识、发展理论、开发新品、走在时代的前列的保障体系。

1.

文献检索

狭义的检索(Retrieval)是指依据特定的需求,按一定的方法,从已经搜集并组织好的大量有关文献信息的文献集合中,查找并获取特定的相关文献的过程。

广义的检索包括信息的存储和检索两个过程(Storage and

Retrieval)。信息存储是将大量无序的信息集中起来,根据信息本身具有的内外部特征,经过筛选、加工和整序等处理,使其集约化、有序化、系统化,形成具有检索功能的数据库(检索系统),供人们检索和利用的过程。而信息检索是信息用户根据各自的信息需求,利用已经编制好的检索工具或数据库(检索系统),查找出特定信息的过程。

社会信息数量剧增、流速加快、分布散乱、优劣混杂,使我们处于“信息超载”的时代,却又过着“知识贫乏”的生活,人们认识到,大量而无序的信息不是财富而是灾难。

序是事物的一种结构形式,是指事物或系统组成要素之间的相互联系以及这种联系在时空结构中的具体表现。当事物组成要素之间具有某种约束性,在时间序列及空间结构上呈现某种规律时,便可称这一事物为有序的。有序化,即把杂乱无序的事物,按一定标准、使用一定的方法手段,整理为某种易被理解的序列的一种活动。

文献检索则是解决文献生产、分布和流动的无序性与人们利用文献的有序性和特定性之间矛盾的有效方法。因为文献检索的对象,可以简单地归结为构成我们此前已经介绍过的文献资源——各种载体形式、各种出版类型及各种文献加工层次的文献集合。而文献集合一般是对文献进行有序化管理的产物。

2.文献检索系统及功能

(1)文献检索系统

就是有序的文献集合,具体是指用来存储、报道和查找文献信息的各种数据库。它由数据库中收集并整序化的大量文献信息、存储与检索设备及相应的支持设施(如网络等)等要素共同构成,满足人们按一定的需求、已知的线索找寻各种各样的相关文献信息及其原文的目的,是人们开展学习、研究、预测、开发、设计、生产、商贸等活动的得力助手。

(2)文献检索系统的功能

①报道文献信息

检索系统具有对文献信息予以揭示、反映、报道的功能。信息用户只有通过利用文献检索系统,才能对大量产生并随时更新的各种信息进行及时了解和系统掌握。

②存储文献信息

通过对大量分散而无序的原始文献进行有目的的存储,并按照一定特征及规则组织,形成了包容各个年代、各种载体、各个学科门类的文献检索系统。

③检索文献信息

通过对信息的报道和存储,把大量信息按外表特征与内容特征集中排序,实现方便、高效的信息检索,它是文献检索系统中最突出的功能。

④辅助创新文献信息

通过提供各种各样的文献信息管理功能、学术论文投稿信息、个性化知识传播途径等,为人们搭建了一个从检索文献信息,到利用文献信息再到创新文献知识的良好平台。

3.文献检索系统的分类

按照不同需求、不同的用途、不同的检索目的,人们已经设计并开发了不同作用与功能的文献检索系统,以下我们针对常见系统的特征,分门别类地对它们做一些介绍,旨在帮助我们有针对性地选择使用相应的数据库,以期提高文献检索与利用活动的效率。

(1)按检索系统揭示的文献资源特征分类

①图书检索系统。专门提供电子图书的检索与利用的数据库。如“超星数字图书馆”“American Star Foreign Digital Library”。主要提供反映图书特点的各种检索入口,如书名、作者、出版社及相关主题等,供检索者根据已知线索查找相关图书之用。

②期刊检索系统。专门提供电子期刊的检索与利用的数据库。如“中国期刊网”“Springer Link电子期刊”。主要提供反映具有期刊特点的各种检索入口,如刊名、作者、篇名及相关主题等,供检索者根据已知线索查找相关的期刊论文之用。

③学位论文检索系统。专门提供经过电子化的硕士或博士学位论文的检索与利用的数据库。如“中国学位论文全文数据库”“ProQuest博士论文全文数据库”。主要提供反映带有明显学位论文特点的各种检索入口,如学位授予单位、导师、作者及相关主题等,供检索者根据已知线索查找相关的学位论文之用。

④专利文献检索系统。专门提供经过电子化的专利文献信息的检索与利用的数据库。如“中国专利文献检索系统”“美国专利检索系统”。主要提供反映具有专利文献特点的各种检索入口,如篇名、学位授予单位、导师、作者及相关主题等,供检索者根据已知线索查找相关的专利文献信息之用。

⑤会议资料检索系统。专门提供经过电子化的学术会议文献信息的检索与利用的数据库。如“中国学术会议论文全文数据库”“ISTP(Index to Scientific&Technical Proceedings)科学技术会议索引”。主要提供反映具有明显的会议文献信息特点的各种检索入口,如会议名称、会议主办单位、会议地点、论文作者及相关主题等,供检索者根据已知线索查找相关的国内外学术会议论文信息之用。

⑥标准资料检索系统。专门提供经过电子化的标准文献信息的检索与利用的数据库。如“中国标准数据库”“IEC(国际电工标准)数据库”。主要提供反映具有明显的技术标准文献信息特点的各种检索入口,如标准名称、标准号、标准分类号及相关主题等,供检索者根据已知线索查找相关的国内外标准信息之用。

⑦科技报告检索系统。专门提供经过电子化的科技报告文献信息的检索与利用的数据库。如“NTIS美国政府报告数据库(National Technical Information Service)”。主要提供反映具有明显的科技报告文献信息特点的各种检索入口,如报告名称、报告号、报告者(作者)及相关主题等,供检索者根据已知线索查找相关的科技报告文献信息之用。

⑧产品资料检索系统。专门提供经过电子化的产品资料及信息的检索与利用的数据库。如“MBF(MyBoeingFlee)民用航空产品资料数据库”“化工产品数据库”。主要提供反映具有产品信息特点的各种检索入口,如产品名称、厂家信息、产品型号及相关主题等,供检索者根据已知线索查找相关的国内外产品信息之用。

⑨档案资料检索系统。专门提供经过电子化的各种档案资料及信息的检索与利用的数据库。如“民国时期档案目录数据库”“中华人民共和国时期档案目录数据库”。主要提供反映具有各个时期、各个领域、各个地区、各种人物及事件以及各种政策等历史档案特点的各种检索入口,如名称、地名、时间及相关主题等,供检索者根据已知线索查找相关的档案资料信息之用。

⑩政府出版物检索系统。专门提供经过电子化的政府出版物信息的检索与利用的数据库。如“GPO(美国政府出版物数据库)”。主要提供反映政府各部门在各个时期、各种领域等出版发行的文件特点的各种检索入口,如出版物名称、作者、部门及相关主题等,供检索者根据已知线索查找相关的政府出版物信息之用。[“GPO(美国政府出版物数据库)”主要报道了与美国政府相关的各个方面的文件。包括:国会报告、国会意见听证会、国会辩论、国会档案、法院资料以及由美国政府具体实施部门,如:国防部、内政部、劳动部、总统办公室等出版发行的文件,数据库包含的内容范畴是与美国政府有关的所有相关主题,覆盖了从1976年以来的资料。]

(2)按检索系统功能及反映文献的详略程度划分

①书目数据库。它是全面反映某个单位、某类机构、某个地区相关组织的各种特征文献资源收藏数量、收藏地点以及流通状态等的数据库,内容主要反映了图书馆具体收藏的各种文献的题目、作者、出版机构、版本情况、文献编号等书目信息。这类检索系统主要用于查找、了解馆藏情况,确定原始文献借阅或索取的最佳对象。

②文摘数据库。这类数据库从内容上看,其重点在于及时而概略地反映相关领域、专业的相对完整系列的或最新的研究成果;从揭示信息的详略程度上看,除了提供每一篇(本)文献的题目、作者、出版机构、版本情况、文献编号(包括卷、期、年及页码或代码、分类号)等书目信息以外,特别对原始文献的全文进行了摘要反映,即提供了每篇文献的文摘,很好地起到了帮助检索者识别、判断文献主题与检索目标的相关度的作用;从检索功能上看,大大扩展了检索者的检索途径,甚至扩大了检索者对原文获取的能力。目前一些国际著名的检索系统都是文摘数据库,如SA(科学文摘)、EI(工程索引)、CA(美国化学文摘)等(详见本书第4章)。

③全文数据库。以提供全文(如整本图书、整篇论文、完整的专利说明书、完整的各种统计记录、图谱或数据等)为特征的文献检索系统,叫全文检索系统。在这种数据库中,所收录的信息不仅反映了以上文摘数据库中的所有信息,还详细地提供了原始文献本身(详见本书第2章、第3章),使检索者可以方便而直接地从检索系统中浏览、下载所需要的文献全文或部分内容,大大地节省了时间和精力,同时提高了检索活动的效率。

④引文数据库。根据引用与被引用文献之间讨论的主题内容一定存在着或多或少、直接和相关联系的事实,在提供文献书目信息的基础上,强调通过揭示不同文献之间相互引用的情况,来进一步反映文献之间的内在联系的文献数据库叫引文数据库。如“SCI(科学索引)”“中国科学引文索引”。这种数据库的主要作用在于客观显示研究与学科内部及其之间的相关性和继承性,全面了解某一学术观点、思想、研究方法等的产生、发展及最新动向及趋势;从一定程度上评估和鉴别某一研究工作在学术界的影响力,从一个侧面反映科技成果被认可和利用的程度及其学术价值;作为图书馆选择专业期刊、选定核心期刊、优化馆藏文献的参照。

⑤统一检索平台。它主要是指数据库中同时包含了多种文献类型(图书、专利、期刊、学位论文等)的信息,其中部分以文摘数据库出现,部分却属于全文数据库情形,甚至部分是引文数据库的形式的检索系统。如“万方数字资源系统”“读秀学术搜索”。这类数据库的特点主要是为人们在同一检索平台上,进行更多需求的信息检索与利用活动提供良好条件。

4.检索系统的评价标准

以上我们对常见的一些检索系统及特征、功用进行了简介,以下将对检索系统的评价标准做一些必要的介绍,目的是帮助大家在把握各种数据库特点的同时,掌握有关数据库质量的评价标准,以期选择优秀的检索系统,提高检索活动的效果。从使用者的角度来考察,检索系统的评价标准应该包含以下几个方面的内容:

(1)检索系统的收录对象及范围

数据库的收录对象及范围决定了数据库中所提供信息的可靠性、完整性,是体现检索系统重要性的主要标志。

(2)检索系统对其中所包含的各种数据揭示与反映的质量

作为优秀的检索系统,应该对其中各种信息的揭示与反映做到充分详尽、准确无误、规范标准,具体表现在其对信息描述的质量及信息标引的质量等方面,查全率及查准率是考查系统收录质量的两项重要指标(详见2.9节)。

(3)数据库中信息的更新速度

数据库中信息更新的速度,反映了数据库能提供最新文献信息的水平和时差。主要表现在数据库中新增加的信息与该信息原始文献出版、发表之间的时间跨度。

(4)数据库提供的检索途径及检索功能

一般来说,数据库所提供的检索途径越丰富,数据库响应用户需求的水平越高,数据库能支持的检索技术(如布尔逻辑检索、位置检索、截词检索、限制检索等)种类越多;检索过程速度就会越快,检索效率(查全率与查准率)也随之越高。另外,实际操作是否方便以及对检索结果的显示、排序、选择、格式转换、打印、保存等的响应情况,也反映了检索系统的功能。

(5)数据库正常运行的支持体系

主要是指数据库商家所提供的维护数据库正常运行的数据、技术、维修等保障措施和手段。1.6 信息检索途径及方法

所谓检索途径又可以称为检索入口,是数据库编制者为用户设立或提供的检索与查找其数据库中所有信息的路径。而检索方法,就是采用什么形式、手段来查找信息及其原始文献。1.6.1 常用文献检索途径

一般来说,检索路径的设置主要根据两方面的原则确立:一是文献所表现出来的特征,包括其外部特征(如文献的名称、作者、出版信息等)和内容特征(如文献所描述的主题、所属的学科分类信息等)。二是将用户的使用习惯作为抽取文献标志的主要依据。根据这两个原则,总结常见文献信息检索系统的主要检索途径如下。

(1)文献名称检索途径/入口

它是以文献的名称为线索进行检索的途径。文献名称主要指书名(图书)、刊名(期刊)、篇名(学位论文篇名、期刊论文篇名、会议论文篇名等)、专利发明名称、标准名称、产品名称、文件名称、机构名称、作者名称、事物名称、事件名称等。由于文献名称比较直接、准确地反映了文献特征,便于用户识别、判断文献的相关信息,符合用户检索习惯,因此无论什么样的检索系统都把它作为最基本、最重要的检索途径提供给用户使用。

(2)文献主题检索途径/入口

它是以文献所反映的主题内容为线索开展检索的途径。具体而言,就是把每一个文献(一本书、一篇论文、一件专利等)中能够体现文献主题概念、事物特征、具有实际意义的词语抽取出来,作为检索标记,提供给大家检索,从而使得用户可以从不同学科背景、不同检索需求出发,检索到同一主题的所有文献。主题检索途径的优点在于检索词具有直观简洁、通俗易取的优点,能够很容易地查找到大量含有所选用的主题词的文献,但同时需要用户对检索结果进行认真筛选。在选择主题检索途径时,如果能同时采用一些必要的检索技术,则会取得较好的检索结果(相关的知识我们将在之后的章节中,结合数据库的使用做进一步阐述)。

(3)文献分类检索途径/入口

它是以文献所反映的内容其所属学科的分类体系为线索开展检索的途径。即根据一定的文献分类规范,按照所描述对象的学科分类体系,赋予每一个文献(一本书、一篇论文、一件专利等)一个或多个能够揭示文献内容特征、能够表征所属学科分类等级、具有特殊含义的由字母或数字(或共同)构成的代号即分类号,提供用户从学科体系、专业属性方面检索文献,以得到一系列内容上具有从属关系或相互关联、前后继承的相关文献。《中国图书馆图书分类法》(简称“中图法”)作为我国图书分类的国家标准,根据书籍内容的学科属性及知识的内在联系,采用字母作为学科代号,将图书划分为“A~马列主义、毛泽东思想,B哲学,C~K社会科学,N~T自然科学,Z综合性图书”五大部类和22个基本大类,是我国各级各类图书馆进行图书分类、管理、组织、利用的依据和基础。

(4)

文献代码检索途径/入口它是以某些文献所具有的特指或特定的代码为线索开展检索的途径。这类代码包括专利号、专利公开号、文摘号、化学物质登记号、标准号、科技报告号、合同号、ISBN号、ISSN号等,其特点就是一个代码只代表一件特指的文献。以上介绍的分类号却不具备特指某一具体文献的特点,原因在于同一篇文献涉及的主题概念、反映的学科属性往往不止一个,同时,同一学科主题的研究往往具有众多的研究者和研究成果(论文等),使得同一文献具有多个分类号、不同作者的文献具有同样分类号的情形经常可见。因此,采用文献分类号检索的结果,可以使我们获得一系列的相关文献,而采用文献代码检索的结果,却能使我们准确地获取特定的、唯一的所需文献。

决定用户选择什么检索途径的依据主要有两方面:一是检索系统已经为我们提供的各种检索入口;二是用户当前已经掌握的相关线索。要取得既完善又准确的检索结果,正确地选择检索途径是很关键的,同时用户所具有的数据库知识、检索技能以及对检索目标的把握情况也是非常重要的。1.6.2 常用文献检索方法

这里讲的检索方法就是根据用户的自身条件,以最少时间、最佳途径、获得最满意检索效果的方法。常用的检索方法大致有以下几种。

(1)系统检索法

系统检索法也叫“工具法”或“常用法”,即利用检索系统开展全面的文献信息检索的方法。这是人们最常用的检索方法,只要检索者具备利用相关检索系统的条件,又对检索系统具备足够的了解和检索技巧的掌握,能够及时地进行检索实践并不断总结经验,一定能取得令人满意的结果。

(2)引文查找法

引文查找法也叫“追溯法”,是以已经获得的文献中所注明的“参考文献”为线索,查找所需要文献的方法。优点是所要查找的对象已经被人采用、引用,具有相对的准确性和可靠性;减少了相关文献检索的难度;有利于对同一主题内容研究轨迹的追踪、回顾,把握其历史和趋势。

(3)系统—引文交替法

系统—引文交替法是将以上两种方法相结合的检索方法。当用户手中没有掌握任何相关文献原文的情况时,可先采用系统法——即利用检索系统进行检索,然后对检中的比较切题的文献进行全文浏览,如果的确内容相关度很大,则进一步对其所采用的参考文献进行追踪,以便尽快获得核心参考文献。另外,当用户在进行系统检索前已经拥有一篇重要的参考资料,则一定要先根据其后的“参考文献”进行引文追踪,进而再利用检索系统检索,如此会提高检索效率,节省因不断摸索尝试而耗费的时间。1.6.3 图书馆书目信息(馆藏书目)检索

所谓“图书馆书目信息检索系统”(即“馆藏书目”),是最常见、历史最悠久的文献检索系统。它在电子文献出现之前的100多年前,就在传统图书馆中产生并受到广泛重视和利用。直到今天,数字化文献增长迅速、利用普及、数字图书馆大有取代传统图书馆的“强劲”势头下,“馆藏书目”依然是图书馆收藏的重要检索系统。

1.

馆藏书目的检索

随着图书馆现代化技术的普遍应用,20世纪80年代后,全国各大高校图书馆、公共图书馆以及研究机构图书馆大都对馆藏文献进行计算机编目,形成了各自的馆藏书目(数据库)并向公众开放,旨在方便人们了解有关图书馆的全部收藏,方便用户查找自己需要的文献所在,提高文献资源的利用率。图1.2 馆藏书目的检索系统及常见检索途径(检索字段)

尽管考虑到诸多的因素,各个不同单位的图书馆选用了不同供应商研制的图书馆自动化系统,使得各馆的馆藏书目数据库并不是千馆一面,但其反映图书馆收藏的基本信息和系统的检索功能大致是相似的。

题名(书名、丛书名或期刊名等)、责任者(作者、团体作者、编者等)、主题词、分类号、出版社、ISBN或ISSN(书号或刊号)、索书号是馆藏书目数据库检索的主要途径(字段),也是用户在查找图书馆馆藏之前通常已经掌握的一些线索(图1.2)。

2.

书目信息检索系统的作用

书目信息检索系统(馆藏书目)反映的内容,就是图书馆全部文献收藏的书目信息。无论是过去、现在还是将来,每个图书馆都具有自己的馆藏书目,而不同特点、不同大小的图书馆,对于记录和揭示自己“家底”的本馆书目信息检索系统(馆藏书目),都会放置在其主页上比较醒目的位置,以便用户识别和使用。

所谓书目信息主要包含了文献的题名、作者、出版情况、排架标记、内容提要等大体情况。书目信息检索系统(馆藏书目)的主要作用是:①以文献的种/册为单元揭示文献特征,展示某个图书馆文献收藏详情,指引用户按照一定的规则及已经掌握的线索,查找所需要的文献在某个馆是否有馆藏;②如果有馆藏,指示其具体收藏地址、位置;③标明目前该文献的流通状态(可借,可阅,等)。(图1.3)图1.3 书目检索系统检索结果举例

书目检索系统(馆藏书目)尽管在每个图书馆都有,而且一般都设置在图书馆主页的显要位置,但对它的称谓或表现形式却不尽相同,如称之为“书刊检索”“馆藏检索”“馆藏目录”“书刊目录检索”……,但它们的功能却是基本一样的。

3.常用检索技术及其作用

所谓检索技术,实际就是在检索的过程中所采用的“扩检”及“缩检”的措施,作用在于使得检索结果既全面、又准确。本书第2章将对具体的“扩检”及“缩检”的措施做出介绍和分析,以下介绍一些常用的检索技术。

(1)布尔逻辑检索

利用布尔逻辑算符进行检索词之间的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑“与”/AND、逻辑“或”/OR、逻辑“非”/NOT。

逻辑“与”/AND运算,意味着同时要包括“AND”前后两个检索词的书目记录才是满足检索条件的。例如,输入“计算机AND检索技术”,检索结果必须既包括“计算机”又包括“检索技术”,显然这样限定后的检索结果会比较少(“缩检”),但比较准确。

逻辑“或”/OR运算,意味着只要满足其中任何一个检索词即可。例如“俄罗斯OR苏联”检索结果或包括俄罗斯,或包括苏联,范围扩大很多(“扩检”)。

逻辑“非”/NOT运算,意味着需要从一个检索词的概念中排除某个或某些概念(“缩检”)。

(2)截词检索

截词检索是计算机检索系统中应用非常普遍的一种“扩检”技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等原因,在实际检索过程中,如果仅仅选择了检索词的某一种或几种情形,都有可能造成“漏检”(即遗漏本应该有的检索结果),采用截词检索,能够避免检索结果不全面的现象发生,避免“漏检”的情况出现。

(3)位置检索

位置检索就是在全文中,通过限定检索词之间的距离(或关系),即对检索词之间的相对位置进行限定,使得检索结果更加逼近检索要求的一种“缩检”举措。通常是在检索词之间用位置算符组配(连接),以表达具有比较专指的主题概念。

(4)限定检索

限定检索是对检索词在文献中出现的包括时间、文种、文献类型、文献级别及字段进行限定性检索,是常见的“缩检”举措之一。其中,字段限定检索是指采用检索词在数据库记录中的一个或几个限定的字段范围内进行查找的检索方法。

另外,还有“加权检索”“聚类检索”等检索技术,由于它们在我们常用的国内外数据库检索中使用非常有限,此处不做赘述。还有需要说明的是:在不同的检索系统中,截词算符、位置算符等的表现形式也有所不同,我们将在之后的相关章节对具体某个数据库中的这些算符其具体表现形式和作用做具体的介绍。复习思考题

1.信息环境问题的主要表现情形有哪些?你认为“只要不断强化技术手段就可以保障信息安全及信息环境优良”的说法对吗?为什么?

2.信息检索的功用表现在科学评价、权威鉴定方面主要有哪些?

3.查找文献的方法中,什么是引文法?

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载