法律检索资源方法

2024-09-20 版权声明 我要投稿

法律检索资源方法(推荐8篇)

法律检索资源方法 篇1

中国(大陆资源检索p1、港澳台资源检索p6、法律出版物p4)

外国(美国p7、英国p7)

国际组织(搜索引擎检索p7、数据库检索p7、通用检索p8)

从信息的传播方式来看,可通过互联网、新闻媒体、报纸、期刊、杂志、法律书籍、法律光盘制品、广播等途径来获取。

根据我国法律体系的组成、《立法法》的规定,以及律师工作业务需要,与律师工作息息相关的法律信息类型可分为国内外法律法规信息,具体包括我国宪法、法律、行政法规、司法解释、部门规章、地方性法规、自治条例和单行条例、地方政府规章、我国签署的条约、军事法规和军事规章、特别行政区的法律文件、立法背景资料及其他规范性文件,中国法律英文译本、外国法律制度、国际公约与条约、WTO规则等等;案例信息,包括我国各级人民法院裁判文书(最高人民法院、各地高级、中级、基层人民法院审理的案件判决书、调解书、裁定书等)、案例评析、仲裁案例等;实用法律资料,包括法律释义、司法解释解读、法律实务指南,法律文书、合同范本等;参考资料,包括法学论文、法学教材、法律词典、法律新闻等。

法律资料以载体的不同展现出不同的形式,其顺序应为:网络资源、光盘数据库、法律出版物。

(一)中国法律资源(含港澳台地区)

1.主要网络资源

(1)法律数据库或在线法律服务(Legal Online Services)

法律数据库是律师必备的、有效、最方便的法律工具之一,全面权威的法律数据库能为律师提供可靠的法律信息检索服务,提高工作效率。

①北大法宝()、法制日报网站()等,可以很方便地查询报纸内容。

①中国法院网()

中国法院网经最高人民法院批准成立的,法律综合性新闻网站。致力于为社会提供最丰富的法律资讯、最权威的法院信息,最快捷的案件报道。中国法院网对传播审判信息、增强审判工作的透明度,向社会提供完善法律服务方面都发挥重要作用。

②正义网()、英国法律在线(http://)、世界贸易组织(http://)、欧盟委员会(http://为例)

法律数据库遵循检索常用的方法,包含逻辑运算符、二次检索等功能,该功能将在下文做介绍。由于其专注于法律专业文件的检索,在检索字段设置、检索技巧上都有其独特之处。北大法宝主要的检索方法包括:(1)跨库检索

该数据库支持跨库检索,可同时在14个主体数据库中通过输入标题或全文关键词进行快速检索,同时可选择“显示命中条款”功能,可在检索结果中将含有关键词的条款内容标红提示给用户。

(2)标题关键词检索

标题关键词检索数据减缩是最常用、最直接的检索方法。当查询者知道所要查询的标题中的关键词时,最适合使用此查询方式,能快速找到检索结果。

(3)全文关键词检索

需要查询正文内容中包括某词汇的全部文件时,这种查询是最快捷有效的方法,全文查询中尽量不要单独使用助动词如“的、地、得”、简单的数词如“1,2”等,检索关键词在北大法宝数据库中会在正文中用红颜色标出。

(4)发文字号检索

发文字号检索能保证检索文件的精确性,如知道法规的发文字号,在“发文字号”文本框中输入要查询法规的发文字号,即可查询到所有相同发文字号的法规信息。

(5)分类检索

北大法宝数据库中有着详尽的分类体系,中央法律法规库分为99个大类,今千个小类,可通过查找键,找到具体分类,可了解某一分类下的所有相关文件。如结合标题和全文关键词检索,结果会更准确、有效。

(6)日期检索

需要查询某日期范围内的法规信息时,适合使用此查询方法。在相应的日期字段有前后两个输入框用于输入日期范围;如果只输入前一个日期,则表示在此日期之后;如果只输入后一个日期,则表示在此日期之前;如果前后两个输入框都输入日期,则表示在两个日期期间内进行检索。法宝数据库中根据不同的子库,具有日期类型的字段有:发布日期、实施日期、批准日期、签字日期、生效日期、终审日期、调解日期和裁决日期。

数据库中,根据子库的不同和特点,设置了不同可检索的字段,具体包括:发布部门、批准部门、法规分类、时效性、效力级别、范本分类、相对国、条约分类、文书分类、终审法院、案件分类、相关组织以及裁决机构等等。

3.搜索引擎与法律数据库的通用检索方法

对于搜索引擎和法律数据库而言,检索方法有其共性,具有一些通用的检索方法。

首先是恰当地运用符号检索,会提高检索结果的精确度。添加符号检索,一般对于多字、多词或限定范围之需要,这就需要熟练使用布尔逻辑运算符,具体的运算符含义见下表:

搜索引擎GOOGLE、百度以及专业的法律数据库等网站,采用的就是布尔逻辑运算符进行检索,能够方便用户完成精确查找。

另外,可以使用双引号、书名号进行词组检索。如果查找的是一个词组、多个汉字或者书名时,最好的办法就是将它们用双引号(英言文状态)或书名号括起来,这样得到的结果最少、最精确。如输入一个书名时,最好是全部名称,并加双引号或书名号,这样便会被认为是一个词组进行检索,提高准确性。

其次,选择适当的关键词。使用关键词查询时,要求表述准确,简练,尽量使用更精确的词汇,用最少的词表达清楚所查信息的主题,尽可能删去一些同义词或近义词。对于太长的关键词,改用逻辑组合,使用运算符,而不是文字。

再次,注意检索细节。在Internet上进行查询时如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。

法律检索资源方法 篇2

1 网络信息资源

网络信息资源 (Network Information Resource) 是指通过计算机网络可以获取利用的各种信息资源的总和。它包括在Internet这个平台上可以获得的一切信息资源, 如网络数据库、电子出版物和其他的网站、网页等。具体地说是指以数字形式记录, 以多媒体形式表达, 存储在网络和计算机磁介质、光介质以及各类通信介质上, 并借助计算机与网络通信设备发布、存储、传递和利用的信息资源集合。需要指出的是, 网络信息资源不仅包括互联网信息资源, 也包括没有连入互联网, 存在于局域网或内部网的信息资源。

2 网络信息资源检索方法

网络信息检索与传统信息检索的共同点是按图索骥。用户需要知道这些信息存储在哪里, 然后设法获取。在网络环境下就是要知道信息存储地址, 然后通过该地址去访问该资源, 获取信息。那么怎样获取这些地址呢?首先是平时积累, 其次是利用各种网络检索工具查询。

2.1 平时多渠道地收集积累一些网址, 直接按网址进行登录浏览获取信息

网络信息资源的用户大都有自己侧重的研究领域或喜爱的主题, 平时有意识地积累一些与此相关的网址, 如果用户要访问已知地址的信息资源, 可以在浏览器地址栏中输入已知的网站或网页地址, 直接登录进行浏览, 这是一种最常见最简单网络信息资源的获取方式, 简单得似乎不值得一提, 但却是最有用的, 也有人称之为“去信息所在的地方 (go where it is) ”。直接按网址进行查询的方法简单高效, 但获得的网络信息资源仅是沧海一粟, 能够通过这种方法获得的信息非常有限。能否有效地采用这种方法, 关键在于用户平时是否能多渠道地收集相关网址。

2.2 利用网络检索工具查找网址

2.2.1 利用网络资源目录指南 (也称目录型搜索引擎) 查网站地址

为了对互联网这个无序的信息世界加以组织和管理, 使大量有价值的信息纳入一个有序的组织体系, 便于用户全面地掌握网络资源的分布, 专业人员在对网络信息资源进行鉴别、选择、评价和组织的基础上开发出了可供浏览和检索的网络资源目录指南 (也称分类导航) 。网络资源目录指南提供按照分类编制的等级结构式网站目录, 其检索方法为分类浏览方式。它将各站点按主题内容组织成等级结构, 用户依照这个等级循序渐进地逐层浏览, 直至找到所需信息。在各个类别下面, 排列着该类网站的站名和网址链接, 有些还有网站简介, 但并不收录所有的网页信息。分类目录型检索工具的优点是将信息分门别类, 用户可以清晰方便地浏览某一大类信息, 尤其适合那些仅希望了解某一方面、某个范围内信息的用户。网络资源目录指南的缺点是由于它的综述和标引工作一般靠专业人员完成, 其管理、维护跟不上网络信息的增长速度, 导致其收录范围不够全面, 新颖性、及时性不够强, 且用户要受标引者分类思想的控制。加之它对各站点的描述具有一定的局限性且较笼统, 没有文献全文, 只能检索到主题目录和—些简单的描述信息。该类检索工具的代表有Yahoo!、Galaxy、Lycos、网易等。

2.2.2 利用以关键词检索为主的全文搜索引擎查找网页的网址

这是获取网络信息资源最为常规和普遍的方式。全文搜索引擎提供按关键词查询网页地址, 其检索方法为关键词检索方式。搜索引擎的数据库会将一个网站上所有网页全部保留下来。当用户查询的关键词在数据库的网页中出现过时, 该网页就会作为一项搜索结果返回到搜索结果的页面上。该类检索工具的代表有Google、Baidu、Aha Vista、Hot Bot、Excite、天网等。

在分类目录型检索工具的数据库中, 保存的是互联网上各个网站的站名、网址和内容简介;而在搜索引擎的数据库中, 保存的则是互联网上各网站的所有网页 (包括主页和其他网页) 的全部内容, 涉及范围要大得多。利用搜索引擎进行检索的优点是:省时省力、简单方便、检索速度快、范围广, 能及时获取新增信息。由于采用计算机软件自动进行信息的加工、处理, 且检索软件的智能性不是很高, 造成检索的准确性不是很理想, 离他们的检索需求及对检索效率的期望有一定差距。因此, 一般可以用它检索Internet上公开的、免费的信息。

2.2.3 重视网上学术信息资源的检索

为了方便地获取互联网上的信息, 搜索引擎扮演着越来越重要的角色, 几乎所有上网的人都会用搜索引擎来查找信息, 因此很多网络用户认为搜索引擎能提供网络上最为全面的信息。事实上, 没有任何—个搜索引擎能知道网站的每一个网页。由于搜索引擎在网络信息资源采集方法、索引技术和处理能力等方面的问题, 致使越来越多的信息不能被有效地索引而被隐藏起来, 通常人们将用户通过一般搜索引擎无法获取的那一部分网络信息资源称为看不见的网络 (Invisible Web) 或深网 (Deep Web或Hidden Web) 。实际上这些内容本身并非真正隐藏起来, 不是“看不见的”, 只是由于绝大部分网络用户使用信息检索工具很难找到这些内容而已。除非用户知道它的确切位置, 否则就很难找到它。所以说, 网络信息可见是绝对的, 看不见则是相对的。

互联网上存在大量具有学术研究价值的社会科学和自然科学领域的电子资源, 这些信息资源中大部分信息都是搜索引擎无法访问、无法检索和标引的, 它们构成了看不见的网络中大部分的内容。而这些网上学术资源作为网络数字信息资源的重要组成部分, 以其独特的性能, 正日益成为高校教学与科研工作中不可忽视的重要信息资源。因此对网上学术信息资源必须重点检索。

3 结论

掌握网络信息资源的检索方法可使研究者徜徉在丰富的网络信息资源中自由地淘金, 获取到一流的、丰富的网络信息资源。

摘要:本文介绍了网络信息资源的概念, 并对网络信息资源的检索方法进行了研究。

关键词:网络信息资源,检索

参考文献

[1]王细荣, 韩玲, 张勤.文献信息检索与论文写作[M].上海:上海交通大学出版社, 2006.

[2]赵静.现代信息查询与利用[M].北京:科学出版社, 2004.

网上经济信息资源检索方略 篇3

[关键词] 网络环境 经济信息资源 利用问题

随着计算机技术、网络技术的迅猛发展和经济发展的全球化, 网上经济信息的数量和种类也以惊人的速度增长,给人们工作、学习、生活提供了极大的方便。但由于网上经济信息的无序化与分散性,网络发布的信息没有统一的管理和规范,现有的网络检索工具智能化程度较低, 导致了信息检索困难,大大影响了网上经济信息资源的开发与利用。本文结合作者在实际查找网络经济信息中遇到的问题进行论述, 并提出相应的解决对策。

一、网上经济信息资源利用中存在的问题

1.网上海量和无序的经济信息资源易导致利用者“迷航”

由于网上信息发布十分自由, 任何一个单位、组织和个人均可在网上发布信息, 而且信息的复制、生产也十分简单,使网上信息出现“信息爆炸”问题。网上经济信息资源包括与工农业生产、交通运输、财经贸易、市场行情等一系列与经济活动有关的信息,因而网上经济信息浩瀚庞杂, 占网上信息的95%以上。另一方面网上信息又缺乏有效的组织和控制。目前网上最有效的检索工具就是搜索引擎, 但由于搜索引擎存在着信息标引类型有限、标引内容重复、针对性比较差等问题,其对网络信息的组织效果十分有限, 即使最好的搜索引擎( 如Google) 也不能涵盖30%的互联网网页。人们在检索过程中由于检索策略不当等原因,很容易在如此庞大的信息库中迷失方向。

2.网上高额的经济信息资源检索费用令利用者“望而却步”

利用网络查找经济信息时,除缴纳计时上网费用外,获取经济信息的使用权也要缴费。即用户要想在网上浏览全部或最有价值的信息, 一般也要通过交付一定费用才能获得信息的使用权。根据《2004年中国互联网信息资源数量报告》, 我国目前对在线数据库进行收费的网站比例占12.3%,其中商业网站在线数据库的收费比例最高,为30%左右。如金融股票数据库、科技信息数据库、企业名录数据库等。一些大型的、稍有名气的经济信息网络数据库不仅收费,而且费用之昂贵不是普通的网民甚至中小企事业机构敢问津的。

3.经济专业搜索引擎匮乏

除利用数据库外,通常人们主要利用新浪、网易、雅虎等大型综合性搜索引擎查找经济信息。由于每个学科都有自己的专业术语, 同一词在不同学科有不同的含义, 因此会导致综合搜索引擎在查找经济信息时查准率低, 检索者的需求与查到的检索结果相差甚大的问题。而目前我国具有一定规模的经济专题搜索引擎匮乏, 远远不能满足人们查找经济信息的需要。同时,由于管理体制不适应, 部门之间、地方之间相互分割, 自成体系, 信息资源存在着比较严重的重复分散、浪费和效率低下的现象,使大量的经济信息资源无法得到充分利用。

4.检索工具检索功能不完善,智能化程度低

除一些大型综合性的搜索引擎如Yahoo、新浪网等和以数据库为主的中国知网、维普资讯网等比较注重检索系统功能建设,提供多个检索点, 性能较为完善外, 大部分检索经济信息的网站都不太注重其检索系统的检索功能建设, 检索性能大多不够齐全。如利用关键词检索的网络检索工具, 大多只配置一个简单的检索框, 或只提供最基本的布尔逻辑式, 缺乏复杂高级的精确检索方式, 不易于处理多词检索和限定词检索, 无法进行匹配查询, 查准率不高。此外,目前经济信息检索的网络检索工具智能检索功能不强, 只能检索到含有指定主题词、关键词的经济信息, 而检索不出与主题密切相关, 但并不包含这些主题词的经济信息, 缺乏知识理解与处理能力。

二、网上经济信息资源检索策略

面对网上经济信息资源利用中存在的问题, 经济信息检索者应充分利用网络为我们提供的便捷, 积极想办法找对策来解决自己在查找经济信息资源过程中遇到的问题。

1.制定正确的检索策略

面对海量无序的网上经济信息, 制定正确的检索策略是快速、准确获取所需信息的关键。在具体的检索实践中,采纳的操作策略基本相同,通常是由以下几个步骤组成。

(1)对查找的内容进行分析

首先明确检索的目的, 信息检索的目的有科研立题、科研成果鉴定、为领导决策提供信息参考等。目的不同,检索的深度与广度各不相同。其次是明确检索的主题内容, 即具体需要哪些内容的经济信息, 避免检出大量无关信息。再次是要明确学科范围, 看自己要查找的经济信息属于经济的哪个学科领域, 是会计、劳动经济、物质经济还是工业经济等。同时还要明确所需经济信息的语种、年代范围及文献类型等。

(2)选择检索工具

第一,检索比较专业的学术性较强的文献信息。如正式发表的期刊、论文、会议记录等, 应选择网上数据库检索系统, 如中外文期刊全文数据库、学位论文数据库和会议论文数据库等,以保证检索结果的全面性和权威性。

第二,检索时效性较强的信息。如新闻报道, 可选择网上综合或专业性搜索引擎。但对于学术性强的课题, 用搜索引擎检索效果并不理想。

第三,查找经济动态、产品信息、企业机构名录等内容, 除选择综合性搜索引擎或各经济信息网站的检索通道外, 还可选择一些经济类专业数据库, 如万方数据资源系统的《中国企业、公司及产品数据库》收录了96个行业的近20万家企业的详尽信息, 全记录包含30多个字段, 对企业进行了全方位的立体描述。

2.确定检索词

确定检索词要考虑满足以下两个要求。

(1)满足检索课题要求

一个检索课题往往涉及多个概念, 所以要对课题的主题内容进行分析, 选择恰当的主题词或关键词,同时同义词、相关词、近义词要尽量选全。

(2)检索词的输入要求

需要对数据库提供的检索字段有所了解, 这些字段是确定检索词的基础。一般有主题词、关键词、作者、刊名、机构等多种检索字段。若采用主题词字段检索, 所用的检索词应是规范化词语, 最好从主题词表中选取; 若采用关键词字段, 则对检索词没有什么要求,同一词选全即可。检索时要根据选择的字段,输入相应的检索词进行检索。

3.编制检索提问式

即编制检索提问的逻辑表达式。该过程是合理处理检索词之间关系的重要步骤之一, 常用的逻辑表达式通常是用布尔逻辑运算符的逻辑或(OR)、逻辑与(AND)、逻辑非(NOT)来表达检索词之间的关系, 这样可以增强检索的专指性, 扩大或缩小信息检索范围, 从而提高查全率或查准率。

4.选择和处理检索结果

检索结果的选择与处理是指选取、整理、加工、编辑和打印相关的文献资料。检出信息提供给信息用户, 接受用户反馈, 甚至调整检索策略, 再次检索直到用户满意。提高查全率的技巧有:利用通用搜索引擎或经济专业搜索引擎进行检索,也可降低检索词的专指度、从词表中选出上位词,增加检索途径等方式提高查全率。提高查准率的技巧有:提高检索词的专指度,换用下位词或专指度较强的自由词;用“逻辑与”进一步限定主题概念的相关检索项; 利用逻辑非剔除, 利用文献外部特征限制, 使用规范词, 少用自由词;恰当运用组配,限定和二次检索等方法,使查全率和查准率最佳化, 全面提高检索效率。

参考文献:

[1]黄颖唐承秀:网络环境下经济信息资源利用中存在的问题与对策.图书馆论坛,2006(4)

[2]詹仁锋:对互联网经济信息资源利用问题的思考.现代图书情报技术,2002(1)

[3]陈红梅牟平:网上经济信息资源分布及检索策略研究.情报科学,2004(5)

法律检索资源方法 篇4

大中小

一、概述

DPINFO----德国专利商标局信息中心,隶属于德国专利商标局的信息服务部。DPINFO是2000年德国利用因特网提供的政府电子登记的免费信息库,是用于德国专利商标局有关专利(包括原德意志民主共和国(GDR)的专利)、商标和工业设计登记的普通网络接口,提供每日最新的有关申请案和登记/授权的知识产权权利的法律和程序状态。DPINFO 的信息服务手册,通过网址:http://dpinfo.dpma.de/download/dpinfo_handbuch-2.pdf 得到。

二、进入方法

1.直接进入

网址:http://dpinfo.dpma.de/

2.通过国家知识产权局网站链接进入

国家知识产权局政府网站(网址:http://)/DPINFO。

三、法律状态检索

该数据库系统提供专利/实用新型(Patent and utility models)、商标(Trade Marks)、工业设计(Industrial designs)的相关法律状态检索。点击“English user interface”,可转换成英文界面。

可通过点击左侧菜单列表或中间相关项目图标进入检索界面: Patent and utility models:专利/实用新型法律状态检索界面; Trade Marks:商标法律状态检索界面; Industrial designs:工业设计法律状态检索界面;

左侧菜单列表中的“information”提供该数据库的简介、安全提示、打印规则等;“help”提供使用帮助;“Important Notices”为重要提示。

专利/实用新型法律状态检索(包括原德意志民主共和国的专利数据)

其该页面分为两部分:Query部分和Search部分。(1)Query部分

数据选择项,可以选择德国(DE)的专利和实用新型数据,也可以选择原德意志民主共和国(DD)的专利数据;

file number(申请号)输入框。(2)Search部分 IPC

Type of IP Right(知识产权的类型):专利申请号、实用新型申请号、国家专利申请号、欧洲专利(德国申请号)Licence(许可)

Kind of document(文献类型):公开的专利申请、专利说明书、注册的实用新型。注意:各字段间逻辑关系为“AND”。

具体的输入方式,请参照页面左侧的“Help”或图标“+”。

四、检索结果

检索结果将以列表的方式显示。若检索结果多于1000条,将仅显示前1000条记录。

检索结果列表的上方,将显示输入的检索信息,检索结果数及数据提供时间。选中其中的一条或几条记录,点击下方的“search”,即可查看该申请号的法律状态。

举例:检索德国专利申请号为102004000023的法律状态信息。

该结果以著录项目列表的方式显示,将该专利自申请至最近的情况一一列出。经过分析,得到结果。(如:申请号 DE: 10 2004 000 023.9;申请日期:2004.8.17;完成初审日期:2004.10.7;公开日期:2006.2.23;专利部门:16;下一次专利费用缴纳日期:2007.8.31;主分类:B32B 27/22;实质审查请求提出日:2004.8.18;出版出版物的国家及文献号等。)

点击每一项的“English language information”即可显示德、英文信息的对照表,方便不懂德文的公众使用。

注意:由于德国专利商标局的DPINFO 在线服务经常更新,不可避免会出现各种错误,德国专利商标局不能承担在此服务范围内提供出错数据的责任。此外,德国专利商标局不能保证该服务范围内提供的数据与第三方的权利冲突情况。

25.01.88 filing

The registration is not pending / IP right is extinguished Last Stand of the process:

01/25/2008(ZAB)patent expired and the passage of time

Entry Date: 19/02/2008

14.01.87 filing

The registration is not pending / IP right is extinguished Last Stand of the process:

中国文献信息资源与检索利用 篇5

重点一:九大类型工具书  字典词典  类书政书  书目索引文摘  年鉴手册  百科全书  图录表谱  名录  丛集会要

重点二:工具书的排检方式(四角号码)重点三:选择纸板,电子工具书的原则 重点四:电子版工具书优势 重点五:电子版工具书的检索功能: 1 检索词:字段词和任意词

字段词:以数值型数据库,事实性数据库和书目数据库出现的电子版检索工具,检索词是字段词,因为这类数据库史记上是关系数据库,数据库中存贮的大量记录是通过字段来描述和解释其内容特征和形态特征,如题名字段,著者字段,主题字段,摘要字段,时间字段,语种字段等。

任意词:以全文数据库出现的电子版检索工具,检索词可以使源文献中任何具有实际意义的语词,也就是通常所说的

“任意词”——自然语言系统中任意的字词,短语,短句。这是因为全文数据库的数据源是全文的,数据技术采用了类似于印刷版工具书中语词索引的方法,对源文献中所有具有实际意义的语词进行了标引,并利用字符串检索,逻辑检索,截词检索,位置检索等现代检索技术对标引词进行了处理,因此标引的对象是全文。

“循环衍生法”可以对检索词进行遴选:1 定义衍生法 2 语素衍生法 3 语境衍生法 2 二次检索

二次检索又称再次检索,是在已有的检索结果中的进一步检索。利用这种功能,可以有效地淘汰冗杂检索结果,使检索效率最大化。3 高级检索

高级检索也称复杂检索。现有的中文电子版检索工具一般都设有高级检索功能。较多地使用的检索技术是布尔逻辑检索,截词检索和位置检索,体现出的检索特点是组配检索,模糊检索和限定检索。1)布尔逻辑检索

从理论上说,它是利用布尔逻辑原理,利用概念组配的方法形成表达式,进行文献信息的选择性检索。具体说,他利用布尔逻辑检索符(逻辑“与and”,逻辑“或or”,逻辑“非not”)连接检索词,形成逻辑表达式,计算机按照表达式的

指令进行逻辑运算,见所处数据库中与表达式要求相符的文献信息。

3个布尔逻辑运算符的含义是:

逻辑“与”and符号表示为“*”。以逻辑“与”连接的检索词是“同时包含”关系

逻辑“或”or符号表示为“+”。以逻辑“或”连接的检索词是“分别包含”关系

逻辑“非”not符号表示为“-”。以逻辑“非”连接的检索词是“排除其他:关系

布尔逻辑检索的突出特点是可以进行不同检索条件的组配检索,从而有效地扩展或缩小检索范围,优化检索结果。这种检索技术比较符合人们建立在思维习惯基础上的文献信息现实需求,因此它在计算机检索系统中得到了广泛应用,也是体现计算机检索优势重要方面之一。不过,也应该明确,布尔逻辑检索实际上是建立在概念组配基础上的,而概念与文献信息的内容往往有距离,同时,概念之间不仅有区别,也往往有联系,所以布尔逻辑检索中的“与”“或”“非”界定,有时也与文献信息的实际状况有距离。2)截词检索

截词检索是利用检索词的词干或不完整词形进行检索的方法。在现有的中文电子版检索工具中,截词的形式主要有两种:

A 任意截断 在词的任意位置截断。其中“前截断”的检索结果是“后方一致”,“后截断”的检索结果是“前方一致”,“前后截断”的检索结果是“任意一致”

B 嵌入截断 在检索词中嵌入截断符号。符号所代表的汉字的数量是规定的,但表达的意义是随意的。

截词检索的最大有点是使模糊检索成为可能。当对检索对象的了解不是很确切的时候,它能帮助我们有效地集中相关文献信息。同时它还可以减少检索词的输入量,简化检索步骤,扩大检索范围,从而提高查全率。C 位置检索

位置检索主要运用于全文数据库。它是一种对多个检索词在源文献中相对文职进行限定性查找的方式。

位置检索的有点是为查找相关概念在局部环境中的同现情况提供方便,而相关概念的同现,往往意味着文献信息内容的相关,所以,位置检索同样是提高查全率和查准率的有效方法之一。

第二章 辞书资源与汉语字词的查考 重点一:辞书的基本了解 辞书是字典和词典的统称

字典是主要用来解释汉字形,音,义的工具书;词典是主要用来解释词语的意义,概念,用法的工具书。重点二:中国古代代表性的字书

 中国最早的字典是周宣王是的史官曾编撰的《史籀篇》 

西汉元帝时,黄门令史游作《急就篇》,是我国现存最早的用于教授学童识字的字书

 《尔雅》是中国最早的以训释词义为主要内容的训诂书,被称为中国最早的词典

西汉杨雄编撰的《方言》(全称《輶轩使者绝代语释别国方言》),是我国历史上第一部具有方言词典性质的汉语比较方言词汇集。

东汉中期许慎《说文解字》是我国历史上第一部系统地分析字形,解释字义的字书,代表了当时字书编撰的最高水平。首创的按照部首归并集中汉字的字书编撰方法对中国字典,词典编撰所产生的深远影响。

 三国时期,我国历史上最早的韵书——李登编撰的《声类》  明代《字汇》和《正字通》为古代字书编撰法的定型奠定了基础。

 《康熙字典》是中国历史上第一部明确以“字典”命名的字书,中国传统学术文化总结时期出现的最具代表性的古代字书。

重点三:中国辞书的结构体例与编撰传统 ★ 字典,词典的书证和例证

引自书面文献的例证,一般称为“书证”;影子当代口头通行证的例证,直接称为“例证”或者“例句”

首先,大型历史性语文字典词典的举证,不采用例证,只采用书证。描写性字典,词典可以采用例证

其次,引用书证必须详注出处。出处一般包括作者,书名,篇目或卷次

第三,统一义项引用多条书证,以时代先后排列顺序。第四,书证引自“始见书”。★ 字典中的注音方式

大型历史性语文字典,词典的注音,不仅标注汉字的现代读音,还标注古代读音。古代读音有上古音和中古音之分。上古音指以《诗经》音为代表的先秦两汉时期的汉语语音系统,中古音是指以《切韵》为代表的隋唐时期的汉语语音系统。

标注古音的项目,较为齐全的包括反切,声调,韵部,声纽;也有的简化标注反切和韵部。

反切是中国古代给汉字注音的一种方法。它用两个汉字拼合另外一个汉字的读音。拼合的原理是:反切上字与被切字的声母相同,反切下字与切字的韵母和声调相同。拼合时,取反切上字的声母,取反切下字的韵母和声调,把它们拼合起来,便是反切字的读音。

声调也称字调,是整个音节额音高。古代的声调分为平,上,去,入四种

韵部是古代韵书中对同韵汉字的归并。凡同韵的汉字归并为

一类,称为一个韵部。每一个韵部都用一个汉字来代表,这个代表字称为韵目。

声纽是声母的别名,简称“声”,“纽”,又称“音纽”。古人认为一个字的读音,声母处于关键,枢纽的地位,故名。声母的代表字称为字母。声母有时也称为声类。重点四 代表性中国辞书 新华字典 现代汉语词典 古汉语常用字字典 辞典 辞源 汉语大字典 康熙字典 说文解字

第三章 古籍资源与基本古籍的查考 重点一:正史查找线索

重点二:基本古籍资源

 “十三经”:中国古代集中代表儒家思想的十三部经典著作

 “二十六史”:中国古代最为著名的纪传体史书,古代历史著作的典型代表

 《诸子集成》汇集诸子著作的大型丛书  古籍丛书,类书,证书,方志 重点三:查找古籍的代表性目录

汉书·艺文志 是汉书中记载当时国家图书典藏情况的专门篇章。它是根据刘向父子《七略》编成的

隋书·经籍志 是《隋书》中记载当时国家图书典藏情况的专门篇章。《经籍志》部分由著名学者魏徵编撰,在唐太宗贞观三年至十年(公元629年——636年)成书。

四库全书总目 是清代乾隆年间编修《四库全书》的连带产品,基本上包括了清乾隆以前我国重要的古籍,特别是元代以前的书籍更完备。领衔者是乾隆皇帝的六子永王容,实际主持编撰工作的是纪昀。

续修四库全书总目提要 1931-1945年间以日本人主持的“东方文化事业委员会”设立的“北平人文科学研究所”名义编撰的,提要稿全部由中国学者编写,内容上包括了对《四库全书总目》的“续”和“补”。续,是续编清代乾隆年间以后到20世纪30年代新出的图书;补,是补充乾隆年间以前《四库全书总目》失收或虽然收录但篡改删削严重,版本不佳者。

贩书偶记 部主要收录清代著作的目录兼收少量明代小说和辛亥革命至抗战前有关中国古代文化的著作。孙殿起编,原则:

1、凡见于《四库全书总目》者概不收录,录

者必卷数不同的;

2、非单刻本不录,间有在丛书者,必系初刻的单行本或抽印本

贩书偶记续录 雷梦水著,1980年出版,共收录6000余种清代图书,是《贩书偶记》是补充

古籍整理图书目录 录1949年10月-1991年12月国内出版的文、史、哲、书画艺术、医农、科技等方面的古籍图书,还包括一部分翻译成汉文的少数民族古籍。重点四:电子版古籍查找(基本古籍检索系统,四库全书)★基本古籍检索系统 “十三经”

我们台湾地区“中央研究院”开发的“汉籍电子文献翰典全文检索系统”加载的“十三经”,是有代表性的网络版“十三经”全文检索系统之一 “二十五史”

“二十五史”是《新元史》和“二十四史”的合称 南开大学组合数学研究中心和天津永川软件技术有限公司开发的“二十五史全文阅读检索系统”是具有代表性的“二十五史”全文检索系统。它所指的“二十五史”是指“二十四史”加《清史稿》。两个功能:1 全文阅读 2 全文检索 我们台湾地区“中央研究院”开发的“汉籍电子文献翰典全文检索系统”加载的“二十五史” 《四库全书》

上海人民出版社和香港迪志文化出版公司联合推出的文渊阁《四库全书》电子版 ★《四库全书》电子版

《四库全书》是中国古代规模最大的丛书。

上海人民出版社和香港迪志文化出版公司联合推出的文渊阁《四库全书》电子版

该电子版分为“原文及标题检索版”(简称“标题版”)和“原文及全文检索版”(简称“全文版”)两种版本。全文版的主体是《四库全书》全文文本数据库和原文图像数据。它所具有的功能主要是:

1)基本检索 包括全文检索,分类检索,书名检索,著者检索四种方式。其中,分类检索按照《四库全书》的分类体系逐级递进,递进层次为:部→类→属→书→卷(或篇目)→原文;书名检索和著者检索均支持模糊检索,即命中对象是包含了检索词的任意一致;全文检索以原文或者注释中的任意字词,字符串作为检索词。

2)高级检索 这是两个检索条件的逻辑组配检索,逻辑关系包括“与”,“或”,“非”。不论是全文检索还是高级检索,检索词的输入都设计了“辅助输入”功能和“汉字关联”功能。

3)全文文本与全文图像的切换。古籍的“保真”和“整理”存在着矛盾。保真拒绝整理,整理难以保真。但保真的古籍

和整理的古籍各有适用的对象。因此,理想的状态应是“保真原则”和“整理原则”相结合。

文渊阁《四库全书》电子版在这方面作了有益的尝试。它采用了扫描技术输入原文,通过OCR技术自动进行原文图像的编码字符转换,从而使它既保留了完全保真的图像数据,又形成了可以实现检索的文本数据。两个文本可以进行切换,以便于比勘对照。

提供原文图像,满足了古籍研究中版本鉴定,文物鉴赏,书史研究,文字校勘,原件对照等特殊需要。更重要的意义在于,文本版与图像版的结合,凸显了数字化古籍可以兼顾“文物存贮”和“资料应用”两种功能的优势,时古籍整理“保真”和“整理”相结合的原则在电子版阶段真正变成了现实。4)辅助工具和研究支持功能 文渊阁《四库全书》电子版加载了一些对研究工作 具有支持功能的辅助工具。包括:资料管理员,单字字义查询,写字板,古今纪年换算,干支/公元年换算,八卦·六十四卦表,实时标点断句,实时字义查考,实时添加笔记。

重点五:古籍丛书的查找《中国丛书综录》。1)结构

上海图书馆编,中华书局1959-1962年出版,上海古籍出版社1982年新一版。共分三册。

第一册 《总目》,分“汇编”、“类编”两部分。“汇编”分杂篡、辑佚、郡邑、氏族、独撰五类,主要是四部各类兼容的丛书,具有综合性质。“类编”收经、史、子、集四类。书后有

1、“全国主要图书馆收藏情况表”,反映了国内41所图书馆收藏古籍丛书的情况,2、“丛书书名索引”

3、字头笔画检字。本册可按类及丛书名两种途径检索某部丛书包含哪些古籍及其收藏情况

第二册是“子目”,即以丛书所汇集的单种古籍为著录对象的子目分类目录。

第三册是“索引”,即第二册“子目”的索引,包括“子目书名索引”和“子目著者索引”两部分。2)使用方法

重点六:中国古代代表性类书

艺文类聚:唐·欧阳询等编 成书于唐高祖武德七年(公元624年),是现存最早的类书

初学记 唐·徐坚等编。该书转为皇子临文作诗时查考事类典故、词藻对语而编,故名。

太平御览 宋·李昉等编,成书于宋太平兴国八年(公元984年)初名《太平编类》。综合性类书中,最具代表性。事物纪原 宋代出现的一部专门用来考订事物起源和流变的小型类书

永乐大典 明代编撰的,我国历史上规模最大的一部类书。明永乐元年(公元1403年)开始编撰,主持其事者有解缙,胡广,胡俨,杨士奇等

三才图会 明代颇具特色的类书。该书由王土斤,王思义父子编撰。图文并茂“图谱之学”

古今图书集成 清康熙四十年(公元1701年)在陈梦龙主持下开始编撰,五年后初稿完成,初名为《汇编》是现存中国古代累书中规模最大,汇集资料最丰富的一部。古今图书集成索引 林仲湘编

佩文韵府 清·张廷玉等编,清康熙五十年(公元1711年)成书

骈字类编 清·张廷玉等编

第四章近代以来的图书资源与查考 重点一:古代图书装订形式 重点二:书目检索工具 1)图书馆联机书目检索系统

多字段或多条件组配检索,模糊检索,检索范围或条件的限定,再次检索等功能,在联机书目检索系统中都可以实现 国家图书馆的“联机公共目录查询系统”:简单检索,多字段检索,多库检索,高级检索。2)中国高等教育文献保证系统

简称CALIS,是我国高等教育“211工程”的子项目之一,目标是建设以中国高等教育数字图书馆为核心的教育文献联合保障系统,实现文献信息资源的共建、共知、共享。重点二:总结性书目

民时期总书目由北京图书馆编,书目文献出版社1986年-1997年陆续出版。它以北京图书馆、上海图书馆、重庆图书馆的馆藏为基础编撰,收录了1911年至1949年9月间中国出版的中文图书124000余种,基本反映了民国时期出版的图书全貌。(国家图书馆开发民国时期中文图书书目数据库)

中国国家书目由北京图书馆《中国国家书目》编委会主编,《中国国家书目》编辑组编辑。该书目不但收录我国大陆出版的文献,而且还收录台湾、香港、澳门出版的文献和中国与其它国家共同出版的文献。其具体收录的文献类型和范围包括图书、连续出版物、地图、技术标准、博士论文、书刊索引、少数民族语言文献、盲文文献等。因此,它是目前我国收录文献最全的书目,是图书馆必备的一种采选文献的参考工具。(中国国家书名数据库)重点三:电子图书系统 1)方正Apabi数字图书馆

所容纳的资源,采用与出版社合作的方式,提供获得著作者直接授权的电子新书 2)超新数字图书馆

国内开发较早,目前拥有电子图书资源数量最多的数字图书馆系统。优势:在资源的规模上。依托国内大中型图书馆提供纸质图书进行数字化加工制作,同时征集作者授权。不仅容纳了电子图书,还有一个规模较大的论文资源数据库。

书生之家数字图书馆 电子新书涉及的学科范围比较广泛,但在内容上,目前以人文科学图书为多。

中国数字图书馆 首先依托国家图书馆的文献资源进行数字转化,内容覆盖齐全,覆盖经济,文学,计算机技术,历史,医药卫生等22个门类。据称已拥有20万册电子图书,是目前我国规模较大的中文电子图书系统之一。其次,是基于国家图书馆丰富的馆藏资源,经过整合,形成一系列有特色的专题资源库,如,WTO专题,法律法规,百年敦煌等。主要检索功能:

1)分类检索 分类浏览,选择系统中包含的电子图书 2)字段词检索 以基本书目信息作为字段词进行检索,如书名,作者,出版社等

3)高级检索 目前中文电子图书系统中的高级检索,都是多个书目字段的逻辑组配检索,有的还可以附加出版时间的限制

4)目次检索 指在系统中检索图书时,给定检索词

后,命中对象不仅仅在书名层次而且深入到目次层次

5)全文检索 中文电子图书检索系统在书目检索层面上真正具有全文检索功能的不多,具有代表性的是书生之家

重点四: 中国大百科全书 百科全书特点

简单地概括就是概述知识条目化,条目编排词典化。条目化:

百科全书的内容是对知识体系中的知识点进行总结性概述

概述知识的基本单元是条目。(条目应是独立的概念或者完整的知识主题;条目必须具有检索意义)编排词典化:

条目按标题的子目顺序排列 有完备的参见系统 有完备的检索系统

第五章 报刊资源与论文资料的查考 代表性检索系统特点

中国期刊全文数据库(CJFD)中文科技期刊全文数据库

CGRS全文检索数据库 万方数据资源系统

中国学术会议论文全文数据库(PACC)全国报刊索引数据库

第六章 时事信息资源与事实、数据、法规的查考 重点一:时事资源信息的检索途径

手册,年鉴,统计集,资料汇编,法律汇编 政府网站,统计网站,经济网站 重点二 国内比较有影响的经济网站 国务院发展研究院(国研网)中国宏观经济信息网(中宏网)中国经济信息网(中经网)数据中华

重点三 叙述我国年鉴资源的类型及特点 特点

整体构成容纳了多种类型的工具书要素,内容体系多元互补,集知识,信息,数据,资料于一身 逐年编辑,连续出版

以栏目作为容纳内容的基本单元,以条目作为表现 内容的主要手段 使用角度分类:

政府年鉴,行业年鉴,学科年鉴,统计年鉴,百科全书年

重点四 当代法律资源的分布情况

大众传播媒介,年鉴、手册等专门工具书,法规汇编,网络检索系统,光盘数据库 重点五 主要法律网络检索系统

法律检索资源方法 篇6

中国文献信息资源及其检索工具体系

大体了解中国文献信息资源的数量:2-3页;

类型:图书、期刊、报纸、会议论文、学位论文、研究报告、政府出版物、档案文献等。

按加工情况分,可有一次文献、二次文献和三次文献;按载体形式分,可有书写文献、印刷文献、缩微文献、音像文献、机读文献等;按内容的学科范围分,则有社科文献、科技文献等。

把握一次文献、二次文献、三次文献的概念,3页;

工具书的概念:工具书是一种汇集、编著或译述的材料,按特定的方法加以编排,以供解疑释难时查考之用的图书。4页;

其与普通图书的区别:内容的概述性、编制的查考性、条目排列的易检性;

理解数值型数据库、事实型数据库、文献型数据库等基本概念:6页;

检索工具的三大特点:电子版检索工具的五大优势:

三大特点:从内容上看,检索工具强调比较全面系统地汇集、记录某一方面的知识或材料;从编排上看,检索工具强调必须按照特定的方法对内容加以组织编排;从编纂目的上看,检索工具强调主要是供人们有目的地检索查考,而不是系统阅读。简单地概括,检索工具在内容上具有完整性,在编排上具有易检性,在目的功用上具有查考性。P6

五大优势:具有强大的检索功能;检索工具和文献信息资源本身二位一体,一次文献和二次文献零距离;强化了对文献信息资源内涵和内在联系的深度揭示;提供全方位、立体化的信息;内容更新周期短、速度快。P7 使用检索工具的基本技术方法

掌握重点概念:印刷版工具的主要排检方法

A.检索词:10页。包括字段词和任意词:11页。结合实例理解扩大检索次遴选范围的方法:循环衍生法(定义衍生法、语素衍生法、语境衍生法):13页。

B.二次检索:13页

C.布尔逻辑检索(逻辑“与”、逻辑“或”、逻辑“非”以及具体的应用)、截词检索(前截断、后截断)、嵌入检索(符号“?”和“!”)、位置检索(在检索系统中的应用)。14页。

D.自然语句检索21页、相关检索22页;搜索引擎结果输出限定方法23页;

相关度:相关度是指检索结果与输入的检索语词在内容上关联的疏密程度,由计算机根据词语主题关联分析技术自动处理完成。24页;

文献信息资源利用中的学术规范

文献信息资源利用学术规范及其基本原则是什么? 九项基本原则

答:所谓学术规范,是指学术共同体内形成的进行学术活动的基本伦理道德规范。一般地讲,它涉及学术研究的全过程,学术活动的各方面。基本原则:(1)所有的专门性研究,都应该依据已有的文献对相同或相关方面的研究成果、研究状况作出概略性的说明介绍;(2)对已有文献任何形式的引用,都必须注明出处;(3)原则上不采用间接引用方式;(4)引用以必要、适当为限;(5)引用不得改变或歪曲被引内容的原貌、原义;(6)引用原则上使用原始文献;(7)引用原则上使用最新版本;(8)引用标注应完整、准确地显示被引作品的相关信息;

(9)引用网络资源注意其“动态性”。P24~30

把握文献信息资源利用的引证标注方法(3种情况:注释、引文出处、参考文献)31页;

对于中国三大规范,要了解各自基本规定、特点和局限,会具体使用,能够对别人的使用加以评价。

了解相关概念:、文献类型及载体类型标识(熟悉常用标识)、电子文献的可获得地址。

第2章 辞书资源与汉语字词的查考

中国辞书的演进源流

了解基本概念:字典、词典、语文性字典词典、学科词典、专名词典、辞书、字书、韵书、训诂书等;

较为完整的中国辞书体系形成的标志:

基础性、权威性汉语语文辞书已经形成系列,汉外对照的双语辞书基本覆盖了所有实用语种,学科性辞书基本覆盖了所有主要学科,辞书的品种、类型多样化,辞书的功能。效用特定化,辞书的社会认知程度明显提高。P46

了解中国辞书发展演变的概略线索:古代形态的字书向近代形态的字词典转化的标志、以字带词分条释义的编纂方法、较为完整的中国辞书体系基本形成的标志、中国辞书发展的新趋势——电子词典、网络词典。

中国辞书的结构体例与编纂传统

特别是以字带词(统领字、被统领字)、分条释义、书证和例证、三段标注法、反切等概念。

中国特色的编纂传统是什么?

答:以字带词:汉语语文字典、词典对词条的编排组织,一般采用“以字带词”的方式——先列出单子词条,然后带出一系列包含了该单字的词语词条。分条释义:一个义项作为一条,分别列举,逐一解释。一般是本义居前,然后引申义、假借义依次排列; 书证和例证:语文字典、词典对单位字词每一个义项的解释,一般都要求举例,以证明该字词确有该意义。引自书面文献的例证,一般称为“书证”;引自当代口头通行语的例证,直接称为“例证”或“例句”; 因声求义:汉字的现代读音和古代读音的标注,古代读音标注采用三段标注法、反切等; 总之,从编排体例上看,中国的字典、词典在古代字书阶段就已形成了先注音、后释义,以及字义有序排列、释义列举书证等规范,并且在义项排列、引用书证等方面形成了优良的传统。发展到现代字典、词典阶段,编纂体例上的最大变化是形成了“以字带词,分条释义”的表现形式,中国字书编纂的优良传统在这一形式中得到了继承和发展。

掌握有关电子词典的深度开发以及网络词典的特点。

代表性中国辞书

了解课本本节中介绍的几种辞书在中国辞书发展史上的重要地位和重要价值,及其最突出特点。

《新华字典》、《现代汉语词典》、《辞源》、《辞海》、《汉语大字典》、《汉语大词典》、《康熙字典》、《说文解字》 掌握电子版词典(以《汉语大词典》、《康熙字典》为例)的基本使用方法及其主要特点和优势;理解与电子版词典有关的特殊概念:关联字、字信息、正笔顺、逆笔顺。

《辞海》和《辞源》的特点 答:

《辞海》的主要特点:在选收词语上,以解决一般人在学习、工作中质疑问难的需要为主,并兼顾各学科的固有体系;在释文内容上,以介绍基本的知识为主,并注意材料与观点的统一。P57 《辞源》的主要特点:在收词上,以语词为主,兼收百科,以常见为主,强调实用;在释义上,结合书证,重在溯源。“溯源”是《辞源》的本质特点。通过对文献证据(尽可能是出自“始见书”的证据)的梳理分析追溯词语意义发展演变的源流,义项排列反映字词本义、引申义、通假义的发展递变,书证排列严格以出现先后为序,标注统领字的古代读音,这些都是《辞源》“溯源”特点的鲜明体现。P58

第3章 古籍资源与基本古籍的查考

中国古籍资源

对古籍资源本身要有一个大概的了解,了解经史子集等概念

图书分类法的演进

十三经、二十六史

基本古籍的全文检索系统

十三经、《十三经索引》,文句索引

重点掌握文渊阁四库全书电子版和“二十五史”全文阅读检索系统的基本概况和基本检索方法(全文检索),二十六史的人名索引、地名索引、书志索引、综合索引能够灵活应用,特别注意汉字关联功能的开启与关闭。

了解二十四史、二十五史、二十六史、正史等概念,了解四库全书、四库全书总目的概念,四库全书简明目录和四库全书总目的关系等。

《四部丛刊》的基本情况

古籍流传与古籍版本

中国目录“辨章学术、考镜源流”的传统、划时代意义的古籍目录(《汉书·艺文志》,《隋书·经籍志》),《四库全书总目》、古籍版本,善本的界定;善本的判断标准“三性九条”、《中国古籍善本书目》、《中国善本书提要》基本情况 古籍版本:是指一部古书经过多次传写或刊印所形成的不同的书本形态。

古籍丛书与类书

丛书定义、《中国丛书综录》的基本情况、了解类书的定义及其特点、代表性的类书。

类书的作用:

答:要点:(1)系统收集参考资料;(2)查考词语和典故出处;(3)校勘考证古籍,辑录古籍佚文;P123~124 P105(要展开论述)

“以韵统字、以字隶事”的含义:

以韵统字,说的是类书的整体架构不是一个分类系统,而是一个按古韵目的既定成规统摄同韵单字的韵目系统;以字隶事,说的是类书汇聚的具体资料,不是隶属于分类系统的类目之下,而是隶属于韵目系统中由韵脚字构成的词语之下。P1

21第4章近代以来的图书资源与查考

书目检索工具

国家图书馆联机公共目录查询系统148页;中国高等教育文献保障系统(CALIS)150页;“词临近”150页。了解民国时期总书目、中国国家书目的内容、特点、功用。

电子图书系统

明确电子图书与电子图书系统的概念,掌握电子图书系统的特点。155页;

电子图书:电子图书是指利用计算机阅读平台或手持阅读设备阅读的数字化图书。

掌握教材上介绍的4大代表性中文电子图书系统的特点、优势、区别。

答:方正Apabi数字图书馆:数字版权保护技术;超星数字图书馆:目标将所有有价值的图书数字化,不仅仅提供获得作者直接授权的电子新书;书生之家数字图书馆:以提供1999年以后出版的数字化中文新书为主要特色;中国数字图书馆:主要依托国家图书馆的文献资源进行数字转化。

掌握电子图书系统的使用方法,注意三大步骤。159页;

掌握中文电子图书系统的检索功能,注意目次检索162页与全文检索163页。

了解电子图书系统专用阅读器的功能164页;

现代百科全书

了解百科全书的概念169页、分类172页;了解百科全书发展的三个阶段169页;

我国百科全书检索工具体系基本形成的标志:

答:以综合性百科全书为主体,以专业性和地方性百科全书为两翼的百科全书体系初具规模,代表国家水平的综合性百科全书与国际惯例接轨的连续修订制度已经建立起来;百科全书的品种、类型、载体形式已经呈现多元发展的格局,基本可以满足不同的利用需求。P17

2重点、深入掌握百科全书的特点(概述知识条目化173页、条目编排词典化174页)

百科全书的特点:

要点:简单地概括:概述知识条目化,条目编排词典化 概述知识条目化,包含:(1)百科全书的内容是对知识体系中的知识点进行总结性概述。(2)概述知识的基本单元是条目。百科全书的条目一般由条头、释文和参考书目构成。(3)条目应该是独立的概念或完整的知识主题(4)条目必须具有检索意义。条目编排词典化:(1)条目按标题的字母顺序排列(2)有完备的参见系统(3)有完备的检索系统 P173~175(要展开)

理解掌握百科全书与百科词典、类书的区别175页;了解三种代表性百科全书各自的主要特点176页-180页

第5章 报刊资源与论文资料的查考

数字化报刊资源及其检索系统

掌握5大代表性数字化报刊资源检索系统的内容、特点、功能及使用方法,注意彼此间的比较。181-204

需要注意的检索方法:类聚检索185页、检索词字段(或称索引词字典)187页、同义词扩展、检索词的优先处理、关联检索、检索结果排序

掌握检索式的形成和理解:能把问题变成数据库系统可以执行的检索式;面对检索界面显示的检索式,能理解其含义,明白检索的结果是什么,知道如何进行检索。

报刊引文检索系统

引文索引:引文索引是一种通过文献的引证关系检索相关文献的索引。

208页,理解有关引文检索的一些基本概念:被引率、自引率209页、总被引次数、影响因子、即年指标、被引用半衰期、出版时滞211页、来源文献检索213页、被引文献检索251页。

掌握中文社会科学引文索引(CSSCI)212页、中国科学引文数据库(CSCD)217页的内容、特点、功用

第6章 时事信息资源与事实、数据法规的查考

网站资源及其检索利用

网站资源检索的策略与方法:

答:

1、要从整体上了解不同类型的网站容纳的信息资源的不同特点;2需要了解网站中文献信息资源的组织结构和方法;3充分利用网站提供的检索功能。(适当展开论述)P232-239

网站资源检索的策略与方法如下:

第一步:分析检索主题,从而决定从何处开始进行检索。

分析检索主题可以从以下几个方面着手进行:

检索主题中是否含有专有词汇或短语?不含有专有词汇,只有那些容易导致检索结果不符合检索要求的较普通的、泛指的词汇和短语。检索主题涉及的主题范围较宽泛。检索主题是关于某一较宽主题范围的某一方面。使用的检索词有同义词、近义词,或是有词形变化。

第二步:选择合适的网络检索工具。

根据不同的检索需求,选择使用搜索引擎、主题指南或者专题数据库,有时可能还要请专家帮忙,解决检索问题。如果以上都不可能实现,检索专家告之的最后一招就是凭运气搜索,其实这里所谓的凭运气就是边检索边学习边摸索,谁在一开始都不可能是检索能手,只有不断操作实践,才能真正领悟检索的奥秘。

第三步:边检索边学习。

不要认为在检索之前你就知道你要查找的所有东西,最应该做的工作是看一看上一次的搜索结果,是否还需要对已构造好的检索词或检索式进行必要的修改。

第四步:学会放弃那些没有效果的检索策略。

搜索引擎、主题指南可灵活换着使用,也可以使用与检索主题相关的专题指南,或者使用数据库。

第五步:回过头去试一试前面的检索策略。

经过多轮检索策略的修改和应用,也许在前面使用的检索策略比较有效,那么再回过头去试一试前面的检索策略。总之,该网站的特点是学术性强,适合于学生及专业人士浏览。它是众多著名大学所开辟的介绍检索知识的站点中最为出色的一个网站。

年鉴资源及其检索利用

年鉴:是一种全面记述事业的年度发展,系统汇集年度重要时事文献信息,逐年编辑、连续出版的资料工具书。特点;240页 年鉴的栏目与条目243页;年鉴条目的要求;年鉴条目的基本特征和基本属性243页

了解电子版年鉴的主要优势251页和中国年鉴资源全文数据库的特点257页

法律资源及其检索利用

了解法律资源分布情况261页;了解法律数据库的检索特点265页。目录、索引、文摘属于(B)A.A.一次文献B.B.二次文献C.C.三次文献正确

2.(B)是中国古代字书发展史上第一部明确以“字典”命名的字书。

A.A.《辞源》B.B.《康熙字典》C.C.《说文解字》D.D.《汉语大字典》

3.下列哪个不是构成查考清代乾隆年间以前中国古籍的具有“划分阶段”意义的三道重要关卡。(D)

A.A.《汉书•艺文志》B.B.《隋书•经籍志》C.C.《四库全书总目》D.D.《古今图书集成》

4.查考1911~1949年间国内出版图书的总结性书目的工具书是(C)

A.A.《中国国家书目》B.B.《中国古籍善本书目》C.C.《民国时期总书目》

5.下列逻辑运算次序最优先的是(C)

A.A.逻辑“与”B.B.逻辑“非”C.C.放入符号“()”(半角)中D.D.逻辑“或”

6.年鉴的条目必须是(A)

A.A.事实主题或资料主题B.B.语词主题C.C.知识主题D.D.概念主题

7.在年鉴标题制作的技术方法上,一般遵循(A)原则

信息资源的开发与检索 篇7

随着互联网的发展, 网络信息资源已成为当今世界上最大的信息库和全球范围内传播知识的重要渠道。面对如此众多的网络信息, 人们如何在浩如烟海的信息海洋中快速、准确地寻找到自己所需要的有用信息?如何对网上的信息资源进行筛选, 去其糟粕, 取其精华?如何对有用的信息资源进行有序的组织、整理?本文就此问题进行探讨。

1信息资源的开发

1.1立足实际, 制定科学的开发原则

在网络环境下, 研究所应从实际出发, 根据自己的发展规划, 制定出科学的采集原则, 并以此作为采集工作的依据。所制定的采集原则, 必须体现以下要求:① 采集工作的重点必须随着工作重点的转变而转变, 及时地调整各专业、各层次、各载体类型的采集比例, 明确各类信息采集的先后顺序, 以满足发展变化的要求;② 所采集的信息, 在内容上要体现专业特色, 要具备一定的科研价值、参考价值和指导价值;在深度上要体现专业的最新前沿, 反映专业学科内容新进展和最新研究成果;③ 在有限经费的条件下, 首先要保证以重点专业建设为主的信息资源的采集, 根据重点专业的设置和变化, 及时调整采集结构, 形成有特色的信息资源布局, 从而发挥有限经费的效益, 真正满足重点专业建设的需要。

1.2熟悉网络信息资源特点及分布状况

了解常用信息资源的特点和分布方式, 如国内外著名的科研机构、信息发布机构的特点和网址, 及时准确地获得这些权威机构发布的信息, 可以帮助用户及时掌握最新科研动态。

1.3合理配置信息资源

由于对信息资源在时间、空间、数量3方面的配置存在不同程度的问题, 即在空间的分配不均匀, 时间的分配不合理, 数量的分配不均衡, 所以优化配置网络资源尤为重要。在空间上注重网络资源在不同地区、不同行业部门的分布, 在数量上对各种各样网络信息资源采取合理比例配置, 在时间上调整好网络资源在过去、现在和将来3种时态上的配置。

1.4加大电子文献的采集力度, 优化采集结构

电子出版物包括电子期刊、电子报纸、光盘图书、网络图书和软件读物等。与传统出版物相比, 电子出版物有着存贮量大、检索便捷、在网络环境下应用面较广等优点。电子文献由于具有体积小、容量大、检索方便等特点, 越来越受到广大读者的欢迎。电子文献的采集已经成为信息资源采集的一个重要组成部分, 而且所占的比例呈现出逐步上升的趋势。因此, 应根据自己的实际需要, 合理加大电子文献的采集力度。电子文献一般分为2类:① 普通电子出版物, 主要是指以普通光盘形式发行的电子文献;② 网络电子出版物, 主要是指利用计算机网络出版发行的电子图书、期刊和图像等电子文献。网络电子出版物可根据需要, 有选择地下载到数字图书馆的网站上, 或利用有关的检索和浏览工具, 查阅所需要的信息。普通电子出版物, 应侧重于各类光盘数据库的采集, 尤其是以采集一次文献数据库为重点。例如, CNKI中国期刊网络数据库是以各学科领域的带头期刊、核心期刊构成基本框架的全文信息检索系统, 收录了1994年以来的中文 7 000种学术期刊题录和3 500种核心期刊全文, 这类光盘是采集的首选。目前, 在光盘镜像上的技术也较成熟, 现在有大容量的光盘镜像服务器可以利用, 它可将上千片的光盘镜像到硬盘上, 而且多能提供局域网上检索。但是, 应当尽量购买能够用web浏览的电子出版物, 以满足各类读者需求, 实现最大程度上的资源共享。

1.5网上信息资源是信息资源采集的重要组成部分

在重视电子型文献采集的同时, 也要重视网上信息资源的开发利用。具体的做法主要有:① 借助搜索引擎。因特网上的信息量非常巨大, 为了方便利用因特网上的信息, 网络信息检索迅速发展起来, 其主流是万维网信息检索, 即搜索引擎。现有数百种搜索引擎投入使用, 供用户进行自动化的搜索。只要给出关键词, 搜索引擎就可以在数万计的网页中迅速地筛选出所需要的信息。根据发展目标和主要用户的要求, 借助百度、Google、Yahoo、EXCI TE、ALSTA和VISTA 等搜索引擎, 寻找、收集所需信息源, 通过资源指南查找各种相应的信息, 然后将检索获得的各种信息分门别类, 按一定的主题进行加工、整合, 形成特定用户需要的序列化的有效信息资源;② 利用软件的方式。如元数据编辑器和元数据生成器, 实现与全球计算机的自动联接, 将对方万维网服务器上的主页或文章等信息自动取回, 自动置于HTML文件或XML文件的META标记中, 并进行排序或索引, 形成一个庞大的主页信息数据库, 为用户提供所需信息;③ 建立指引库。利用在因特网上建立专业性的信息资源指引库的方法, 帮助用户集中查找网络上的专业信息, 这样可以大大节省用户的查找时间, 提高检索速度;④利用TRS信息采集系统。TRS搜索引擎由3部分构成:采集器、索引器和检索器, TRS智能化网络资源采集机器人担任网络信息或者企业内部非结构化信息的采集工作, TRS 全文数据库服务器提供海量信息的分布存储和即时索引, 并提供全文检索和多种特征检索功能, 和多种输出结果处理功能。利用TRS信息采集系统每天在指定网站上抓取所需信息, 将抓取到的信息经过筛选、分类、排序后存放在本地服务器上, 再发布到数字图书馆的工作网站上。

1.6比建立信息导航库

为了提高用户检索的检准率和检全率, 为了使网络信息有序化, 建立学科信息导航系统, 利用各种搜索引擎对某一主题信息上网查询、浏览并参考有关文献, 选择价值较高的信息资源, 由专业人员经过加工、组织、归类和设置类目, 形成新的知识关联, 产生更高层次上的综合信息产品, 方便用户查询。

由于网络信息资源具有数量巨大、种类繁多、分布广泛和变化频繁等特点, 读者使用网络资源受到各方面的限制。为了方便读者和建设本馆虚拟馆藏, 可以利用建立专业导航库的方式将与专业相关的网址、二次文献和一次文献、全文数据在网页上组织, 以简单、有效的方式提供读者使用。读者可不必再在纷繁复杂的网络资源中去寻找有所需的专业信息, 而只需进入图书馆提供的专业导航库即可检索到最新、最全的专业文献信息, 如研究方向、学者名录、电子出版物、会议信息、研究机构和学科介绍等。

导航库的组成主要有3部分:① 反映该专业国内外信息资源的网址;② 原始信息;③ 一套方便信息组织和用户查询的检索系统。导航库的建设是突破传统信息资源建设模式的一项关键技术, 也是对新型信息服务模式的一种探索。

1.7加强网上搜集, 增强针对性

对重点学科的课题除进行定期服务、跟踪服务和信息调研等服务外, 还要有针对性地广泛搜集实用网址。这样做, 不仅使用户从虚拟馆藏中得到现实的信息资源, 且深化了网络信息资源服务层次。

2信息资源的开发技术

2.1Push技术

所谓Push技术是一种基于客户服务器机制, 由服务器主动的将信息发往客户端的技术。与传统的拉技术 (Pull) 相比, 二者最为主要的区别在于前者的是由服务器主动发送信息, 而后者则是由客户机主动请求信息。作为Internet的一种新技术, Push技术提出了新的服务模式, 即核心点放在服务方, 在信息发布获取就用中它表现为Push服务器自动搜集感兴趣的信息, 并将其定期地传送给用户。其表现形式为:Web服务器扩展;客户代理方式;Push服务器方式。

2.2WWW信息挖掘技术

WWW的数据信息挖掘是指从大型数据库的数据中提取出用户感兴趣的文本型知识, 这些知识是隐含的、事先未知的、潜在的有用信息。而网上文本信息的挖掘是在已知的数据样本基础上, 得到数据对象词的内在特性, 并以此为依据在网络上进行有目的的信息提取。这种信息挖掘能自动地提取相关文献之间的有价值的关系知识, 并将这些知识以可视的、动态改变的方式反馈给用户。可视方式为用户提供了以直观的易于快速理解的知识掌握途径, 而动态改变的方式则满足了用户的及时性要求。它由特征提取、源信息采集和特征匹配3部分组成。特征提取负责根据一定的算法和策略, 从现有的样本文档中提取出其内在的特征, 即进行挖掘目标的特征提取;源信息采集负责从WWW上选择下载原始文档, 这部分工作一般由多个具有一定启发策略的Robot ( Robot是一个能沿着Web页面中的超链接进行自动漫游, 并通过HTTP等标准协议读取漫游到页面的程序) 完成;特征匹配是利用挖掘目标特征判断源信息的相似度, 即进行相关信息的提取。

2.3联机分析处理技术

首先联机分析处理 (OLAP) 与数据挖掘 (DM) 是基于数据仓库 (数据库) 技术而发展起来的信息分析与挖掘工具, 在实际应用中各有侧重。前者是验证型的, 后者是挖掘型的。OLAP建立在多维视图的基础上, 重在根据已有的模式将直接源自数据仓库中的不同信息源的大量相关信息联系起来, 以给分析人员一个清晰、一致的视图。DM建立在各种信息源的基础上, 重在发现隐藏在大量原始数据深层中的对用户有用的模式。被抽取的即知识, 具备可靠、新颖、有效、易于理解的特点。其次, OLAP与DM相结合, 即OLAM, 兼有OLAP多维分析的在线性、灵活性和DM对数据处理的深入性, 因而可在更高层次上满足网上信息分析与挖掘需求。联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取, 允许管理决策人员对数据进行深入观察。决策数据是多维数据, 多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作, 侧重对决策人员和高层管理人员的决策支持, 可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理, 并且以一种直观而易懂的形式将查询结果提供给决策人员, 以便他们准确了解对象的需求, 制定正确的方案。

3信息资源的检索

3.1网络时代信息检索的特点及变化

信息检索就其方式而言, 可分为委托检索和直接检索。在脱机和联机检索时代, 由于受设备条件和检索技巧等限制, 用户的检索多表现为委托性检索。 然而, 网络时代的到来使许多情况都发生了很大的改变。首先, 网络的触角已延伸至各个领域、各个地区, 并已开始走入寻常百姓家。其次, 大量的信息资源 (包括电子图书、电子期刊、数据库、各式各样的网站、讨论组等) 都被挂在网上, 面对如此众多唾手可得的信息, 信息用户激起了自己检索信息的欲望。第三, 评判检索效果有二个重要原则, 即相关性原则和适用性原则。相关性原则只是用于评判检索结果和用户提问之间的相关程度, 适用性原则才真正用来评判检索结果的有用程度。而委托检索往往会受用户表达方式、表达能力以及用户和检索人员的交互程度等的限制, 所用的检索提问往往不能准确地反映出用户的检索本意, 只有在用户的直接检索中, 用户才能即时通过自己的判断, 不断地选择、调整检索提问, 制定检索策略, 从而达到最好的检索结果。由此可见, 网络时代的用户检索, 将更多地表现为直接检索。

3.2引进全文检索数据库

网上信息资源以网络传输为主, 目前许多著名的数据库检索系统已经上网供用户检索, 常用的有DIALOG系统、STN系统、万方数据库资源系统、中国科学院科学数据库系统和CNKI中国期刊网络数据库等。其中最著名的是DIALOG系统, 它是世界上最大的联机检索服务机构, 有600多个数据库, 涉及到全文型、数据型、事实型和指导型的数据库, 有近3亿条记录。涉及的学科专业范围广、检索功能强、数据更新及时、文献数据时间跨度大, 是项目查新、文献调研、课题立项、论文撰写和专利申请等重要依据。它可通过Telnet方式联入, 也可通过WWW方式联机的超文本界面。

3.3网上信息直接检索方式的实现

检索的实质是检索标识和文献标识之间的匹配。文献标引为了避免产生歧义, 采用的是受控的人工语言。 作为标引的逆过程的检索同样也必须采用人工语言, 才能实现检索标识和文献标识的精确匹配, 而进行直接检索的普通用户却不大可能熟练地掌握人工语言, 因此, 必须在用户所采用的自然语言和文献标识采用的人工语言之间架起一座桥梁, 使普通用户能够在网上进行直接的检索。要实现这种网上资源的直接检索方式, 也必须利用上文所提到的分类主题帮助词表。用户在检索时可以用能体现自己检索意图的自然语言输入, 系统会自动提示和该自然语言相关的人工语言标识, 用户判断、选择后再按照范例提示合理组配检索标识之间的逻辑关系, 既可实现有效检索, 还可视检索的结果随时利用上位类、下位类标引词扩大或缩小检索范围;另外, 元数据标签中包含的其它信息均可作为检索途径, 和主题一起组成高级布尔逻辑检索、 加权检索、 限定检索等途径, 提供对网上资源的有效检索利用。

4结束语

随着计算机网络技术的不断发展, 网络环境下信息资源的组织也会不断发生变化, 不断提出新的挑战。新技术的出现为充分利用网络信息资源提供了有利的工具和基础, 如何将其充分利用到信息资源的采集和检索中, 为科技人员提供丰富的参考资料是进一步要做的工作。

参考文献

[1]程文娟.网上信息资源的开发利用[J].现代情报, 2004 (4) :16-17.

[2]魏仲建.开发网上科技信息资源的途径与方法[J].情报杂志, 2001 (8) :65-66.

法律检索资源方法 篇8

关键词:资源描述与检索 RDA 编目规则 资源描述

中图分类号: G254.3 文献标识码: A 文章编号: 1003-6938(2011)05-0012-05

The Analysis of the Development of the Content Frame for Resource Description and Access (RDA)

Xu Jing (The National Science Library, Chinese Academy of Sciences, Beijing, 100190)

Abstract:This article carries out the comparison and analysis of the 4 drafts of the content frame during the exploiting of the“Resource Description and Access”, which includes the attempts and exploration, and the possible shortcomings of each phase. By this development of the content frame of RDA, we could find out how important the logical analysis is, and how it tried to describe the complicated information resource types and new features of information. RDA emphasizes the contents and the relations of the entities, digs deeply for the information and stresses on the user-centered resource description process.

Key words: Resource Description and Access; RDA; cataloging rules; resource description

CLC number: G254.3 Document code: A Article ID: 1003-6938(2011)05-0012-05

1 引言

出于统一描述,提高信息描述机构间数据交换效率,最大程度揭示出满足用户需求的信息,实现信息有序化的目的,相关机构专门编制了适用于各类特殊需求的国际性编目原则和规则。1961年发布的“巴黎原则”促成了“英美编目条例”(Anglo-American Cataloguing Rules,AACR)的诞生,在一定程度上解决了图书馆信息资源描述的统一问题,为书目世界的沟通带来便利。然而无论是信息本身的特性,还是用户需求,随着时代的发展总会表现出新的变化,AACR系列也因此成立专门的联合修订委员会JSC(Joint Steering Committee for the Revision of AACR)。

新版AARC系列的修订计划发端于2003年,并于2010年6月以新名称“资源描述与检索”(Resource Description and Access,RDA)正式发布。RDA的出现与AACR系列有着密切渊源,它既是AACR2某种形式的延续,又对其做出了大范围的改动,特别是思路方面的大变革。一方面希望RDA能够尽可能的兼容根据AACR2进行描述的历史数据,最大程度地降低数据转换成本;另一方面,又因认识到AACR2编制年代的局限,而在新一版中做出了前所未有的变化,与AACR系列有着明显的思路分歧。通过对RDA历次宏观内容框架的对比和分析,帮助我们更好的理解RDA的本质,窥探信息描述的发展力程,在未来的实践应用中把握方向和前景。

2 RDA历次内容框架的尝试和争议

RDA是为数字世界设计的一套新标准,它由AACR发展而来,为各种类型的内容和媒体提供一系列有关资源描述和检索的指南和说明。RDA将满足图书馆用户以及其他信息组织机构发现、识别、选择、获取资源的信息需求。[1 ]它是一个元数据的内容标准,用来指导如何对信息资源进行描述,决定哪些信息有被描述的必要,如何规范描述才能更好的满足用户需求,为其他机构理解并接受,符合机器识别的需求。

自JSC决定开发新版AACR系列后,内容框架历经数轮大改动。按照公示草稿的时间,可分为2004年12月、2005年12月、2006年6月和2008年11月[2 ] [3 ] [4 ] [5 ][6 ]共计4个版本(框架细节见表1)。

2.1 2004年12月版AACR3草稿:初次尝试

2004年12月首次提供外界评审的新版本被延续命名为AACR3,“著录”部分被划分为“通用”、“特殊”两个层次。“通用规则”涉及资源普遍存在的特征,其中A2章、A3章分别针对图书馆工作中常见的连续性资源和集成性资源给予单独指导;第二层则根据不同“内容类型”和“媒介类型”特征提供专门的补充规则。Part I的每一具体章节内容均对应ISBD的著录项进行组织。

在使用规则时,编目人员可根据资源特性,通过“一般规则 + 特殊内容类型 + 特殊媒介类型”的方式,组配出个性化规则。这种尝试一改AACR2按照资源类型划分著录部分的组织方式,在一定程度上减少对具有相似特征资源的规则冗余,也相对更适应新信息环境下的资源所承载的复合特征。自AACR3起,JSC开始尝试对资源特征进行抽象和归纳,降低资源类型的分类维度,提高信息描述的灵活度,从而提高规则的通用性。

这一版的草稿虽未提供Part II(检索点的选择)和Part III(检索点的形式)的具体内容,但从大标题可获知新版本已开始舍弃传统卡片目录时代“标目”、“款目”的术语,接纳“检索点”的概念。

虽然这一版草稿对Part I进行归纳的初衷值得肯定,但仍存在明显局限。首先,“通用规则”章节安排的逻辑思路不明晰。A2(连续发行的资源)和A3(集成性资源)作为某一种特殊形态的资源类型而纳入“通用规则”,将“通用”规则的普遍适用程度降低;其次,“特殊规则”部分的分类范围和标准不明确。无论是特殊内容类型还是媒介类型,AACR3仅区别出为数不多的几种,且未提供“其他”类型资源的适用规则,能否适应当今越来越复杂的资源类型仍存疑;第三,该草稿的章节编号规则极为复杂,非线性的数字+字母组合的复杂编号方式更加大了使用者理解的难度。

该版本同样也受到了来自评审社区的质疑,例如希望新规则能够适应于网络环境、覆盖所有的材料、在使用和理解方面应简单易用、提高与其他资源描述和检索标准的兼容、超越图书馆社区的范畴等。[7 ]总之,这一版AACR3虽在编纂思路上试图做出改进,但更像是对AACR2章节的拆分、合并和重组,更多的被业界视为AACR2的新修订版。

2.2 2005年12月版RDA草稿:概念模型的确定

针对上一版争议,JSC意识到当前信息环境已发生巨大改变,在充分调研的基础上,决定改变编纂思路,将FRBR(书目记录的功能需求)、FRAD(规范记录的功能需求)和FRSAD(主题规范数据的功能需求)为主的“FR家族”概念模型作为基础,同时将AACR3的副题名“资源描述与检索”作为新版正题名,去除“英美”、“编目”字眼,既凸显其国际化战略,又显示其走出图书馆界的雄心。[8 ]

在内容和结构方面,第1章主要涉及描述方法、必备元素、著录语种和文字等基本规则。第2~6章分别从识别、描述、获取的角度对资源进行剖析。Part II(关系)和Part III(检索点控制)的内容尚处于规划阶段,Part II将关注于检索点的使用,反映FRBR模型中第一组实体间的关系以及第二组与第一组实体的关系,同时也将涵盖第一组实体间的“引用”关系,探索如何简易方便的选择“引用”作品的主要检索点;Part III将检索点的“选择”和“形式”合并为“检索点控制”,术语上更加贴合FR家族的概念,主要关注于反映个人、家族、团体和作品题名的名称规范形式和变异形式。

在与ISBD的协调方面,这一版本决定将原有规则中关于数据的描述功能和展示功能独立开来,通过新增附录来提供展示数据的原则和规则,如ISBD与RDA的协调,未来计划扩展到诸如OPAC等其他展示方式。这一改动首次将ISBD纷繁复杂的各种标点和规则剥离出来,为RDA日后成为纯粹的元数据内容描述标准奠定了基础。同时在各具体章节的组织方面舍弃了按ISBD著录项目的组织顺序,尝试以“元素”作为组织内容的核心。例如第2章的具体章节分别是:题名;责任声明;版本;编号;出版者、发行者等;出版地、发行地等等。强化了“元素”的价值,与“元数据”概念更加接轨。

这一版的问题则主要集中于对FR家族的取舍过于片段,最终导致内容框架逻辑不清。以Part I部分为例,其虽反映出按照用户任务组织文本的逻辑思路,但将FRBR所定义的“发现”任务合并入“识别”实难理解。而如果按FRBR第一组实体的角度来分析,第3章或可视为“载体表现”,第4章为“内容表达”及“作品”层,第5章则是“单件”的一种语言表达方式,是层次方面的另一种混乱。此外,该版本过多的关注于“载体表现”和“单件”,对FR家族的优势——内容及内容间的关系有所忽略,关系的层次、各类实体间关系的细节都没有得以展示。

从总体上说,这一版已可以看出JSC接纳FR家族的尝试和探索,确认了FR家族作为概念模型的基础地位,开始接受FR系列术语。但是RDA对FR家族的融合程度又并非完全和彻底的,反而造成理解方面的困惑,并未充分发挥出概念模型的价值。

2.3 2006年06月版RDA草稿:关系的舍弃

2006年6月,RDA框架再次微调,将原有Part I(著录)和Part II(关系)合并为Part A(著录),涵盖图书馆意义上的“书目记录”;原有Part III(检索点控制)更换为Part B(检索点控制),涵盖“规范记录”。新结构源于JSC认为没有必要过于区分“描述”元素和“检索”元素,而且关系元素的处理也必然涉及大量描述方面的内容,将两者合并起来有利用使RDA被其他信息描述社区所接受。[9 ]

这一版本主要提供了Part A第6章和第7章涉及“关系”的部分供审阅,前者围绕FRBR第一组实体,后者为第二组实体。“相关作品”和“特殊作品类型”等特殊性规则不在单独罗列为一个章节,有利于章节逻辑层次的统一。JSC希望合并后的Part A能够使得整个结构更加协调。然而从具体的章节来看,由于未对上一版本Part I进行实质性修改,仍然继承之前存在的问题。

FR家族概念模型从实体到实体的分析优势在这一版基本被舍弃。草稿将“关系”拆分为各种线性组合,如:整体与部分关系、部分与部分关系、来源与复制关系、格式与格式关系、版本与版本关系、合订关系、关于音乐资源/艺术资源/法律资源的附加规则等。首先,这一方法是否能够真正涵盖所有分类有待证实,术语的使用也让人理解困难;其次,后半部分脱离普遍关系,转而专门涉及几种特殊资源的附加规则,逻辑思路依稀可见AACR3草稿的影子;第三,整个第6章所涉及的“关系”无法分清到底是FRBR第一组实体间的关系,还是单个实体内部的关系。第7章也存在类似问题。

受邀进行评审的各机构也对草稿提出尖锐意见。ALA对于这种再三的结构改动和复杂的工作计划表示出了担忧,其中一条关键建议:勿再使用AACR2作为开发和实践RDA的思路来源。[10 ]RDA不应再被视为现有编目规则的修订版,应指引未来图书馆编目和元数据的蓝图,适应更有效的元数据框架和其他元数据标准。ALA强烈建议RDA与FRBR和FRAD进行更充分的结盟,对术语和分类按照FR家族的思路重新审视,并强调章节安排的逻辑性。在可能的情况下,RDA中的“关系”可使用受控的数据,为未来语义领域的表达打下基础。业界此时也有声音将RDA视为“20世纪的编目规则”,[11 ]并一度被美国国会图书馆未来编目控制组建议暂缓开发。[12 ]

总之,这一版本的尝试并未达到JSC的预期,逻辑层次不清的问题是RDA面临的最大问题,RDA真正走向未来的元数据内容标准还有很大的差距。

2.4 2008年11月版RDA草稿:正式版本的定型

由于2006年6月版草稿的评审意见并不乐观,JSC在2008年对整体框架进行了大范围调整,正式出版时间一再推迟。2010年6月正式出版的RDA文本基本保持了2008年草稿框架。

JSC接受了各方关于RDA与FR家族更加契合的建议,新方案按照ER分析方法分为“属性”和“关系”两大块,共10个部分。Part A严格遵循FRBR的三组实体对各实体的属性描述设定规则,反映编目人员的工作流,从单件到所代表的载体表现,进而深入挖掘资源内涵;Part B也舍弃原先方案,遵循FR家族所识别的实体内及实体间的关系。模块化的属性和关系将有利于开发支持资源发现的应用,新的组织结构不再与任何特殊的记录结构绑定,有利于灵活适应各类社区的数据库结构。新框架的适应性和扩展性,将为RDA今后走向面向对象的模型结构提供更好的扩展空间。

同时,RDA不再延续按资源类型分类的组织结构,而是从内容、媒介和载体三个角度分别对资源类型进行界定。一方面有利于适应复合多种类型的资源描述,另一方面降低了资源类型的颗粒度,为未来进一步开发RDA的应用提供潜在便利。虽然这种安排方式或许会对当前从事信息描述工作的人员,尤其是图书馆的编目人员带来不便,但RDA在线工具Toolkit所提供的工作流抽取和重组的功能或可改善这一问题。随着应用的推广,大型信息资源机构,尤其是国家级图书馆或可共享使用针对具体资源的编目工作流。

在新版的RDA草稿中,不在单独设立关于检索点的大模块,而是将检索点的描述与著录部分合并在各个相关章节里。例如第06章在展示了作品、内容表达相关识别元素的规则后,继续分别介绍了通用的、音乐类、法律类、宗教类和正式照会作品及内容表达的规范检索点和变异检索点的构建;第09、第10、第11、第16章也是类似处理,先给出著录方面的规则,再给出构建个人、家族、团体规范检索点和变异检索点的规则。

由于该版本的内容框架与FR家族的关系已相当密切,逻辑思路也较为清晰,基本获得了评审社区的认可。虽然由于追赶进度一度在文字书写及排版方面出现了较多问题,对RDA的质量和评价带来一定负面的影响,部分降低了信任程度,但随着后续对内容的不断细化和改进,RDA的宏观内容框架基本获得认可,最终的问题集中于具体的规则细节方面,例如使用的语言过于“精巧”,理解困难;缺少适合各类情况的具体示例,使用者易造成困惑;部分规则含糊,没有给出实际的操作方案,在具体实践中无法确切把握等。

3 RDA内容框架演变历程的分析与启示

3.1 强调逻辑分析的价值和逻辑思路的统一

早在1997年的“AACR原则与未来发展国际会议”上,JSC即明确应对AACR的原则和结构进行逻辑分析,辅助AACR2的修订,决定未来发展方向,并责成加拿大国家图书馆的Tom Delsey着手开展。Delsey在次年的特别会议上介绍了利用E-R分析方法对AACR2原有内容模块化而得的实体、属性和关系,[13 ]将逻辑结构分为对对象进行描述性编目,强调具有一定的物理形态的“单件”和为描述的对象决定和建立标目,以智力资源“作品”为主要研究对象的两部分。这一逻辑分析方法与同期开发的FR家族异曲同工。在充分调研FRBR的基础上,JSC最终采纳FR家族作为开发下一代AACR的逻辑基础。

RDA的开发过程,是对FR家族接纳程度的不断反思。逻辑思路的统一贯穿整个开发历程,一度成为RDA最致命的问题。从最终正式发布版本来看,RDA较为忠实的接纳了FR家族的思路,接受FR家族定义的实体、关系和属性,并遵循FR家族的用户任务,使用FR家族术语,与FR家族密切契合。

3.2 尝试对复杂信息资源类型和新信息特征进行描述

信息创造、记录以及表现手段的发展导致信息资源的类型变得愈加复杂,从物理形态或内容形态单一角度对资源进行分类的方式也变得更加困难,所描述的信息资源已不仅仅局限于单纯的书本、期刊、舆图、录音等形式,更多的走向杂糅和细化。随着数字化、自出版等新技术和新发行模式的流行,资源类型更加复合。新时代下,作为试图规范如何描述信息资源的RDA不可避免的面临着如何组织规则的难题。

从RDA开发伊始,已放弃按资源类型来组织规则的惯常手段,“一般规则 + 特殊内容类型 + 特殊媒介类型”的组配是一种很好的尝试。在与出版行业ONIX合作后,RDA更加细化了资源类型维度,开发出了一套从内容类型、载体类型和媒介类型三个角度对资源进行分类的方法,同时提供了三种类型的受控词表。相对应的,由于RDA尝试对更加复杂的信息资源类型进行描述,从中抽象出符合用户需求的新信息特征,不可避免的造成较之AACR2更加复杂和琐碎,同样的也可能遗漏更多。

3.3 强调挖掘信息资源的内容,反映实体间的关系

随着信息量的海量增长,信息资源已不再是一个个独立的信息源,对资源内容和资源间关系的挖掘已成为用户使用的重要趋势之一。反映在信息资源描述方面,则不再仅仅关注于资源外部特征和浅显内容特征的转录,需通过更加细致的描述方式,为未来挖掘信息资源的内容和关系留出足够空间,降低描述单元的维度和耦合度。

从RDA框架的一路演变来看,在接受FR家族概念模型的基础上,对资源属性模块化,采纳“实体”概念,越来越强调“作品”和“内容表达”的价值,对“关系”的挖掘也按照FRBR所定义的3组实体而细分为6个部分,形成“属性”和“关系”的两大部分。从信息层面到知识层面的服务升级,不可能仅通过对资源的完整描述来实现,但合理的基础数据是进行下一步拓展服务的基础,作为元数据内容标准的RDA已经做出了这方面的努力和尝试。

3.4 强调以用户为中心

RDA接纳了FR家族,特别是FRBR“发现、识别、选择、获取”的用户任务,站在用户的角度来重新认识资源特征,强调“用户便利性”。06年06月版Part A已略可看出“识别-选择-获取”的逻辑思路,直到最终正式发行版关于用户任务的对应更加清晰,例如Section 1的第01章(记录载体表现和单件属性的一般规则)对应“发现”;第02章(载体表现和单件的识别)对应“识别”;第03章(描述载体)对应“选择”;第04章(提供获取与检索信息)对应“获取”。无论是RDA,还是其他内容标准,无论是图书馆界还是其他行业,最终立足点都将是尽可能的方便用户找到所需的资源。以用户为中心,满足用户需求的核心价值理念将始终引领技术和服务的发展。

4 结语

综上所述,从RDA历次版本的更新可清晰看出其与FR家族步步深入结合。与之对应的,也就要求信息描述人员除了掌握RDA本身外,还需要学习FR家族的相关概念、深入理解“实体-关系-属性”的ER分析技术等,把握资源的内容实质,挖掘资源、实体间的各种可能存在的关系,这些均对信息描述人员的能力提出很大挑战。RDA未来如何应用到实际工作中,如何充分发挥它的价值还需要相关行业进一步分析和把握。

参考文献:

[1]JSC. statement of purpose for RDA[EB/OL].[2011-05-02]. http://www.rda-jsc.org/stratplan.html.

[2]JSC. AACR3-Part I-Constituency Review of December 2004 Draft[EB/OL].[2011-05-29]. http://www.rda-jsc.org/docs/5aacr3-part1.pdf.

[3]JSC, RDA:Resource Description and Access Part I - Constituency Review of December 2005 Draft[EB/OL]. [2011-05-09].http://www.rda-jsc.org/docs/5rda-part1.pdf.

[4]JSC. RDA: Resource Description and Access Part A, Chapters 6-7. Constituency Review of June 2006 Draft[EB/OL].[2011-05-20].http://www.rda-jsc.org/docs/5rd

a-parta-ch6&7.pdf.

[5]Ed Jones. The shape of Things to Come: Resource Description and Access(RDA)[J]. The Serials Librarian. 2007,

52(3/4): 281-289.

[6]RDA Toolkit. RDA Constituency Review Draft[EB/OL]. [2011-07-17].http://www.rdatoolkit.org/constituencydraft.

[7]JSC. Outcomes of the Meeting of the Joint Steering Committee Held in Chicago[EB/OL]. [2011-05-02]. http://www.rda-jsc.org/0504out.html.

[8]胡小菁.RDA的国际化战略[J]数字图书馆论坛,2010,(12): 16-18.

[9]Outcomes of the Meeting of the Joint Steering Committee Held in Ottawa[EB/OL].[2011-05-20]. http://www.rda-jsc.org/0604out.html.

[10]ALA. RDA: Resource Description and Access Part A, Chapters 6-7. Constituency Review of June 2006 Draft [EB/OL].[2011-05-20]. http://www.rda-jsc.org/docs/5rda-parta-ch6&7-alaresp.pdf.

[11]Karen Coyle. Resource Description and Access(RDA): Cataloging Rules for the 20th Century[J]. D-Lib Magazine,2007,(1/2):131-133.

[12]On the record: report of the library of congress working group on the future of bibiliographic control[EB/OL].[2011-04-20]. http://www.loc.gov/bibliographic-future

/news/LCWGResponse-Marcum-Final-061008.pdf.

[13]Tom Delsey. The Logical Structure of the AACR Part I[EB/OL]. [2011-04-30]. http://www.rda-jsc.org/docs/aacr.pdf.

上一篇:【实用】感谢朋友作文下一篇:学校校园及周边环境综合整治实施方案