信息检索考试(精选7篇)
人的一生都在不断地学习, 然而善于学习比起纯粹地学习更为重要, 善于学习不仅是一种能力, 而且是未来时代的必备要求之一。尤其是在信息时代, 善于学习才能更好地迎接新的挑战, 适应社会的发展与变化。如今, 信息技术日新月异, 生活与互联网紧密联系, 人们可以在网络上搜索大量的信息, 于是“搜商”这一词渐渐出现在人们的视线中并获得了更高的关注度。搜商不仅能帮助人们解决生活中遇到的问题, 还能影响人们的生活水平和生活质量。
1 初步了解信息检索与利用
搜商的含义, 即有效率地搜寻资源、解决问题的素养和能力。搜商的核心是搜索的意识和能力。在《信息检索与利用》的第一节课中, 初次接触到搜商, 了解信息检索与利用这门课程的主要内容和作用, 发现学会了这门课程对我的专业有很大的帮助, 能够解决专业上和学习上的问题。同时我也对搜商产生了浓厚的兴趣, 在接下来的一次次课程中, 揭开了搜商的神秘面纱。在课后实践过程中, 学会利用课堂上学到的知识来解决学习上的困难, 尝试搜商的各种功能得到不同的搜索结果, 更深层次地学习搜商, 提高了搜商能力。
2 信息检索与利用的学习过程
第二节课中, 学习了图书馆信息资源的使用, 原来图书查询不用到图书馆一本本翻阅才能找到想要的那一本书, 为了节省时间和提高效率, 登录学院图书馆主页, 在搜索框中输入相关书籍的书名、作者、索取号来获取书籍的相关信息, 记下索书号和馆藏地点, 就能快速到图书馆找到这本书。在图书馆主页中进入数据库导航, 有中文数据库和外文数据库, 中文数据库有中国知网、读秀知识库、超星数字图书、书生数字图书、方正Apabi电子图书等。中国知网主要是论文和期刊资源, 其他的可以浏览电子图书, 这样就不需要购买书籍或是到图书馆借阅, 直接在网络上打开相关网址, 下载相关阅读器, 就可以阅读想要看的电子书籍。这样, 阅读就不会受到地点、时间、空间的限制, 打开了人们阅读的另一扇“窗户”。
中文数据库里还有超星名师讲堂、新东方多媒体学习库、超星发现等。超星名师讲堂主要是讲师视频, 与浏览电子书相比较, 看视频学习更能让人浅显易懂, 而不显得枯燥无味。新东方多媒体学习库主要是学习英语, 比如英语四级考试, 我就可以到新东方数据库找到学习英语的相关资源, 英语四级的真题及解析答案或是英语高分的攻略技巧。超星发现是检测论文重复率, 有时老师布置论文需要检查论文重复率, 那么就可以到超星发现检测。中文数据库还有其他的功能等待我慢慢挖掘, 除了老师讲解的内容, 还有其他的用途等着我实践与应用, 这也是搜商能快速提高的一种方法。
第三节课中, 老师介绍了中国图书馆分类法, 简称《中图法》, 分为五个基本部类, 22个基本大类, 所有图书是按《中图法》给出的分类号排列。我学会了如何看图书的索取号和图书馆的排架原则, 这样在知道图书的索取号后, 很快就能到图书馆找到这本书, 而不是毫无方向的四处打转, 浪费了大量时间还找不到自己需要的书籍。第四节课的主要内容是中国知网的使用方法和搜索技巧, 先学习了如何进入和登陆中国知网, 其次是搜索方法, 快速而有效地找到自己需要的资源, 比如跟踪名人学者, 找到他们发表的论文以及几种导出论文的方式。最后, 我了解了投搞论文的方法和建设个人数字图书馆, 并尝试建设自己的数字图书馆, 将理论和实践相结合, 对搜商的应用有了进一步的了解。
第五节课是关于期刊论文的撰写, 老师讲了论文的基本构成与要求和参考文献的书写格式以及大雅论文相似度检测。之前我不了解怎样才能写出一篇好的论文, 学了这门课程后, 我知道了论文的构成要素和搜索相关的论文资源, 参考别人的论文成果, 然后自己就可以写出一篇论文了。老师又介绍了中国期刊网, 主要有龙源期刊网、万方数据库和维普数据库。如果想看期刊杂志, 就可以不用到图书馆借阅或将期刊买回来翻阅, 只要自己到这三个数据库, 查询想看的期刊花费少量的资金就可以看到自己喜欢的杂志。还可以在数据库上检测论文相似度, 以前只知道在淘宝上检测论文, 现在学会了多种检测论文的方法。
第六节课主要是电子图书的检索与利用, 可以在网络上阅览电子图书, 一种是在图书网站上检索书籍, 另一种是在图书数据库上检索学术方面的书籍。我学习了如何在超星数字图书高级检索电子图书, 从中进入读秀知识库浏览电子图书, 有效率地搜寻和利用电子资源。另一节课学习了其他数字图书馆的高级检索与中国国家图书馆的图书检索和公开课, 接下来老师讲了百度高级检索技巧, 每一个技巧对我搜索信息有很大的帮助并且节省了一定的时间, 让我有更多的空余时间做自己喜欢的事情。
3 信息检索与利用的心得体会
之前我一直认为在学习知识方面需要读很多的书, 大脑要记住很多的知识, 然而互联网发展, 信息在不断地更新, 我发现需要学习的知识太多, 需要了解的范围太广泛。现在, 我学习了《信息检索与利用》这门课程, 发现自己能够运用一些搜索技巧以及找到解决问题的有效方法。通过课上学到的知识, 运用到生活中, 在图书馆借了一本书名为《我的搜主意比你多》, 作者黄泰山将他搜索的经验与读者分享, 所以我对搜商有了进一步的认识, 发现传统的独立思考效果也会受到限制, 独立思考只有个人的力量, 需要花费大量的时间才能解决问题。有时候没有那么多的时间, 难道就不能解决了吗?我为什么要花比别人多一倍的时间才能完成任务呢?
搜商除了可以帮助我解决问题以外, 还可以提高我的智商、情商和成功的概率。在我的专业领域, 多少接触过一些相关信息, 但我更加需要找到这个领域内最有价值的信息, 而不仅仅是相关信息。在第七节课中, 学会用不同的搜索引擎有效地得到信息资源。而我明白了搜索不仅仅是一件供人利用的工具, 还是检索到有效方法解决问题的路径。掌握了搜索技巧, 我在完成专业作业时, 设置准确的关键词, 利用相应的搜索引擎, 获得自己想要的信息, 快速地完成了作业。不仅在专业领域的学习, 想要提升其他能力, 搜商可以助你一臂之力, 搜索资料认识能力, 学习和研究经典案例, 找到提升能力的方法, 对该领域的最新研究成果、动态发展的了解, 也可以依托搜商获取最新的信息和资源。
4 总结
总的来说, 学习这门课程, 就像拿到一把开启知识库大门的钥匙。无论你欠缺哪方面的知识、技能, 都可以上网寻求帮助, 获得学习资源。在这个有互联网的时代, 每一天都在变化, 信息也在更新换代, 而我们也需要变化, 积累更多的知识, 适应未来的变化发展。搜商的学习不会止步于此, 每天学习一点, 未来收获更多。
参考文献
关键词:信息检索;搜索引擎;网络爬虫;中文分词;排序
中图分类号:TP393文献标识码:A文章编号:1009-3044(2007)15-30770-02
Analysis of the Key Technology of Chinese Information Retrieval
WANG Dong
(Dept of Computer Science & Technology, Qiongzhou College, Wuzhishan 572200, China)
Abstract:The paper makes a brief introduction on the Web Chinese Information Retrieval, and analyses some key technology on it. And the Chinese search engine technology popularly at present has been turned out. The author proposed some ideas, the experiences and the tentative plans, and eventually carried on the forecast on the intelligent Chinese search engine technology.
Key words:Information Retrieval;Search Engine;Web Crawler;Chinese Participle;Arrangement
1 引言
近年来,Internet迅速发展成为一个分布于全球的混合信息空间。为了帮助用户获得网络上的丰富信息,Web信息检索系统应运而生,其最新发展趋势是检索的智能化和垂直化。人们在享受信息检索工具带来方便的同时,“忠实表达”和“表达差异”等问题日益突显出来。随着人工智能、机器学习、语义Web等技术的快速发展,人们提出了智能化搜索引擎来解决传统搜索存在的弊端。下面笔者就Web中文信息检索的智能化技术提出自己的一些看法。
2 Web中文信息检索概述
WWW上的信息检索主要研究对整个HTML文档信息的表示、存储、组织和访问,即根据用户查询要求,从信息数据库中检索出相关信息资料,以文本数据为主要处理对象,提供根据数据资料的内容而不是外在特征来实现的信息检索手段。[1]
在Web信息检索技术领域,英文信息检索发展得较为完善,如信息的表示采用向量空间方法,基于内容相关性的查询反馈等。Web信息检索的发展是一个不断探索的过程,如今它己向第二代发展,功能也越来越强大[2]。然而,目前中文网络信息检索还存在着许多问题:1、查询方式单一,查准率和查全率不高。中文搜索引擎一般只有分类目录浏览和简单的关键词检索,缺乏高级的查询方式。但是中文是一种存在着大量音、形、义相近词汇的复杂语言,单一的检索方式经常会使得使用者得不到想要的结果;2、中英文混合检索问题。如:当你输入“MP3”时,有些网站会认为你在查找英文网页,进而自动将你送到一个英文搜索引擎上;3、专业的网络信息检索引擎较少;4、中文网络检索的相关性无法与英文媲美,检索字串与网页中文字的简单匹配并不见得就是语义上的匹配。
3 Web中文信息检索的关键技术
3.1 网络爬虫
网络爬虫(Crawler)是通过网页的链接地址来寻找网页的程序,它从网站的某一个页面开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。网络爬虫一般有两种策略:深度优先和广度优先[3,4]。深度优先是指网络爬虫会从起始页开始,逐个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。广度优先是指网络爬虫会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。第二种方式可以让网络爬虫并行处理,提高其抓取速度。网络爬虫抓取HTML文档时,需要把HTML标识符过滤掉,同时记录页面的版式信息,例如文字的大小、是否标题等,这些信息有助于计算单词在网页中的重要程度。
3.2 中文自动分词技术
对中文来讲,自动识别汉语文献中词的边界,将书面汉字序列切分成正确的词串,是理解自然语言的第一步,分词质量的好坏将直接影响到主题抽取的质量。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
本文主要说明一下基于统计的分词方法,此方法一般不依赖于词典,因此也称为无词典分词法。该方法根据计算字与字相邻共现的频率来确定是否成词,共现信息体现了汉字之间结合关系的紧密程度,当紧密程度高于某一个阈值时,便认为此字组可能构成一个词。这种方法只需对语料的字组频度进行统计,不需要分词词典。但它也不足,比如说像“之一”、“有的”等词它们尽管不是词组,但一起出现的概率也很大,这样就会对词组分词产生一些偏差[5]。改进的方法是:先使用一部基本的分词字典进行关键词分词,同时使用统计方法识别一些新的词组,即把词频统计和字典方法结合起来,这样两者可以相得益彰,效果更好。此外,还可以把得到的搜索结果进行动态的归类,有条理地给出搜索结果,这样可以让用户清楚地寻找自己的搜索内容属于哪个类,节省用户在大量的搜索结果中查找所需信息的时间。
很多搜索引擎对中文的“一词多义”都束手无策。在这种情况下,我们可以采用系统和手工干预相结合的办法来解决这个问题。首先,系统查找知识库并得到搜索词的所有含义,同时进行相应的排序,而后系统把搜索词的各个含义以网页的形式呈现给用户。用户就可以选择自己感兴趣的含义。该方法避免了对关键词的曲解,同时避免了大量垃圾信息产生,因此极大地提高了查找效率。特别是在个性化搜索引擎方面,系统可以增加用户对个性数据库反馈的功能,这样当该关键词下一次出现的时候系统就会把用户的这次选择作为其默认选项。
3.3 搜索结果排序
传统的PageRank算法的工作机理是:若一个页面被多个页面引用,则这个页面可能是重要页面;一个页面尽管没有被多个页面引用,但被一个重要页面引用,那么这个页面也可能是重要的。在此基础上,我们可以进一步提出一些设想:1、某位用户所搜索的信息可能只涉及的某个领域,因此在使用PageRank算法时,可以考虑用户感兴趣的领域。例如,如果网站是介绍“电器”的,有10个链接都是从“电器”相关的网站链接过来,那这10个链接比另外10个从“体育”相关网站链接过来的贡献要大;2、网页设计者经常会根据强调内容的不同,给网页的不同部分加上不同的标记或用不同的字体等。因此,我们就可以根据页面版式信息来确定所搜索的结果和搜索词的相关程度;3、我们发现,当用户打开搜索结果中的某个页面,如果发现该页面没有他想要的内容,他就会立刻关闭;而如果有他要查找的内容,他则会驻留比较长的时间。因此可以采用用户在某页面的停留时间,作为搜索结果排序的参考之一。
目前的搜索引擎排序算法上还存在两大不足:1、正解相关性。相关性是指搜索词和页面的相关程度。仅仅通过链接、字体、位置等表面特征,并不能真正判断搜索关键词与文章的相关性。另外,很多文章尽管没有出现搜索词,但是文章表达的意思却与搜索词相关,这时搜索引擎将无法搜到这些相关网页。可见,表面特征搜索只能治标,而不能治本。解决问题的关键在于增加语义理解,让机器明白人的意图;2、搜索结果的单一化。在搜索引擎中,任何人搜索同一个词都会得到同样的结果。比如说用户输入搜索词“苹果”,如果用户是一个IT工作者,他也许想找到的是苹果计算机;而对于一个农民而言,他也许想找到的是如何栽培优质苹果的方法。而当前的搜索引擎尽管在个性化方面有了一些尝试,但距离人们想要的真正意义上的“个性化”还有很大的差距。
综上所述,搜索引擎的排序技术将会向两个方向发展,即:语义相关性和排序个性化。如果一个搜索引擎能从根本上解决这些问题,它将成为搜索领域的霸主。
4 Web中文信息检索的发展趋势
近年来,信息检索技术开始注重网页质量与相关性的结合,这主要是通过三种手段:1、对网上的超文本链接结构进行分析,如Infoseek和Google;2、对用户的点击行为进行分析,如Directhit;3、与网站目录相结合。信息检索最新的趋势是智能化(包括个性化),智能信息检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。搜索引擎的智能化还表现在用自然语言与用户交流的能力,对知识的理解和处理能力。目前Internet 上的人工智能产品越来越多,如:智能搜索引擎、智能浏览器、学习智能体、知识共享智能体等已经从实验室进入市场[6]。
5 结束语
本文介绍了Web中文信息检索技术的基本理论,在此基础上,分析和研究了中文搜索引擎的三大关键技术:网络爬虫、中文分词、搜索结果排序,并就中文分词和搜索结果排序提出了一些设想。我们深信:随着互联网技术的不断发展,搜索引擎也将迎来革命性的变革,人们将在这个信息爆炸的年代里获得越来越精确和及时的信息。
参考文献:
[1]Venkat N Gudivada. Information Retrieval on the World Wide Web[J]. IEEE Internet Coputing,1997,(4):58-68.
[2]翁惠玉,马范援,朱义军,杨传厚. 网络搜索引擎的现状分析[J]. 情报学报,1999,18:100-102.
[3]李学勇,欧阳柳波,李国徽,钟敏娟. 搜索引擎中网络蜘蛛搜索策略比较研究[J]. 计算机技术与自动化,2003,22(04):63-67.
[4]李学勇,欧阳柳波,李国徽,王鑫.专业搜索引擎搜索策略综述[J].计算机工程,2004,30(13) :32-33.
[5]唐培丽,胡明,张勇. 基于中文文本主题提取的分词方法研究[J]. 吉林工程技术师范学院学报,2005,21(2):34-36.
5、查找有关本专业的会议文献三篇,并分别写出会议名称、作者、举办者、举办时间、举办地点。
6、利用CNKI引文数据库查找本专业某教师论文被引用情况,记录总 被引频次和其中两条引证文献的简要信息。
7、在CNKI“工具书全文数据库”中查找有关本专业的工具书,请列 举五种工具书的名称。
1信息(INFORMATION):信息从字面看,可被理解为迹象、征兆和消息。大家公认的定义是:信息是自然界、人类社会、人类思维活动中一切事物的存在及其运动状态的反映。
2知识:人们在改造世界的实践中所获得的认识和经验的总和。知识的产生来源于信息,系统化了的信息才是知识。
3情报:传递给一定对象的有用的新知识和新信息。4文献:文献是记录有知识的一切载体。(如竹简、纸张、磁带、光盘等)如纸本文献、电子文献等。其记录的方式有:手写、印刷、机录、感光等。
一、文献的类型
1按文献载体、出版的形式划分(1)。印刷型
图书:指以印刷方式单本发行的出版物。图书的缺点是由于编著和出版的时间长,所论述的知识与期刊论文等文献相比有3-5年的时差。
期刊:定期或不定期的连续出版物,有固定的期刊名和出版形式。期刊比图书出版周期短,信息量大,内容新颖。约有60—70%的信息来源于期刊
特种文献:专利说明书、、标准、会议论文、学位论文、政府报告等)(2)缩微型:以感光材料为载体记录的文献,如:缩微胶卷等。(3)声像型:包括录音带、录像带、幻灯片、电影拷贝等。
(4)机读型:指以数字化技术将文献存储在光、磁载体上,通过计算机或网络进行阅读的文献,可分为数据库文献和网络文献信息。
二、信息检索
(一)概念:检索即查找、获取的意思。广义的信息检索包括信息的存储和检索,是指将信息按一定方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。狭义的信息检索仅指信息的查取,从已组织的信息系统中查取所需信息的过程。
(二)信息检索语言:
是指在信息检索过程中用来描述文献特征和表达检索提问的一种专门人工语言。
规范化语言:指检索用语经过人为规范了的检索语言,是把检索用语中的同义词、近义词、同物异名词等进行规范化处理,使每个检索词只能表示一个概念,每个检索概念只用一个唯一的检索词来表达,从而提高信息检索效率。如:主题词语言。
主题词:指能表达文献信息的实质内容,经过规范化处理的名词述语。非规范化语言(自然语言):对检索用语中的同义词、近义词等不作处理,而直接使用原始语言作为检索语言。如:关键词语言。
关键词:是指从文献信息中提取出来的,能表达文献信息的实质内容的名词术语。文献信息指在文献的标题、文摘或全文中提取,能被人们作为检索入口的关键性专业名词术语。
计算机检索
(一)概念:计算机检索:就是用户对检索课题加以分析,利用检索语言形成标识,制定检索提问式,输入计算机进行信息检索的过程。
(二)计算机信息检索发展阶段
脱机检索阶段(20世纪50年代~60年代中期),联机检索阶段(20世纪60年代~70年代中期),光盘检索的阶段(80年代中期至今),网络检索阶段(20世纪90年代以来)。
(三)数据库结构
数据库基本的结构由文档、记录、字段组成。文档 :数据库中一部分记录的集合.按学科或年代分割成若干个文档.如:CNKI中的九个专集 记录 :构成数据库的一个基本信息单元.一条记录在数据库中代表一篇原始文献相关信息. 字段 :组成记录的基本要素.字段在检索中起重要作用.如:TI(篇名)、AU(作者)、AD(地址)、SO(刊名)、AB(摘要)等。
(四)计算机索的方法*
1、布尔逻辑检索:
通过布尔逻辑运算符(AND、OR、NOT)来连接检索词、以及表示运算优先级的括号组成检索算式,来表达用户的检索要求,实现检索的方法叫布尔逻辑检索。AND:(逻辑与),表示”相交”关系,可用来缩小检索范围.例 A AND B ,检索的文献必须同时包含A和B两个检索词才行, OR:(逻辑或)表示”并列”关系,可用来扩大检索范围.A OR B , 只要满足A或B中的一个条件即可.图中所有部分。NOT:(逻辑非)表示”排斥”关系,可缩小检索范围.如何编制布尔逻辑检索式? 举例:
1、武汉或湖南地区天气状况
检索式为:(武汉 or湖南)and天气
2、限定检索:对数据库特定字段的检索。限定符有:“IN”,“=”,等 如:molecular and structure in TI(篇名限定);PY=2003(时间限定);title:希波克拉底誓言(搜索引擎)
4、扩展检索:指初始设定的检索范围太小,命中文献不多,需要扩大检索范围的方法。有概念的扩大、范围的扩大、增加同义词、年代的扩大几种主要的检索方法。
5、缩小检索:又称二次检索。指开始的检索范围太大,命中文献太多,查准率太低,需要提高查准率的方法。除概念、范围、年代的缩小外,还可以通过以下方法限定:核心概念、语种、特定期刊的限定等。
6、计算机信息检索的步骤:
(1)分析检索课题,明确检索要求(2)选择数据库和检索途径
(3)确定检索标识,构筑检索提问式(4)上机检索操作
(5)整理检索结果,获取原始文献
三、网络信息检索
(一)因特网中的基本概念和术语 Internet概念:什么是Internet?中译名为因特网,又称国际互联网。是全球最大、最开放、由众多的计算机和计算机网络,通过统一的技术协议(TCP/IP协议)连接在一起,从而使网上计算机用户能够共享信息资源,并互通信息的大网络系统的集合。TCP/IP协议:TCP/IP:即传输控制协议/网间协议。TCP/IP是将数百万台计算机系统维系在一起的纽带。3 IP地址:连入因特网的计算机或节点被赋予一个世界唯一的数字作为地址,称为IP地址。如三峡大学图书馆主页http://192.168.52.5。由于IP地址不易记忆,因此还有另一种方便易记的地址方式:
4、域名地址:即用一组英文简写来代替难记的数字。如清华大学的IP地址为166.111.9.2,相应的域名地址为KI中国知网等)在检索方面的异同:
相同之处是,都能够提供布尔、截词、限定和字段检索等方法; 不同之处是,搜索引擎提供的检索结果是以检索主题相关的网址为主要内容,尤其是中文搜索引擎一般不提供学术论文的全文。此外,尽管信息覆盖量大,如一个检索词检索结果达几十万条,但无关结果出现频率高,查准率低。专业数据库主要是为学术研究提供各学科的文献资料的,并且专业文献资料齐全,需要检索和下载科技论文信息及全文,最好到各类专业数据库中查找,查准、查全率都高,但是专业数据库是需要付费的,只有特定条件下才能免费使用。
五、中文综合性期刊全文数据库
图书馆购买的中文综合性期刊全文数据库主要有:CNKI数据库、万方数据库、维普数据库等。本课程主要详细介绍CNKI数据库的检索技巧及CAJ浏览器的使用。
(一)CNKI数据库
1、数据库简介:中国学术期刊网络出版总库是目前世界上最大的连续动态更新的中国期刊全文数据库,分十大专辑,知识来源:国内公开出版的8200种核心期刊与专业特色期刊的全文。覆盖范围:理工A(数理化天地生)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学。收录年限:1979年至今。2数据库使用:(略)
3.使用中注意的问题
1、先下载CAJ.Viewer最新版本的浏览器:否则不能浏览CAJ格式的全文。
2、如命中篇数太大,则需使用二次检索。
3、对于检索篇数太少的课题,要注意使用同义词,反复搜索。例:乙肝——乙型肝炎。
(二)万方数据库
万方数据股份有限公司是我国第一家以信息服务为核心的股份制高新技术企业,目前有12大类100多个数据库,收录全面,内容丰富。除了收录中国公开发行的奇论文外6000余种期刊论文外,还收录了标准、专利、会议、学位论文等特种文献。尤其收录了中国专利的说明书全文,极大地方便了广大学者检索专利的需求。
六、中文电子图书数据库
(一)超星电子图书
超星数字图书馆于1999年开通使用。其包括文学、经济、理工等五十余类、数十万册电子图书,为目前世界最大的中文在线数字图书馆。我馆购买的有各类电子图书40万册。2005年以后的新书没有购买。
(二)方正电子图书
方正Apabi是由北京北大方正集团公司开发的电子图书系统,其中的图书由全国400家大型出版社提供,图书正版、新书多,2002年以后出版的新书占70%。我馆购买了12000多种,主要是各专业学习参考用书。
(三)读秀学术搜索
读秀学术搜索是全球最大的中文文献资源服务平台,是超星图书馆数据库公司开发的又一个新产品。文献资源收录丰富,几乎涵盖了所有的中文出版图书。目前收录了280万种中文图书。它集文献搜索、全文下载、试读为一体,是一个可以对文献及全文内容进行深度搜索,并通过Email进行文献传递服务的一站式检索平台。
如果在超星数字图书馆中没有的电子图书,可以在读秀学术搜索中检索,并通过它的Email文献传递服务系统,读者自已行文献传递,非常方便。
七、外文综合性期刊全文数据库
图书馆购买的外文综合性期刊全文数据库主要有:EBSCO数据库、Springerlink数据库、Elsevier SDOL数据库、Wiley-Blackwell期刊全文数据库。本课程主要详细介绍EBSCO、Elsevier数据库的检索技巧及PDF浏览器的使用。IEL数据库是美国电气电子工程师学会(IEEE)和英国电气工程师学会(IEE)出版的229种期刊、8739种会议录、1646种标准的全文信息,是一个外文专业数据库在这里不做介绍。而Ei Village数据库是由美国工程情报公司开发的一个文摘型数据库,不提供全文。
(一)、EBSCO数据库
1、数据库简介:
EBSCO-ASP(学术期刊全文库Academic search premier),该数据库收录有生物科学、工商经济、资讯科技、通讯传播、工程、教育、艺术、文学、医药学等领域的包括4,286种期刊,是一个综合性外文全文数据库。BSP(Business Source Premier商业资源电子文献全文数据库),收录2630种期刊的索引和文摘和2080种期刊全文。
2、检索方式:略
3、检索注意事项:
3.1查找经济、金融、商业类的文献要注意选择BSP数据库。3.2其它学科专业文献均可选择EBSCO-ASP数据库。3.3 阅读PDF全文要先下载Adobe Reader软件。
3.4有一些检索结果没有提供全文。如果需要全文,可以在Elesvier、Springer等数据库中再查找,如果还没有,可通过图书馆信息服务部向其它高校图书馆进行文献传递服务。
(二)Elsevier数据库
Elsevier SDOL数据库是荷兰Elsevier Science出版公司开发研制的,完全基于web的电子期刊全文数据库检索系统。Elsevier Science是荷兰的历史悠久的跨国科学出版公司,是世界享有盛誉的学术出版商。同时将其出版的2000余种期刊全部数字化,建立了ScienceDirect全文数据库。学科范围覆盖自然科学与社会科学的各个领域。
(三)Ei Village数据库
EI指美国《工程索引》,是一种外文文摘刊物,没有全文提供。1995年,由美国工程情报公司开发为数据库,有网络版及光盘版两种。是目前全球最全面的工程领域二次文献数据库,侧重提供应用科学和工程领域的文摘信息。其数据来源于5000多种工程类期刊、会议论文集和技术报告。
八、学术论文写作
概念:学术论文是对某一学术课题在实验性、理论性或观测性上具有新的科学研究成果或创新见解和知识的科学记录;或是某种已知原理应用与实践中取得新进展的科学总结,用以提供学术会议宣读、交流或讨论;或在学术刊物上发表;或作其他用途的书面文件
学术论文撰写规范和要求
1.学术论文的组成:主要由前置部分和主体部分组成。前置部分又包括:篇名、作者(单位)、摘要、关键词(3-8个)、中国图书馆图书分类号。主体部分包括:引言、正文、结论、参考文献、附录性材料。2.撰写要求 略。
1、根据课题,制定检索策略(需要一个截图)并形成检索结果(需
要一个截图),并对这些结果创建引文报告(需要一个截图),利用SCI分析功能从15个方面选择三个方面对引文进行分析(需要三个截图)。
2、从上述检索结果中挑选出引文频次最高的文献,打开这篇文章
要求看到文摘等内容那一页(需要一个截图),对引文频次最高的这篇文献进行被引参考文献检索,制定检索策略(需要一个截图),选中需要的记录(需要一个截图),排除第一作者后的检索结果页面(需要一个截图)。
注:课题内容不许重复
一、信息检索简介
1. 概念
广义的信息检索范围很大, 可以说从书本、报纸以及其他的各种媒体中查找人们需要的信息都可以称为信息检索。
狭义的信息检索是特指利用计算机这个高效的工具对各种信息进行检索的技术。信息检索的内容包括文本、图像、视频和音频等多种, 但本文只讨论文本信息的检索技术, 特别是中文信息的检索技术。
信息检索是一门研究从一定规模的文档库 (D o c u m e n t Collection) 中找出满足用户提出的信息需求 (User Information Need) 的技术。
2. Web信息检索
Web的出现大大地促进了信息检索技术的发展。Web上有异常丰富但又十分混乱的信息资源, 其中绝大部分有用的信息还没有挖掘出来。这是因为目前还没有特别好的信息处理和检索工具。这一领域的开发仍然处于初级阶段。
3. 中西文信息检索比较
在文本信息检索领域, 西文信息检索的发展较为迅速。西文信息检索系统可以利用向量空间表示检索信息内容, 并将自然语言处理应用于信息检索, 大大提高了信息检索的准确性。中文信息的检索和英文信息的检索在很多地方是一致的, 但也有一些不同。比如中文词语之间没有空格, 因此在索引前需要进行词语切分。此外, 与英文相比, 汉语句法分析和语义理解更为困难。
4. 信息检索的模型
一般有两种信息检索模型:基于统计的模型和基于语义的模型。基于统计的模型是应用某些统计的手段从被检索文档和高标注等级文档中查询与用户需求匹配程度最好的文档;而基于语义的模型则尝试对需求实现一定程度语法语义分析, 即对自然语言文本进行一定程度的理解并重新生成查询。
基于统计的模型主要有:布尔模型 (Boolean Model) 、扩展布尔模型 (Extended Boolean Model) 、向量空间模型 (Vector Space Model) 以及概率模型 (Probabilistic Model) 等。
二、向量模型
向量模型是重要的检索模型, 其主要优点在于:a、通过对特征项的加权改进了模型的检索效果;b.模型的部分匹配策略允许检索出与查询条件相接近的文献;c.相似度的引进使得能够对查询结果进行排序, 以倒排文档方式提交结果。
1. 文档和项的向量空间表示
首先把一个文档进行分词处理, 并去除那些停用词, 如“我”、“的”、“人们”等。然后对剩余的词进行合并处理。
在一个给定的集合中先对每个文档进行以上的操作, 获得每个文档索引项的集合。再把所有文档的索引项进行合并, 形成了一个代表整个文档集合的索引项集合, 整个索引项集合表示了一个“空间”。在一个文档空间中, 可以给每个索引项赋一个权值, 代表这个索引项在这个文档中的地位。如表1所示, 文档1的向量空间是 (3, 4, 5) , 文档2的向量空间是 (2, 3, 3) 。
与文档空间相对应的一个概念是“项空间”, 它是指一个索引项在文档集合中的各个文档权值的集合。如表1所示, 索引项“经济”的向量空间是 (4, 3, 0, 0) , 索引项“金融”的向量空间是 (5, 3, 0, 5) 。
于是文献和查询均可用由项构成的向量来表示:d= (t1, t2, ……, tn) 。项的权重 (term weight) :对于有n个不同的项的系统, 文献D= (t1, t2, ……, tn) 。
2. 项权值
项t k (1≤k≤n) 常常被赋予一个数值Wk, 表示它在文献中的重要程度, 称为项t k的权重。因此, 我们一般用D= (w1, w2, …, wn) 的形式表示文献。特征项的权重计算, 是人为赋予的, 因此主观性较强, 但比较权威的确定权重的方法是运用TF-IDF公式, 即Wik=tfik/dfk=tfik×idfk, 其中tfik为特征项Tk在文档Di中的出现频率, 称为项频率 (term frequency) ;dfk则是文档集D中出现特征项Tk的文档的数量, 称为文档频率;idfk为dfk的倒数, 称为反转文档频率 (inverteddocument frequency) 。另外, 还应考虑到文档的长度, 否则长文档易被检出, 而短文档会被漏检, 所以通常还要对上面公式进行标准化处理。
假设有三个项:“经济”、“金融”和“计算机”, 它们在不同文档中的权值如表1所示。
根据这个表, 可以画出权值和文档的三维向量空间。
3. 计算向量之间的相似程度
相似度S (Similarity) :指两个文档内容相关程度的大小, 当文档以向量来表示时, 可以使用向量文档向量间的距离来衡量, 一般使用内积或夹角θ的余弦来计算, 两者夹角越小说明相似度越高。由于查询也可以在同一空间里表示为一个查询向量 (见图1) , 可以通过相似度计算公式计算出每个文档向量与查询向量的相似度, 排序这个结果后与设立的阈值进行比较。如果大于阈值则页面与查询相关, 保留该页面查询结果;如果小于则不相关, 过滤此页。这样就可以控制查询结果的数量, 加快查询速度。
三、以经济信息检索为例的实例分析
经济发展依赖于自然资源的开发与利用, 也离不开经济信息资源的开发和利用。开发经济信息资源, 实际上是对人类智力的开发, 是一种知识和科学技术的开发, 一种生产技能和管理技能的开发。现在, 经济信息已经渗透到现代生活的各个领域, 有效地地开发和利用经济信息, 提高经济信息的传播速度已经成为现代经济发展的一种推动力, 能够大大提高劳动者的智力水平, 从而促进经济的发展。因此, 在以经济建设为中心、大力发展社会主义经济的过程中, 必须不断地开发和利用经济信息资源。
经济信息是一种社会资源, 作用于经济活动过程, 已经成为现代社会经济发展的一个先决条件。现代经济建设是一个庞大而复杂的系统, 需要依据大量的经济信息去控制、指挥、协调和组织系统的内部关系, 系统和系统之间也需要靠经济信息去联系, 才能使经济活动达到人们预期的目标。在科学技术迅猛发展的社会里, 经济信息资源显得更加重要。
假设现有一个包含4篇经济金融类相关信息文档的集合, 这4篇文档如下:
D1:金融投资的对象是金融资产……
D2:金融资产是获得投资收益的资产……
D3:证券投资、基金投资和期权投资组成金融投资……
D4:获得投资收益是证券性金融投资的主要目的……
检索表达式Q为:金融投资的资产收益。
首先, 需要对文档和检索表达式进行分词处理, 其结果如下:
D1:金融/投资/的/对象/是/金融/资产/……
D2:金融/资产/是/获得/投资/收益/的/资产/……
D3:证券/投资/、/基金/投资/和/期权/投资/组成/金融/投资/……
D4:获得/投资/收益/是/证券/性/金融/投资/的/主要/目的/……
Q:金融/投资/的/资产/收益/。
然后除去停用词, 去除后的文档如下:
D1:金融/投资/对象/金融/资产/……
D2:金融/资产/获得/投资/收益/资产/……
D3:证券/投资/基金/投资/期权/投资/组成/金融/投资/……
D4:获得/投资/收益/证券/金融/投资/主要/目的/……
Q:金融/投资/资产/收益/。
计算项的权值根据公式
各个索引项的df和idf值如表2所示
各个索引项在文档中的频度如表3所示
则各个索引项在文档中的权值如表4所示
检索表达式的权值很简单, 如表5所示
采用内积法计算向量的相似度, 则可以看出, 文档D3与检索表达式的相似度最高, D1、D2、D4相同且低于D3。
四、算法分析总结
算法的计算复杂程度还需要进一步探讨, 目前这些研究都还不够深入, 许多问题还有待于进一步探讨;同时由于自然语言的复杂性, 新查询向量的查全率和查准率虽然有所提高向量模型是以假设向量空间的各维之间相互正交 (即各关键字之间相互独立) 为前提的, 因而不可避免地存在由此带来的损失关键字间的相关性的缺点, 可它把对文档内容和查询要求的处理简化为向量空间中向量的运算, 克服了布尔模型的二值评价的缺点, 可以计算出文档与查询式的相关程度, 因而可以很容易地进行输出结果的排序, 用户相关性反馈机制也很容易实现, 尤其是具有对处理海量数据的适应性等种种优点使得它自诞生以来, 至今都有很强的生命力。
参考文献
[1]雷景生林冬雪符浅浅:基于改进向量空间模型的Web信息检索技术研究[J].计算机工程, 2005, 1:14~16
[2]王晓黎王文杰:基于向量空间模型的文本检索系统[J].微电子学与计算机, 2006, 23:188~190
[3]包金龙:基于向量空间模型的信息检索系统的设计[J].情报检索, 2005, 7:44~45
[4]安茹娜:浅析经济文献信息的开发和利用[J].科技情报开发与经济, 2007, 12:54~55
[5]刘海峰王元元:基于向量模型的文本检索若干问题研究[J].情报杂志, 2006, 10:57~59
关键词 信息检索 教学改革 主题案例法
分类号 G254.9
DOI 10.16810/j.cnki.1672-514X.2016.10.014
Research on Information Retrieval Course Reform:Design and Implementation of the Theme Case Teaching Method
Huang Yueshen
Abstract Aiming at the problems of the information retrieval course and the limitation of the existing case teaching method, this paper proposes the design of the theme case teaching method. This method takes the theme case as the main line to connect curriculum system, so as to guide students to establish a complete information retrieval thinking more effectively, and helps to realize the reform of the course from the teaching of information retrieval skills to the information retrieval thinking. In accordance with the theme case teaching method, it constructs the theme case library, and discusses 4 key factors including the structure, case design, content expansion, and the display of the theme case library.
Keywords Information retrieval. Curriculum reform. Theme case teaching method.
进入21世纪,我国高等教育改革进程加快,新的教育理念强调素质教育、自主学习能力和创新能力的培养。在此背景下,2002年2月,教育部颁布了《普通高等学校图书馆规程(修订)》,其中总则第三条明确规定当前高等学校图书馆五项主要任务之一就是“开展信息素质教育,培养读者的检索意识和获取、利用文献信息的能力。”[1] 这项规程赋予了信息检索课程新的时代任务,拉开了信息检索课程改革的大幕。关于教学方法的创新成为了课程改革的焦点和研究热点。
信息检索课程改革的核心是“教”与“学”两个方面,一是教师的“教育”需要转向检索思维的培育,具有启发性,二是学生的“学习”需要面向任务目标,具有实用性。教学改革不仅要求教与学双向而行,二者兼顾,同步创新,而且,实施方法须具有较强的可操作性。按照这个要求,本文针对当前信息检索课程中存在的普遍问题,提出了主题案例法的实施思路,分析了主题案例法相比于已有的案例教学法的优势,并深入探讨了主题案例库的构建策略。
1 信息检索课程存在的问题
当前,随着信息环境的巨大变迁、信息技术的飞速发展,信息检索课与信息环境、学生需求存在脱节现象,教学形势不容乐观。具体原因主要有4点。
1.1 教学目标特殊
一般课程的教学目标是帮助学生建立全新的知识体系,教学内容基本上是学生未知的知识,容易体现教学成效。相对而言,信息检索课并不是赋予学生全新的知识,而是在学生现有的知识基础上提高信息检索技能与策略,以帮助他们构建起系统化、个性化的检索思维。以此为目标,信息检索课的教学工作既不能落于俗套,缺乏启发性,又不能过于高冷,显得故弄玄虚,而是需要深入浅出,贴近实际。这要求教学设计与课程体系必须精益求精,能够给予学生新的启发和触动。看似简单的信息检索课,教学工作却并不轻松,这是课程不好上,上不好的深层原因。
1.2 教学内容平淡
目前,信息检索课多属于选修课,而且主要由图书馆老师兼任,他们白天上班,晚上上课,完成工作任务之余,还要应付课程任务。作为课程的主导者——教师们缺乏足够的时间、精力去深入地思考课程设计、创新教学方式,导致教学内容平淡,不仅没有达到教学目标,而且极易招致学生的抵触和反感。原被寄托培育学生信息素养厚望的信息检索课,沦为一门“鸡肋”课程。
1.3 教学设计乏味
信息检索是一门实用的课程,课程价值应体现为实用价值,教学设计应具有启发性。但是,在现实教学中却存在各种背离现象。如逐一讲解各种检索原理和方法相似的数据库,期望通过数据库的展示和理论的堆砌提升课程价值,但实际上对学生而言却是乏味的陈词,难以激发学习兴趣。
1.4 教学进程紧张
信息检索课不仅需要学生充分理解课堂知识点,而且还需要他们学以致用,这个过程不可能在课堂上全部完成,还需要学生课后反刍消化。但是,现在的信息检索课只注重课时内的教学,课时外的自学自省制度没有充分建立起来,致使学生忙于应付短平快的课堂学习,却疏于课后的自省学习。对学生而言,走马观花般的课堂学习不利于知识的内化,更勿论检索思维的培养和娴熟运用。
nlc202309081716
2 主题案例法实施思路
2.1 已有的案例教学法存在的问题和改进方向
2006年,华东理工大学唐永林老师首次提出将案例法引入到信息检索课程中,他认为应有针对性地引导学生运用基本信息检索理论和方法,对案例进行分析与讨论,深化对信息检索理论的理解[2]。此后,不少学者从激发学生学习兴趣的角度详细探讨了如何实施案例教学法[3-6]。虽然成果颇丰,但是,这些研究基本是在原有的课程体系中探讨案例法的实际运用和成效,只能作为对传统教学模式的改良。对此,早在2008年,学者杨光武在回顾信息检索课程的创新教学法时就深刻地指出,传统教学属于三段式教学:基础理论—理论应用—实训练习,现时的案例法只是在理论讲解时通过案例讲解强化学生的理解和记忆,是对传统教学的改良[7]。时至今日,这个问题仍未解决。2015年,常娥在《信息检索课案例教学法思考》中指出,当前的案例教学法圃于传统的信息检索教学理念的束缚,无论是检索案例的设计,还是检索案例的课堂教学,都与过去的上机实践课类似,未能发挥它在帮助学生构建立体检索思维方面的独特作用[8]。
针对当前案例教学法的症结,常娥进一步指出了案例教学法难于深入开展的原因为未形成完备的教学大纲和检索案例库,主要凭教师经验进行教学[9],并提出了解决问题的两个切入点。(1)重新认识案例教学法的地位与作用。应从课程设计的高度,考究以案例为中心的课程编排,用案例融汇知识、用案例联系实际、用案例启迪思维,而不是沿袭传统的课程编排方法,以检索理论和方法为核心,案例从属理论的老套路。(2)构建信息检索课主题案例库。多年来,案例教学法没能有效地深入推广的一个重要原因,是已有的实践研究主要是个人教学经验的总结,大家各说各的问题,没有在统一的框架内展开讨论,导致研究不能向纵深发展。因此,目前急需解决的问题是在总结现有教学经验的基础上,把教案体系、授课思路以主题案例库的形式固化,才能在此基础上进行更深入的探讨。
2.2 主题案例法的设计目标
与已有的案例教学法相比,主题案例法不仅是教学方法,而且是课程体系与学习体系的组织方法,它依托一系列的主题案例支撑起课程的体系结构,学生只要依次完成主题案例学习,就能系统地学习信息检索的全部流程与思维策略。
2.2.1 用案例统领知识
传统的信息检索课程以理论知识为主线串联课程,其弊端是过分强调理论的完备性,而忽视其实用价值,这是导致信息检索课问题百出的深层原因之一。例如,查准率与查全率这对评价检索结果的指标,理论上很完美,但实际上不符合当前的信息检索实务。在信息体量巨大的今天,要找全找准符合检索需求的信息是一件极难实现的事情,而且,通常情况下,检索者根本不需要这两项评价指标,只要能找到需要的信息解决问题即可。主题案例法的首要目标,就是把案例教学提升到课程体系的组织核心位置,以案例为中心融汇知识,从实用的角度重构知识体系,淘汰脱节的知识,留下适用的精华,拓展空缺的主题,永葆课程活力。
2.2.2 用案例启迪思维
传统的信息检索课程重在信息检索工具的利用和信息检索方法的讲解,其弊端是将信息检索局限在信息查找与获取阶段。然而,随着计算机与互联网技术的飞速发展,检索工具的普及度和易用性已有很大提升,再将信息检索课局限在工具讲解和技术分析上实无必要。信息检索课必须走出狭义的信息检索观,从广义的角度组织课程教学。信息检索是提出检索问题—分析检索问题—执行检索—分析整理检索结果—解决问题的过程。在此过程中,工具的使用只是其中一环,更重要的是检索者对问题的分析能力、对检索过程的掌控能力、对检索结果的利用能力,这要求今后的信息检索课必须强调对学生的检索意识和检索思维的培育和锻炼。
意识和思维的养成是一个主观的过程,修为看个人,外力仅起引导作用,绝不可能只通过知识灌输的方式来实现。为此,信息检索课应转变教学方式,重视案例教学的导向作用,针对学生在检索意识和检索思维方面的薄弱环节制定案例。例如,可以设计一些学生会遇到的问题包括如何读好大学?如何输入不会读音的生僻字?虽然这些题目表面上跟信息检索没有关联,但是实际上都可以通过信息检索来解决,而且用到的检索工具极为常用:利用图书馆的书目检索系统找“读大学”的指导书;使用百度搜索生僻字的字形结构就能获得解题线索。通过这些事例,就能让学生深刻地领悟到检索意识的重要性,即仅知道信息检索工具的使用方法并不等于能用好它们,还必须注重培养检索意识,在遇到实际问题时懂得灵活地使用检索工具。
3 主题案例库的构建方案
主题案例法是信息检索课程改革的支点之一,而主题案例库是主题案例法的具体实施方案。主题案例库不仅要发挥案例对理论知识的阐释作用,而且要通过组织主题案例体系串联起课程教学,有效引导学生的学习过程。主题案例库的建设重点不仅在于搜集精彩的个案为课程添姿润色,还在于建立起案例之间的主题关联,形成新的课程体系和学习体系,为教学工作提供新的思路和方向。
3.1 主题案例库的体系结构
传统的信息检索课程以传授检索技能为主,以资源和工具为组织体系,形成了特种文献检索、自科文献检索、社科文献检索、网络信息检索等课程内容。这种课程体系的优点在于对各类检索工具的使用技巧讲解深入,针对性强,但其弊端也显而易见,即在横向拓展检索技能的基础上,对检索过程的纵向构建不足,对学生构建检索思维的引导力不足。
针对传统检索课程体系的不足,现在的检索课程已将重点落在信息检索思维的培育与完善上,强调通过信息检索解决实际问题的能力。代表性课程包括:黄如花教授的《信息检索》MOOC课程[10],以信息检索在解决各类实际问题中的实施方法为线索组织课程内容,彻底颠覆了传统的信息检索课程体系;邓发云老师的国家精品课程教材《信息检索与利用》[11],在理论讲授的基础上,提供了大量的案例、思考训练题、讨论题,重在发挥案例讨论的启发式教学作用,是针对常规课程体系的有效改良;罗昭锋老师的《文献管理与信息分析》课程[12]的微课教学,将传统的课程内容转化为主题化的微课程,针对性、实用性强。业界关于信息检索课程体系的改良和变革,为主题案例库的组织设计提供了重要参考。
nlc202309081716
主题设计对整个主题案例法的实施起到关键的作用。按照信息检索课程的改革方向,应以信息检索思维在解决实际问题中的运用为教学目标。笔者认为,主题的设置必须围绕解决实际问题的需要,以解决问题为原点,依次设置分析检索问题—选择检索工具—构建检索策略(实施初次检索)—筛选检索结果—优化检索策略(实施多次检索)—利用检索结果六大主题,最后为解决问题提供有参考价值的信息结果。这个主题设计符合信息检索的一般流程,具有良好的通用性和实用性,容易学习。每个主题之间联系紧凑,既不冗余繁琐,又不缺乏内涵,主题的知识包容度高、拓展性强,可以根据信息环境和信息技术的发展,建立次级主题,从而保障课程的活力。
3.2 主题案例库的难点与对策
3.2.1 细化案例库的主题结构
主题是案例库的基础框架,主题结构细致深入,案例库才能丰满,课程内容才富有内涵和价值。反之,案例库只会徒有外表,给人故弄玄虚之感,结果适得其反。因此,在六大主题框架内,进一步细化主题结构是构建案例库的重要基础工作。表1列出了案例库的主题结构以及包含的知识点。
3.2.2 选择和分析主题案例
主题案例是案例库的核心要素,选择案例的标准以及分析案例的角度是制定案例时必须考虑的重要问题。首先,案例选择应满足两方面的条件,即普遍性和启发性。普遍性是指案例创设的情景应该是学生熟悉的,甚至是经历过的,这有利于学生理解和认同。启发性是指案例导向应该发人思考,引领学生从新的视角展开思考。其次,案例的分析角度应具有多元性,不仅要从检索技能的角度分析案例,更应该从检索意识、检索思维的角度剖析案例,这更能体现案例教学的优势。在制定案例时,还须注意精选案例,力求短小精悍。
按照上述原则,笔者针对“如何评估检索工具”主题,选用了百度作为案例对象,除了简要分析其原理、优点等学生熟悉的内容外,更重点分析它的局限性,这是学生容易忽视的地方。具体过程如下:通过使用百度检索“大数据”,对前20条结果进行分析,结果发现,百度知道、百度贴吧、百度文库、百度百科等百度旗下产品占据了10条之多。由此引导学生重新评价百度搜索引擎的客观性,并且思考如何避免“百度蒙蔽”现象,以及如何高效地搜索专题资源,让学生直观地意识到会用检索工具不代表能用好检索工具,还要进行科学评价、扬长避短、知贤善用。通过案例教学,引导学生发现自己在检索过程中的短板环节,进而思考应对措施,从而达到补强和完善检索思维的教学效果。
3.2.3 拓展新主题
永葆信息检索课程生命力的关键在于与时俱进。只有紧跟信息环境的变迁和信息技术的发展,切合当前主流趋势,不断拓展课程主题,才能继续扮演好引领者的角色,为学生带来超前的检索思维和先进的检索策略,才能满足学生对课程的期盼与要求。就课程特质而论,信息检索作为一门基于信息传播、信息技术与信息分析的工具课,与外部的信息大环境息息相关,外部变化需要及时地传递和反映到课程建设上。例如,针对当前网络流言猖獗、真假信息难辨的现象,笔者在“筛选检索结果”主题下拓展了二级主题“如何利用信息检索辨别网络信息的真伪”,通过选择和分析各类虚假信息的案例,引导学生建立起甄别虚假信息的5种思维方法,包括否定判断法、来源追踪法、逻辑分析法、人肉搜索法、存疑判伪法。又如,在大数据时代,需要强化对数据进行分析和利用的能力,为此,在“如何提取有价值的信息”的主题下建立“数据可视化分析”主题,讲授基础的数据分析流程和易用的可视化分析工具。
3.3 主题案例库的实现形式及功能拓展
为了适应在线学习的发展,主题案例库采用B/S架构实现,学生通过浏览器即可随时随地地进行课程学习。为了支持包括PC、平板电脑、手机等各种终端的访问需要,主题案例库采用两套页面布局方案,针对PC等大屏设备采用双列的框架式布局,针对手机等小屏设备采用单列的瀑布式布局。显示效果如图1、图2所示。
为了加强主题案例库的功能,可以采用“混搭”的方式,嵌入其他系统的优秀功能模块。例如,Moodle是一个功能成熟的在线学习平台,有丰富且成熟的课程互动功能,包括讨论、评论、提交作业等,只要进行适当的嵌入,就可以作为辅助功能融入到主题案例库中。在保持主题案例库已有组织形式的基础上,利用混搭方式嵌入第三方系统的优秀模块,扩展系统功能,使主题案例库更好地支持MOOC背景下的在线学习。
4 结语
在信息交流空前活跃、各种信息工具普及易用的信息环境下,信息检索观不可局限于获取信息的狭义观念中,必须从广义的层面认识信息检索,即以解决问题为目标的信息检索过程,课程内涵也必须随之从检索技能的传授扩展至检索思维的培育上。本文针对信息检索课存在的普遍问题,以及案例教学法在实施过程中存在的问题,提出了主题案例法的目标与思路,并深入探讨了主题案例库的实施方案。与已有的案例教学法相比,主题案例库的指导思路是以案例体系作为课程体系的组织框架。实施方法是以主题任务组织案例,以案例联结知识。以此为基础的学习过程能更有效地引导学生建立完整的信息检索思维。
参考文献:
[ 1 ] 张怀涛,慎明旭,岳修志,等.文献检索课的发展历程与发展对策[J].大学图书馆学报,2011(3):81-84.
[ 2 ] 唐永林,唐梦斐.文献检索课程的“案例教学法”初探[J].现代情报,2006(3):199-201.
[ 3 ] 罗敏.案例教学在文献检索课程中的应用探讨[J].大学图书馆学报,2007(3):101-103.
[ 4 ] 黄碧云,胡德华,罗爱静,等.信息检索精品课程中应用案例教学法研究[J].图书馆学研究,2007(1):58-60.
[ 5 ] 王敏,嵇绍春.案例教学法在文献检索课程教学中的应用[J].图书馆理论与实践,2013(1):101-102.
[ 6 ] 马建春.案例教学法在信息检索课教学中的应用探讨[J].图书馆研究,2011,41(1):120-122.
[ 7 ] 杨光武.项目课程法在文献检索课教学中的应用[J]. 大学图书馆学报,2008(4):81-84.
[ 8 ] 常娥.信息检索课案例教学法思考[J].图书情报工作,2015(8):54-58.
[10] 黄如花.信息检索[EB/OL].[2015-12-02].http://www.icourse163.org/course/whu-29001#/info.
[11] 邓发云.信息检索与利用[M].北京:科学出版社,2013.
[12] 罗昭锋.文献管理与信息分析[EB/OL].[2015-12-02]. http://mooc.chaoxing.com/course/874584.html.