信息检索相关论文(通用7篇)
出版社网页
网上书店
数字图书馆
图书馆目录
此题回答正确
8.一般而言,CNKI 等商业性数据库通常具有以下哪种(些)检索 功能?
专家检索
二次检索
高级检索
快速检索
此题回答正确
1.想了解对“知识构建”这一术语的解释,可检索:
google scholar
WIKI
CKNI
百度知道
此题回答正确
2.超星公司的读秀学术搜索可用于搜索:
期刊论文
标记为待复查标记为待复查标记为待复查
图书全文
报纸
图书书目
此题回答正确
9.宝钢外部信息资源网可提供以下哪种(些)信息资源及其服务功能? 标记为待复查
网络信息和推荐信息
商业和专题数据库
电子期刊
Email 和RSS 信息推送
此题回答正确
10.以下哪些方法可导致信息检索时检准率的提高?
限定语种
扩大概念
减少年代
增加同义词
此题回答正确 3.以下在科技论文写作的各个阶段中,哪个(些)需要信息检索? 论文撰写
论文选题
论文递交
论文研究
此题回答正确
标记为待复查标记为待复查
10.撰写综述性论文所进行的检索属于以下哪种检索类型?
查准型
查全型
查新型
动态型
此题回答正确 3.“数字理论”在文献中可能的表达形式为digital theory 或theory of digital 或theory of the digital,以下哪种检索策略可一次性检索到全部3 种形式且不致扩大检索范围?
number(2N)theory
number and theory
number * theory
number(2W)theory
此题回答不正确
8.查询宝钢2007 在财富500 强中的排名,属于:
文献检索
全文检索
事实检索
数据检索
此题回答正确
标记为待复查
标记为待复查
关键词:信息,检索,相关特性,效果评价
1.引言
信息检索 (Information Retrieval) , 亦称情报检索、文献检索, 包括信息的存储、组织、表现、查询、存取等各个方面, 其核心为文本信息的索引和检索。它起源于图书馆的参考咨询工作和文摘索引工作, 从19世纪下半叶开始发展, 至20世纪40年代, 索引和检索已成为图书馆独立的使用工具和用户服务项目。从信息检索的历史沿革上看, 信息检索经历了手工 (文献、资料) 检索、计算机 (联机、光盘、网上) 检索到目前信息检索技术发展的新趋势——网络化、智能化检索等多个发展阶段。
20世纪中叶以前, 信息的存储和传播主要是以纸质媒介为载体, 信息检索活动主要围绕相关文献的获取和利用而展开, 因此当时的信息检索也称为“文献检索”。20世纪中叶以后, 社会信息传播与存储载体呈现多元化发展, 人们不再拘泥于纸质载体研究信息检索, 于是开始广泛“情报检索”。英文词汇Information可以概括“情报”与“信息”, 而汉语中“信息”一词较“情报”一词的含义更为宽泛, 因此, 人们越来越倾向于将文献检索和情报检索统称为信息检索。信息检索有着悠久的历史, 随着信息时代的发展, 其重要地位日益突出。如何从浩如烟海的信息中检索出所需信息一直是信息科学的重要研究领域之一。下面我们就信息检索的相关特性及检索效果做一些探讨。
2.信息检索的相关特性
信息检索包括两个层次的涵义:信息的存储和信息的查找。信息的存贮就是将大量无序的文献信息进行搜集、整理、分类, 采用规范的方法有序排列, 编制出各种检索工具或检索系统。信息检索必须先有信息存储, 而信息存储就是为了更快捷地查找有效信息。信息检索则是信息存储的逆向过程, 也就是人们根据特定需求, 运用已有的检索工具, 有序地查询并查找出符合要求的信息。
提问与查询的相关程度成为衡量信息系统有效性 (effectiveness) 的重要指标。情报学家切尔内认为:所谓相关性, 是指信息检索时规定的一篇正文与表示信息提问的另一篇正文的符合程度。国内信息界认为:相关特性表明用户是否认为一文献与一提问吻合。在信息检索领域中广泛存在着信息相关特性的问题。
目前实用性的检索系统基本上都是以系统相关性为基础的, 因此, 信息检索系统的评价也是以评价系统观的相关性为主的。这种情况从早期的Cranfield实验, 一直持续到近些年来的TREC会议, 其中主要评价指标都是以系统观相关性思想为基础的。
然而信息检索中的相关性是一个多维的、动态的概念。Mizzaro曾经用四维模型来解释信息检索中的相关性, 其中, 相关性涉及了信息源、用户、时间和构件四个维度。Saracevic的分层模型中也由低到高将相关性划分为系统或算法相关、主题相关、认知相关、情境相关和动机相关等多个层次。
目前相关性判断的基本方法有:对于相关性程度规定一系列带有一定级差的指标, 组织一定数量的用户人工对相关性进行判断评分, 最后综合评分结果。例如, TREC会议一般将相关性程度定义为高度相关、比较相关、轻微相关和不相关, 然后组织会议参加者或者与数据集有密切关系的人员进行相关性评估测试。TREC会议企业检索的专家检索子项目在2006年及以前都是由所有参与测试的研究者来进行相关性评估, 而在2007年则改由其选择作为数据集的网页所属组织的少数内部人员直接给出相关性评估结果。
早期信息检索研究的数据集规模都非常小, 例如, 著名的Cranfield实验, 其中第二阶段的数据集 (CranfieldII) 只含有1400篇文档, 225个查询。然而, 为了对数据集中每个查询和文档对的相关性都进行评估, 在当时耗费了五位相关专业研究生共计1500个小时的时间。由此可见, 相关性评估是一项既耗时又费力的过程。
如今信息时代信息爆炸增长, 信息检索要处理的数据规模也飞速增长。对于TREC会议数据集, 甚至超过上百万篇文档的数据集而言, 其工作量和成本是难以想象的。20世纪末, 陆续出现了一些针对大规模数据集的相关性判断方法, 这些方法只需对数据集中的小部分文档进行判断, 但能取得相近的效果。问题是现在的相关性评估只要求检出文档集中各文档的相关特性高低程度进行排序, 而对相关性的精确定量问题并未深入探讨。
3.信息检索的有效性评价
衡量系统检索性能指标有:查全率、查准率、漏检率、误检率和响应时间等。其中两个最基本、最经典的指标是查全率 (Recall) 和查准率 (Precision) 。影响查全率和查准率的因素很多, 但都包含在检索系统检索方法和编排质量这两者之中。在检索过程中, 无论如何调整检索策略, 无论如何改进检索系统的质量, 都无法使查全率和查准率同时达到100%, 这就表明了它们的互逆相关性。
Perry和Kent在1957年最早提出查全率和查准率的概念, 查全率和查准率之间的互逆相关性是由英国C.W.Cleverdon领导的Cranfield试验所发现的, Cleverdon在1962年首次将它运用于实际信息检索系统的评价实验 (Cranfield II) 中。也就是说, 在排除了人为因素的情况下, 任何提高查全率的措施都会降低查准率, 反之亦然。究其原因根本不是在检索系统本身, 而是在检索对象——文献, 因为文献所反映的信息与各个学科知识之间的普遍联系, 各种知识之间的相互渗透、相互包容是影响查全率和查准率不能同时达到100%, 而成反比关系的客观因素, 称为“合理影响因素”, 由其造成的误检和漏检称为“合理误检”和“合理漏检”。
虽然长期以来, 查全率和查准率在多方面存在争议, 但它在一定程度上还是可以评价系统性能的。现有检索技术很多, 算法各异, 但其最终目标只有一个, “当相关性看来不能独立作为一个评价指标时, 它就被包含于别的指标, 如查全率 (Recall) 或查准率 (Precision) 当中。”这样, 查全率和查准率就成了评价检索系统的“客观公正”的尺度, 计算这两个指标已经成为行业内评测检索效果的标准。然而尽管查全率和查准率在信息检索效果评价中是非常通用的, 但是它们也有一定局限性。
4.各式检索工具的检索效果
(1) 手工检索工具优点是费用相当低, 院校里一些教师、专家、学者可根据自身的需求有选择地进行订购, 缺点是使用起来较为繁琐, 只能查到线索, 不能马上得到原文。书本检索工具查阅方便, 但会受出版时间等因素的限制, 往往不能反映最新的资料;期刊式检索工具能反映最新资料, 可受到篇幅限制, 不能全面的反映资料历史内容;专业性检索工具具有极强的专指性, 是查找学科方面的专题资料的首选;综合性检索工具能开拓视野和知识面, 现代学科之间的渗透很多, 查阅综合性检索工具有时能得到意想不到的收获。
文献信息检索的方法, 最重要的是关键词选择, 即检索词和检索策略的选择。检索词精确, 不仅可节省时间, 提高检索速度, 而且可提高检索质量, 找到所需数据或文献资料。
(2) 计算机检索工具有联机、光盘、网上三种检索形式, 各有优势。联机检索一般提供的是多种类、科研价值高的大型数据库, 缺点是费用较高, 检索方法较为复杂;光盘检索 (局域网数据库检索) , 使用的是菜单式检索方式, 较容易掌握和使用, 且投资的费用较低;网上检索信息丰富, 但须具备一定的检索知识和经验, 缺点是费用高。
在检索中要注意将专题索引与综合性索引、专业数据库与综合性数据库等配合起来使用。在检索时, 首先明确自己的信息需求, 再选择相应的检索工具, 依次按光盘检索——网上检索——联机检索——手工检索的方式检索, 这样才能保证更好更快的搜索到有效信息。
(3) 网络化信息检索工具。与其他检索工具相比, 更具有强大的使用价值和广泛的应用前景。网络信息检索经过发展, 可以说已经渗透到各个领域, 如Enterprise IR (企业信息检索) 、XML IR (XML文件信息检索) 、Desktop IR (桌面信息检索) 、Information Extraction Distributed IR (分布式信息提取信息检索) 等, 信息检索的对象从相对封闭、稳定一致的独立数据库集中管理信息内容扩展到动态开放、更新快、分布广、管理松散的Web内容。
但网络检索也有其局限性, 如搜索引擎的查全率、查准率不高, 搜索引擎采集数据的速度远远落后于信息资源的增长速度, 现有搜索引擎检索信息的普遍现象是返回的信息及返回重复的信息过多;当前搜索引擎与网络用户的交互性不够, 彼此间缺乏足够的协作, 不能与用户进行足够好的交互来提高有效检索;网络信息标引的准确度不够, 当用户要进行特定的文献检索时, 检索工具经常会在返回大量垃圾信息的同时丢失有用信息, 以至检索出来的数据完全被无用信息所覆盖。以web全文信息检索技术为例来说, 目前的全文检索技术还存在着一些未尽人意的结果。
5.结语
信息时代, 网络搜索成为日常生活的一部分, 成为一种生活态度, 信息检索的用户也由原来的情报专业人员扩展到普通大众, 如管理人员、商务人员、教师学生等各行各业专业人士, 他们对信息检索从效果到方式提出了更高、更多样化的要求。比如教师、专家、学者, 在研究课题时, 需要检索大量的信息, 这时应将几种检索方法综合运用。如中国知网、万方数据资源系统等, 能较好的反映国内的研究成果;EBSCO host-外文期刊全文数据库、WorldSciNet (WSN) 全文电子期刊, 能获得世界上最新研究动态。再按信息需求角度, 对学位论文、期刊论文、图书、标准、专利、科技成果、资料性信息 (事实或数据) 等进行综合性检索。
今后, 信息检索技术将向智能化发展。2009年9月14日, 中国移动总裁王建宙在北京举行的中国通信业发展高层论坛阐述了对于物联网的理解。他表示, 物联网是个大趋势, 物联网蕴藏巨大商机, 中国移动将与各方开放合作。物联网中信息的采集、传输、整理利用就包括信息检索技术, 今后各种智能系统将不断涌现, 例如智能交通、智能商城、智能家居等。信息检索技术如Question Answering (问答系统) 、Multimedia IR (多媒体信息检索) 、Cross Language Retrieval (跨语言检索) 、entity retrieval (实体检索) 等就能在智能系统中发挥重要作用, 智能化信息检索技术将成为信息检索发展的必然趋势, 相信到那时, 信息检索的相关特性和检索效果也会发生一些影响。
参考文献
[1]秦喜艳, 陆伟, 姜捷璞.信息检索中的相关性判断和系统评价述评[J].图书情报知识, 2009, (04) .
[2]成全, 司辉.信息检索相关性评价及其改善策略研究[J].情报杂志, 2008, (02) .
[3]黄丽红.信息检索中“相关性”的探究[J].图书馆学研究, 2006, (02) .
[4]陆小辉.网络信息检索的相关性问题[J].现代情报, 2006, (02) .
[5]高凡.网络信息检索的发展方向[J].情报理论与实践, 2004, (02) .
[6]史田华.网络信息的智能化搜索[J].图书馆杂志, 2002, (03) .
[7]董慧.网络信息资源开发与利用.武汉:武汉大学出版社, 2001.
[8]焦玉英, 符绍宏, 何绍华.信息检索.武汉:武汉大学出版社, 2001.
[9]Peter Bailey, Nick Craswell.Overview of the TREC2007Enterprise Track.In the proceedings of the16th Text REtrieval Conference (TREC2007) .
[关键词] 情报检索系统 用户相关性 灰靶决策 检索系统评价
情报检索系统主要的任务是确定与用户情报需求相关的文献,并按检索结果的用户相關程度进行排序后提供给检索者使用。然而,时常出现检索者在搜索引擎或数据库面前,或者一无所获,或者虽得到成千上万个检索结果,但却与检索需求相去甚远的情况[1]。用户相关性受多种因素的影响,其中有些属于确定的因素,有些属于非确定的因素,因而面对用户某项检索提问所得的一系列检索结果,往往难以做出取舍。本文是解决用户相关性判断问题的系列论文之一,作者曾用灰色聚类决策法及层次分析法对此类问题进行过探讨[2-3],本文作为又一次新的尝试。
1 灰靶决策方法简介
灰靶决策方法能够对不同项目或方案进行识别、选优、分级排序。而且这种排序是综合考虑了被评价单元的各项指标值之后得到的一个等级划分结果。首先在一组决策对象的指标序列中,找出最靠近目标值的标准数据序列,称之为灰靶的靶心。靶心与各决策对象的指标数列构成灰靶,而每一个灰关联差异信息空间中的指标序列与靶心的灰关联度称为靶心接近度。靶心接近度可用来对决策对象进行评估分级[4-5]。在多指标决策中,因为不同的指标通常在决策中具有不同的作用,所以应该在灰靶理论基础上采用加权模式进行处理[6],用加权灰靶原理进行决策的基本步骤如下:
建立方案集A对指标集的效果样本矩阵R,并对其进行无量纲化(初值法或均值法)处理得到矩阵 。
确定标准模式。决策目标分为效果值越大越好的目标、效果值越小越好的目标以及效果值适中为好的目标。当决策目标为效果值越大越好的目标时,取 , ;当决策目标为效果值越小越好的目标时,取 , ;当决策目标为效果值适中为好的目标时,取 (指定值)或 (平均数), 。称 为标准模式,其中i为方案数,n为指标个数。
确定指标权数。通过德尔菲法或层次分析法确定各指标的权重向量 。
利用灰靶变换确定决策矩阵及靶心。对无量纲化后的指标集效果样本矩阵 进行灰靶变换,得灰靶决策矩阵T。变换公式为:
(1)
如果 , 为标准模式,则称 ={1,1,……1}为标准灰靶靶心,简称靶心。
计算靶心距,并决定最优方案。称
(2)
为效果向量 的靶心距。效果向量的靶心距越小,与之对应的方案越满意。反之,效果向量的靶心距越大,与之对应的方案越差。因而可用靶心距来确定最优方案,并对各方案按优劣程度进行排序[1]。
2情报检索系统用户相关性判断的灰靶决策
根据上述用加权灰靶方法进行决策的5个步骤,对情报检索系统用户相关性进行判断。
建立方案集A对指标集的效果样本矩阵。采用文献[2]中网络文献资源评价的三项指标:①内容:准确性、权威性、客观性、可靠性、独特性、新颖性、针对性、范围面和写作水平等。②设计:用户界面的友好性、浏览和检索的难易、信息组织的科学性、页面设计的艺术性和适用性。③运营:信息提供的保障性、可存取性、链接的可达性、设备使用的兼容性及费用的高低等。决策指标可根据要求确定,由于指标项数的多少不影响对决策方法的介绍,为了方便起见,我们不妨把决策指标确定为以上三大项。
设某检索系统就用户的一项检索提问共输出6个检索结果。6个方案对3个决策指标的量化评价值也取文献[2]中的矩阵
由于方案中的指标值均为百分制分值,单位统一,因此可省略无量纲化处理环节,此时 。
对目标而言,方案中的指标值越大越好。所以取 , ,
得标准状态模式序列{86,96,86}。
三项指标的权重仍与文献[2]保持一致,即内容、设计、运营三项指标的权重向量为(0.708,0.138,0.154)(决策指标的权重可根据用户需求确定,使得优选结果更符合用户的特点)。
根据(1)式进行灰靶变换,得出靶心及灰靶矩阵。靶心 ,灰靶矩阵
根据(2)式计算各方案距标准方案的靶心距。对于方案1,靶心距为:
=0.073
类似地,可以计算出其它各方案的靶心距:
由于 < < < < < ,可知,编号为1的检索结果靶心距最小,可以作为相关性最强的检索结果,后边的检索结果按其相关性由强到弱的排序为4,2,3,5,6。
3结语
在上面的实例中,6个检索结果相关性排序与文献[2]基本一致,但结果2,4的顺序发生了变化。究其原因在于文献[2]中在确定白化权函数时人为因素较大,对判断的准确程度产生一定的影响,而灰靶决策方法受主观因素影响较小。但文献[2]中的灰色聚类方法却可将检索结果按相关程度分成几个灰类,例如将检索结果分为相关、部分相关、部分不相关和不相关等灰类,便于从整体上对检索结果进行评价和取舍。在对情报检索系统用户相关性进行评价时,可根据评价要求选用其中一种方法,使评价结果更具有针对性。
本文采用加权灰靶决策方法对情报检索系统用户相关性进行判断,并通过实例说明了该方法是一种科学、方便可行的定量方法。若对多个检索系统的检索结果同时采用加权灰靶决策方法进行比较、判断,例如求各个检索系统检索结果的平均靶心距,并比较它们的大小,则平均靶心距越小,检索系统的检索效果越好,这样便可对不同的检索系统进行选择和评价。
参考文献:
[1] 孙铭蔚,马海群.基于加权灰靶决策理论的信息政策方案选优.情报理论与实践,2010(7):101-103.
[2] 王筠.情报检索系统用户相关性判断的灰色聚类决策.中国图书馆学报,2004(1):94-96.
[3] 王筠.情报检索系统用户相关性判断的层次分析模型.情报学报,2005(3):341-345.
[4] 邓聚龙.灰理论基础.武汉:华中科技大学出版社,2002:171-182.
[5] 刘思峰,郭天榜,党耀国,等.灰色系统理论基础及其应用.北京:科学出版社,1999:175-179.
[6] 党耀国.多指标加权灰靶的决策模型.决策参考,2004(4):24-26.
[作者简介] 王筠,女,1958年生,教授,发表论文30余篇。
一、基本说明
1模块:高中信息技术基础
2年级:高中一年级
3所用教材版本:上海科技教育出版社
4所属的章节:第二章第三节
5学时数:45分钟(机房授课)
二、教学设计
1、教学目标:了解网络信息检索的几种常用方法;掌握利用搜索引擎获取网络信息的策略与技巧;能够根据问题确定信息的需求与,并选择适当的方法获取信息。
2、内容分析:本课是《信息技术基础》(必修)第二章第三节的内容,旨在培养和提升学生获取网络信息的能力,使其成为每位学生在信息社会必须掌握的生存技能,并为学生学会有效组织和处理信息奠定基础,是学生继续学习和不断发展的不竭动力。本节强调通过体验和感悟网络信息活动中的操作与应用,培养学生掌握利用网络获取信息的过程和方法,为学生的学习、生活和发展提供服务。另外,本节还注意引导学生形成自主学习意识、与他人合作意识,也为必修模块的其他章节和各选修模块开展多元化交流与合作奠定基础。
3、学情分析:学生已有使用网络检索信息的感性经验,老师要结合学生原有的认知基础加以归纳提升,使学生形成多网络信息检索的理性认识,并在实践中不断总结积累自己利用网络检索信息的经验,不断提高自己的网络信息检索水平。但是学生之间的差异比较大,老师要注意营造交流学习的氛围。
4、设计思路:由问题“你知道有关中秋节的传说故事吗?”引出利用网络获取信息的学习任务,在学生交流探究并实践的基础上,让先查到的同学汇报自己的检索结果和所使用的方法,带动全班同学的学习积极性和学习兴趣,一起参与到课堂教学中来,师生一起用探究学习和交流学习的方式总结出常用网络信息搜索的方法。
在此基础上进一步引导学生学习常用信息检索方法——关键词查询法,掌握关键词的提炼和组合,然后通过抢答比赛让学生去体会和总结网络信息检索的策略与技巧。
中国的传统节日形式多样,内容丰富,是我们中华民族悠久历史文化的一个组成部分。最后让学生综合运用本节所掌握的网络信息检索策略与技巧全面了解中国重大传统节日的相关文化,以此来增进学生对传统文化的了解和继承。
三、教学过程
教学环节及时间
教师活动
学生活动
对学生学习过程的观察和考查及设计意图
创设情境问题引入
3’
播放不到一分钟的中秋送月饼的flash动画片,然后引出话题:农历八月十五日,是我国传统的中秋节,也是我国仅次于春节的第二大传统节日。那么你知道中秋节有哪些传说故事吗?
学生回答
激发学生兴趣,让学生很快进入信息技术的课堂氛围。
课程实施
37’
试
一
试
5’
组成员之间交流探讨,试一试如何利用因特网查询中秋节的传说故事?
老师巡回
老师带领大家总结出常用的网络信息检索方法:
1、目录检索
2、关键词查询
、学生小组探索。
2、先查到的同学汇报自己的检索结果和所使用的方法
根据学生的探索了解学生已有的网络信息检索水平
想
一
想
7’
以上两类信息搜索方法中我们平时用的最多的是哪一类方法?你知道为什么吗?这两种信息检索法有什么区别?
在学生归纳的基础上,老师总结出两种信息检索方法的特点:
查询方式
比较项目
分类检索服务网站
关键词查询服务网站
实现方式
分类目录
搜索引擎
操作方式
层层点击
输入关键词
优点
得到比较系统的信息
得到具体的信息
缺点
难以准确找到具体信息
不适合找到系统的信息
、学生回答。
2、学生归纳比较两种信息检索方法。
培养学生归纳总结能力。
赛
一
赛
9’
老师读完题目后,小组成员分别利用不同的网络信息检索方法查询问题答案,先查到的,举手示意,经老师同意后汇报自己的查询结果。
答对者,给所在小组加十分,抢答答错者(包括抢答不遵守规则者)扣十分,其他小组继续抢答。整个比赛结束时得分最高组为优胜组。
学生检索问题答案进行抢答。、结合活动开展,巩固信息检索方法的使用,利于学生掌握新知。
2、通过分组活动培养学生的团结协作精神。
想
一
想
7’
小组成员之间交流比赛过程中自己利用网络搜索信息的体会,想一想如何才能使用搜索引擎准确快速地找到自己需要的信息,并推举小组代表总结发言。
师生共同总结出搜索引擎的使用技巧:
1、关键词的选择最重要。
(1)提炼关键词
(2)组合关键词
用布尔运算符组合关键词:
AND或“+”、空格
oR或“|”
NoT或“-”
2、不要局限于一个搜索引擎。
3、强制检索的方法——加英文双引号。如查询谚语“raincatsanddogs”的汉语意思。加英文双引号可大大提高搜索的速度和准确率。
、小组交流。
2、推举代表总结。、培养学生探究学习的能力。
2、培养学生归纳总结能力。
练
一
练
9’
背景:
保护好属于中华民族的传统节日,是我们的一种责任!在我国已经延续了几千年的传统民间节日端午节,却于XX年被韩国抢先申报为该国文化遗产。在各种洋节日益盛行的今天,端午节等传统节日日渐式微。
中国的传统节日形式多样,内容丰富,是我们中华民族悠久历史文化的一个组成部分。
请结合小组抽到的信息检索题目,查查相关中国传统节日的来历、习俗、传说、诗词并与同学交流。
请推举小组代表介绍:
小组查询的是关于中国哪个传统节日的内容?
具体查询方法是:
查询结果如何?
学生根据抽到的题目进行信息检索。
通过该环节对中国各传统节日相关文化的搜索,来加强学生对民族文化的认识和继承,树立起对民族文化的珍惜与爱护之情。
拓展
1’
不管是从因特网获取信息还是从其他途径获取信息,必须保证获取信息的途径和方法是合法的,严禁不合法的信息获取行为——偷窃国家或单位机密信息;运用偷拍、窃听等手段侵犯他人隐私;使用威胁或黑客入侵手段等。
使学生知道在使用网络的过程中,应该遵纪守法,自觉抵制不良信息,负责任的参与信息实践,养成良好的网络道德行为和习惯。
总结
4’
让学生谈本节课的收获,老师补充。
学生一起回答
回顾本课,对所学作总结,学生再回忆一遍,加深印象
四、教学反思
采取这种主题活动式教学,对教师的要求更高。要想组织好一堂课,教师必须精心设计课堂,把活动安排得更细致,并要考虑周全。最重要的是要引起学生的极大兴趣,这就需要教师有非常好的引导,并在过程中给予学生帮助与指导。要有随机应变、驾驭课堂的能力,能调动气氛。当要各小组讨论时,要能及时调动学生积极参与,教师巡视时发现学生的闪光点及时进行肯定与表扬,进而带动整个课堂的气氛。课堂设定的评价机制要明确,活动要达成的目标要明确。
任课教师:刘存杰
学院学号姓名:土木工程学院
12014084329 王旭星
学生E-Mail:316703042@qq.com
导师姓名及E-Mail:刘存杰
lcjlib@nuaa.edu.cn
作业时间:2016年10月
一、检索课题确定(要求课题名称具体,宁可选择小题大做。如果在主题词查找后,决定修正课题名称,请说明,并写出课题名称。)
检索课题的名称确定为:大体积预应力混凝土的温控技术。Subject for retrieval:Temperature control technology of large volume prestressedconcrete.二、写出检索课题的研究背景和研究目的。
研究目的、必要性和重要性、意义:
桥梁施工建设中,为推动施工顺利进行,不仅要合理安排施工工序,促进工程建设质量提高。同时还要加强温度应力控制,尤其是大体积预应力混凝土温度应力的控制,在施工现场对出现的裂缝及时处理。从而保证桥梁工程结构的外形美观,减少养护维修的工作量,进 而实现对工程质量的有效控制,推动桥梁工程建设质量和效益提高。
桥梁施工建设中,往往需要进行大体积预应力混凝土施工。由于其体积较大,内外温差大,如果忽视采取有效的温度控制技术,容易导致裂缝出现,给整个桥梁施工建设带来不利影响。为有效弥补这种问题与缺陷,应该综合采取有效的温控技术措施,尽量缩小大体积混 凝土内部和外部的温差,确保工程质量。
三、选择检索主题词,请将选择的过程详细描述,并将最后选择的所有中文主题词写出来。(要求包括同行认可的同义词、近义词及可能的各种变化)我们一般定义文献主题为:“概括文献中关于某一事物的情报内容的概念。”即为文献的中心内容而文献主题词就是在标引和检索中用以表达文献主题的规范化的词或词组。根据选择主题词的三个原则:实用性原则;准确性原则;通用性原则;来选择本次检索主题词。首先我们选择“大体积预应力混凝土”为主题词进行检索,发现检索的结果符合我们的要求,然后添加“温控技术”主题词进行检索发现检索结果依然正确,进一步添加“裂缝处理、水化热、混凝土收缩”为主题词,通过不同的组合来进行检索,得到符合要求的检索结果。
检索的主题词的英文为:大体积预应力混凝土(large volume of prestressed concrete),温控技术(temperature control technology),裂缝处理(crack treatment),水化热(heat of hydration),混凝土收缩(concrete shrinkage)。
四、数据库选择,请写出你所选择的数据库名称(CNKI)。(要求尽量全而准)
在检索的过程中选用的数据库有: 万方数据;
Ei Village 工程索引; Elsevier 综合类学术期刊; IEEE-Wiley eBooks Library; IEEE/IET Electronic Library(IEL); 中国学术期刊网(CNKI); 维普中文科技期刊。
五、选择1个中文数据库检索平台(CNKI)实际进行检索。并将检索策略写出来。(要求逻辑运算符、位置算符、截词算符使用正确)
利用中国学术期刊网(CNKI)进行实际检索:
利用NUAA图书馆主页中文电子资源——中国学术期刊网(CNKI)进行文献检索。首先,根据本次的检索课题《大体积预应力混凝土的温控技术》,在高级检索中输入主题词:“大体积预应力混凝土”,可以得到大体积预应力混凝土有关的文献,通过查阅这些文献了解预应力混凝土定义、研究现状、应用等相关的文献。
然后进一步选用“温控技术”(主题)、“裂缝处理”(主题)、“水化热”(主题)、“混凝土收缩”(主题)四者关系为“并含”(and),可以得到相的大体积预应力混凝土温控技术的文献,通过阅读,来了解大体积预应力混凝土裂缝产生的情况以及温控技术对裂缝的影响。其中具有代表性的文献:张锐敏.大体积预应力混凝土温控技术[J/OL].交通世界(建养,机械),2016(13).检索到得文献的摘要为:结合桥梁施工建设基本情况,就大体积预应力混凝土温控技术进行探讨分析,同时还提出了温度裂缝的处理技术措施,为日后相关工作提供借鉴。试验发现,摘要:结合桥梁施工建设基本情况,就大体积预应力混凝土温控技术进行探讨分析,同时还提出了温度裂缝的处理技术措施,为日后相关工作提供借鉴。
检索到的文献与本次检索主题相当吻合,可以通过对文献的阅读来掌握该项研究的大体思路。然后再通过添加主题词包括:“水化热”、“裂缝处理”等来对相关文献进行检索,找到与检索主题相关的文献进行阅读。
六、使用2个搜索引擎进行查找,写出查找所用的检索策略。(要求尽可能使用高级检索界面,查找结果准确)
在检索过程中使用了:百度学术搜索以及搜狗学术搜索服务来进行检索。
百度学术搜索:利用百度学术搜索可以直接搜索我们已经知道题名的文献,如图所示:
检索结果如图所示,可以看出检索出来的结果和检索主题很符合:
搜狗学术搜索:利用搜狗学术搜索可以直接搜索我们已经知道题名的文献,如图所示:
检索结果如图所示,可以看出检索出来的结果和检索主题很符合:
七、整理检索结果,找出相关文献,并列出相关文献的三个基本字段:TITLE(篇名)、AUTHOR(作者)、SOURCE(出处)。(要求著录正确)
文献中的引文的汇总:
[1]张锐敏.大体积预应力混凝土温控技术[J].交通世界(建养.机械),2016,13:88-89.[2]张锐敏.大体积预应力混凝土温控技术[J].交通世界,2016,13:88-89.[3]叶再军.大体积预应力混凝土温控技术研究[J].交通科技,2015,04:1-3.[4]刘家彬,郭正兴 ,韦世国 ,赵有明 ,刘加平.润扬长江大桥南锚碇超大体积混凝土温控技术[J].建筑技术,2003,01:41-43.[5]张连春.小云峰大坝大体积混凝土温控技术研究[D].哈尔滨工程大学,2010.[6]苏骏,田乐松.大体积混凝土温控技术及热工计算[J].安徽理工大学学报(自然科学版),2010,02:5-7.[7]周建林.苏通大桥北塔承台大体积混凝土温控技术[J].现代交通技术,2007,05:31-35.[8]伍波.厦漳跨海大桥大体积混凝土温控技术[J].施工技术,2015,18:1-4.[9]施召云,武晓杰.大体积混凝土温控技术研究[J].云南水力发电,2011,01:67-68+105.[10]陈卫国,屠柳青,刘可心,孙同兴,刘鸿.舟山西堠门大桥南锚碇大体积混凝土温控技术[J].公路,2006,06:112-116.[11]刘杰,赵超.缺水山区大体积混凝土温控技术[J].中外公路,2015,03:188-191.[12]沈卢明,王忠海.西藏通麦特大桥锚碇无降温管大体积混凝土温控技术应用[J].公路交通技术,2015,03:69-73.[13]袁建平.马新大桥主塔承台大体积高标号混凝土温控技术研究[J].城市道桥与防洪,2011,08:224-227+255+10.[14]文亚军,尹红星.矮寨大桥大体积混凝土温控技术[J].企业技术开发,2010,09:19-21.[15]于金琪.大体积混凝土温控技术在西固黄河大桥施工中的应用与分析[J].公路交通科技(应用技术版),2016,05:282-285.[16]邝青梅,刘朝军.承台高标号大体积混凝土温控技术[J].广东公路交通,2016,04:65-69.[17]阮有力.悬索桥锚碇大体积混凝土温控技术研究[J].低温建筑技术,2008,04:153-154.[18]罗志唐,丘必学.大体积混凝土温控技术在梅州市清凉山水库扩建工程中的应用[J].广东水利水电,2012,06:52-54.[19]刘大荣.大体积混凝土温控技术应用实例[J].广东建材,2008,09:76-78.[20]王立新,霍燚.青兰渡槽大体积混凝土温控技术研究[J].小水电,2015,01:58-63.八、对2篇中文相关文献的全文进行查找,写出这2篇全文查找的过程,并注明网络地址。(要求查找思路正确)
全文检索的基本原理
非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。对非结构化数据的搜索:全文检索。全文检索大体分两个过程,索引创建(Indexing)和搜索索引(Search)。1.索引创建:将现实世界中所有的结构化和非结构化数据提取信息,创建索引的过程。2.搜索索引:就是得到用户的查询,请求搜索创建的索引然后返回结果的过程。
实现全文检索功能
1、对数据库内容进行检索。通过程序读取数据库内容并生成检索对象,通过全文检索引擎处理检索对象。
2、针对XLS格式数据,调用poi组件读取纯文本数据,调用全文检索引擎处理检索对象。
3、针对DOC格式数据,调用poi组件读取纯文本数据,调用全文检索引擎处理检索对象
4、针对PPT格式数据,调用poi组件读取纯文本数据,调用全文检索引擎处理检索对象。
5、针对PDF格式数据,调用PDFBOX组件读取纯文本数据,调用全文检索引擎处理检索对象。
进行全文检索的核心索引包括如下内容: title,authors,journal,year,volume,issue,pages,abstract,keywords,url等。现在特选取文献文献第一篇:张锐敏.大体积预应力混凝土温控技术[J].交通世界(建养.机械),2016,13:88-89.第二篇:叶再军.大体积预应力混凝土温控技术研究[J].交通科技,2015,04:1-3.进行全文检索,首先,生成全文检索的索引,对于第一篇所要检索的文献
文献一:DataType: 1 Title-题名: 大体积预应力混凝土温控技术 Author-作者: 张锐敏
Source-刊名: 交通世界(建养.机械)Year-年: 2016 PubTime-出版时间: 2016-5
Keyword-关键词: 大体积预应力混凝土;温控技术;桥梁施工;裂缝处理
Summary-摘要: 结合桥梁施工建设基本情况,就大体积预应力混凝土温控技术进行探讨分析,同时还提出了温度裂缝的处理技术措施,为日后相关工作提供借鉴。Period-期: 13 SrcDatabase-来源数据库: 期刊
Organ-机构: 中建路桥集团有限公司,河北,石家庄050000 网址http:///?mod=home&id=256 主管单位:中华人民共和国交通运输 期刊信息:《交通世界》创刊于1994年,由中华人民共和国交通运输部主管,交通运输部科学研究院主办,《交通世界》杂志社出版,面向国内外公开发行的中央级科技期刊,其凭借丰富的内容、精致的印刷,成为中国交通系统影响力最大的主流媒体之一。《交通世界》应广大读者和客户的要求,从2007年第1期开始改为半月刊,以“建养·机械”和“运输·车辆”为主题,每月分上册和下册出版,有针对性地发行,使杂志受众对象更明确,既方便读者查询自己感兴趣的资讯,又利于广告客户准确传递企业及产品信息。邮发代号:82-943。
期刊栏目:
1)《交通世界(建养·机械)》栏目:
行业资讯——国内外最新行业资讯和工程情报,交通建设、工程机械等最新成果展示
专题报道——行业主管的专题访问、重点峰会、大型展会报道;知名企业的经理人访谈
重大项目——国家重点交通建设项目采访报道
机械广场——工程机械市场分析、最新产品、施工技术、工艺推荐
现代公路——公路规划、设计、施工、管理
养护天地——公路、市政养护设备、施工工艺介绍
沥青技术——沥青混凝土的技术发展及应用
桥梁隧道——桥梁和隧道的设计、施工、养护、监管
交通统计——交通建设投资、机械产品销售等分析预测 关注用户——使用工程建设、养护设备的用户访谈
2)《交通世界(运输·车辆)》栏目:
行业资讯——国内外最新行业资讯,物流、运输、汽车、智能交通等最新科技成果展示
专题报道——行业主管的专题访问、重点峰会、大型展会报道;知名企业的经理人访谈
精英访谈——重点商用汽车企业领导、大型物流运输集团老总、业内知名专家采访
卡车看台——各种卡车、牵引车、挂车、工程车及特种车市场分析和车型报道
客车视点——各种大客车、公交巴士、长途汽车及商务车市场分析和车型报道
动力总成——各类发动机、变速箱及传动系统的新产品和节能减排技术、新能源技术
物流货运——最新的物流运营技术、方案分析、运输安全
城市交通——城市公共交通规划方案、交通工具、营运管理
绿色交通——世界商用汽车排放标准、法规介绍及应用解决方案
交通统计——我国客运、货运量和商用汽车销售数据统计、分析及预测
关注用户——运输企业及商用汽车的用户访谈
•读者对象:《交通世界(建养·机械)》受众为全国交通厅(局)、公路局、高管局、港口航道、工程机械、建设施工、市政养护等行业各级领导、企业经理人和专家学者以及各国驻华使馆商务处负责人。《交通世界(运输·车辆)》受众为交通局、公路局、高管局、城乡客运、物流运输、商用汽车、发动机及配套件等行业各级领导、企业经理人和专家学者。
No2 中国土木工程网
网址:http:/// 网站简介
土木工程网于2011年5月2日正式开通与大家见面,是一个纯学术类的技术交流网站,提供土木工程专业资料免费下载,包括了图集、施工资料、图纸、软件、规范、监理、设计、技术交流、论文等资源的下载。
网站文化
土木工程网自成立来本着“自由开放,资源共享”的原则为土木工程从业者提供一个良好的技术交流平台,土木工程网锁定的用户群体以20-50岁社会高知主流人群,这个群体的特征是中高消费、高学历、高感度(指信息的整合能力和对新事物的接受能力强)。共享资源丰富。
发展方向
土木工程网旨在发展成为土木工程专业最火的资源交流网站,为用户永久的提供免费的土木工程专业资源,为每一个土木工程师创造一个良好的技术交流平台,网站栏目
基于内容的图像检索CBIR (Content Based Image Retrieval) 是指利用图像的视觉内容, 如颜色、纹理、形状、空间布局、语义等, 从大量图片数据库中搜索用户感兴趣的图片。由于CBIR系统给出的初始检索结果往往不能很好地满足用户的需求, 为此, 人们将相关反馈RF (Relevance Feedback) 技术应用到图像检索领域[1]。文献[2]假设特征分量间相互独立, 用所有正例样本在各个特征分量上取值标准差的倒数作为该分量的权值, 从而动态地调整特征分量的权重, 算法依赖于正例样本且样本数越多, 反馈效果越好, 如果全部是负样本或只有一个正例样本, 权重将不会被调整;文献[3, 4]把反馈回的相关和不相关图像看成两类问题, 通过建立SVM分类模型, 来分类图像库中的图像, 但如果只有相关图像或只有不相关图像, 将无法建立SVM分类模型;文献[5, 6]把粒子群优化算法应用到图像检索相关反馈中, 文献[5]把用户反馈回的所有相关图像的平均位置作为全局最优位置, 指导粒子的运动方向, 最终把全局最优位置附近的图像反馈给用户, 其算法的本质是查询点移动, 并且最优查询点已经知道, 文献[6]用粒子群优化算法动态调整图像特征分量权重, 使目标图像与相关图像相似性变大, 与不相关图像相似性变小, 但由于特征向量维数巨大, 计算出的最优权重空间泛化能力差, 并且群优化算法的时间复杂度高;文献[7-9]通过用户和产品的二部图表示建立资源分配矩阵, 并成功应用到推荐系统中, 图像检索中的相关反馈过程也可以看作一种用户查询偏好的建立, 图像看作一种资源, 因此本文提出了一种基于网络结构的图像检索相关反馈算法, 首先对图像进行颜色、纹理、形状的特征提取, 用底层特征进行相似比较, 返回初始查询结果, 在反馈阶段, 动态构造用户反馈矢量, 用离线建立好的图像之间的资源分配矩阵乘以用户反馈矢量, 实现资源的扩散, 最终重排图像, 实验结果表明, 算法能够有效地提高检索性能。
1 图像底层特征提取
颜色直方图是对图像中的像素按照颜色在不同的量化区间的分布数量的统计, 描述不同色彩在整幅图像中所占的比例, 其具体提取方法为:
(1) 将原始图像从RGB空间转换到HSV空间;
(2) 如果直接用HSV空间的颜色直方图来描述整幅图像;计算量将非常巨大, 因此需要对HSV空间进行量化[10], 量化比例为16 (色调) ∶4 (饱和度) ∶4 (亮度) ;
(3) 统计不同量化区间的颜色数量, 整幅图像的颜色直方图信息表示成1×256维的特征向量f1。
边缘方向直方图特征提取是在边缘检测理论基础上提出的, 该方法首先剥离出原始图像的边缘, 计算出每个边缘点的方向, 然后统计每个方向上的边缘点数目构成边缘方向直方图, 以此作为图像的形状特征, 其具体提取方法为:
(1) 将原始RGB图像转化为灰度图像;
(2) 用Sobel边缘算子[11]对图像进行边缘检测;
(3) 计算每个边缘点的方向, 分别统计方向在[0°, 90°) 、[90°, 180°) 、[180°, 270°) 、[270°, 360°) 区间内的边缘点个数, 整幅图像的边缘方向直方图信息表示成1×4维的特征向量f2。
灰度共生矩阵从数学角度研究了图像纹理中灰度的空间依赖关系, 根据图像像素间的方位和距离关系构造共生矩阵, 然后从共生矩阵中提取有意义的统计量作为纹理特征的描述, 其具体提取方法为:
(1) 将原始RGB图像转化为灰度图像;
(2) 分别计算灰度图像4个方向上 (0°、45°、90°、135°) 的灰度共生矩阵, 并提取每个共生矩阵的对比度、相关性、能量、同质性4个统计量;
(3) 计算每个统计量的均值和方差, 组成1×8维的纹理特征向量f3。
利用文献[2]的方法, 分别规格化特征向量f1、f2、f3的特征分量取值到[0, 1]区间, 最终图像j的底层特征表示为1×268维的向量fj=[f1, f2, f3]=[a1j, a2j, …, a268j]。
2 基于网络结构的相关反馈
2.1 资源分配矩阵的建立
假设特征分量个数为m和图像总数为n, 每幅图像的底层特征已由第1节的方法获得, 在推荐系统中, 通过用户和产品的二部图表示, 利用式 (1) 建立资源分配矩阵:
而我们现在已经拥有了m个特征分量和n张图像的二部图, 所不同的是图像j和特征分量i之间的连接aij (i=1, 2, …, m;j=1, 2, …, n) , 表示图像j在特征分量i上的取值, 有别于推荐系统中的1 (选择过) 或者0 (没有选择过) , 由于此时aij的取值区间为[0, 1], 为了更好地反映出资源j与资源i之间的相似性, 需要考虑特征分量取值之间的差异, 差异越大, 相似性越小, 定义如下:
利用式 (2) 建立图像之间的资源分配矩阵W, 其中kj表示图像j的特征向量的所有特征分量取值之和, kl表示所有图像的特征向量在特征分量l上的取值之和, 资源分配矩阵的每一项wij表示图像j愿意分配多少资源给图像i, 通常拥有资源的图像会把更多的资源交给自己更青睐的图像, 因此图像j和图像i越相似, 则wij越大。
2.2 用户反馈矢量的表示
在推荐系统中, 构造n维的0/1矢量代表个体的初始资源分配, 在图像检索相关反馈过程中, 用户标记的相关和不相关图像可以看作一种查询偏好, 为了充分利用用户反馈信息和快速获取用户需求, 相关资源 (相关图像) 和不相关资源 (不相关图像) 需要同时传递, 共同作用, 定义反馈矢量f=[f1, f2, …, fn]T, 没有反馈前, fi=0, i=1, 2, …, n, 每次反馈得到相关和不相关图像, 如果图像i相关, 则fi=pi;若图像i不相关, fi=ni, 其中pi代表正激励, 是一个正的可调参数, ni代表负激励, 是一个负的可调参数, pi和ni通过实验获得。通过计算矢量R=W×f实现图像资源的扩散和重排, 由于反馈矢量f中的相关图像和不相关图像倾向于把资源传递给与自己相似的图像, 所以R中的值越大, 说明和相关图像越相似, 越应该反馈给用户。
2.3 改进资源分配矩阵
假设用户检索目标是包含特征分量f1和特征分量f2的图像, 通过反馈得到用户标记的相关图像P1和P2, 其中P1包含特征分量f1, P2包含特征分量f2, 如果图像库中有图像P3同时包含特征分量f1和f2, 则图像P1和P2都对图像P3产生资源分配, 总强度为2 (P1和P3因为f1关联, P2和P3因为f2关联, 关联强度假设都是1) 。考虑另一种情况, 用户标记的相关图像P4和P5都包含特征分量f1, 但不包含特征分量f2, 如果图像库中有图像P6也包含特征分量f1, 且不含特征分量f2, 则图像P4和P5也对图像P6产生资源分配, 总强度也是2。虽然强度一样, 但用户更加喜欢P3排在P6的前面, 因为P3既包含特征分量f1, 又包含特征分量f2;而P6只包含特征分量f1, 很显然, 来自图像P4和P5的资源分配包含重复属性特征分量f1, 如果两个图像资源在对另一个图像分配资源时包含了重复的属性, 则这个属性就会导致它们的自身关联, 为了降低这种重复属性的影响, 可以考虑图像之间的二阶关联, 由于P4和P5自身具有较强的关联, 所以从P4经由P5到P6和从P5经由P4到P6的二阶关联应该比较强, 而P1和P2自身具有较弱的关联, 从P1经由P2到P3和从P2经由P1到P3的二阶关联应该比较弱, 从原来的资源分配矩阵中适当减去二阶关联, 将提高反馈中的重排效果, 定义改进后的资源分配矩阵W'为:
其中a是一个正的可调参数, 通过实验获得。
2.4 具体算法步骤
离线阶段:
(1) 对图像库的每幅图像进行颜色、纹理、形状的特征提取, 组成268维的特征向量;
(2) 建立资源分配矩阵W和W';
算法1:
在线阶段:
(1) 对查询图像进行底层特征提取;
(2) 查询图像同图像库中所有图像进行特征相似比较, 返回初始检索结果;
(3) 相关反馈阶段。
算法2:
3 实验及结果分析
3.1 测评平台
实验用MATLAB 7.0编写的仿真程序, Windows XP操作系统, Intel (R) Core (TM) 2 Duo CPU E8400@3.00GHz处理器, 2GB内存的PC机。
3.2 实验准备
选取Corel标准图片库进行实验, 图片库共包含1 000幅图片, 分为10个类别:Africa、beaches、monuments、busses、dinosaurs、elephants、flowers、horses、mountain、cookie/food, 每个类别均包含100幅图片。
反馈过程中, 只对前20幅图像标记相关和不相关, 作为反馈学习样本, 数据的获得是通过计算每一幅图像的检索精度, 最后1 000幅图像求平均。
3.3 评价指标
图像的查准率是指在一次查询过程中, 系统返回的相关图像数目占所有返回图像数目的比例, 查全率则指系统返回的查询结果中相关图像数目占图像库中所有相关图像数目的比例。
3.4 实验结果
图1给出了正激励pi取不同值时的检索精度对比, 实验过程中, 负激励ni固定为-1, 由图可知, 当pi=2, 检索精度最高, 因此固定正激励和负激励分别为2和-1。
图2给出了参数a取不同值时的检索精度对比, 由图可知, 当a=0.25时, 检索精度最高, 因此固定可调参数a为0.25。
为了验证本文方法的有效性, 基于网络结构的方法 (NS) 同传统的图像检索相关反馈方法[2] (RUI) , 和基于SVM的相关反馈方法[3] (SVM) 进行了比较, 把改进资源分配矩阵的算法称为NS-2, 表1为不同方法top20检索精度对比, R0表示初始检索, R1-R5分别表示第1~5次反馈, 随着反馈次数的增加, RUI和SVM的反馈效果都不明显, 检索精度增长缓慢, 而本文算法, 检索精度增长快。
表2是反馈2次后不同方法在查全率分别为0.2、0.4、0.6、0.8、1.0时, 对应的查准率, 基于网络结构的算法在每个查全率下, 查准率都高于RUI、SVM, NS-2方法由于适当减小了重复属性的影响, 检索效果优于NS, 验证了2.3节提出的改进算法的有效性。
3.5 实验分析
通过以上实验发现, 基于网络结构的相关反馈算法不仅简单, 而且反馈效果出色, 其主要优点有: (1) 具有很强的鲁棒性, 用户反馈回的图像不管是只有相关图像, 或者只有不相关图像, 下次反馈都能继续进行; (2) 反馈效率高, 时间复杂度低, 算法的大部分工作是离线进行的 (建立资源分配矩阵) , 在线阶段, 只需要完成简单的矩阵乘法运算, 就可以实现图像重排; (3) 用户查询偏好简单有效地表达, 反馈是一种递增形式, 用户多次反馈后, 反馈信息不断累积, 反馈矢量包含越来越多的相关和不相关图像激励, 检索效果越来越好。
4 结语
本文利用用户标记的相关和不相关图像动态构造反馈矢量, 把反馈矢量看作用户的查询偏好, 用事先在特征空间建立好的图像之间的资源分配矩阵乘以反馈矢量, 得到重新排序后的图像。通过对1000幅图像的实验表明, 反馈后, 查准率和查全率都提高了, 而且随着标记的相关和不相关图像增多, 检索效果越来越好。
参考文献
[1]吴洪, 卢汉青, 马颂德.基于内容图像检索中相关反馈技术的回顾[J].计算机学报, 2005, 28 (12) :1969-1979.
[2]Rui Y, Hhang T S, Ortega M, et al.Relevance feedback:a power tool in interactive content-based image retrieval[J].IEEE Transactions on Circuits and Systems for Video Technology, 1998, 8 (5) :644-655.
[3]张磊, 林福宗, 张钹.基于支持向量机的相关反馈图像检索算法[J].清华大学学报, 2002, 42 (1) :81-83.
[4]周新虹, 彭玉华, 刘勇, 等.基于多尺度分析和SVM相关反馈的纹理图像检索[J].山东大学学报, 2008, 38 (2) :2-6.
[5]许相莉, 张利彪, 刘向东, 等.基于粒子群的图像检索相关反馈算法[J].电子学报, 2010, 38 (8) :1936-1940.
[6]唐朝霞, 章慧, 徐冬梅.一种改进的粒子群算法和相关反馈的图像检索[J].计算机科学, 2011, 38 (10) :278-280.
[7]Zhou T, Ren J, Medo M, et al.Bipartite network projection and personal recommendation[J].Physical Review E, 2007, 76:046115.
[8]Zhou T, Jiang L L, Su R Q, et al.Effect of initial configuration on network-based recommendation[J].Europhysics Letters, 2008, 81:58004.
[9]Zhou T, Su R Q, Liu R R, et al.Ultra accurate personal recommendation via eliminating redundant correlations[J].arXiv:0805.4127.
[10]Manjunath B S, Ohm J R, Vasudevan V V, et al.Color and texture descriptors[J].IEEE Transactions on Circuits and Systems for Video Technology, 2001, 11 (6) :703-715.
[11]陈宏.基于形状特征的图像检索[D].西安:西安电子科技大学, 2010.
信息资源的检索是从网络、数据库、文摘、索引、目录以及馆藏文献中找出所需文献的活动,音乐信息资源由于其专业的特殊性,在检索与利用方面与其他学科有很大不同,本文即对与音乐信息资源检索相关的几个方面进行研究,并综合整理出适用于音乐专业师生实用的一套检索途径和方法。
一、音乐信息资源检索发展现状
笔者通过分析已出版的音乐检索类图书和目前开设音乐信息检索课程的院校两方面,概括出我国目前音乐信息资源检索的发展现状。
(一)音乐信息资源检索参考图书
综合信息检索类图书在市面上比比皆是,但音乐专业的信息检索类图书因为其专业的特殊性出版非常少。下表格是已出版的音乐专业信息检索图书的集合,从1989年至今只出版了6种可参考的图书(见后表)。
(二)国内开设音乐文检课院校
笔者通过调研我国影响力较大的九大音乐学院发现,目前设有音乐专业文献信息检索课程的院校非常少,专业音乐学院中只有少数的几家图书馆设有这门课程,更别说其他综合类院校了。
下面是开设此门课程的院校和相关课程的简介:
1.中央音乐学院:由本院图书馆参考咨询部教师开设资源检索课,并不定期面向全院师生开展各类培训讲座。
2.中国音乐学院:没有开设专门的信息检索课程。参考咨询部每学期据读者需求举办十次馆藏资源培训讲座,内容涉及各种数据库的使用和馆藏信息的介绍,每学期有讲座的安排表,并提供预约讲座服务。
3.上海音乐学院:网站上没有显示记录讲座培训的信息,通过CNKI文献检索发现上音图书馆开设音乐信息检索课程已有些年且积累了些经验,并有教师由此发表学术论文。
4.武汉音乐学院:设有音乐文献检索选修课,并可以在图书馆网站下载到音乐文献检索课的相关资料。
5.沈阳音乐学院:没有专门开设课程,利用新生入馆教育和不定期的“图书馆信息检索”讲座介绍馆内外资源。
6.西安音乐学院:没有开设专门的信息检索课程,图书馆主要通过新生入学教育、培训讲座、参观辅导、专题讲座等活动,帮助读者了解图书馆、熟练使用图书馆资源,面对不同的读者常年不定期开设不同类型的讲座。
7.天津音乐学院:没有开设信息检索课程,但提供预约讲座服务,讲座内容可根据读者需求,按学科、专题或数据库等开展;讲座时间与地点协商安排:预约讲座人数需超5人,需要提前两周预约。
8.四川音乐学院:没有开设专门的信息检索课程。面对不同层次读者开设不同类型的培训讲座,讲座内容涉及各学科领域文献信息资源利用、该校各种网络数据库的检索技术等,培训讲座分为定期和不定期两种。
9.星海音乐学院:网站检索显示没有开设文献检索课,且没有发现与信息检索培训相关的信息。
通过以上调研发现,我国的音乐信息资源检索虽有研究涉及,且在教学中实践了多年,但发展缓慢不成体系,没有形成一套适合于音乐专业读者检索与利用的方法和规范,音乐专业师生大部分对信息资源的获取不够重视,信息检索意识和思维不强,遇到需要查找的资料时比较茫然。已开设的音乐信息检索课程院校很少,但几乎每个音乐学院的图书馆都会对本院师生通过各种方式进行各类的信息检索培训,可见信息检索这门课程在音乐专业院校图书馆的重要地位已达成了共识,只是由于音乐专业的性质和学生的文化素质等因素在行业内还不能引起足够的重视与关注。
二、常用音乐信息资源的类型
音乐信息资源按照不同的分类方式可以分成多种类型,本文主要按照记录文献的载体把资源分成印刷型和非印刷型,印刷型包括图书、期刊、报纸、乐谱、工具书,非印刷型包括缩微型文献、视听型文献和电子型文献,视听、电子型文献在音乐专业学习教学的过程中占有相当大的比重。
(一)音乐专业印刷型资源
1.图书:音乐专业图书一般包括音乐各学科专业的专著、教材(也称教科书)、论文集、资料汇编和会议论文。中图法中的J6是音乐专业类图书。
2.乐谱:音乐专业最常用资源,是将音乐通过特定的符号记录在纸张等载体形式上的一种文献形式。乐谱的种类非常繁杂,按记谱法分,可分有工尺谱、减字谱、简谱和五线谱,按记录不同的乐器,可分钢琴谱、吉他谱、古筝谱、琵琶谱等。在中图法中乐谱也属于J6类。
3.期刊:音乐类期刊通过CNKI检索共有45种,其中核心期刊有8种,它们是:《音乐研究》、《中央音乐学院学报》、《中国音乐学》、《中国音乐》、《音乐艺术》、《黄钟》、《人民音乐》、《音乐创作》。
4.报纸:是一种计划无限期地按期出版的连续出版物,音乐专业报纸资源比较少,常用的只有《音乐周报>和《音乐生活报》。
5.工具书:依据其编制目的、收录内容和用途,一般分为参考工具书和检索工具书。参考工具书包括音乐百科全书、年鉴、手册等。检索工具书包括书目、表谱、文摘、索引和图录等。目前世界上最大的音乐类参考性工具书是《新格罗夫音乐与音乐家词典》
(二)音乐专业非印刷型资源
1.缩微型文献:是以感光材料为载体,采用光学缩微技术将文字或图像记录在感光材料上形成的文献,分有缩微胶片、缩微胶卷、缩微卡片和穿孔式卡片四种形式。在实际应用中需要使用专门的阅读机进行检索查阅,所以作为收藏保存比实际应用更有优势。
2.视听型文献:是采用磁录技术和光录技术等手段将声音、图像等多媒体信息记录在光学材料、磁性材料上形成的文献。主要包括唱片、录音带、录像带、幻灯片、激光视盘等。此类文献存储信息密度高,内容直观,表达力强,但制作、阅读需要专门的设备。
3.电子型文献:是以数字代码方式将图、文、声、像等信息存储到磁、光、电介质上的文献。此类文献种类多、数量大、内容丰富,如:各种电子图书、电子期刊、联机数据库、网络数据库等。特点是存储量大,出版周期短易更新,传递信息迅速,存取速度快,信息共享好,但需通过计算机或类似设备阅读使用。endprint
三、常用音乐文献的获取途径
本文主要探讨印刷型音乐资源和非印刷型音乐资源的获取,数据库的优势是全、新、专,劣势是价格不菲需要购买,网络资源的优势是可以免费获取,但资源的质量和检索到的结果都有一定的随机性,需要检索者对其进行甄别区分。
(一)音乐专业印刷型资源的获取
1.图书馆
印刷型音乐资源图书馆收录较全也较新,尤其期刊、报纸的更新几乎与世面同步,读者可以通过图书馆的文献检索系统对图书馆的这类文献进行检索与利用。要想熟练掌握快速检索到这类音乐资源的能力,必然要了解的是《中图法》,音乐类在《中图法》类目体系中是从属于“J艺术”大类的二级类目,其下按照《中图法》类目设置的一般规律分为:“论、史、法、演”,并设置艺术类特有的“作品”类,下边是J6音乐类目的一个简单介绍:
①“论”即理论类,分为一般理论和专业理论,一般理论的类目是J60-J608。
②“史”即历史类,分为综合历史和专门历史,《中图法》将综合历史的类目归入一般理论类,其类目有J609-J609.9。专门历史类归入相关各类,如:器乐史入“J62器乐理论与演奏法”下。
③“法”即方法类,分为一般方法和专业方法,《中图法》将一般方法归入一般理论类,如:“J604音乐创作方法和经验”,而将专业方法归入各相关专业理论类,专业理论和专业方法类目是J61-J619.4。
④“演”即演奏法,《中图法》中把各专业理论与演奏法放到了一起,首先分为西洋乐器和民族乐器,然后划分乐器的类型,最后按各种具体的乐器分,如:“钢琴”、“小提琴”、“琵琶”等类目,该类目是J62-J633/637。
⑤“作品”类分为“中国音乐作品”和“各国音乐作品”,下一级分为各种类型的“声乐乐曲”和“器乐乐曲”,最后按各种具体的声乐形式或乐器,如“群众歌曲”、“艺术歌曲”等设置类目。此分类下的类目有J64-J65。
2.购买
除了通过图书馆查阅印刷型的音乐资源,对于急需的资源有时我们会通过购买获得,笔者列出了一些购买音乐类资源的途径:
①实地购买
市面上出版音乐类印刷型资源的出版社非常多,但就其专业型和权威性来说只有以下的几家,读者在购买音乐资源时注意鉴别,下面对其——进行介绍:
“北京天天文化艺术音像出版社”:是目前中国最大的艺术教育音像教材出版发行商;拥有中国地区最具权威及规模的专业音乐连锁书店。
“人民音乐出版社”:出版社以“忠诚、敬业、创新、卓越”为企业文化。以创建“中国第一、世界一流”的出版社为目标。
“上海音乐出版社”:以“既富有文化品位,又符合市场需求”为出书方针。
“中央音乐学院出版社”:其建社宗旨是充分利用我国几十年,尤其是最近一二十年中央音乐学院和其他音乐院校所积累的教学和研究成果,将它们公开出版,实现音乐教育资源共享。
②网络购买
在网络普及的今天,网络购书不仅为我们带来了便利,还节省了宝贵时间。下面是网络上几家专业经营音乐图书的网站。
a.北京音乐图书网http:I/www.book51.org/
是一家专业的音乐艺术教育音像教材网络出版发行商。秉承“我们热爱音乐、热爱艺术”的理念,以“权威、全面”的市场定位,为广大客户提供及时、周到的服务。
b.中国音乐图书网http:llwww.musicbookchina.com/
是一家新兴的音乐图书出版、乐器经营、音乐教学、商业演出组织策划于一身的文化公司,主要从事音乐类图书的制作、编辑、出版、发行。
C.天天艺术网上书店http://www.tt-art.com/shop/in—dex.asp
分类详细,几乎涵盖音乐类图书的所有类别,就笔者考察发现天天艺术的实体店比天天艺术网上书店的更新要及时,且各专业的资源更全面,网上书店相对滞后一些。
d.当当网
http://category.dangdang.com/cp01.07.21.00.00.00.htrrd
以图书零售起家,如今已发展成为领先的在线零售商,目前已是综合性购物网站,在音乐类目下可以找到音乐专业书籍共12630种,但由于不是专业音乐图书网站,分类较粗资源也不是很全。
e.亚马逊http:llwww.amazon.cn/ref=gno_logo
同当当网一样开始只经营网络的书籍销售业务,现在则扩及了范围相当广的其他产品,目前在此网站检索到音乐类书籍共11910种。
(二)音乐专业非印刷型资源的获取
1.图书馆数据库
(1)外国音乐数据库
①国际音乐期刊索引与数据库(IIMP)
互联网上最全面的音乐期刊资源。包括20多个国家、1 7种语言的四百五十多种国际音乐期刊的索引和文摘,以及140多种音乐期刊的全文下载。
②牛津格罗夫音乐在线数据库
牛津大学出版社出版的多种音乐著作的在线版全文数据库,是当今唯一被公认最具权威性的音乐学术与表演艺术的在线百科全书。
③ASP世界在线
拥有超过30万首世界各地各个时期的音乐。拥有完全版权,读者可以在线欣赏全部内容,同时提供约五十万页的音乐参考资料。
④国际音乐表演期刊(IIPAFT)
表演艺术领域重要的在线资源,提供逾279种国际期刊的索引,以及118种期刊全文。
⑤IMSLP
截止到2013年4月诞生于2006年,从一开始就以“自由公共领域的音乐图书馆”为目标,借助于互联网强大的交互性搭建起一个巨大的免费乐谱下载平台。2日乐谱总量已达234,000张,唱片有有23,000张。endprint
⑥新格罗夫在线词典http://www.oxfordmusiconline.com/subscriber/
(2)国内音视频数据库
①KUKE音乐数字图书馆
国内首家专业音乐数字音乐图书馆。整合拿索斯(Naxos)、马可波罗(Harco Polo)、瑞士唱片公司(AVC)、德国唱片公司(Countdown)、中国唱片总公司(CRC)等国内国际著名唱片公司音乐资源,提供正版音乐点播服务。
②KUKE音乐视频图书馆
汇集歌剧、芭蕾、音乐会现场、音乐纪录片、爵士等从中世纪到现当代400部优秀音乐视频作品。
③超星学术视频
超星公司拍摄制作的、具有学术前沿性的、拥有自主知识产权的网络学术视频网站,音乐学术视频有128个专题,由多位海内外名师学者主讲。
3.网络
随着互联网络的飞速发展,网上音乐资源已经达到了相当的规格和规模,网络音乐信息资源主要以音视频资源为主,籍由于此,本文介绍几种常见的音视频格式和网络音视频资源的检索方法和途径。
(1)音视频格式类型
①音频常用格式:
MP3常用的音频文件格式。优点是容量小。属于有损有压缩,所以在声音方面还是有些衰减的。
WAV大家最一般CD直转无损无压缩的格式就是这个。由于是无损无压缩,衰减的最少,理论上是不衰减,所以声音也是最好的,但是容量比较大。
APE是WAV的转压格式的一种,是无损有压缩。声音基本与WAV一样,但是容量约为WAV的2J3。
FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。它不会破坏任何原有的音频资讯,可以还原音乐光盘音质。
②视频常用格式:
AVl它的英文全称为Audio Video Interleaved,即音频视频交错格式,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,但是其缺点是体积过于庞大。
MPEG MPEG-1是我们熟悉的VCD制作格式,文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等。
MPEG-2主要应用在DVD的制作方面,常用的DVD光盘就是采用MPEG-2标准压缩,这种视频格式的文件扩展名包括.mpg、mpe、mpeg、m2v及DVD光盘上的.vob文件等。
MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。这种视频格式的文件扩展名包括.asf、mov和DivX、AVI等。
FLV是FLASH VIDEO的简称,视频网站大都采用这种格式。FLV流媒体格式是随着Flash HX的推出发展而来的视频格式。它形成的文件极小、加载速度极快。
(2)网络音视频的获取
①音频
笔者列出常用的14家音频网站,网页的功能布局大体类似,都提供在线试听和下载功能,更新很快,大部分音频网站都做有自己的客户端,对于智能手机用户使用非常方便,音频格式提供mp3、wma、flac等格式,分有普通音质和高品质音质,但一般高品质音质需要收费才能下载。
百度音乐http://music.baidu.com/
搜狗音乐http://mp3.sogou.com/
酷狗音乐http://www.kugou.com/1153
酷我音乐http://www.kuwo.cn/
QQ音乐http:∥y.qq.com//type=1ndex
一听音乐网http:llwww.1ting.com/
九酷音乐http:llwww.9kU.COm/
九天音乐http:I/www.9sI(y.com/
365音乐网http:/A~ww.yue365.com/
SOSO音乐http://music.soso.com/1ndex.html
虾米音乐网http:llwww.xiami.com/
网易云音乐http://music.163.com/
多米音乐http:/Avww.duomi.COm/
咪咕音乐—移动音乐门户http:I/Www.migu.cn/
②视频
网络视频网站中的视频不仅种类繁多,内容也是鱼龙混杂,同时一部分的视频画面效果不清晰,但很多的最新音乐会、单曲等视频会有网友传到视频网站,大部分网站设有专门的音乐类别,这就需要检索者对其进行分辨甄别,视频网站的视频多是FLV流媒体格式,可以下载并通过搜索引擎检索。限于篇幅笔者仅列举出其中常用的9个网站:
优酷网http://music.youku.com/
爱奇艺http://music.iqiyi.com/
土豆网http://music.tudou.com/
搜狐视频http://tv.sohu.com/musiC/
迅雷看看http://yinyue.kankan.com/
新浪视频http://video.sina.com.cn/mv/
56网http://music.56.com/
酷6网http://mv.ku6.com/?hpsrc=1—8—6—7—0
乐视网http://music.1etv.com/
③其他音乐专业网站
网络音乐网站浩如烟海,笔者仅列出几个个人认为音乐专业常用,且不同专业方向的网站信息做以代表,包括钢琴、声乐、中外器乐等:endprint
周广仁钢琴艺术中心http://www.zgr.com.cn/
由周广仁教授与北京锡华集团共同创办的专业化钢琴艺术培训机构,网站上有不少值得学习借鉴的资源信息。
流行钢琴网:http://www.popiano.org
提供各种钢琴谱,钢琴曲,流行钢琴曲谱。论坛很不错,是目前国内所有钢琴论坛里讨论气氛最浓厚的。
虫虫钢琴:http://www.gangqinpu.com
是十年的老牌钢琴网站,特点是钢琴谱特别全,资源可以下载,需要注册。
星夜钢琴网http:llwww.cpiano.com
中国钢琴第一门户网站,拥有最热闹的钢琴交流论坛,设有钢琴教学、钢琴选购、音乐欣赏、钢琴曲、钢琴谱下载等栏目,需要注册。
青歌赛官网http://qgs.cntv.cn/1 5/1ndex.shtml
收录历届青歌赛视频,是声乐专业学习者值得查阅的地方。
天津音乐学院音乐资源库http:I/www.tjcm.edu.cn/yyzy/main.htm
类别丰富,几乎涵盖音乐专业所有类别,可以在线欣赏,音质完美。
中国乐器协会网http:IA~ww.cmia.com.cn/
可查阅到行业内最新新闻公告,各种乐器品牌发展现状。
中国古曲网http:llwww.guqu.net/
为中国古典音乐喜好者提供古典音乐试听、中国古典音乐欣赏,发扬中国古典音乐国之文化精髓,资源可在线试听并下载,需要注册。
中国二胡艺术网http://www.erhuart.cn/toplista.asp?id=262
提供与二胡相关的各类信息,提供音视频下载,需要注册。
中国古筝网http:llwww.guzheng.cn/
古筝门户网站,名家名曲这里都能够检索得到,并提供下载。
搜谱网http:I/www.sooopu.com/
全国最大的歌谱搜索引擎,是一个专业的歌谱搜索网站。
结话
在整理音乐信息资源的过程中笔者发现,要想把音乐资源的检索规范成体系课程。需要我们投入更大的努力,音乐文献信息资源检索是一项具有深远意义的工作,在信息技术高速发展的今天,我们图书馆工作者要不断学习,调整自己的教学检索模式,找到一条适合于音乐专业学习的信息检索道路。①邓珞华、董讯《音乐信息检索》,高等教育出版社2006年版。②徐波《音乐音响文献检索与利用》,哈尔滨地图出版社2007年版。③[EB]http://baike.baidu.com/link?url=dlRfwlJQmZmt4kyDDP6xP一
2Yut97SVSV9u0QpeM69Q019H6r5adL50i7nwQVGODe.马琳
石家庄学院音乐学科馆员