实验三网络信息检索(精选8篇)
(三)一、实验学时:2学时
二、实验目的
利用网络平台或移动APP平台,构建学习空间,体验网络平台或移动APP平台为教学服务,感受教育技术应用,开展网络论坛教学研讨。
三、实验内容
(一)移动APP教学应用 A)利用QQ群进行教学交流与分享
1、按小组为单位,建立QQ家校(师生)群
要求:群成员至少包括本小组全体成员及本班其他3-5名同学。
2、发布一条群公告,说明本群功能及入群要求
要求:群功能简要明确,有条理,符合教学交流群性质。入群须知中应包含群名片修改规则,能通过群名片有效区分不同身份人群。
3、修改群名片及身份
要求:QQ家校(师生)群中成员可有三种不同身份(老师、家长、学生),小组讨论确定本小组成员在群中模拟身份。并修改为对应身份。按群公告要求修改本群名片。
4、群作业发布及在线提交
要求:在小组建立的群中,群中老师成员利用群作业中的题库功能生成并发布一套至少包含10个题目的群作业,要求群中学生成员完成并在线提交作业。学生成员完成群作业,并按要求进行提交。
5、群文件共享
要求:在本小组建立的群中,小组成员至少上传1个与本学科专业相关教学研究论文(doc格式文档)或现代教育技术课程学习相关的文档。小组做好上传文档有关信息记录(上传者、文档名、主要内容等)
6、群投票
要求:在本班群投票中,以小组为单位发起一项群投票,投票内容与第一次实验所在基础教育学段(小学、初中、高中)有关的学科问卷调查,内容自拟,投票选项不少于5项。参与本小组群投票人数不少于20人。
7、QQ群相片
要求:以小组为单位在班级QQ群相册中建立小组相册,并在相册中将1-6小题完成后的截图上传到该相册中。可用多张图片来展示,也可将以上作业拼接在一张图片中。
B)微信公众号及微信群应用
1、以小组为单位,尝试搭建一个微信公众号,了解微信公众号的一些基本功能。
2、小组成员至少需要关注一个与教育技术主题相关的微信公众号和一个学科教学相关的微信公众号,浏览并学习相关公众号的文章。探究基于微信公众号的教学应用。
3、以小组为单位建议一个微信群聊,群聊名称能体现现代教育技术相关主题。
(二)建立个人网络资源空间(以百度网站为例——个人任务)
申请百度账号并利用其进行教学交流及资源收集 利用百度账号,在百度知道中发布一个有关本学科专业相关教学或现代教育技术课程学习有关的求助信息,并对别人回复的消息进行及时评价及反馈。(按个人完成此项任务,以屏幕截屏为据,截图以“组+学号+姓名+百度知道”为名保存,并上传至1.7中的群相册中。)利用百度账号,在百度文库中,至少分享1篇与本学科专业相关教学或现代教育技术课程学习相关的文档。(按个人完成此项任务,以屏幕截屏为据,截图以“组+学号+姓名+百度文库”为名保存,并上传至1.4中的群相册中。)利用百度账号,申请百度云盘,在云盘中按资源分类建立文件夹(按个人完成此项任务,以屏幕截屏为据,截图以“组+学号+姓名+百度云盘”为名保存,并上传至1.7中的群相册中。)对百度云盘建立合适的文档分类文件夹,并将前两次实验的内容保存在自己建立的百度云盘中;通过有关渠道获取与现代教育技术课程学习或本学科专业相关教学相关的资源,并将其保存在自己的百度云盘中,并至少在百度云盘中建立关于本学科专业相关教学或现代教育技术课程学习相关的公共分享链接和私密分享链接各1个,将有关资源分享给本班同学(按个人完成此项任务,以截屏为据,以小组为单位提交此项任务。注:不得分享与教学内容无关或与法律、道德标准相悖资料,否则一旦查实,小组此项实验记0分)。
(三)其他网络资源为教学服务体验 A、美篇制作
以小组为单位,利用美篇APP或美篇网页版制作一个学生活动主题相关的美篇。
要求:
1、主题明确,选材适当。
2、文档中至少包含4张以上图片信息,有一定的文本介绍。
3、各小组创建好的美篇需分享到QQ课程教学群中。B、易企秀
以小组为单位,利用易企秀设计一项学生学习活动的海报(或邀请函)。要求:
1、主题自拟,但需信息明确,具有一定的操作性,选题选材适当,符合社会道德价值取向,传递正能量。
2、活动时间、方式、地点、人员等信息应明确,文档中需辅以图文信息。
3、各小组创建好的海报(或邀请函)需分享到QQ课程教学群中。
(四)实验报告
以小组为单位,完成本次实验有关实验报告。实验报告要能体现本小组完成有关过程、难点及心得体会。实验报告以小组为单位提交到本班课程负责同学处。课程负责同学收齐后于10月11日统一提交给赵老师。
互联网的快速发展和广泛应用, 为人们提供了一个广阔的信息空间, 也为信息检索提供了一个广阔的发展平台。互联网的开放性和自由性使得网络信息资源呈现出数量巨大、异构性、分散性和动态性特征。但由于网络信息时效性强以及互联网缺乏必要的监督和质量控制, 使得大量垃圾信息混于高质量信息当中, 增加了有效信息获取的难度, 影响检索效率。因此, 使用有效的检索工具才能使得网络信息资源为人们所充分利用。
1 网络信息资源点与检索工具
上世纪90年代中期出现的搜索引擎技术目前已经成为检索各类网络信息资源最主要的检索工具。搜索引擎一般工作流程是借助于网络自动搜索软件 (Robot、Spider等) 访问浏览网页并抓取文件, 并通过已浏览的网页中的链接访问更多网页。在抓取网页的同时对页面文件进行分析分解以及索引, 建立索引数据库。当用户在搜索引擎界面输入搜索词后, 搜索引擎对搜索词进行处理, 按照处理后的搜索词在索引数据库中找出所有包含相关内容的网页, 并更具排名算法计算出排名顺序然后按照一定的格式返回到搜索页面。普通的搜索引擎缺点在于返回的检索结果数量巨大, 无关和冗余信息较多, 用户必须从中进行筛选。虽然布尔运算、截词运算、自然语言检索等技术使用大大提高了准确率, 但对用户检索素养要求很高。针对以上问题, 学者把研究对象放到对词意的挖掘上, 探索实现基于概念匹配的检索技术和方法, 基于本体的语义检索成为研究重点。
2 语义检索基本要素和原理
随着人工智能以及自然语言处理的发展, 尤其是语义网技术的兴起, 自上个世纪以来语义检索研究得到了迅猛的发展。虽然对于语义检索在概念上到目前为止没有统一的界定, 但是不同的研究都有一个共同之处就是基于对信息资源的语义处理时限效率更高的检索[1]。本体是语义检索的基础, 其主要任务是对信息资源进行语义表达。
本体 (Ontology) 原本是一个描述客观事物本质的哲学概念, 是对客观存在的一个系统的解释和说明。如今, 本体是一种能在语义和知识层次上描述概念体系的有效工具, 用来描述概念以及概念之间的关系, 通过概念之间的管理来描述概念的语义。本体作为一种最先进的知识表示方式能够充分的描述所以的数据结构, 是推理和关系数据库的结合[2]。概括的讲本体能够在人们和应用系统之间达成对术语含义的共享和共同理解, 通过函数 (functions) 、关系 (relations) 、原则 (axioms) 和实例 (instances) 、类 (classes) 这5种元素表达本体中的知识, 使其具有逻辑推理和语义识别功能, 帮助检索系统跨越目前基于关键词的检索过程中的上述问题以实现语义检索[3]。目前实现网络检索的技术主要有两种:第一种, 依赖于编码处理, 以分类模式来描述信息资源以实现检索的目的;第二种, 是通过全文检索查找文本中包含用户指定的词语的信息源。语义检索的语义信息的提取和处理是基于语义网方法与技术的查询处理与文档标注及索引。基于本体的查询处理包括:查询消歧和查询扩展, 通过消岐, 明确查询的确切所指, 准确反映用户的信息意图, 继而通过加入与其语义相关的其他概念来实施扩展。在对文档进行语义标注与索引的基础上, 先进行实例检索, 再据此返回所有以检出实例标注的文档信息是语义标注文档检索的一种普遍思路。相对于传统的网络检索, 基于本体的语义检索的优势在于体现语义信息, 准确表达用户的查询意图。
3 常见语义检索系统介绍
3.1 一体化医学语言系统 (UMLS) UMLS (Unified Medical Language System)
作为计算机化的情报检索语言集成系统, 是美国国立医学图书馆 (NLM) 主持的一项长期开发研究计划。它不仅是自然语言处理、语言规范化以及语言翻译的规范化工具, 更是实现实现跨数据库检测的词汇转换系统并且还可以帮助用户连接情报源, 包括书目数据库、事实数据库、计算机化的病案记录以及专家系统过程中对于其他的电子式生物医学情报的一体化检索。UMLS包括情报源图谱 (Information Sources Map) 、语义网络 (Semantic Network) 、专家词典 (SPECIALIST Lexicon) ) 和超级叙词表 (Metathesaurus) 四部分。其中超级叙词表是术语、生物医学概念、等级范畴、词汇及其涵义的广泛集成。1997年第8版的超级叙词表收录了739439个词汇, 这些词汇来源于30多种生物医学词表和分类表的能表达33万多个概念的, 词汇量达到空前规模。而语义网络是为超级叙词表中的所有概念提供语义类型及相互关系结构的工具, 是为建立概念术语间相互错综复杂关系而设计的。UMLS的语义网络不仅运用了常规的语义控制手段, 如属分、相关关系控制、语义等级, 同时在语义规范和语义关系分析、延伸等多方面有许多创新。
3.2 语义网 (Semantic Web)
为了能够在网络环境下也同样实现语义检索的功能进而开发研究了语义网的W3C项目。W3C项目是将网络上的数据通过一种方式进行连续和定义, 通过这种定义和连续可以根据人的不同需求实现计算机将数据自动进行整合以及再利用, 从而达到更有利于人机协作的目的。资源描述框架 (Re-source Description Framework, 简称RDF) 是语义网的核心构件。在网络中, 一般用元数据对资源进行描述, 而RDF则是处理元数据的一个基础。RDF认为一个具体的元数据是由属性值 (Statements) 、属性 (Properties) 和资源 (Resources) 构成的三元关系模式[4], 实际上是关于一个特定的资源特定属性的取值声明。使用RDFS语言, 元数据的设计者不仅可以定义所描述资源的类别、属性以及词汇, 还可以定义这些属性或者对象的关系以及对象与属性之间的相互关系, 同时还可以进一步定义这些资源的对象、属性以及属性应用类别和取值条件等, 通过这些定义从而能以计算机理解的标准方式对元数据进行描述语义内容以及元数据的结构关系。
3.3 Word Net
Word Net是一种基于认知语言学的英语词典, 它是由普林斯顿大学的计算机工程师、心理学家和语言学家联合设计的不仅是把单词以字母顺序排列, 并且是按单侧的意义组成的一个“单词的网络”。Word Net将所有的英语词汇按词性分为功能词、形容词、动词、名词和副词五类。动词被组成各种推演关系;名词在词汇记忆中被组成主题的层次;而形容词和副词被组织在N维超空间中。根据Word Net关系分析最大的优势是能在他的单词网里通过相关关系消除歧义, 因为Word Net分析主要是关系分析。Word Net在名词的语义消歧率可以超过60%。
4 结语
从以上三个语义系统来看, 无论是相对封闭的ULMS系统还是开放式的语义网、wordnet系统都具有较强的灵活性和扩展性。相对于常见的关键字信息检索, 语义检索不需要用户使用专业的检索策略, 也不需要语法严谨的检索式, 用户可以将自己的信息需求通过自然语言直接表达出来。语义检索在后台经过大量的计算, 分析用户的用户的语义文档信息, 充分利用各种语义关系消除歧义将用户真正需要的准确的信息资源反馈给用户, 将用户的检索效率提升60—80%。因此, 语义检索无疑是当前信息爆炸条件下最适合的网络信息检索方式。
摘要:互联网给用户的信息检索带来便利的同时也导致大量冗余信息出现, 使得检索效率低下。语义检索通过对用户检索要求的语义分析使得检索效率以及检索准确度大大提升。本文在分析语义检索基本要素和检索原理的基础上, 介绍三种常用的语义检索系统, 体现语义检索在网络信息检索环境下的优势。
关键词:语义检索,本体,语义网
参考文献
[1]黄敏, 赖茂生.语义检索研究综述[J].图书情报工作, 2008, (6) :63-66.
[2]Studer R, Benjamins R, Fensel D.Knowledge Engineering, Principles and Methods[J].Data and Knowledge Engineering, 1998, 25 (1-2) :16l-197.
[3]翁畅平, 沈娟.基于Ontology的个性化语义检索系统研究[J].图书馆理论与实践, 2009 (10) :77-80.
关键词:网络信息检索搜索引擎局限性
1 网络信息检索简介
1.1 信息检索的概念 信息检索指的是将信息按照一定的方式组织、存储起来,根据信息用户的需求查找所需信息的过程和技术。信息检索主要通过以下几种途径来获取信息:①传统的信息检索,即利用人工查询的方式,查询图书馆等文献丰富的机构,并获取文献;②联机信息检索,它和传统的信息检索比起来具有广泛性、实时性、完整性和共享性等特点;③网络信息检索,即信息用户利用网络信息检索工具检索Internet信息空间中的各类网络信息资源。
1.2 网络信息检索的原理 概率模型、布尔逻辑模型、模糊逻辑模型是应用比较广泛的几种网络信息检索模型主要有:①概率模型。该模型是在贝叶斯概率原理的基础上提出来的,对词条和文档间的内在联系进行研究之后,通过词条和词条之间和以及词条和文档之间的概率相依性来检索信息。②布尔逻辑模型。根据检索项在文档中的布尔逻辑关系提交查询,搜索工具按照提前组建的倒排文档结构来确定查询结果。③模糊逻辑模型。处理查询结果的过程中引入模糊逻辑比较,同时根据先后次序将查询结果排列出来。
2 搜索引擎
搜索引擎,又称检索引擎,指的是在Internet上运行,通过对信息资源进行检索来提供所需数据的服务系统。当前,大部分人们都利用搜索引擎来检索网络信息。和其他检索工具比起来,它这种检索工具的检准率、检全率远远高于其他检索工具,具有极强的利用价值,且就目前情况而言,它的市场强劲非常广阔。
2.1 搜索引擎的功能 ①模糊检索。对网络资源进行检索时,系统检索用户提供的关键词以及与冠军按此相似的词语,同时返回包含关键词,或这些相似词的检索结果。②布尔逻辑检索。用户可通过NOT、AND、OR进行关键词的搭配检索。③截词检索。截取词条的某一部分来进行检索。在搜索引擎中,用户提供包含“?”、“*”通配符的检索项进行检索。④限定词检索。它用来规定检索项中必须出现或是必须不出现某些关键词。
2.2 搜索引擎的工作原理 搜索引擎的检索机制一般包括数据组织机制、数据采集和标引机制和用户检索机制。
①数据组织据组织机制是对www页面信息进行整合,使其更加简单、规范,同时构建相应的索引数据库。②数据采集和标引机制根据相关规律及一定的方法来搜索网络上的www站点,同时将搜索结果存入搜索引擎临时的数据库内。③索引数据库是信息检索的先决条件,检索结果是否符合要求在很大程度上去觉与索引数据的准确性,数据库质量主要取决于搜索引擎的数据采集及标引机制。④用户检索机制通过相应的方式对引擎的索引数据库进行检索,从中获取有价值的网页或站点。
2.3 搜索引擎的分类 目前的中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎和元搜索引擎。
①目录式搜索引擎,是通过半人工、人工的办法采集信息,组建数据库,编辑对某一web站点进行访问以后由编辑人员在访问以后描述这个站点,同时按照站点的性质、内容对该站点归类处理。②机器人搜索引擎是目前运用较广的搜索引擎。这个搜索引擎采用自动采集软件Robot,对网页信息进行检索,同时将其下载并储存在本地文档库中,然后自动分析文档内容,建立索引。根据用户的检索需求,对索引进行检索,分析出相应的文档并反馈给用户。③元搜索引擎主要通过调用其他搜索引擎的引擎来完成信息检索。它在一个统一的用户界面上,以用户需求为目的,在多个搜索引擎中寻找合适的引擎来检索信息资源。
3 网络信息检索的局限
用户都是通过网络信息检索工具在网络信息资源进行查找自己需要的信息,因此,检索工具的优劣会对检索效率产生很大的影响。近些年,网络信息检索工具的确有所发展,但仍然存在着这样或那样的局限。
3.1 文本信息检索的局限 ①搜索引擎的查全率低。网络信息资源库在持续扩充,信息资源的增长的速度要比搜索引擎采集数据的速度快的多,这会大大降低搜索引擎的检全率。②搜索引擎的查准率低。一是当前的搜索引擎中普遍存在反馈信息;二是信息重复反馈。同一信息源有时在检索结果中产生不同的组成部分,不同的信息源也有相同内容信息出现的情况。③网络信息标引准确度不达标。大部分检索工具标引的准确度都无法达到设计要求,检索工具往往在反馈垃圾信息的过程中也会将部分有价值的信息丢掉,某些情况下,垃圾信息会覆盖所有有价值的信息。④查询方式较少。当前的很多搜索引擎,在查询方式上都过于单一,而且都需要用户提供关键词来查询或采用分类查询的方法。这样,只能就某一关键词或概念进行笼统检索,因此使查询结果相关性很差。⑤检索对象的数据结构单一。由于现在大多网站使用傳统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种数据库非常擅长处理结构化的数据,但对非结构化的数据的处理能力很弱。⑥交互性不够。大部分搜索引擎和用户之间无法建立其很好的交互性,在协作方面比较欠缺,对用户信息很陌生,不对用户查询的信息进行记录,无法对用户的反馈信息进行处理,也就无法与用户之间达成良好的交互来提高检索效率。
3.2 多媒体信息检索的局限 虽然眼下已经存在只针对声音、视频和图像等媒体的检索技术,但仍未研究出能检索多媒体信息的搜索引擎,具体体现在以下几点:①检索效果不好。就目前情况而言,大部分多媒体搜索引擎的查准率都无法满足用户的需求,用户不得不从众多图像结果中自己筛选出所需的信息资源。这很费时,而且有时根本检不出想要的东西。究其原因,一是查询方式少,二是在于对图像的标引深度不到位,所以,必须进一步完善图像检索及相关的索引机制。②用户查询接口单一。科学的多媒体检索系统,人处于主动地位,用户的查询接口直观易用,可提供足够的交互能力,用户能可以对检索参数进行适当的调整之后,将图像的语义感知准确的表达出来,并从中取得较好的结果。当前,多媒体搜索引擎用户查询接口呈现单一的发展趋势,很多引擎仅能通过关键词或提问框进行查询。③信息的自动加工与人工标引不够。目前多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,人工干预虽能提高查准率,但可被人工标引的非常有限,同时,因为人工标引需要付出很多劳动而使检索范围受到限制,因此,当前亟待解决的一个问题是快速标引图像信息,并对其进行合理的分类。
当前,基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。
参考文献:
[1]孙建军,成颖.信息检索技术[M].北京:科学出版社,2004.
(三)班级 学号 姓名:成绩:【实习目的】1.熟悉馆藏书目数据库的检索方法。
2.掌握《中图法》分类体系,熟悉所学专业的二级类目。3.掌握电子图书全文数据库的检索方法。【实习方式】计算机检索。【实习地点】物流实验室3601。
【实习内容】书目查询与电子图书的检索,实习报告格式如下:
一、使用超星图书馆,检索自己感兴趣的中文图书,记录复制所查到的一本图
书的完整的著录款目(又称图书的基本信息)1.检索方法: 2.字段限制:标题
3.关键词分析(1~3个):(1)大学生(2)心理健康4.图书检索结果共: 349本5.其中一本图书的基本信息:书名:大学生心理健康读本
作者: 张改叶
出版社:河南人民出版社出版日期:2007.2页数:512 关键词::大学生 心理卫生 高等学校 郭玉琴 张改叶 白剑波分类:哲学宗教 >青少年心理学
二、利用读秀学术搜索操作平台,检索自己感兴趣的主题方面的图书。
1. 从中选出一本是“馆藏纸本”的书,查看并复制本馆馆藏地点、图书状态及索书号(藏书情况)。
图书书名:大学生心理健康
藏书情况〖馆藏信息〗
条码号 4079197 4079198
馆藏地点
流通类型
状态 在馆 在馆
应还日期
卷册说明
流动站(2)社科图书 社科借书处
社科图书
2. 选择一本标注“电子全文”的本馆图书,点击后使用“阅览器阅览”,运用全文界面上的各功能进行阅读、翻页,使用文本或图像下载。下载的内容请复制
下载的内容为:
3. 下来
主题指南将信息系统地进行归类,可使用户方便地查找到某一大类信息,但其搜索范围较搜索引擎要小许多。搜索引擎查询较为全面而充分,可以提供最全面、最广泛的搜索结果,但所提供的信息不像主题指南那样层次结构清晰,显得繁多而杂乱。由于主题指南和搜索引擎各有优势,两者可以相互结合,取长补短,合理运用,以产生最佳结果。总之,选择合适的搜索引擎是信息检索至关重要的一步。搜索引擎在查询范围、检索能力、效率等方面各具特色,针对不同目的的检索,应选用不同的搜索引擎。
2 缩小检索范围
(1)采用恰当的检索表达式。在检索表达式的构造中,可采用把一个短语作为一个整体进行查询的办法,或者采用强制包含或排除特定关键词的办法限定检索范围。
(2)限定检索范围。当检索的范围过大时,可以对检索词的年代、语种、数量、学科等检索范围进行限定。这些限定检索的运用可以有效控制检索的相关性,从而提高检准率,使检索结果接近用户需求。
(3)利用进阶检索功能。进阶查询(Refine Query)是指利用前一次检索的结果作为后一次检索的依据,逐步缩小检索范围。
(4)搜索力求具体化。检索文献信息资源时,要明确检索课题的需求,限定查询范围,选择确切的检索词,使检索要求具体化、明确化。这样,有利于提高文献信息资源检索的查准率。
3 扩大检索范围
(1)使用同义词或近义词检索。目前,检索软件的智能化程度较低,容易漏检与关键词意思相近或一致的内容。此外,搜索引擎对网络信息资源中出现的多姓名的个人著者,更名的机关团体,同一事物的不同名称不像图书馆目录那样提供规范化的检索点,也容易出现漏检现象。因此,用户需要使用同义词、近义词或同一事物的不同名称尽可能全面地扩大检索范围。反映同一概念的检索词越多,就越能保证查全率。
(2)使用All-in-one整合型检索。All-in-one是指在统一的标准界面下,同一检索词用户只需输入一次即可委托多个搜索引擎查询。WWW上的信息资源非常庞大,没有一个搜索引擎能够搜索全部网页,同时使用多个搜索引擎能弥补单个搜索引擎数据库容量不足的缺陷。如NetLocator(http://nln.com)能在Yahoo!,Lycos,Altavista,Webcrowler 4个搜索引擎同时代理用户的检索指令,最大限度地确保文献信息资源的查全率。
4 使用组合搜索关键词
如果一个陌生人突然走近你,问你“北京”,你会怎样回答?大多数人会觉得莫名其妙,然后会再问这个人到底想问“北京”哪方面的事情。同样,如果你在搜索引擎中输入一个关键词“北京”,搜索引擎也不知道你要找什么,它也可能返回很多莫名其妙的结果。因此你要养成使用多个关键词搜索的习惯,当然,大多数情况下使用两个关键词搜索已经足够了,关键词与关键词之间以空格隔开。比如,你想了解北京旅游方面的信息,就输入“北京旅游”这样才能获取与北京旅游有关的信息。
5 强制搜索
通过添加英文双引号来搜索短语词,这一方法在查找名言警句时显得格外有用。例如用““京剧”+“脸谱””的搜索结果比“京剧+脸谱”更精确。
6 模糊搜索
搜索引擎中允许使用模糊查询,即用*号通配符代替不确定的字或词,每种搜索引擎都有各自的关键词技巧,除了通配符还可以用or或and逻辑运算符。
7 搜索之前先思考
网上的内容虽然很丰富,但必须先有人放上网。搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,很可能成为漏网之鱼。所以在使用搜索引擎之前,应该先花几秒钟想一下,我要找的东西网上可能有吗?如果有,又可能在哪里?网页上会含有哪些关键字?
8 点击搜索结果前先分析
学生姓名: 专 业:
班 级: 学 号: 课程名称:电子商务实务 学时: 实训成绩:
一、实训目的(抄题)
通过本次实训,使学习了解国内外各大搜索引擎的功能及特点,学会使用搜索引擎进行商务信息检索,并掌握各种搜索技巧。
二、实训内容与要求(抄题)
1、申请个人免费搜索引擎,并使用该搜索引擎完成实训任务。
2、了解国内外各大搜索引擎的功能及特点,掌握搜索引擎的使用方法。
3、使用搜索引擎,进行网络商务信息的检索与利用。
三、实训步骤(不抄题)
1、设臵自己的搜索引擎,完成所有页面设臵。(操作题)(35分)
(1)登陆Google网站HK版(http://),完成Google的“注册”,以注册好的会员名称登录Google,点击“我的帐号”,选择“产品”,点击“自定义搜索”。或者直接进入Google自定义搜索页面(http://NIC中国互联网络信息中心,查找《第29次中国互联网络发展状况统计报告》有关数据并记录下来。(问答题20分)
(1)我国网民规模、手机网民规模是多少?(2)我国互联网普及率是多少?(3)我国网民网络应用主要有哪些?
四、实训结果(按照要求完成实训操作后,将实训步骤中的提出的问题进行作答)答:2、3、4问答题的结果写下来。
一、网络信息的组织
信息组织是信息资源管理的基本范畴之一,在信息资源管理过程中,当信息采集完成后,是对信息资源进行有序化处理的过程。广义上信息组织包括两个部分,一是信源组织,即根据某种规律或结构对信息资源进行有序化处理;二是信道组织,为了有效利用存储空间提高传递效率而对信息资源实施重组。因此,在网络化环境下,有效的组织是充分利用网络资源的重要前提。
1、网络信息组织原理
网络信息组织是基于网络中大量信息的一种序化方法,并且随着社会信息化的发展而逐步趋于规范。网络信息具有本质、数量、质量、关系、作用、过程、状态、空间、时间等属性,这些属性都可以作为网络信息组织的依据。具体来讲,网络信息组织的过程就是依照事物属性之间的同一性、包容性、交叉性、排斥性等关系实施序化的过程。网络信息组织是一个序化过程,这个过程分为两个阶段,即序化阶段与优化阶段。网络信息的序化是按照一定的办法将无序的网络信息组织成为有序的过程。它包含两层意义:一是内在必然联系的网络信息,为了利用和管理上的方便加以组织;二是把本质上具有必然联系的网络信息,按照其自身的客观逻辑结构加以组织。网络信息的优化则是在序化的基础上,针对某种目的,依照结构功能优化原理对网络信息进行再序化的过程,是网络信息序化的继续和升华。在实际的操作过程中,网络信息的序化和优化没有明显的界限,它们是一个辨证统一的整体。
2、网络信息资源组织含义
世界上所有的一切都是产生和传播信息的源泉,这些信息需要加以整理和组织才能为人们所利用,因此,组织是人们认识事物的基础也是认识事物的结果,网络信息是存储于网络之中并传播于网络之上的信息,网络是其依附的载体。网络信息组织是指人们根据网络信息本身的特点,运用各种工具和方法,对网络信息进行加工、整理、排列、组合,使之有序化、系统化、规律化,从而有利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。
3、网络信息组织方法
凡是能将网络信息有序化的方法都是网络信息的组织方法,目前网络信息组织方法种类多,划分途径也多,如分为思维领域的组织方法和实践领域的组织方法;宏观领域的组织方法和微观领域的组织方法;信息的序化方法和信息的优化方法等。但是这些划分并不十分完善,如果按照一切事物都具有形式、内容、效用三个方面的特征或属性来划分则比较科学,并有较强的实际作用。据此,网络信息组织方法可归纳为语法信息组织方法、语义信息组织方法和语用信息组织方法;新的方法还有通过超级链连接数据库、在数据库上附加链服务、建立超媒体结构的数据库系统。
二、网络信息的检索
随着www站点的增长,internet上的信息数量和种类越来越多,为了解决信息利用的难题,互联网建立了许多专门的信息检索工具——搜索引擎,使用户可以通过关键词或分类的方法找到所需信息。
1、网络信息检索基本工作原理
(1)在网上搜寻所有相关信息;
(2)对搜索到的信息进行加工分类,建立搜索引擎数据库;
(3)通过Web页面接受用户的查询请求,并将搜索引擎数据库中查询到的信息返回给用户。
2、网络信息检索特点
网络信息检索是一种基于超文本方式的信息查询工具。它对信息的存储可以按照交叉联想的方式,可以方便灵活地检索信息。以下是网络信息检索的特点:
(1)具备网状的复杂信息链接结构,能够按照不同查询条件链界结构。
(2)信息丰富。
(3)好的导航能力可引导读者在复杂的网络信息图中漫游而不至于迷失方向。
(4)良好的编辑能力。
(5)通过网络共享数据库,可使多个用户同时使用库内信息。
3、网络信息检索方法
网络信息检索方法有两种:一是通过分类搜索引擎检索,二是通过关键词检索。
分类搜索引擎可以清晰方便地查找到某一大类信息,比较符合传统的信息查找方式,尤其适合那些希望了解某一方面信息,并不严格限于查询关键字的用户。但目录式搜索引擎的搜索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,这样有可能遗漏某些重要的信息源。分类搜索引擎的分类方法有学科分类和图书分类。
关键词检索是直接在搜索引擎提供的检索对话框中输入要检索的关键词进行检索。输入的关键词可以是单个词汇,也可以是多个词汇,通过组配的方法进行比较复杂的检索。关键词组配是根据关键词之间的逻辑关系,利用逻辑运算把关键词连接起来,构成检索表达式进行的检索。
4、网络信息检索技巧(1)选择合适的搜索引擎
选择WWW搜索引擎,要考虑到其收录内容。主要包括:(1)网络资源包含的项目。如是只收录URL的,还是又包括FT P、Gopher、Usenet等。(2)信息类别。如是否包括不同媒体类型的网络资源,是否提供超链接和是否列出URL地址。(3)更新的周期和增加的速度。(4)标引深度。如只针对URL标引,还是标引范围涉及题名、标题、关键词、摘要、超链接,或作全文标引。
(2)选用恰当的关键词
这是查询最基本的要求,它对于准确而迅速查询信息至关重要。若选用的关键词过宽,会有大量无用信息,过窄则可能查不到。
(3)注意拼法
应注意英美对某些单词的拼法不同,以及有些单词拆分形式和合写形式多种表达方法,我们在检索时两者都应当检索,这样才能提高查全率。
(4)使用短语搜索
大多数搜索引擎都支持短语搜索。搜索引擎以引号作为识别短语的标志,也就是说,必须在短语上加引号。比如,搜索黑龙江大学,如果不加双引号,检索结果就会被拆分,有关“黑龙江”、“大学”等的结果都会出现,若输入“黑龙江大学”,就能检索出跟该校准确相关的站点。
(5)使用布尔逻辑搜索
在输入检索词时可使用布尔逻辑式:AND、OR、NOTAND表示前后关键词都要出现在检索结果里,AND表示前后关键词都必须出现在检索结果中,OR要求至少1个,NOT表示关键词不要出现在检索结果里。使用布尔逻辑式,有助于在关键词间建立相应的逻辑关系,可以压缩或扩展搜索范围。
(6)少用空格
在输入汉字作关键词的时候,不要在汉字后追加不必要的空格,因为空格将被认作特殊操作符,其作用与AND一样。比如,你输入了这样的关键词“电脑”,那么它不会被当作一个完整词“电脑”去查询,由于中间有空格,会被认为是需要查出所有同时包含“电”、“脑”两个字的文档,这个范围就要比“电脑”作关键词的查询结果大多了,更重要的是它偏离了本来的含义。
(7)利用进阶检索功能
进阶查询(Refine Quer y)是指利用前一次检索的结果作为后一次检索的范围,逐步缩小检索范围。
网络信息组织是网络信息检索的前提,只有在网络信息有组织后,才能达到检索的快捷、方便。二者的有机结合是网络信息得以广泛利用,达到信息服务的目的,因此,网络信息的组织与检索是关键也是网络信息利用的重重之重,为了提高网络信息的利用率,不断开发、研究网络信息组织和检索,才能达到信息利用的飞跃。
参考文献
[1]陈力等.网络信息资源的采集与保存[J].国家图书馆学刊.2004,(1)
[2]黎小妮.网络信息资源检索研究[J].图书馆学刊.2006,(5)
[3]于晓峰.网络信息检索浅谈[J].职业技术专题研究.2006,(12)
[4]徐险峰.网络信息资源组织的方式与方法[J].图书馆学刊.2006,(4)
[5]王知津.网络信息组织的原理、方法与问题[J].图书馆理论与实践.2006,(3)
关键词:Internet;查新检索;手工检索
查新检索工作是信息服务的一个重要组成部分,也是开发和利用信息资源的一种有效途径。查新检索不同于普通的信息检索。普通的信息检索只是用户在数据库中查找与某种情报有关的文献记录的过程。而查新检索则是从事查新工作专业人员以科技文献为依据,运用联机检索系统检索国内外及自建数据库或手工检索馆藏资料等手段索取文献,并运用综合分析和对比等手法,找出其技术创新点,给科研课题或成果一个公正的、客观的、科学的查新结论,从而避免重复研究,提高对科技成果评价的准确性。
一、Internet下的查新检索
随着因特网的迅速发展,网上信息资源如雨后春笋般涌现,由于它们具有更新快,检索方便,内容丰富,节省费用等优点,不少查新机构把网络资源作为查新过程中文献资源的重要补充。
1电子函件传递
电子函件传递是Internet的基本功能之一,主要用于信息交流。在电子函件服务站申请到电子通讯地址和电子信箱后,查新人员即可利用计算机和通讯网络传递多媒体信息,通过Internet进行电子函件的传递,直接向作者、编辑部或收藏单位索取原文,大大缩短了工作时间。
2数据库检索
据估计,Internet上的数据库总量大约有近万个。如此宏大的信息资源为查新工作提供了坚实的文献资源基础。通过数据库检索可扩大检索范围,满足查新需要。要使用数据库检索功能,只要有相应的帐号和口令,就能通过远程登录使用Internet网上对外开放的数据库资源。
3文件传输协议
通过文件传输服务,查新人员可以从服务中心订阅论文预印本的摘要或全文,掌握有关领域的研究动态或成果,从而解决了因检索刊物出版发行和数据库数据更新滞后,导致查新所需文献的时段空缺问题。另外,查新人员若想知道何处的文件传输协议服务器存有自己所要的信息资料,可利用检索工具ARCHIE,查新人员可通过关键词查找散布在世界各地的1000多个文件传输服务器上的信息资源,充分利用文件传输功能,有助于查新质量的提高。
4信息查新工具
为了帮助网上用户更方便地获取信息,Internet还提供了许多功能完善、使用方便的查阅工具,如考查访问服务站、广域信息服务站、环球网等。不仅方便、快捷、准确、价廉,而且有助于保证查新工作的质量。可以说,利用Internet查新将成为查新工作最现代化、最广泛的一种手段和途径。
二、Internet下的手工检索
国内外数据库都处在不断发展、完善时期,不同程度上存在与课题检索要求的年代差和更新周期时间差等问题。特别是国内数据库更是如此。因此,仅靠机检是不能完成课题检索要求的,还必须靠手工检索来弥补机检的空档,补充和完善课题的检索,只有将手工和机检有机地结合起来,才能确保课题查新的检索质量。
1手工检索缩短了数据库更新周期
手工检索虽然不像机检那么方便、快捷,但它是机检的必要补充,是不可缺少的查新检索手段。用户检索文件要求一般都在10年以上,而国内数据库建设都会因当时的特定环境和因素使数据库制作的起始年代受到限制。因此,要完成该项工作,就必须靠手工进行检索。所以说,手工检索是目前弥补和完善国内外数据库年代差和更新周期时间差的最好办法。
2手工检索弥补了数据库遗漏现象
在检索课题中,常会碰到因我们检索的数据库收录文献量有限,特别是专业文献收录不全,组配的主题词输入后显示为零。遇到这种情况,也要靠手工检索书本式各类相关文件进行补充检索。我们在检索课题中,都要根据该课题的内容要求进行书本式专业文摘的检索,起到对专业文献的弥补遗漏作用。
3手工检索填充了数据文摘的空档
国内数据库大都没有文摘,从文摘的提示内容中往往难以得出准确的判断,仍需打印题目后,再提原始文件进行鉴别。实践证明,手工检索与课题相关的专业及综合性文摘,是非常必要的。
4手工检索扩展了文献信息量
【实验三网络信息检索】推荐阅读:
网络信息检索与技巧05-27
山东大学网络教育学院 现代信息检索技术1doc 答案10-06
网络工程实践实验报告06-02
网络安全实验报告综合06-13
网络数据采集实验报告10-09
无线传感器网络实验10-11
计算机网络原理实验二06-18
计算机网络实验思想总结11-24
实验7 网络的基本操作12-05