网格技术的发展与数字图书馆建设(精选10篇)
【摘要题】数字图书馆论坛
【关键词】网格技术/因特网/数字图书馆
1 网格技术的特点及其意义
网格(Grid)是近年来兴起的一种前沿信息技术,是互联网信息技术发展的新趋势。它的思想来源于电力网格,目的是将计算能力和信息资源象电力网一样通过网络形式方便地传送到用户中。网格是高性能计算机、数据资源、因特网三种技术的有机组合和发展,它把分布在各地的各种计算机连接起来,进行资源共享。美国网格项目的负责人之一伊安・福斯特在他所主编的题为《网格:21世纪信息技术基础设施的蓝图》一书认为:“网格就是构筑在互联网上的一组新兴技术。它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通用户提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格的功能则更多和更强,能让人们透明地使用计算、存储等其他资源。”因此,网格是一个一致、开放、标准的计算环境的信息基础设施,支持聚合地理上广泛分布的高性能计算资源、大容量数据和信息存储资源、软件和应用系统、高速测试和获取系统、以及人力等各种资源的合作问题求解系统的构造。
网格的根本特征是资源共享。它把整个网络整合成一台巨大的超级虚拟计算机,实现各种资源的全面共享。目前因特网上各种信息资源由于分散在不同的地方,要进行资源共享十分困难,并且利用效率比较低。网格则可以实现互联网上所有资源包括硬软件资源、计算资源、存储资源、通信资源、信息资源、知识资源等的全面连通,通过网格系统进行利用,使网络信息资源能充分利用,从而发挥网络信息资源的价值。
网格是因特网应用的新发展。有人把网格看成是未来的互联网技术,是继因特网之后的第三次互联网浪潮,是“下一代因特网”、“新一代Web”等。因特网实现了计算机硬件、网页等的联想,而网格的性能比因特网具有更强的功能:首先,网格比因特网具有更大的带宽,欧美的网格计划都使用更高速度的主干网。第二,网格上将有更多高性能计算机,它的计算速度、数据处理速度可以大幅度提高。第三,网格的体系结构将比因特网更能有效地利用网络信息资源。网格采用广域缓存技术,能够自动把用户最需要的信息放在离用户最近的服务器上。第四,网格将促进更多、更大规模的网络社区的出现,这些相互联结的社区最终构成一个庞大的网格社区。
网格将带来一场互联网的革命。互联网的作用是将各种计算机连结起来,而网格是将各种信息资源连结起来。互联网实现了计算机硬件的连通,Web实现了网页的连通,而网格试图实现互联网上所有资源的全面连通,包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。网格的应用将会遍及各个领域,从而给各行各业带来巨大的效益。正如IBM深度计算研究所所长比尔・普里布兰所说,网格和高性能计算机等信息技术的根本目的就是辅佐人类实现人与机器共生,从而解放人的大脑,提高社会的生产力。有人认为,美国70年代对因特网的研究导致了今天网络经济的繁荣,而现在对网格的研究可与当年的因特网研究相提并论,可以预料后的网格将如同今天的因特网一样,普及到国民经济和社会的各个领域,从而起到重大的作用。
网格将成为信息产业的新热点,从而带来许多机会和巨大的经济效益。据美国《福布斯》杂志的预测,网格技术将在达到高峰。如果网格技术能按预期的17%年增长率持续发展的话,那么,在将会形成一个年产值20万亿美元的大产业,将对世界社会经济产生巨大的影响。
2 网格技术的兴起和发展
网格技术是现代信息技术发展的必然产物。现代社会产生大量的数据和信息,而利用这些数据需要更大的计算能力,许多领域的计算和资源共享问题促使要利用分布在各地的计算机和信息资源,只有通过高速网络连接起来,才能共同完成有关的任务。网格可以连接广域范围内不同标准的异构“孤岛”,形成庞大的计算和信息共享体系。由于网格是因特网进一步的发展,因此它一经提出就受到世界各国的高度重视。
美国、欧洲、日本等国家都启动了大型网格研究计划。美国政府用于网格技术的基础研究经费则高达5亿美元。目前美国正规划实施一个宏大的网格计划“全球信息网格(GlobalInformationGrid)”,预计在20完成。美国国防部和欧洲能源机构等在三年前先后采用了网格技术,并得到了产业界的大力支持。英国政府已投资1亿英镑用来研制“英国国家网格(UKNationalGrid)”,将英国主要大学的超级计算机利用网格技术和高速宽带连接起来,并计划将这一系统面向企业用户开放。日本的NTTData计划进行一项网格计算试验,将有包括家庭、企业和学术机构的100万台计算机相联,其总处理能力将比现有的最快的超级计算机还要快5倍。许多信息产业界的企业也相继实施网格研究开发计划,如IBM公司正在研究一种能被多家科研单位和众多用户同时使用的超级计算机网格。5月,IBM与一家名为Butterfly.net的公司合作开发网络视频游戏平台――“蝴蝶网格(ButterflyGrid)”,使用了多台通过光纤连接的Linux服务器,采用分布式人工智能技术,支持无限用户数量以及数以百万用户同时在线的视频游戏。另外,Butterfly.net还计划推出相应的开发工具,供网格计算技术的开发商使用。蝴蝶网格的技术核心是网格计算,是真正意义上的第一个商用网格系统。206月,Sun公司推出网格引擎企业版软件,该软件提供了更高水平的控制能力和灵活性能拥有策略管理功能,允许多个小组根据公司确定的目标共享可用的计算资源,通过该软件Sun扩展了它对开放企业网格架构的理念,有关网格计算的开放方法排除了在异种环境中利用网格技术的障碍,继续强化了它在网格计算领域的领导地位,从而把网格计算技术推向了一个新的发展阶段。Microsoft也决定支持网格组织Globus企业建造和管理网格的计划。Microsoft的研究部门还参与了各项分布式计算研究项目,包括容错远程文件系统,以及建设分布式系统等。Compaq与加拿大PlatformComputing结盟,为用户提供完整的、集成的、开放的网络解决方案。Oracle在其最新版本的应用服务器中推出了全新的OraclePortal技术,是面向信息网格的新一代技术和解决方案。
网格技术在我国也开始引起重视,863计划已经启动了中国网格技术的研究,着手建立我国的国家高性能计算环境和国家信息网格,目前正在开
关键词:网格技术,数字图书馆建设,资源共享
网格技术的发展及以网格技术为基础构建的Escience科研环境给图书馆的发展带来了机遇。在Escience环境下, 科学研究的各个阶段都需要各种信息、仪器设备等资源的支持, 而且这种支撑的力度和紧密性将比传统环境下更强大。因此, 科学研究需要文献情报服务在各个阶段融入科研活动之中, 而这种融入将是以人员、产品、平台、服务的全方位融入。因此, 本文在分析了数字图书馆建设的现状和网格技术对数字图书馆建设的影响, 结合国内外重要的网格项目及重要项目的主要内容, 提出了基于网格理念的数字图书馆应用系统设计理念。
一 数字图书馆建设的现状
随着互联网的出现及广泛普及, 研究人员和团体开展科学研究的模式发生了重大的改变, 它们已经不再主要依靠传统的、难以检索、难以保存完整的印刷型出版物, 而是更多地利用数字图书馆来实现对全球信息的高效获取。数字图书馆是利用现代网络技术, 实现跨地区、跨国家的多个数字化图书馆有效连接, 使读者能够通过统一的面, 在任何地点、任何时间都能获取数字图书馆所提供的信息。数字图书的建设重点之一, 即是实现数字图书馆之间的共建共享和协同服务。数字图书馆的研究对象也有很大的拓展.不再仅仅局限于图书馆拥有的资源, 而是扩展到了整个网络上所能够提供给用户的信息。数字图书馆就是要在用户与这些信息之间搭建一座桥梁, 方便用户对信息的快速获取。“不求为我所有, 但求为我所用”这就是数字图书馆建设的目的, 而要实现这个目的, 就需要先进信息技术的支持。
二 网格技术对数字图书馆建设的影响
通过上述对网格技术的分析, 可以看出网格技术对互联网在资源共享、人机结合和信息安全等方面取得重大突破将产生重要作用。它强调全面共享资源、全面应用服务, 而这与数字图书馆的职能具有紧密的联系。因此可以说, 网格技术将给数字图书馆的服务模式带来了巨大的机遇与挑战。如果将网格技术与数字图书馆的建设全面结合起来, 则将在提升信息服务水平与效率方面发挥重要的作用。近年来, 图书馆界开始关注网格技术的发展, 并与IT界共同探讨网格技术在数字图书馆领域中的应用, 以寻求数字图书馆在资源高效利用与共享方面的新突破。不过需要注意的是尽管通过在数字图书馆应用网格技术, 图书馆可以利用更多的资源提供更优质的服务, 但是在这个过程中, 由于各类不同系统的存在, 各个数字图书馆必须重视格式的“统一”, 从而才能达到网格系统的灵活性、简单性、低成本的最佳状态。总的来说, 网格可以在以下方面影响数字图书馆的建设。
1. 网格为数字图书馆提供了统一平台
由于网格的许多平台和资源都是共享的, 它将分布在各地的计算机、数据、信息、知识等组织成一个逻辑整体, 并在此基础上运行各自的应用网格, 从而明显降低了建立网站和提供网络服务的成本, 也为数字图书馆提供了一体化信息服务的信息基础设施。
2. 网格有利于实现数字图书馆的资源共享
网格把整个因特网整合为一个巨大的超级计算机, 实现网上所有资源的全面连通。能消除信息孤岛, 实现计算机资源、存储资源、数据资源、信息资源、知识资源等多种资源的全面共享。网格提供单一的系统映像, 具有透明性、可靠性、负载平衡等功能。网格支持对异构数据资源的访问, 为用户提供统一的访问接口, 选择适当的访问协议来实现用户提出的数据访问请求。
3. 网格有利于数字图书馆的海量数据处理
数字图书馆所要处理的数据通常比较大, 网格则能够很好地解决海量数据的计算处理和分析问题。
4. 网格有利于数字图书馆的信息集成
在分布式的异构环境中, 网格技术能够精确定位所需的数据集, 并为后续处理提供支持。人们利用这些资源就像用电源一样, 不必计较这些资源的来源和负载情况。
5. 网格有利于数字图书馆进行知识管理
网格能加强对信息质量的管理。网格与因特网相比, 具有更为严格的标准规范, 也只有符合这些规范用户信息服务的发布都必须符合这些规范, 才能面向用户服务。再加上严格的服务登记制度, 有助于提高用户发布信息的质量, 在这样一个环境中得到了充分的体现。
三 网格技术与数字图书馆建设结合实例
2004年, 清华同方公司和知识传播技术研究院在近十年的大规模开发知识资源及整合传播技术的基础上, 研制成功了基于网格技术的全新资源管理应用技术——“CNKI网格资源共享平台”。它能有效地克服各种数据库之间自成体系、相对对立、只供单独使用的不足, 也能克服网上资源结构错综复杂、内容残缺或重复、功能参差不齐、难于驾驭、使用不便的缺点, 为驾驭大量无序资源、构造真正意义上的数字图书馆提供了一个全面、规范、高水准的解决方案。目前, 该平台已经连接了1400多个数据库, 包括CNKI系列数据库和来自国内外的加盟数据库, 使这些分布在全球不同地方、行业、数据格式和检索方法不尽相同的数据库, 在CNKI平台的统一管理下, 实现了跨库、跨平台、跨语言的无线链接。DILIGENT项目由欧盟资助, 于2004年9月开始启动, 为期3年, 项目的目标是创建一个先进的试验床, 使动态虚拟的组织成员能够存取共享的知识, 并以安全、协调、动态和低成本、高效益的方式进行合作。启动DIHGENT项目是为了创建一个由网格技术支持的先进数字图书馆基础架构, 该架构允许来自动态虚拟组织的成员在共享计算资源、存储资源、多媒体资源、多类型内容资源及多类型应用资源的基础上建立一个临时的虚拟数字图书馆。
四 基于网格理念的数字图书馆应用系统设计理念
如前文所述, 网格又称网格计算, 顾名思义, 其重点在于实现计算能力的共享, 而后又扩展到了大型科学仪器及科研环境的共享。由此带来一系列的关键技术需要突破, 如传感器技术、安全技术等。而计算能力和设备的共享并不是数字图书馆建设关注的重点, 数字图书馆更强调信息、数据及服务的共享, 在目前Web环境下, 数字图书馆建设从某种意义上来说已经领先一步, 基本实现了网格计算所要实现的东西。例如, 一个期刊数据库, 只要用户具有权限, 那么他在全球任何可以上网的地方都可以实现对该数据库的访问。因此网格技术在数字图书馆建设中的应用, 并不需要太多高深的理论和高深技术的突破, 更多的是应深刻领会网格架构的内涵, 并将其与实践工作相结合, 解决一些存在的问题。在工作实践中, 科研人员在查找文献时经常遇到的问题是数据库种类、数量繁多, 每种数据库都有自己的使用方式, 如果科研人员为了查找特定的资源而逐一进行数据库的查询, 会带来很大的不方便。网格的重要应用之一就是可以建立一个集成服务的知识环境, 用户点击进入便可获得所需资源, 而不用关心资源从何而来。但网格的这种应用有一个前提, 就是所有的应用系统都是基于网格架构及标准建立的, 所有的服务都是在网格环境下发布, 在这样的情况下, 所有网格上的应用服务在统一调度下, 很容易发现与集成服务, 这种网格环境的建立正是目前研究的热点。所以可以基于这一思路, 研究搭建一个分布式存储的异构数据库集成检索系统。
参考文献
[1]曲建峰、杨宗英、郑巧英等.基于网格的数字图书馆服务模式探讨[J].现代图书情报技术, 2006 (21)
[2]郑志蕴、闭乐鹏、牛振东等.数字图书馆网格互操作框架[J].计算机工程与应用, 2005 (25)
目前,国内外有为数众多的DL还没有实现连接,形成“联邦服务”的机制。因为它们是属于不同的机构、为了不同的目的而建造的,所以它们使用的都是不同的、不可互操作的技术,这也构成了形成联邦数字图书馆的最大障碍。为了克服这一困难,出现了各种实现DL之间互操作的方案。其中基于元数据收集(metadata harvesting)的OAI-PMH方案由于实现的简单性和易用性而得到了广泛的应用。
然而假设随着采用OAI-PMH技术的DL的增多,怎样才能连接不同的DL,建立一个高效的联邦数字图书馆,使它能够通过统一的接口收集异构的、急速增长的OAI-PMH数据呢?网格技术的出现为我们指明了方向。本文在OAI-PMH框架的基础上,结合网格技术,提出一个全新的DL互操作框架——数字图书馆网格(DL Grid)。
一、OAI-PMH技术
目前国内外存在的大量的DL还没有形成统一的联邦式的服务,用户可能要访问多个DL才能得到自己需要的资料。形成联邦式数字图书馆的最大障碍是不同DL间的互操作问题,OAI-PMH通过元数据收割来解决DL之间的互操作问题。许多以前的DL采用“分布式检索”来实现DL之间的互操作。这种方法只适用于节点较少时(如小于20个)的情况,对于互联网上大规模的节点之间(如大于100)却显得效率低下。OAI-PMH的最新版本2.0定义了元数据交互时通用的格式,这种交互是独立于底层数据库的。
OAI-PMH是一个比其他互操作技术更简单的批量元数据传输协议,其他更具体的功能则要借助其他技术。理解OAI-PMH的关键是理解OAI-PMH中DP(Data Provider,数据提供者)和SP(Service Provider,服务提供者)的区别。DP是一个数据仓储,向SP提供元数据。SP利用DP提供的元数据提供增值服务,SP向用户提供服务,DP向SP提供元数据,一个SP可以从多个DP收割元数据,而实际上,一个DL既可以是DP也可以是SP。OAI-PMH对用户是完全透明的,它定义了SP和DP之间的交互作用。
二、DL Grid体系结构
OA I-PMH是利用Harvesting概念建立的典型元数据采集框架,它为DL的互操作提出了一种简单、可行的解决方案,解决了分布式搜索无法解决的一个规模问题。而网格技术关注大规模的资源共享,革新的应用,以及在某些事例上高性能的需求,它强调多机构之间大规模的资源共享和合作使用,提供了资源共享的基本方法。
通过研究网格和OAI-PMH的架构,本文提出一个基于网格的三层DL互操作框架。过去OAI-PMH只是将DP和SP直接相连,简单地在http上实现元数据的采集,而本文提出的框架中,采集(harvester)节点通过网格收集DP的元数据。为增强收集和索引的动态性能,加快元数据的更新速度,在DL Grid体系结构中引入三类网格服务节点:采集调度服务节点、元数据采集节点和元数据收集/传送节点。本文提出的三层DL Grid从下到上依次分为资源层、网格服务层和服务层。
1.资源层
资源层由异构的DL构成,是整个DL Grid系统的信息提供者,也就是OAI-PMH中的DP。它将DL的相关信息提供给采集调度服务,并且向元数据采集节点提供符合OAI-PMH标准的Dublin Core标准元数据,或者其他任何可以编码成XML文档格式的元数据。
2.网格服务层
网格服务层是DL Grid的核心,它利用网格技术实现资源层中元数据发现、采集、组织、存储等功能,并向服务层提供透明、统一的接口。
(1)采集调度服务节点。该服务的主要功能是:存储一个配置文件,其中存储所有被收集的DP的列表;检查元数据收集节点上的软件版本是否一致、可用,如果某个元数据收集节点的软件不可用,则通过采集调度服务节点向其传送可用的软件压缩包;将收集元数据的任务分配给元数据收集节点并配置参数,再根据参数对收集工作进行跟踪。
(2)元数据收集节点。这类节点从采集调度服务节点处接受任务,获得DP的地址,从DP处采集元数据。采集完成后,通知采集调度服务,领取新任务,并接受采集调度节点的命令将收集的元数据传送给元数据收集/传送节点。
(3)元数据收集/传送节点。该节点的功能是收集元数据收集节点的元数据,并把它们分配到不同的索引和收集节点。
3.服务层
服务层集成收集来的元数据,通过向用户提供统一的联邦搜索服务,为用户提供文献检索、个性化服务、参考咨询等增值服务。该层由以下节点构成:
(1)索引和搜索集群节点。该节点存储下层元数据采集/传送服务节点传来的元数据,并对其进行重新索引或增量索引;按照联邦搜索节点的要求,利用索引执行搜索任务,并返回结果。
(2)联邦搜索节点。该节点向用户提供统一的搜索界面,将用户的搜索请求分配给索引和搜索集群节点,并整合搜索结果提交给用户。
三、实现DL Grid的关键问题
1.元数据管理和信息服务
良好地表示、存储、访问和使用海量资源信息是DL Grid运行的基本前提。在DL Grid中,资源及其提供者是分布的。在DL Grid计算中,需要建立灵活的、可扩展的信息服务体系结构。这种体系结构应当保证资源信息提供者的广泛分布性和加入或离开服务的动态性,避免由于单个信息服务实体的失败导致其他资源信息服务不能正常提供服务。
2.任务管理
任务管理是DL Grid研究必须解决的另一个关键问题。网格计算的目标是分解一个应用为几个子任务。由于应用程序分解的任务之间往往包含优先约束关系,对这样的任务进行调度是必须重点考虑的问题之一。任务管理完成任务提交、查询、为任务指定所需资源、删除任务并监测任务的运行状态。任务调度的作用是根据当前系统的负载情况,对系统内的任务进行动态调度,实现负载平衡,提高系统的运行效率。
3.安全控制
DL Grid所要实现的安全服务主要包含两项基本内容:对资源使用的安全认证和对资源操作的权限控制。安全认证要实现提供给资源使用者及其所要求的资源之间一套能够识别并确认对方身份的机制;权限控制则要求做到能够将资源使用者对该资源的权限明确地映射成该资源在其拥有者本地的操作权限。对于DL Grid中的安全服务,它应该实现下面的功能:
(1)一次性的身份认证。资源的使用者应能在第一次身份认证被确认后就获得对资源相应的操作权限,在释放该资源的控制权之前,使用者对于该资源的各种操作(请求、使用、释放、内部通讯)都不需要再次通过身份认证。
(2)对用户信用信息的保护。这里的用户信用信息主要包括用户的密码等信息,对这类信息的保护需要注意到存储时的保护以及在网络传输时的加密保护措施。
4.用户界面
用户界面设计影响用户使用DL Grid的效率。如何保证用户使用网格资源和构建问题解决(如统一检索、网上咨询)的效率和易用性,使用户界面达到与平台无关、与地理位置无关、安全、易用等目标,是设计DL Grid用户界面应考虑的问题。
实现全球DL的信息资源共享和检索,必须解决不同DL之间的互操作问题。OAI-PMH技术的出现很好解决了这个问题,但是假设使用OAI-PMH技术的DL数量的增加,传统的基于Web的中央控制系统不能满足需要。网格技术在处理分布式系统、异构性资源、动态性服务需求等方面具有强大的功能,作为一种探索性的课题,本文利用先进的网格技术,在原有的OAI-PMH框架基础上,提出了DL Grid的体系框架,为实现大规模DL间的互操作提出了新思路。
关键词:数字电视技术;电视领域;运用;发展前景
随着影视行业的大力发展,电视已由最初的黑白发展为彩色,由无线发展到有线。而近年来,识字电视技术的发展,更是为电视领域带来革命性的变化,引进了很多储存与传输的功能。对于计算机技术来说,这些技术的引进无疑是一个新的挑战与成就。目前,我国数字电视技术已经得到较好的发展,衍生了有线电视、移动电视、手机电视及多媒体广播电视等。这些产品的完善与更新,可能成为数字电视技术的最新发展趋势。
1数字电视技术的概述
1.1涵义
数字电视技术最先起源于西方,早在二十世纪八十年代,法国、德国、英国等欧洲国家就已经出现数字电视技术,并研究了数字卫星广播节目。在82年,美国的第一台数字电视机成功推出,数字电视技术真正的出现。在二十世纪末,我国开始运用数字电视技术,二十一世纪初研发出新的压缩音频和视频的技术,这一领域有了新的发展。
1.2数字电视技术的特点
浅谈高校图书馆的数字化建设
以计算机技术和网络技术为核心的现代信息技术改变了图书馆传统的工作方式,使图书馆的.现代化发展进入了一个新的时期.本文通过阐述建设数字化图书馆的重要性,提出了建设数字化图书馆的构想及策略.
作 者:刘菲 作者单位:襄樊学院,湖北襄樊,441000刊 名:湖南中学物理・教育前沿英文刊名:CUTTING EDGE EDUCATION年,卷(期):2009“”(12)分类号:G647关键词:高校图书馆 数字化 信息化
关键词:数字图书馆云计算SaaSSOA开源软件
中图分类号: G250.76文献标识码: A 文章编号: 1003-6938(2010)02-069-05
Research on Digital Library Based on New Information Technology
Feng Guohe(School of Economy & Management, South China Normal University, Guangzhou, Guangdong,510006)
Abstract: This paper discusses the new technology theory and application in digital library such as Grid, P2P, SOA, cloud computing, data mining, SaaS, OSS and Library2.0 and analyzes the associate relationship between these new technologies. Then, points out some issues which are needed paying attention to digital library construction based on these new technologies.
Key words: digital library; cloud computing; SaaS; SOA; open source software
CLC number: G250.76 Document code: AArticle ID: 1003-6938(2010)02-069-05
经济、社会环境等因素是数字图书馆发展的重要基础,而技术因素则是数字图书馆发展的直接推力。IAN ROWLANDS等给出的数字图书馆建设的生命周期模型指出图书馆引进、探索、整合、传播、使用等业务工作都是在经济、社会、信息等因素影响下进行的。[1 ]近年来,新技术思想的出现对数字图书馆建设产生了深远的影响,改变着数字图书馆发展的方向,特别是2004年6月在意大利召开的“数字图书馆的体系结构:对等网、网格和面向服务”会议、Library2.0以及Michael Stephens预测2009年对图书馆有影响的十大技术趋势之“无所不在的云计算”、“信息技术的角色变迁”等让很多图书馆建设者重新思考图书馆的架构、管理与服务模式。[2 ] [3 ]本文对当前出现的新技术思想进行了研究,并就其如何在数字图书馆建设中应用作了分析,可以预见新技术对数字图书馆的影响是深远的。图书馆建设者在实际工作中多了解新技术新思想有利于工作的开展,推动数字图书馆为人们、为社会提供优质服务。[4 ]
1新技术思想原理与应用
1.1新技术分析
(1)网格、对等网、SOA技术
2004年6月在意大利召开的“数字图书馆的体系结构:对等网、网格和面向服务”会议中,[5 ]学者围绕网格(grid)、对等网(peer to peer network,P2P)与面向服务(service-oriented architecture,SOA)等技术讨论构建数字图书馆新体系结构问题。Ingo Frommholz指出网格、对等网与面向服务等技术构建下一代数字图书馆体系结构成为可能:(1)设计高效低成本的下一代数字图书馆体系结构,使数字图书馆技术向更广泛的用户群体开放;(2)快速适应DL服务及相关IT领域的发展;(3)促使更广泛的内容与服务提供者的动态联邦模式。[6 ]Walkerdine,J等提出了一种基于P2P的数字图书馆系统结构原型(见图1),[7 ]吴颖红指出图书馆利用P2P技术可以进行文件交换、对等计算、协同工作、即时通讯、信息搜集等工作。[8 ]这些工作也是图书馆日常进行的基础工作,利用P2P技术可以给图书馆工作带来便利。网格在我国的典型应用为中国国家网格(China National Grid, CNGrid),CNGrid是国家863计划“高性能计算机及其核心软件”重大专项的重要组成部分,通过资源共享、协同工作和服务机制,有效支持科学研究、资源环境、先进制造和信息服务等应用。[9 ]
(2)云计算
云计算(Cloud Computing)是分布式处理、并行处理和网格计算的发展,基本原理为通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互联网相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。充分体现了以用户为中心的理念,并具有超强的计算能力。李永先指出云计算将给图书馆工作带来如下深刻变化:①确保服务器的可靠运行,最大限度地降低服务器出错概率;②以极低的成本投入获得极高的运算能力,克服服务器访问限制的瓶颈;③在更大程度上进行信息资源共享;④降低有关的维护费用;⑤最大限度地发挥图书馆的作用。[10 ]Michael Stephens预测2009年对图书馆有影响的十大技术趋势时将“无所不在的云计算”列为首位,他认为云计算将会对图书馆产生重大影响。[11 ]云计算所体现的本质特征,也是图书馆需要的,将图书馆架构在云上具有无比的优越性,极大提升图书馆的服务能力。
(3)开源软件
开源软件(Open Source Software,OSS)直接字面意思是公开源代码的软件,其经过十几年的发展,已经成功应用到很多行业,为各组织的发展起到相当大的作用。美国的开放源码促进会(Open Source Initiative,OSI)对于开源软件的描述非常详细,大致可以分成四个层面,首先是软件具有无条件的发布自由;其次是对于源代码开放的具体说明;第三关于演绎作品,即开放源代码软件许可证必须允许源代码可以被修改和允许根据源代码产生有版权法意义上的演绎作品,而这一点为日后开源软件的商业用途提供了契机;最后是与软件使用、开发是否受到歧视相关的要求,例如不得对许可对象有歧视、不得对软件被使用的领域有歧视。[12 ]开源软件深得用户喜爱,一方面是由开源软件自身的特点决定的;另一方面则是社会与技术的发展决定的,开源软件对于客户而言意味着多样性和替代性,更强的客户化能力以及防止供应商锁定,提高透明性和安全性。而对研究或开发者而言则意味着更快的开发速度,更低的开发成本,更少的重复劳动,快速的错误修正,加速了知识共享与知识创新,这些都是与社会需求相适应的。由于开源软件的这些价值,开源软件正日益表现出旺盛的生命力,目前有很多的开源软件运用于数字图书馆建设中,也取得了不错效果,但从更广泛的范围来看,它还有很大的发展空间。奉国和指出图书馆在数字化建设中与开源软件结合是一种趋势,利用开源软件不仅可以构建图书馆知识管理系统还可以提升图书馆的创新能力。[13 ] [14 ]钱国富认为,基于开源软件不仅有助于图书馆在有限的技术力量和资金投资下进行图书馆2.0建设,而且还能够拓展图书馆视野,打破商业软件对图书馆技术发展的束缚。[15 ]目前很多开源软件已经应用到数字图书馆建设中,如操作系统Linux等,数据库MySQL、PostgreSQL等,内容管理Dspace、Fedora等,检索引擎Lucene、Nutch等,这些开源软件为加快图书馆建设、节省图书馆经费带来了极大便利。
(4)数据挖掘与知识发现
数据挖掘是指从大量的数据中提取出可信、新颖、有效并能被人们所理解的、潜在的模式、规律或趋势的高级处理过程。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,在理论研究领域也被称为数据库中的知识发现。[16 ]数据挖掘最主要和最重要的分析方法有四种:①关联分析,即利用关联规则进行数据挖掘。关联分析的目的是分析决定哪些事情将一起发生。如:它能发现数据库中形如“90%的读者在一次借阅活动中借阅书籍A的同时借阅书籍B”之类的知识;②序列模式分析,与关联分析相似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。它能发现数据库中形如“在某一段时间内,读者借阅书籍A,接着借阅书籍B,而后借阅书籍C,即序列A→B→C出现的频度较高”之类的知识;③分类分析,设有一个数据库和一组具有不同特征的类别(标记),该数据库中的每一个记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类;④聚类分析,与分类分析不同,聚类分析输入的是一组未分类记录,并且这些记录应分成几类事先也不知道。聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录所在类别。[17 ]
图书馆馆藏数量越来越大,而读者感兴趣的只是其中很少一部分,如何在浩瀚的书籍信息中找到自己感兴趣的信息则是一件很头疼的事情,如何帮助读者高效找到所需信息资源是图书馆要研究的问题。图书推荐服务是采取主动的方式,向读者提供他可能感兴趣的信息,降低读者对专业知识的要求,节约了读者寻找资料的时间,同时提供了更丰富的信息。图书馆通过分析读者借阅行为来分析读者的借阅特征,发现读者的兴趣爱好,从而采取有个性化的服务;通过分析点击流来分析用户的一些行为特征,发现背后隐藏的信息;通过分析图书的借阅情况,发现哪些书是畅销书,哪些书是流通率小的书籍,为图书采购部提供指向。为此需要从读者的借阅行为中发现读者的借阅特征或者习惯,建立相应模型提供推荐服务。数据挖掘可帮助图书馆实现个性化推荐,图书采购指导,读者群分等服务工作,提升图书馆服务能力。
1.2新思想分析
(1)软件即服务
软件即服务(Software-as-a-Service,SaaS)是随着互联网技术的发展和应用软件的成熟,在21世纪开始兴起的一种完全创新的软件应用模式。它是一种通过Internet提供软件的模式,厂商将应用软件统一部署在自己的服务器上,客户可以根据自己实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并通过互联网获得厂商提供的服务。与传统模式比较SaaS具有使用费用低廉、按需求定制、发展潜力空间大等优势。[18 ]SaaS模式对图书馆建设具有极大的启发,基于SaaS模式图书馆可以将一整套的数据库、软硬件系统交付专业公司建设管理与维护,而图书馆只需专注最核心的服务工作,该模式或许是图书馆以后发展的新方向。
(2)Web2.0、Library2.0理念
很多学者对Web2.0进行过阐述,笔者认为Web2.0是技术跟理念的融合,Web2.0使得网络向社会化和个性化发展,Web2.0的核心理念强调“以用户为中心”,鼓励用户积极参与信息资源的建设。基于Web2.0图书馆界适时提出Library2.0概念,最早出现Library2.0概念在“Campus Library 2.0”[19 ]文中,之后相继有不同的研究者在不同的场合提出Library2.0的概念,对Library2.0作了不同的阐释。Michael Casey在“Library Crunch”中对Lib2.0的解释是“Library2.0是一个能够让图书馆快速地反应市场需求的运作模式,这并不表示要放弃既有的读者或使命。它是一种快速改变、弹性的组织架构、Web2.0工具、及使用者参与的哲学,能够使图书馆处于一个更加巩固的位置,并有效地、有效率地满足更多使用者的需求。”[20 ]John Blyberg指出“Library2.0在馆员之间或者是馆员与读者之间深受科技导向、双向、及社交互动(social interactions)的影响。Library2.0提供了一个框架,在该框架里以usability及findability的目标来重新评估传统图书馆管经营的每一个面向”。[21 ]国内《图书馆杂志》2005年12期有Web2.0对图书馆创新服务的启示论文,[22 ]《大学图书馆学报》2006年1期有关于图书馆2.0的论文,[23 ]而后相继与一些Web2.0/Library2.0的研讨会召开。刘炜将Library2.0定义为:Web2.0的理念和技术在图书馆行业中的应用,它不仅是一些技术的组合,而且是新的“思考方式”或“运营方式”,Lib2.0利用Web2.0技术和理念为图书馆用户提供按需定制的信息服务,如互联网作为平台、利用集体智慧、用户添加数据、支持社会性网络、丰富的用户体验等等,它以用户需求或服务为导向,而不是以技术为导向。[24 ]
从Library2.0的解释来看,Library2.0可以看作Web2.0的延伸,是技术、服务、创新等的结合,Library2.0的提出将会对数字图书馆的发展起着重要作用。基于Web2.0图书馆可以做到:图书馆利用RSS实现信息推送和共享,利用Blog、Wiki建立交流平台,专题信息库等提高图书馆的信息服务水平,利用IM软件促进图书馆的虚拟参考咨询服务建设,利用Tag实现图书馆信息的分类和组织,利用社会网络促进用户与图书馆的合作与共享等。Library2.0的出现极大丰富了图书馆工作内容与工作方式。
(3)其他
SOA技术,其实也是一种思想的重要体现,面向服务结构强调以服务为中心架构图书馆体系,服务思想应该在该结构中得到重点体现。另外开源软件也体现出一种思想,该思想强调图书馆建设开源模式的推行,该模式与商业模式不同,颠覆了图书馆传统的建设模式,影响图书馆未来的发展。
2新技术思想关联关系及启示
新技术为图书馆建设带来新思路,数字图书馆建设充分利用新技术可以节约成本,加速建设进程。图书馆根据各种技术思想特点,有针对性的选择适合自己的建设模式。为此,理清各种技术理念的关联关系,找到一种最佳组合模式是运用新技术的前提。
2.1开源软件与Web2.0/Library2.0
开源软件已经被各行业广为认识和接受。同样在图书馆的建设中,开源软件也受到了图书馆人的认同和欢迎。范并思则认为开源软件是Web2.0的重要理念,应用开源软件也成为Library2.0的重要应用。[25 ]钱国富认为基于开源软件进行Library2.0建设,能够拓展图书馆视野,打破商业软件对图书馆技术发展的束缚。[26 ]目前在全球数字图书馆的研究和实践过程中,出现了很多能够支持图书馆应用的开放源码软件,例如支持存储检索、收割聚合、开放链接、集成门户、知识技术、可视化、单点登录、内容管理、机构仓储、虚拟学习、学术交流等多个方面的开放源码软件。开放源码思想的兴起和开放源码软件的蓬勃发展,给数字图书馆的发展提供了一个“低代价可持续发展”的机会、一个以高性价比产品获得竞争力的机会。针对数字图书馆的发展情况,如果有效地选择、利用、本地化和再开发目前比较成熟的开放源码软件,对于提高自身数字图书馆的层次和起点,加快自身数字图书馆的发展有着重要的意义。开源很多思想与Web2.0/Library2.0的理念是相同的,它们都主张开放、共享,强调人人参与。
2.2网格与云计算
Grid是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通百姓提供更多的资源、功能和交互性。网格技术利用高速因特网把分布于不同地理位置的计算机、数据库、存储器和软件等资源连成整体,就像一台超级计算机一样为用户提供一体化信息服务,其核心思想是“整个因特网就是一台计算机”。网格目标本身不在于规模的大小,而在于可共享资源的种类,共享使用资源的形式,对用户共享资源的要求,共享的透明程度,接口的简单程度等。网格与云计算有很多相似之处,但是云所包含的概念更广泛。高岚岚对网格与云计算从作业调度、应用影响、服务理念等方面作了深入比较。[27 ][28 ]可以预见,云计算无比巨大的优越性,必将对未来产生深远的影响。
2.3云计算与SaaS
云计算的内涵即体现了SaaS思想,它通过浏览器把程序传给成千上万的用户。在用户眼中看来,这样会省去在服务器和软件授权上的开支;从供应商角度来看,这样只需要维持一个程序就够了,这样能够减少成本。云计算核心思想为无所不在的计算、服务,用户只要接上云就可以开展自己工作,而为此提供的服务工作则全部交由云提供商去完成,所以未来将SaaS思想与云计算相结合是一种趋势。
2.4SaaS与SOA
SOA是一种框架的方法,它是开发松耦合软件的框架,是描述业务组件如何构架的方法;而SaaS是一种传递模型,是描述软件如何交付和传递的方法,基于SaaS模式的应用程序是指单实例/多个承租(Multi-Tenant)的应用软件。SaaS和SOA关注问题的角度不同,都是时下流行且备受推崇的技术,两种技术是共生的,而且,两者可以通过两种不同的方法一起工作。一方面,SaaS应用软件程序需要通过SOA的标准和SOA的方法建立起来并作为标准服务被传递;另一方面,SOA基础设施可作为SaaS应用软件程序的一个集成点被使用,通过在SaaS应用软件程序和内部业务线应用软件程序之间,应用基于SOA架构的组织服务总线,可以实现应用集成。[29 ]
3应用新技术思想建设数字图书馆应注意的问题
(1)坚持以服务为宗旨
服务是图书馆的核心工作,任何先进的技术思想都应该是围绕服务去开展应用,基于别人的平台,用别人的软件,使用外部的资源提供读者服务。无论是开源软件还是云计算技术,都应该强调服务这个核心思想,只有方向明确,工作才能更好开展。
(2)具有国际视野
图书馆发展建设是一个动态的过程,它会随着技术、社会、经济等因素的发展而发展,图书馆的决策者在构架图书馆系统时,应该长远考虑,多学习借鉴国际图书馆的经验做法,预留扩展接口,为未来的发展提供充分的扩展性。新技术的发展非常迅猛,新技术思想层出不穷,需要及时准确预判技术发展趋势,保持同国际主流接轨。
参考文献:
[1]IAN ROWLANDS AND DAVID BAWDEN.Digital Libraries:A Conceptual Framework[EB/OL].[2008-02-18].http://www.librijournal.org/pdf/1999-4pp192-202.pdf.
[2][5]Can Türker.Peer-to-Peer数字图书馆体系结构中的对等、网格与服务定向[M].北京:北京燕山出版社,2005:21-23.
[3]Michael Stephens. Ten Trends&Technologies for 2009[EB/OL].[2009-04-18].http://tametheweb.com/2009/01
/12/ten-trends-technologies-for-2009/.
[4]奉国和.多角度探讨数字图书馆发展演化[J].四川图书馆学报,2008,(6):21-25.
[6]Ingo Frommholz,Predrag Kne?evi’c,Bhaskar Mehta,etal.Supporting Information Access in Next Generation Digital Library Architectures[C].Preproceedings of the Sixth Thematic Workshop of the EU Network of Excellence DELOS,2004:49-60.
[7]Walkerdine,J.,Melville,I.,Sommerville,I.. A Framework for P2P Application Development, Technical Report COMP-004-2004[D].Computing Department, Lancaster University,2004.
[8]吴颖红.P2P技术应用与数字图书馆网络发展前瞻[J].晋图学刊,2007,(3):38-41.
[9]金海.网格计算[A].中国计算机学会学术工作委员会.中国计算机科学技术发展报告2004[R].北京:清华大学出版社,2004:99-119.
[10]李永先.云计算技术在图书馆中的应用探讨[J].江西图书馆学刊,2009,39(1):105-106.
[11]Michael Stephens. Ten Trends&Technologies for 2009.[EB/OL].[2009-04-18].http://tametheweb.com/2009/01/12/ten-trends-technologies-for-2009/.
[12]奉国和等.开放源码在数字图书馆建设中的应用[J].中国信息导报,2007,(4):53-54.
[13]奉国和.开源软件与图书馆知识管理探讨[J].图书馆论坛,2008,(2):58-61.
[14]奉国和.开源软件与图书馆创新能力研究[J].图书馆学研究,2008,(6).
[15][26]钱国富,涂颖哲.基于开源软件的图书馆2.0建设研究[J].图书情报工作,2007,(5).
[16]Jiawei Han, Micheline, Fan Ming, Meng Xiaofeng(Translation).Data Minging:Concepts and Techniques[M].Beijing:China Machine Press,2001.
[17]奉国和.基于SAS数据挖掘技术的航空CRM系统分析[J].情报杂志,2006,25(5):56-59.
[18]什么是SaaS?SaaS与传统软件区别是什么? [EB/OL].[2009-04-14].http://www.226e.net/article/91/Article40
788_1.htm.
[19]Albanese A R. Campus Library2.0[J]. Library Journal,2004,129(7).
[20]Casey M. LibraryCrunch[EB/OL].[2008-03-16]. http://www. Library.crunch.com.
[21]Boog J.Library 2.0 movement sees benefit s in collaboration with patrons[EB/OL].[2008-03-16].http://www. publish. com/ article2/0,1895,1881893,00.asp.
[22]孙茜.Web2.0对数字图书馆创新的启示[J].图书馆杂志,2005,(12):27-30.
[23][25]范并思,胡小菁.图书馆2.0:构建新的图书馆服务[J].大学图书馆学报,2006,(1):2-7.
[24]刘炜,葛秋妍.从Web2.0到图书馆2.0:服务因用户而变[J].现代图书情报技术,2006,(9):8-12,67.
[27]高岚岚.云计算与网格计算的深入比较研究[J].海峡科学,2009,(2):56-57.
[28]奉国和.网张环境下信息资源共享技术研究[J].图书与情报,2008,(4):48-53.
[29]霍小军.SaaS模式在电子政务中的应用初探[J].电子政务,2008,(1):73-86.
数字图书馆建设现状及其走向
数字图书馆是信息资源数字化存取、分布式管理、网络化服务的知识库集群.目前数字图书馆的理论研究和实践风行全球,并取得了相当大的`成绩,但这一领域的研发工作还处于探索阶段,其趋势将朝海量数字化存取、全球范围全方位合作、加强标准化建设、科研与工程紧密结合、服务个性化等方向发展.
作 者:乐红丽 YUE Hong-li 作者单位:湖南理工学院,图书馆,湖南,岳阳,414006刊 名:云梦学刊英文刊名:JOURNAL OF YUNMENG年,卷(期):30(1)分类号:G250.76关键词:数字图书馆 数字图书馆建设 现状 发展趋势
邀 请 函
尊敬的:
您好!随着全球信息网络技术的飞速发展带给传统医院图书馆服务与建设的巨大冲击,图
书馆的文献资源从采购到图书管理及服务都发生了重大变化,越来越多的网络化、数字化资源
成为馆藏的重要组成部分,亦是医院图书馆资源建设的重要内容之一。因此,加快图书馆信息
化、数字化建设,收集和开发优质资源,扩大服务内容,满足广大医务工作者的需要已成为当
前医院图书馆的重要工作内容,同时也是国家卫生和计划生育委员会医院等级评审对医院图书
馆的基本要求。为此,陕西省医院图书馆管理委员会拟于2014年5月16日至5月18日举办
“医院信息化数字图书馆建设与发展研讨会”。诚邀贵院相关负责人参与研讨,望您能在百忙
之中拨冗出席。
一、参会人员:各医院院长、主管院长及相关科室主任
二、会议日期:2014年5月16日--5月18日(16号下午14:00签到)
三、会议地点:三门峡市
会议主题:
1、我国医院数字图书馆信息网络化现状和数字图书馆未来发展趋势
2、网络环境下信息资源的检索利用及常用数据库
3、文献资源数字化加工与信息港建设
4、国家卫生和计划生育委员会关于医院等级评审对医院图书馆的要求
5、医院图书馆网络化资源的购置与自建方法及建设创新热点问题
6、数字环境下的未来新型图书馆服务(案例分析、经验交流)
四、会议费用说明
1、免会务费,会议统一安排食宿
2、参会人员往返交通费用自理
五、联系方式
成员 :夏银坡***
孟志威***刘长郎***changlang@dayi100.com
主办单位:陕西省医院图书馆管理委员会
关键词:院校图书馆 数字化建设 发展趋势 研究
【中图分类号】G251
一、数字图书馆的内涵与特点。所谓数字化图书馆,就是指图书馆采用现代高新技术所支持的数字信息系统,对图书馆包括历史文献在内的各种资源进行数字化处理、存贮和传输,为读者提供现代信息服务的图书馆。数字化图书馆运用计算机系统,依托国际互联网并通过网络为信息需求者提供高效、快捷的数字化信息服务,实现真正意义上的信息资源共享。
数字化图书馆有以下特点:一是馆藏数字化。即图书馆利用信息存贮技术把各种媒体信息加工成计算机可识别的数字化信息资源,形成电子文献,实现知识信息载体的革命性变革。二是传递网络化。即利用网络技术和通讯技术环境,数字图书馆可以为用户提供高速跨库连接的信息存取服务,实现更大范围的知识信息交流和获取。三是资源共享化。信息技术和网络技术打破了地域界限,使图书馆的联合在网上实现各信息服务系统相互融合,实现广泛的信息交流和资源共享。四是操作电脑化。图书馆各项业务流程采用计算机技术管理,提高了图书馆工作效率和质量。五是服务社会化。数字图书馆是一个开放的系统,它适应用户需求日益社会化的发展趋势,打破传统图书馆对读者的种种限制。六是馆藏特色化。图书馆把自己最具特色的信息资源编成数据,通过网络奉献给读者,共同担负起传递信息责任。
二、建设院校数字图书馆的必要性
1 通讯技术和网络技术已经成为社会活动的基础之一,其发展是图书馆所处信息环境发生变化的重要原因也是数字图书馆得以实现的重要推动因素。
2 因特网的迅速推广与普及,给数字图书馆的出现提供了现实的网络环境和丰富的电子信息资源。传统的存储组织方式已不适应新的需求,为了解决资源与存储共享和发展,需要新的技术来描述馆藏的服务。
3 随着社会对信息的需求急剧增加。人们希望通过网络直接检索图书馆的馆藏,获取所需的信息。图书馆走数字化建设的道路,向新型的、现代化的数字图书馆方向发展是必然趋势。
4发挥图书馆对校园文化的引领作用。图书馆是一个综合性的文化场所,具有文化传导功能。营造这种优雅、充满文化气息的环境,启发学生自觉学习、勇于探索、追求创新的一种氛围。为学生提供了智力开发、道德教化、精神文明、技能培养、情操陶冶的条件,创造出一种宽松的环境。
三、数字图书馆的模式
1. 通讯系统。网络和通讯系统数字化图书馆的重要基础。从宏观的数字化图书馆的概念来看,它是一个整体化建设,包括一个单位内的区域网络以及地区、国家和国际网络及通讯系统的建设。今后的网络和通讯环境将是各国的NII和全球的GII。宽带网是数字图书馆要求的运行环境。
2.信息资源。一个现实的数字化图书馆在今后一段时间内将同时存在三种资源:即本单位收藏或开发的数字化信息资,传统图书馆的印刷型资料。但应有各种数字化的索引:外界数字化图书馆、信息中心和电子出版物数据库的资料等,就长远观点而言,还应有国家级的“知识银行”、“文献数据库系统”,供各个数字化图书馆共享。全世界已有包括美国国会图书馆在内的1000多所公共图书馆、大学图书馆及400多个学术机构,将其联机馆藏目录通过Internet免费对外开放。它们已是虚拟图书馆重要的信息资源。
3.数字图书馆的咨询系统。一般分为自我服务系统和请求帮助系统。这是数字化图书馆的重要组成部分,前者能在客户端上显示读者指南,可用菜单方式,也可用超级卡或窗口软件,它能自动指引读者使用数字化图书馆。后者为请求帮助系统,应随时提供给用户。数字化图书馆应有各种信息专家,随时接受读者的联机访问并提供咨询。
四、对院校数字图书馆建设的建议
1 加强业务学习,提高馆员素质。必须及时补充、更新、提高自身的知识水平和技能,以适应图书馆事业发展的需要,成为现代图书馆的复合型人才。馆员必须掌握的基本技能有计算机操作,电子信息资源的组织、管理和处理,熟悉各种检索软件工作等。还应具备对繁多的网络资源进行组织、筛选的能力,能对电子信息资源进行深层次的开展。图书馆员必须具备相当的外语水平,才能在网络环境下熟练利用外语进行信息的检索、交流、传递。馆员要提高文化素养与服务质量,围绕着网络的建设、维护、利用,对部分新的设想进行试验性研究、对用户进行宣传、推广工作等。
2 加强电子资源的建设。数字化信息资源已成为馆藏资源激增的主体,包括各种电子数据库、网络信息资源等。高校数字图书馆是为教学科研服务的机构,因此它所收藏的电子资源在学科特点、学术价值和专业范围方面都有特定的要求。各高校图书馆在电子资源建设中目前普遍采用联盟采购的方式来购买国内外著名数据库,在体现特色馆藏和特色文化的基础上建设各种自建数据库,围绕自己的重点学科建立学科信息门户,开发与重组网络信息资源。
3 加强合作。我国为加速国民经济发展和强化国家信息基礎设施,投资建设了中国数字图书馆工程、国家科学数字图书馆、全国文化信息资源共享工程等大型项目。其中,中国数字图书馆是全国最大的电子文献信息中心,收藏了中英文大型数据库70个、全文电子期刊8000余种、多媒体光盘4 000余张,内容覆盖各个学科领域,它可以面向国内外用户提供本地检索、委托查询、课题查询、定题咨询等服务。高校图书馆可以通过签约加入这些组织,通过合作方式来节约数字图书馆建设的投资。
4 做好读者培训工作。 面对浩如烟海的各种信息资源,不少读者,特别是对于刚入校不久的新生,不熟悉馆藏和缺乏相关的网络知识,很难迅速找到自己真正需要的信息。这种情况势必会影响数字图书馆的“应用”效能。改善这种状况的一种有效途径就是图书馆积极主动地开展用户培训工作。图书馆应在了解读者情况及其需求的基础上,定期或不定期地向他们介绍相关的信息技术知识,以及有关信息获取途径和方法的知识和经验,也可将这些知识随时公布在自己的网站上,使读者通过培训和学习,不仅能够利用传统方法获取文献资源,而且可以熟练利用数据库获取所需的信息和知识。
参考文献:
[1] 袁红军:《数字档案馆服务模式研究》,《档案》2007年第1期。
[2] 范晓鹏.关于我国数字化图书馆建设的探讨[J].图书情报工作, 2001, (3).
[3] 周维彬 . 数字图书馆研究的学科实位[J] 图书馆学研究,2003(6)
【关键词】数字图书馆;大数据;资源建设
【作者单位】史少凡,河北农业大学图书馆;杜友君,上海体育学院体育新闻传播与外语学院。
【基金项目】河北省高等学校人文社会科学研究项目“数字图书馆服务性建设及其对于先进农村文化建设的意义”研究成果之一。
自1995年正式引进以来,数字图书馆在我国已经走过20多个年头。随着信息和互联网科技的推陈出新,数字图书馆作为一种网络环境下的信息资源组织和服务方式,不断地吸纳和融合新技术、新应用,加快资源建设的步伐。
大数据技术是信息及互联网科技衍生出的新概念和新的数据服务形式。维克托·迈尔-舍恩伯格和肯尼斯·库克耶在《大数据时代》一书中为其概括了“4V特点”,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。在笔者看来,撇开艰涩的理论概念,通俗地说,大数据技术就是基于分析处理(移动)互联网、信息领域日常运作中累积下来的海量数字信息资料,来发现和形成新的服务形式的技术。
如今,大数据技术已被广泛应用于生产生活各个领域,数字图书馆作为高校图书馆领域中最贴近信息和互联网技术的面向,在自身资源建设过程中,必然要与大数据技术结合。本文对此展开初步的探究,以期达到抛砖引玉的目的。
一、“猜你喜欢”——高校数字图书馆在大数据时代的个性化服务
我们在浏览网页或网购商品时,不时可以看到信息提供商推送的“你可能喜欢的商品”“你可能喜欢的视频”等等链接或模块,这些链接或模块往往暗合网民的心意,让人有意想不到的惊喜,这便是时下网络盛行的“猜你喜欢”,其内在的机理正是大数据技术。
“猜你喜欢”的运作机制并不复杂,网络内容提供商依据网民访问网页、搜索商品时留下的种种“痕迹”进行大数据分析,进而对网民的喜好做出“猜测”,并将结果推送给网民。网民访问和搜索的频率越多,“猜测”所依据的数据样本越多,统计学意义上的计算越准确。
如今高校数字图书馆的学生和教师通过网上借阅、搜索、阅读已经十分平常,读者会在访问数字图书馆时留下“痕迹”,久而久之便形成了数字图书馆的大数据。以往,这些“痕迹”大多数被视为无用的垃圾信息,被定期清空甚至根本不做保留“痕迹”的设置,以至于让这些“金子”还没来得及“闪光”就白白浪费掉。但在已经进入大数据时代的今天,保存和分析高校数字图书馆在运行期间留下的大量大数据信息,在认知和技术上已经不存在任何障碍。
大数据给高校数字图书馆提出了新的课题,即大数据分析的目的是什么。一言以蔽之,就是为读者、客户提供个性化的服务,套用时下流行的网络语言就是“猜你喜欢”。
其中的道理其实不言自明,如今阅读工具日益丰富化,阅读习惯日益个性化,数字图书馆使用渠道日益多元化,数字图书馆已经很难满足所有读者的需求。尤其是高校数字图书馆,由于内容提供方面的局限性,在满足互联网时代师生的信息需求方面,捉襟见肘。如何充分开掘自身信息资源、有效绑定读者群,对现在的数字图书馆来说十分有必要。这方面只有一个办法——满足师生的个性化阅读需求,有针对性地提供个性化服务。
了解海量读者的个性化需求,猜读者的喜欢,需要海量的数据计算。在以往单纯依靠人力的时代,这几乎是不可能完成的任务,但基于大数据技术,一切变得简单起来。因此,数字图书馆的资源建设要与时俱进,迎接大数据时代的到来。
二、从内容提供者到问题解决者——大数据时代高校数字图书馆资源建设的发展路径
大数据技术虽已诞生数年,但与臻于成熟的互联网科技相比,只能算是初出茅庐,不过其气场已经昭示出不可限量的发展空间,人们津津乐道的“互联网+”概念,就处处离不开大数据技术。那么,在大数据技术广泛浸入现代生活的当下,理想中的高校数字图书馆应该是什么样子的?换句话说,高校数字图书馆资源建设的发展路径应该是怎样的,如何与大数据技术结合?我们不妨在这里初步探究一下。
为读者提供内容服务,这是包括数字图书馆在内的形形色色的图书馆天经地义的工作职能。但是在自媒体、云计算、大数据技术已经相当普及的今天,仅仅被动地提供内容服务、被动地反馈读者需求,显然远远不够。大数据时代的数字图书馆资源建设,首先需要的是一场“观念革命”,即由被动接受反馈转变为主动提供服务,从过去的“内容提供者”转变为新时期的“问题解决者”。
在展开讨论前,我们有必要厘清数字图书馆信息资源建设所包含的范畴:一是指与数字图书馆活动有关的各类文字、数字、音像、图表、语言等一切信息的总称;二是指数字图书馆主体利用现代技术手段已经收纳或者可以收纳的所有信息[1]。下文中,笔者就在这一范畴内来阐述基于大数据技术的数字图书馆信息资源建设,主要是基于两个“面向”。
1.面向科研教学提供支撑服务
高校图书馆的一个基本职能就是支持科研和教学。在这方面,基于大数据技术的数字图书馆应主动汇总、收集教学科研人员的阅读需求,进而将收集的数据融入图书馆资源建设和系统开发中,以教学科研人员的需求为指针,依据学校科研特色,着力挖掘数字化图书馆的内容资源,开展更有特色的、全面的、有针对性的服务,为学校科研教学工作提供有力的支撑,让更多的有用资源脱离冰冷的书架,让教师在电脑、手机等终端上能更容易地发现和阅读它们,进而将它们与教学和科研工作结合。
2.面向学生提供差别化服务
学生是高校的主体,某种程度上说也是数字图书馆的使用主体。既要依据学校专业特色为培养学生专业型技能提供支撑,又要根据学生生理和心理年龄提供全面的通识教育,是图书馆资源建设面对的重要课题。基于大数据技术的数字图书馆可以说为解决这一难题另辟了蹊径,只要对学生的专业、兴趣、借阅习惯甚至个性癖好进行大数据分析,就不难对整体和个别学生的阅读进行甄别,从而为图书馆资源建设提供依据。当下,越来越多学生“足不出户(宿)”访问学校图书馆、24小时全天候打开手机阅读等行为习惯,勾画出一幅丰富多彩的高校“热点图”。这类似春运期间一些门户网站制作的城市人群出行轨迹图,图书馆应对此善加利用,制作属于学生群体的“热点图”,再“按图索骥”,主动完善数字图书馆内容服务,让学生随时打开手机和电脑,都能得到合心意的个性化内容服务。
nlc202309082329
三、依托大数据技术的高校数字图书馆资源建设过程中需要注意的问题
1.保护隐私
所谓道高一尺,魔高一丈,大数据技术日新月异,给人们带来一个个不可思议的服务样式,但与此同时,其带来的安全隐患、特别是海量信息收集造成的个人隐私泄密风险,同样要引起我们高度重视。2015年发生的苹果iCloud系统性泄密事件可以说是一个前车之鉴,其所导致的公众人物个人私密信息大规模泄露事件,震惊了世界[2]。
高校数字图书馆应用大数据技术是大势所趋,其所收集到的读者个性化信息正日渐丰富和细致,但同时也面临越来越高的泄密风险,稍有不慎就会被黑客或者别有用心者利用。所以,高校数字图书馆面临的一个重要课题就是保障读者个人信息的安全,可以说信息安全建设重于泰山。
对致力于发展大数据技术并提供相关服务的高校数字图书馆来说,做好信息安全保障工作,一是要积极采用互联网安全方面的最新科技成果,构筑符合自身系统特点的网络防火墙。在这方面,国内已经有相当成熟的系统性解决方案,如北京邮电大学为数字图书馆开发的网络安全系统等。二是要积极延揽网络安全方面的人才。目前,大多数高校数字图书馆技术部门的人才构成仍偏向于内容建设和系统搭建,未来,除了在上述方面继续发力,高校图书馆应考虑逐步向系统搭建与信息安全并重的方向推进,甚至应对安全性有所倾斜,以适应越来越复杂的网络信息安全环境。
只有在硬件(网络信息安全系统及防火墙)和软件(网络安全人才)都相对完备的基础上,基于大数据技术的高校数字图书馆才能建构一个牢靠坚实的平台,防患于未然。
2.增强互动
如前文所述,基于大数据技术的高校数字图书馆可以“猜你喜欢”,可以提供差别化的服务,但即便是能够满足这些条件的数字图书馆,其内容服务水平也可能差距很大,产生差距的关键主要在图书馆(内容/服务提供方)和读者(内容/服务接收方)互动性的强与弱上。
钟情于移动互联网和数码科技的用户,对小米公司近5年来从诞生到迅速崛起的故事应该有所了解,小米快速成长的基础就是所谓的“粉丝文化”。粉丝既是小米产品和服务的消费者和使用者,反过来又对小米公司改进产品和服务提供意见反馈。在一来一往中,双方形成了一种良性的互动,即公司在不断的用户反馈中持续改进服务,用户在服务的不断改进中得到使用上的满足。
事实上,让用户参与“服务改进计划”是很多公司都在进行的工作,但对这项工作特别看重和真诚投入的,恐怕就没有几家了,这也是小米区别于其他公司取得成功的关键。
依托大数据技术,高校数字图书馆可以相对轻松地了解师生的基本信息,如学历、年龄、兴趣爱好等,但对细微的个人情感、阅读习惯的把握却很难精准。这个时候,我们需要借鉴小米公司的经验,将大数据技术和移动互联技术紧密结合,并与用户充分互动。
首先,数字图书馆非常有必要建立自己的社交账号和平台,如微信公众号、官方微博账号等,这是在移动互联时代与师生沟通的基本渠道。数字图书馆既可以在社交媒体上及时发布自己的信息,如活动安排、推荐书单等,也可以开放留言,让师生充分参与到数字图书馆的资源建设中,对图书馆内容或服务建言献策。传统的论坛、留言本等网络平台也不妨保留,对一些有着较深图书馆情怀的老读者而言,这是他们发言的空间。
其次,有条件的高校数字图书馆可以着力开发自己的手机和平板电脑客户端(App),供学生下载使用。如今社会已经步入移动互联时代,从2015年开始,中国手机上网网民数量历史性地超过了电脑,高校师生无疑是领风气之先的群体,因此,高校数字图书馆在这方面必须与时俱进,跟上移动互联网的技术浪潮。高校数字图书馆可以针对安卓和苹果两大主要手机操作系统开发App,技术成熟之后还可以针对iPad等平板电脑开发App,甚至可以与Kindle等电子阅读平台合作。此类客户端开发和运营成本并不高,但效果却是显而易见的,一方面,可以随时随地给师生提供精神食粮,大大方便他们阅读,另一方面,师生只需动动手指就可以轻松地把自己的想法反馈给图书馆,图书馆再根据师生的反馈信息,利用大数据技术进行批次处理,将结果细化到后面的服务中,从而形成一个“图书馆—师生”的双向、良性互动格局。这样美好的图景并非纸上谈兵,只要高校数字图书馆及时行动起来,用心经营,就不难实现。
大数据技术可以说是为互联网特别是移动互联网而生,在人类社会已经步入移动互联网时代的今天,高校数字图书馆势必要与时俱进,拥抱这个朝阳般的技术,并活化运用到自身的资源建设中来。高校图书馆运用大数据技术,不仅可以在同业竞争中处于领先地位,更重要的是可以随时随地为师生提供一流的内容服务,更好地服务于日常的教学和科研工作。
[1]黄俊. 加强数字图书馆资源建设的思考[J]. 河南图书馆学刊,2013(2):86.
[2]腾讯财经. 美国多位女星私密照遭泄露 iCloud遭质疑[EB/OL]. http://tech.qq.com/a/20140901/028072.htm,2014-09-01.
【网格技术的发展与数字图书馆建设】推荐阅读:
数字图书馆及相关技术问题07-22
网格化管理系统的探索与研究06-21
数字图像处理技术的方法及发展方向论文11-09
网格化管理的特征12-17
信息技术的发展与学习方式07-09
厌氧处理技术的发展与展望07-25
网格员的心得体会09-14
浅析建筑工程技术的现状与发展论文07-24
多媒体技术未来发展与应用的展望10-21