图书馆古籍数字化资源建设研究

2022-09-19 版权声明 我要投稿

1 我国图书馆古籍数字化建设的发展概况

据不完全统计, 截止到2010年3月, 我国的图书馆中共收藏约2750多万册的古籍其中国家图书馆、上海图书馆、北京大学图书馆以及南京图书馆的收藏量均超过100万册。近年来, 我国图书馆积极对如此丰富的古籍资源进行数字化的开发, 如在古籍书目数据库以及古籍全文数据库建设等方面均取得了丰厚成果。

1.1 在古籍书目数据库方面的建设

将古籍书目进行数字化建设是我国图书馆最初对古籍数字化建设的尝试和探索, 在我国台湾地区这项工作起步较早, 上世纪90年代古籍书目数字化建设开始在大陆进行。最早在古籍数据库方面建设的图书馆是辽宁图书馆。南京图书馆先后建设了《中国古籍总目》、《南京图书馆藏书目录》以及《南京图书馆藏地方志目录数据库》。从1999年开始, 国家图书馆也进行了古籍书目数据库的建设, 到现在已经完成的古籍书目数据近30余万条。

1.2 在古籍全文数据库方面的建设

从20世纪90年代中期开始, 很多的出版社、学术机构以及商业公司分别加入了古籍资源的数字化建设工作, 这使得我国古籍数字化建设的规模快速地扩大。在国内最早开始进行古籍全文数字化建设的图书馆是上海图书馆。上海图书馆自1996年启动了古籍善本全文光盘工程这个重点科研项目, 该馆同时与长江计算机集团合作, 全部将馆藏古籍善本进行数字化建设, 并进行分期上网服务, 实现了古籍资源数字化尤其是善本古籍数字化建设逐渐朝着全文服务方面发展, 开创了制作古籍善本全文光盘与服务客户的先河。

2 进行图书馆古籍数字化建设的意义

2.1 抢救了即将毁灭的图书馆古籍

采用古籍数字化建设可以对那些由于年代久远, 破损严重的古籍进行抢救, 弥补了只靠传统的修补裱糊方法的缺陷。

2.2 忠实地保存了图书馆古籍原件

数字化的古籍是古籍原件的“翻版”完整地保存了古籍的原来面貌, 古籍信息没有丝毫的损失, 既可以作为古籍原件的替代品投入使用, 同时也可以作为古籍原件的附件进行保存。

2.3 促进了图书馆古籍资源的利用

古籍的数字化建设由于保留了古籍的原样, 与古籍原件具有“异曲同工”的效果作为古籍原件的替代品完全可以投入使用, 同时, 使用它们可以更加方便、快捷, 更受客户的欢迎, 使用范围将会更广, 使用频率将会更高。

2.4 存储容量太, 存放空间小

图书馆古籍经过数字化的建设可使用多种方式进行存储, 存储容量太, 其存放空间却很小, 及其便于收藏与保管。同时可从著者、书名等多途径检索, 十分方便读者查阅。

3 当前图书馆古籍文献数字化的方式

目前, 一般来说图书馆古籍文献数字化的方式有以下四种。

3.1 完全图像方式

完全图像方式是一种最简单的数字化方法。这种方式只需要将古籍原文扫描形成图像形式, 存储在各种介质上就可以, 利用这种方式得到的古籍文献的数字化版本被称之为“全图像版”。这种方式简单实用, 但由于资料是以图像的方式如BMP、JPGE、T AG、GI F等格式存储, 无法对文献内容进行检索, 不方便查询。

3.2 目录文本、正文图像方式

这是在“全图像版”基础上的一种改进, 称为“标题检索版”。采用图像方式存储的正文部分可与文本方式存储的目录建立链接关系。读者可以依据目录进行检索和查找, 并可根据目录与正文之间的链接关系, 检索到所查找的正文图像。这里的目录不但包括卷册、书名、大小标题, 还包括图名和表名等, 是一种广义上的目录。

3.3 全文本方式

“标题检索版”只能在目录中检索与查找, 不属于真正意义上的数字图书馆。而将书中所有文字全部采用文本方式存储的全文本方式可以实现覆盖全文的检索与查找。通过这种方式得到的古籍文献数字化版本我们称为“全文本版”。

3.4 全文图文对照方式

该方式是目前图书馆界应用较多的方法, 是以上几种方式的综合体。它不但将古籍以图像和文本方式存储, 还对古籍中的每一个汉字与它在原书中的图像建立链接关系, 用户在进行全文检索的同时, 又可以方便地查看图像资料。这种既可以通过“全文本版”进行检索、查找和阅读古籍, 又可以迅速方便地翻阅到当前文字所在“全图像版”中对应位置的古籍文献数字化版本我们称为“图文检索版”。

4 古籍数字化处理前应遵循的重要原则

4.1 统筹规划, “三个结合”

图书馆在组织古籍数字化处理工作时, 应该进行统筹规划, 努力做到“三个结合”。一是把古籍数字化处理工作与馆藏古籍的基础整理、资料完善工作结合起来;二是把古籍数字化处理工作与馆藏古籍的保管期限鉴定工作结合起来, 以便利用技术手段将古籍中真正具有永久查考价值的资料预先列入数字化范围;三是把古籍数字化处理工作与抢救修复破损古籍的工作结合起来。通过“三个结合”尽最大限度地实现古籍数字化处理工作的综合效益。

4.2 突出重点, 先急后缓

古籍数字化工作非一日之功, 由于馆藏古籍数量大, 资金和人力相对有限, 所以在计划安排数字化工作时必须统筹兼顾, 遵循“突出重点, 先急后缓”的原则。各图书馆应根据此原则, 制定详细规整的工作计划表, 分步骤按顺序地组织开展古籍数字化工作。

4.3 确保质量, 追求效率

古籍数字化工作势在必行, 但资金投入量大, 技术要求高, 任何图书馆和个人都不能随意浪费国家宝贵的资金和人力资源, 谁也承担不了因工作质量问题带来的反工责任。因此古籍数字化的质量问题是放在首位的。信息社会的发展对古籍数字化的要求十分迫切, 这与大量古籍不能及时进行数字化处理是相矛盾的, 这在客观上也对古籍数字化处理工作提出了更高的要求, 必须追求高效率, 在最短的时间内把工作完成。

4.4 规范古籍书目数据的格式

为满足古籍长久保管和利用的需要, 古籍数字化处理工作必须坚持规范和标准。1986年北京图书馆提出了适用于专著、连续出版、试听、乐谱、测绘资料等的CNMARC的讨论稿, 1991年书目文献出版社正式出版《中国机读目录通讯格式》, 现在CARC已成为国内图书馆界所认同的行业标准。作为综合书目数据库组成成分的古籍书目数据库, 在MARC上也应使用CN MAR C格式, 以保持其一致。数据库的每条记录必须根据《古籍著录规则》的要求制作, 对每一条数据都要采用标准化的术语进行著录, 以免造成不必要的浪费。

摘要:本文分析了我国图书馆古籍数字化工作概况及建设的意义, 介绍了当前古籍数字化的方式, 并提出古籍数字化前处理工作应该遵循的重要原则。

关键词:古籍数字化,再生保护,数字化方式

参考文献

[1] 王璇.我国图书馆古籍数字化探析[J].四川图书馆学报, 2007, 5.

[2] 曾洁莹.浅谈图书馆古籍保护工作[J].科技信息, 2006, 3.

上一篇:基层财政所预算管理刍议下一篇:思想政治工作在医护人员教育管理中的主体作用分析