
目 录
前 言 3
1、国内图书馆现状 5
2、在互联网时代面临的问题 5
3、方案概述 7
4、方案特色 11
5、带来的效益 12
6、技术优势 12
7、应用实例 14
8、技术服务 14
前 言
数字图书馆系统,就是对有高度价值的图像、文本、语音、音响、影像、影视、软件和科学数据等多媒体信息进行收集,组织规范性加工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速横向跨库连接的电子存取服务技术。它同时还涉及到知识产权、存取权限、数据安全管理等一系列问题的解决方法。
数字图书馆的特点是:收藏数字化、操作电脑化、传递网络化、信息存贮自由化、资源共享化和结构连接化。发展中国数字图书馆,就是要积极组织图书馆和有关机构的中文信息资源上网,使我国悠久的历史、灿烂的文化以及经济建设的成就方针和文化教育、科学技术等方面的进展,通过因特网主动广泛地传送到世界各地,占领因特网上中文信息资源领域,扩大中文信息资源的利用和影响。
数字图书馆系统作为一个国家的信息基础工程,其重要作用已得到了社会各界有识之士的认可。数字方舟作为一家专门从事信息系统集成的高科技公司,早已认识到构建有中国特色的、自主版权的数字图书馆方案的重要性,利用多年在数据压缩技术、OCR(字符识别)技术积累和多年在信息行业的经验积累,成功推出数字图书馆整体解决方案。
数字方舟认为,一个切实可行的数字图书馆方案应具有以下功能要素:
1. 快速的信息获取手段,支持以工业流水线的方式将大量的媒介信息快速电子化。
2. 支持各种信息表现形式,如文字,图像,声音,视频信息等。
3. 快速的加工和装订手段,将信息快速录入资源库。
4. 开放的系统,以保护以往的投资和保证将来的扩展性。
5. 灵活高效的资源管理手段。
6. 较高的可利用性,能适应高负荷INTERNET访问的能力。
7. 保护版权,保护出版社和著作权人利益。
8. 方便的检索与查询。
基于以上的基本功能要素,数字方舟的数字图书馆整体解决方案为构建数字图书馆系统提供了功能强大而完整的工具,在开放式体系结构和较好扩展性的基础上,解决了如何将海量图书信息进行数字化加工、存储、查询、检索、网络发布及增值等问题。
数字方舟公司在2000年八月成功推出“数字图书馆系统”,先后与中国数字图书馆有限责任公司结成战略合作伙伴,共同发展中国数字图书馆事业。本套方案正是在我们充分了解目前国内数字图书馆的需求及应用后,结合我们合作伙伴柯达以及富士通公司在硬件设备上的优势,ADOBE公司在软件上的优势而推出的解决方案。
1、国内图书馆现状
传统的纸张作为信息媒介存在着巨大的浪费。成千上万册的书经过印刷、存储、运输、批发、销售等环节后才能送到读者面前。这样不仅成本巨大,资源浪费,而且环节众多,流通不便。同时造成的后果是,大量堆积的纸张难以管理和保存,信息无法检索和查找,更谈不上信息的传播和增值。Interent使得信息传播方式发生了变革,海量的信息可以通过低廉的传输成本在网络上传送,用户可以有选择性地获取和使用自己需要的内容。电子化的信息数据不仅节约了传播的成本,同时加快了信息的增值,因此信息资料的数字化成为未来信息社会的基本需要。目前,国内的图书馆大多存在一下问题:
1) 馆藏图书日益增多,存储空间需求不断增大;
2) 图书的编目及管理以手工方式为主,辅以C/S结构的图书馆管理软件;
3) 图书的借阅频繁,易损坏;
4) 图书的查询以馆内书目检索为主;
5) 随着纸张的日益老化,对书籍难做到永久保存;
6) 馆藏图书的借阅和流通范围小,不能满足信息时代人们对信息共享的要求。
2、在互联网时代面临的问题
随着互联网时代的到来,图书馆的现代化和数字化建设面临着许多亟待解决的问题:
1、 如何将原有的馆藏图书大量快速数字化?
图书馆的馆藏图书的数量非常大,将这些大量的图书完全数字化需要很长的时间。数字方舟采取分步数字化的方案,先将其馆藏特色的书籍进行数字化,其它书籍采用调度系统与其它的图书馆相连,实现图书资源的分布式共享。我们采用世界上先进的柯达高速扫描仪作为图书扫描加工设备,每条生产线可实现日加工量100本到1000本书以上的高速图书数字化加工,使图书馆能在最短时间内建立并启用自己的数字图书馆。
2、 如何实现在互联网上准确查询电子图书?
现有的图书查询系统基本上都是基于C/S结构,读者只能在馆内利用图书馆提供的客户终端机进行书目检索。数字方舟提供的数字图书馆系统基于三层结构构建,读者可以在家使用浏览器通过互联网进行书目检索,随时借阅电子图书。我们采用三层结构构建的数字图书馆可以有效保证了系统的易维护性和书目系统的安全性。
3、 如何保证在现有带宽上的电子图书的快速阅读?
国内互联网的现有带宽下,大多数读者采用拨号方式连结互联网,必须保证电子图书的在线阅读的速度可以被大多数读者所接受。数字方舟采用的电子图书格式是国际上最流行的PDF格式,具有高压缩比和分页传输的特色,可以保证低速率下的在线阅读的流畅。同时由于PDF格式可以容纳多种媒体,所以随着带宽的不断发展,可以随时升级PDF格式的电子图书为多媒体电子图书,不断适应宽带网的发展需要。
4、 电子图书的长期储存及安全备份问题如何解决?
电子图书的存储必须满足长期存储及调阅方便的要求。我们采用光盘库(Jukebox)作为存储设备,采用CD-R作为存储介质,它具有容量大,价格低廉的特点,可以同时访问多张盘片,大大提高了电子图书的存取速度。当需要扩容时,只需简单增加光盘柜的数量以保持更多光盘的在线查询。由于CD-R的价格便宜,所以我们采用CD-R对电子图书做多重备份离线保存,可以随时更换光盘柜中的损坏盘片,以保证系统的稳定及安全。
5、 系统的开放性问题:如何与图书馆原有的图书编目及管理系统相连以及日后的系统扩展问题?
目前,大多数图书馆都有自己的编目系统及图书管理系统,为保证原有系统的可用性和防止重复投入,我们的系统提供标准的MARC数据接口,可以方便的建立电子图书与书目库的有效连结,是原有图书馆系统的扩展。系统具有良好的开放性,可以实现与多数图书馆系统的连接和方便的二次开发。
3、方案概述
数字图书馆系统是对有价值的图像、文本、语音、音响、影像、影视、软件和科学数据等多媒体信息进行收集,组织规范性的加工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速横向跨库连接的电子存取服务。
数字图书馆的概念出现后,传统图书馆的职能从以前以藏书为主和被动地访问方式,转变成以为用户服务为主,实现信息的加工和增值。以下是图书馆角色的对比:

数字图书馆建设是以统一的标准和规范为基础,以数字化的各种信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以电子商务为管理方式,以宽带高速网络为传输通道,将丰富多彩的多媒体信息传递到千家万户。它涉及数字信息资源的生产、加工、存储、检索、传递、保护、利用、归档等全过程。
u 数字图书馆的技术要求
Ø 集成在统一架构下的多种信息类型的检索和管理:对于图书馆资源多样化的特点,数字图书馆系统必须建立统一架构,对数据进行管理和查询。
Ø 海量信息的存储和管理:通过分析图书馆的数据量在几十个TB级别,因此需要能够实现海量信息存储的系统方案。
Ø 具备工业化的数字化加工能力:按照普通的数字化加工,将图书馆藏信息数字化几乎是不可能的。需要建立能够达到日加工几万页到几十万页的加工中心,并根据数字图书馆的元数据和对象数据的标准,将原始数据如书、刊、报、CD、磁带、录象带、缩微胶卷等,加工制作成数字图书馆可使用的数据。
Ø 与其他图书馆能够进行资源共享和调度:由于信息的海量和保护知识产权等因素,各个图书馆的资源必须放置在各个集藏地,可以称之为资源中心。各个资源中心必须实现共享资源和统一调度。
Ø 基于图书的电子商务实现:数字图书馆针对信息的加工是为了实现知识的增值,因此通过电子商务获取价值实现是建设数字图书馆的基本要求之一。
Ø 安全性、可靠性和可扩展性:数字图书馆系统面对海量信息、知识价值、超大用户群,必须实现资源的安全保证,系统的可靠性以及今后系统的可扩展性。
Ø 工程化的设计、施工和管理机制:数字图书馆的建设是系统化的工程,必须通过科学的施工和管理以及相应的机制进行保证。
u 数字图书馆的数据组织
国际上开展数字图书馆的工程研究和建设,已经取得了许多阶段性的成果。其中最主要的成果之一是将资源的组织分为元数据和对象数据,而在对象数据中采用数字对象(Digital Object)为基本元素构造其数据管理体系。
元数据(metadata)的含义是“关于数据的数据”,它为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具。
数字图书馆资源框架如下图所示:

以图书馆的大量馆藏图书为例,通过数字化加工系统将物理图书加工为相对应的图书文件即完成了物理对象到数字对象的转化,同时应提取出该对象的索引和描述信息,构筑元数据集合。对象数据则不仅包括图书,还涵盖了图片、声音和影像等各种对象。查询系统针对元数据的集合,而元数据应该是能够分布式共享与交换的。知识产权保护针对的是对象数据的集合。
u 数字图书馆的系统组成
数字图书馆系统应完成信息资源的生产加工、存储、检索、发布、保护、以及共享等功能环节。其系统结构如下图所示:

Ø 加工系统:各种非数字化对象的数字化处理,同时完成数据对象的索引(index)和置标(markup)处理
Ø 存储管理系统:解决海量数据的存取、备份、权限控制等管理
Ø 查询检索系统:通过基于SGML的搜索引擎,实现元数据检索及内容的全文检索
Ø 发布系统:解决数据对象的流通、传播和增值,以及安全和版权的保护
Ø 调度系统:解决异地跨库的数据共享
4、方案特色
数字图书馆系统是生产性的图书加工和管理系统,基本特点是较高的吞吐量和较低的运行费用,每个工作日每条生产线可以处理40本左右的图书。其主要特色包括:
1、 高速扫描——采用高速扫描仪,可以进行高速扫描,速度在每分钟几十到上百页,能够完全满足业务处理要求。
2、 完善的图像质量控制——提供图像矫正,滤色,字体加深、变浅,剪切黑边等行之有效的图像修补技术,可以得到更好、更清晰的影像文件。
3、 高压缩比——采用国际先进的影像压缩技术,使得存储空间更小,传输速度更快。
4、 支持多种存储介质——可将影像文件存放在光盘塔、光盘库或磁盘阵列上,使用数据容错功能,可以得到很高的安全性。
5、 通用PDF格式——信息可以根据传统习惯组织成书本。
6、 严格的安全权限控制—多级存取权限保护,系统可以自由定义操作员的级别及权限;不同的操作限制;纪录数据库的增、删、改操作。
7、 强大的应用设置——功能强大的应用生成器,不同的用户可以根据自己的需要自定义索引字段,方便灵活;而面向图书馆行业的解决方案则面面俱到,以图书馆行业应用为基础,具有更强大的功能。
8、 快速的影像查询——查询者通过各种索引的组合条件对影像文件进行查询,并可以随时显示影像文件,数字方舟图书馆系统提供高效的搜索引擎。
9、 强大的打印功能——用户通过各种索引的组合条件检索到影像文件后,可以随时打印影像文件原件。
10、 开放结构——易于和已有图书管理系统连接及相互调用,便于二次开发。
11、 系统可伸缩性强,适用不同层次的客户——采用模块化设计,各个软件功能模块可随意更换、摘除。系统软件与扫描仪、海量存储设备等外设通过中间层驱动软件连结,使客户适用于不同层次的客户需求。
12、 先进的微内核设计,适用于不同业务需求的客户——采用流行的微内核设计,把高速扫描仪、数据库处理、存储管理等核心模块设计成系统核心,外部功能可以很方便的加入和修改,以适用不同的客户需求。
5、带来的效益
低成本:采用价格低廉的CD-R作为存储介质,大大降低了以往库房存储的成本。
保护珍贵书籍:即可实现图书的多人借阅,又可以保护图书原件,有利于图书的长久保存。
快捷的检索及图书调阅:利用计算机进行快捷的图书检索和方便的在线电子图书阅读,加快了以往人工查阅图书的速度也减轻了图书馆工作人员的工作量。
图书的流通及共享:传统图书的借阅常常因为图书数量的限制,而出现借不到书的情况。而电子图书以文件形式存储于光盘中,可以实现多用户同时借阅及浏览。
古籍的真实再现:PDF格式的电子图书可以真实反映图书的原版样式,可以使读者阅读到珍贵的古籍原貌,又可以保护了古籍的存放。
充分利用现有资源:数字图书馆系统是图书馆原有系统的扩展和延伸,系统基于MARC格式的标准化设计和开放性保障了图书馆原有系统的可用性,从而保障了投资。
系统维护简单:由于采用三层结构的设计,客户端采用通用的浏览器,对系统的升级及维护只需在服务器端进行即可,大大降低了系统的维护费用。
6、技术优势
JavaSerlet技术:
Servlet是用Java编写的Server端程序,它与协议和平台无关。Servlet运行于Java-enabled Web Server中。Java Servlet可以动态地扩展Server的能力,并采用请求-响应模式提供Web服务。
最早支持Servlet技术的是JavaSoft的Java Web Server。此后,一些其它的基于Java的Web Server开始支持标准的Servlet API。Servlet的主要功能在于交互地浏览和修改数据,生成动态Web内容。这个过程为:服务器将请求信息发送至Servlet;Servlet生成响应内容并将其传给Server。响应内容动态生成,通常取决于客户端的请求;服务器将响应返回给客户端。即如下图:

Servlet看起来像是通常的Java程序。Servlet导入特定的属于Java Servlet API的包。因为是对象字节码,可动态地从网络加载,可以说Servlet对Server就如同Applet对Client一样,但是,由于Servlet运行于Server中,它们并不需要一个图形用户界面。从这个角度讲,Servlet也被称为Faceless Object。
Servlet的优势:
Java Servlet提供了许多优势:
Servlet可以和其他资源(文件、数据库、Applet、Java应用程序等)交互,以生成返回给客户端的响应内容。如果需要,还可以保存请求-响应过程中的信息。
采用Servlet,服务器可以完全授权对本地资源的访问(如数据库),并且Servlet自身将会控制外部用户的访问数量及访问性质。
Servlet可以是其它服务的客户端程序,例如,它们可以用于分布式的应用系统中。
可以从本地硬盘,或者通过网络从远端硬盘激活Servlet。
Servlet可被链接(chain)。一个Servlet可以调用另一个或一系列Servlet,即成为它的客户端。
采用Servlet Tag技术,可以在HTML页面中动态调用Servlet。
Servlet API与协议无关。它并不对传递它的协议有任何假设。
像所有的Java程序一样,Servlet拥有面向对象Java语言的所有优势。
CGI技术
Web服务器扩展技术一般做法是通过CGI来实现,CGI是通用的web服务器扩展标准,任何厂商的web服务器都要支持这个扩展标准。在网站的设计和软件实现,尤其在考虑系统同数据库的接口以及跨平台时,CGI是一个较为容易实现技术手段。
7、应用实例
数字方舟网站:数字图书馆 http://www.digiark.com/tushu/index.html
系统配置:
扫描仪:Kodak 3590C
软件:数字方舟数字图书馆系统软件
PC服务器一台
扫描工作站PC一台
扫描软件:XVCS
数据库:MS SQL SERVER 7.0
操作系统: 服务器端 WINDOWS NT SERVER 4.0 + IIS 4.0
客户端 WINDOWS 98 + IE 4.0 + Acrobat Reader
8、技术服务
系统的成功实施离不开优质的售后服务、全面的技术支持和专业培训。数字方舟公司提供最强有力的技术支援和最丰富有效的培训,帮助用户最大程度的发挥系统投资的效益。
l 提供免费安装、调试和培训服务
1. 数字方舟公司对数字图书馆系统提供现场安装、调试服务,同时在现场培训用户使用、操作、维护机器设备,培训用户更换消耗品。
2. 数字方舟公司负责用户从产品的软件使用到硬件结构、维修的培训。
3. 数字方舟公司与用户共同安排在用户本地的培训。
l 服务承诺
1. 数字方舟公司将提供日常维护服务和保修期外设备维护。将投入不少于10人的软件工程师进行客户各项需求开发。
2. 数字方舟公司配备多名优秀的售后服务工程师,提供不超过72小时的维修响应。
l 系统升级服务
1. 数字方舟公司对数字图书馆系统提供第一年的免费升级服务;在系统升级后,数字方舟公司会主动与客户联系对系统进行升级。
2. 从系统正式使用年第二年开始,用户可以享受优惠的系统升级服务。