- 数字出版与数字图书馆
- 黄肖俊等编著
- 5562字
- 2020-08-28 15:31:26
1.3.2 20世纪前后的数字图书馆
建设数字图书馆需要投入大量人力物力,因为内容和软件都要一点一滴地从头做起。20世纪90年代末,采用分布式结构建立数字图书馆和高附加值信息仓储的要求催生了一些新的想法,例如重复使用现有独立仓储中的内容以减少建设大型数字图书馆的工程量。但是,落实这样的想法面临很多问题,最主要的是如何实现仓储服务的互操作,即异构仓储间无缝连接的能力和使用信息的水平。
当时,达成并遵守共同协议,进而交叉检索的成本很高,且伸缩性很差。1999年10月,在美国新墨西哥州圣达菲召开了一个重要会议,专门讨论电子仓储的互操作,并促成了圣达菲协定。该协定定义了开放文档 Dienst 协议的子集,即现在的OAI-PMH协议(Open Archive Protocol for Metadata Harvesting,OAI-PMH)。圣达菲协定还定义了两个重要角色:“数据提供者”和“服务提供者”。数据提供者负责处理仓储中资源的存储和发布,收集、记录仓储中资源的元数据;服务提供者从数据提供者那里获取元数据,并向用户提供服务。数据提供者和服务提供者之间采用 OAI-PMH 协议开展合作。会议还建立了“开放文档先导”(Open Archives Initiative,OAI)组织。因UPS原型(Universal Preprint Service,UPS)具有数据服务集成的能力,会议曾就利用UPS原型实现互操作进行讨论。但由于与会者很难就其全部功能达成共识,最终不得不采取一定程度的折中策略。
2001年的“欧洲图书馆”项目(The European Library,TEL)是较早尝试在多个数据提供者间推行检索服务的项目之一,其主要目标是调查是否能够建立新的泛欧服务——最终用户将能够访问欧洲各国图书馆的联合资源。项目之初遇到的技术问题也是图书馆之间数据访问的异构问题:有些图书馆可以通过Z39.50协议访问,而有些则不能。而且,并非所有馆藏都包含在国家图书馆的在线公共检索目录(Online Public Access Catalog,OPACs)中。TEL的第一个任务是汇集所有馆藏的元数据,实现集成检索。一个解决方案就是在 OPACs 中采用 Z39.50协议,而那些无法通过Z39.50 协议获得的元数据可通过HTTP协议或OAI-PMH协议获得。至2010年,TEL可以访问欧洲48个国家的图书馆联合资源(数字化和非数字化的书籍、杂志和期刊等),资源总量达到1.5亿条书目数据。
TELplus是另一个欧洲图书馆项目,由26家成员组成的联盟承担,其中包括国家图书馆和研究中心,该项目2007年开始,2009年12月结束。TELplus为欧洲图书馆项目提供增值的服务和产品。它的首要目标是改进服务架构的表现、增强多语种的检索功能、并且提供光学字符识别(Optical Character Recognition,OCR)处理文档的全文检索功能。
研究支持图书馆计划(Research Support Libraries Programme,RSLP)始于1999年,于2002年7月结束。它对英国图书馆和档案馆研究产生过重要的影响。RSLP希望通过对传统方式的改进和对新技术的采用,来促进图书馆信息的存取,其研究主要有三个方面:①协作式的馆藏管理项目;②人文和社会科学馆藏研究项目;③描述和存取。RSLP建立了资源和资源集合描述的元数据模型。在这个模型中,包含了资源集合、存储管理系统、与资源收藏和管理有关的人或机构,以及资源集合的外部关系。
另一大型跨库服务是荷兰数字学术仓储(Digital Academic Repositories, DARE),由荷兰大学、荷兰国家图书馆和其他机构于2003年联合建立,其目标是将荷兰所有研究信息数字化后存储在一个联合的机构仓储(Institutional Repository,IR)的网络中。DARE确立了指导独立仓储间的合作和互操作的原则,包括为实现互操作和联合服务而必须遵守的数据标准。DARE参考了OAI-PMH协议,采用简单的都柏林核心元数据作为必选元数据集,将含自己的修饰词作为可选元数据集。
1998年,美国国家科学基金赞助建立了国家科学数字图书馆(National Science Digital Library,NSDL)。它的研究包含4个方面:①从用户服务的角度增加现有资源的价值;②聚集同类馆藏形成更大的资源规模;③促进 NSDL 信息资源传播的项目;④标准化和共享元数据。NSDL致力于在互联网上建立一个实用的可供广泛接入和方便使用的分布式资源网络和学习机制。2001 年,该项目完成网站www.nsdl.org的雏形并投入使用。2004年,NSDL提出“Pathways”的设想,将站点建设向数字综合门户发展。2011年2月,NSDL发布了一个开源的XML参数框架,使之能与基于都柏林核心数据的架构进行互操作。
Europeana成立于2007年7月,由欧盟委员会提供资金支持。Europeana的目标是通过跨域门户,允许用户访问欧洲的文化和科学遗产。第一个Europeana原型于2008年11月发布,可以检索约200万数字对象(选自欧洲博物馆、图书馆、档案馆、音频/视频馆藏),它通过OAI-PMH协议获取元数据。Europeana的后续版本包含了更多内容和功能。2012年,Europeana的馆藏已经超过2300万条记录,内容涵盖了数字化文本、音频、图像、书籍、电影等各类资源。Europeana旨在建立一个能够满足不同用户需求的系统,既能满足普通用户一时的好奇心又能满足学生的学习需求,既能为进行学术研究的师生提供可靠信息,也能为专家和研究人员提供检索、验证和标注等服务。Europeana有一个特色,就是它在传输元数据时,同时传输数字对象。它所面临的主要问题是异构和互操作,除此之外,还要处理伸缩性、服务质量、联合门户的可持续性等问题。
FUMAGABA是TEL的一个项目,2008年开始,次年结束。该项目旨在完善TEL 的服务,并集成前南斯拉夫的马其顿共和国、乌克兰、摩尔多瓦、阿尔巴尼亚、格鲁吉亚、亚美尼亚、波斯尼亚和黑塞哥维那及阿塞拜疆8个国家的图书馆。除这 8 个国家之外,欧洲国家图书馆会议(Conference of European National Librarians,CENL)的其他所有成员国都已加入了 TEL 平台,FUMAGABA 项目的目标之一就是将这8个国家的图书馆囊括进TEL,扩大馆藏,提供更为多元化的文化资源。
欧洲研究数字仓储基础设施(Digital Repository Infrastructure Vision for European Research,DRIVER)是另一个基于资源的数字图书馆,依赖外部数据提供者提供内容。它由欧盟第六框架计划支持,目标是为建立欧洲仓储基础设施创造条件。解决组织性问题时使用的主要工具是DRIVER Confederation。D-Net技术是DRIVER的基础,是一项技术创新。它基于一个面向服务的架构,对分布和共享的资源的操作都作为标准的网络服务,并包含很多交互服务。它的服务对象既有数据提供者又有服务提供者。数据提供者能够更方便地共享内容,服务提供者能更好地提供服务。
整合文化知识服务资源建设(Building Resources for Integrated Cultural Knowledge Services,BRICKS)是欧盟第六框架计划资助的一个项目。项目从2004年1月1日开始,到2007年6月30日结束。它是一个集成化、可升级、安全性高的开源软件系统,可透明访问分布式资源,支持多种语言,易于安装和维护。BRICKS依托分布式开放结构,通过最大限度地重复使用已有的成果,减少开发和部署新服务的成本,同时通过消除不必要的需求来减少维护成本。BRICKS把全局语义技术视为革新过程,为了克服语言上和本体上的障碍而形成一致性协议,从而创建共享的知识空间。
计算机科学教育咨询平台(Computational Science Education Reference Desk, CSERD)是美国国家科学基金会资助的数字图书馆项目之一,旨在帮助学生学习计算机科学并协助教师在课堂教学中对计算机科学技术的应用。CSERD有三个使命,包括:①从互联网上收集高质量的资料并组织成一个资料目录;②为普通用户和专家提供一个论坛来对目录中条目的真实性、合理性和适用性进行讨论和检验;③为计算机科学在教育领域的应用提供一个独创的计算机科学资源库。CSERD不仅仅对计算机科学资料进行整理,还鼓励用户和各领域的专家对相关资料条目进行评论、添加元数据描述。为此,CSERD为用户提供了VV&A(Verification, Validation and Accreditation)工具,用户在对某项资料进行评论后,该评论要经过CSERD工作人员的审核,通过之后该条评论将会发表在CSERD网站上,从而丰富了该条目的原始元数据。
2008年10月,美国高校图书馆建立了HathiTrust数字图书馆项目。它既是一个数字保存仓储,又是一个高效能的获取平台,为所收藏的公共领域和受版权保护的文献资源提供长期保存和获取服务。HathiTrust的运行系统采用基于开放式存档信息系统(Open Atchival Information System,OAIS)的框架结构,包括信息存储、数据管理、获取等功能模块,使用保存元数据实施战略规范(Preservation Metadata Implementation Strategies,PREMIS),该数据规范被很多数字图书馆项目使用,这样利于数字化项目之间的资源共享。HathiTrust的书目数据采用自行开发的元数据格式(HathiTrust Metadata)而没有使用通常的MARC格式,以便更好地在各成员馆之间以及与联机计算机图书馆中心(Online Computer Library Center, OCLC)之间传输数据。HathiTrust 项目实行严格的版权管理制度,以维护版权所有者的利益,避免引起版权纠纷。截止到2012年1月,HathiTrust包含了890万册数字化资源,共计28亿多页,其中26%是可以开放获取的。
这一部分主要介绍了内容共享方面的系统和项目,大多数项目都在组织方面做出了很多努力。虽然内容共享方面的研究取得了很大进展,不过,由于现有系统采用的模型和实体种类繁多,水平参差不齐,缺少互操作的系统化方法,因而实现广泛、普遍的内容共享仍然困难重重。由欧盟委员会提供资金支持的DL.org,是DELOS的另一项目,专门研究数字图书馆的互操作问题。
由欧盟第七框架资助的DL.org是DELOS创建的项目,始于2008年12月,为期两年,研究方向主要是数字图书馆的互操作。它根据DELOS提出的数字图书馆参考模型,确立了 6 个研究主题:数字图书馆架构、内容、功能、政策、质量管理和用户,其目标是:①提高人们对互操作机制的重要性的认识;②在总结当前互操作方法的基础上,提出数字图书馆最佳互操作的实践方法;③确立互操作相关标准规范,发布数字图书馆技术、方法指南等;④建立跨领域的数字图书馆交流机制,讨论新出现的问题以及发展方向。至2011年,DL.org完成了对数字图书馆互操作情况的调查,公布了“数字图书馆技术和方法指南”(Digital Library Technology and Methodology Cookbook)。它提出了数字图书馆的实施原则,并对各种方法进行评估,包括对实施成本和效果的评估等。
我国数字图书馆建设的探索与实践起步较晚,但发展迅速。从1995年起,图书馆界与科研机构联合开展了一系列的研究项目,如国家“863-317”攻关项目“基于特征的多媒体信息检索系统(MIRES)研究”;国家重点科技项目“中国试验型数字图书馆”;国家“863-306”项目“知识网络——数字图书馆系统工程”;国家“863-300”项目“以中国高速信息示范网为运行环境的中国数字图书馆应用系统”;国家“973”研究项目“海量信息系统组织、管理及其在数字图书馆中的应用研究”;国家自然科学基金重大国际合作项目“中华文化数字图书馆全球化的关键理论、方法和技术研究”等。一批国家级和省部级数字图书馆研究项目取得重要成果,为我国开展大规模的数字图书馆建设实践奠定了基础。
在中国,正式提出数字图书馆概念并导致后来大规模研发工作的是1996年在北京召开的第62届国际图联(International Federation of Library Associations and Institutions,IFLA)大会,数字图书馆成为该会议的一个讨论专题。IBM公司和清华大学图书馆联手展示“IBM数字图书馆方案”。
1997年7月,“中国试验型数字式图书馆项目”由文化部向国家计委立项,由国家图书馆、上海图书馆等 6 家公共图书馆参与,该项目的实施是中国数字图书馆建设开始的标志。
数字图书馆在中国从1998年开始升温,在国家科技部的支持和协调下,国家863计划智能计算机系统主题专家组设立了数字图书馆重点项目——“中国数字图书馆示范工程”,这是一个由国内许多单位联手参与的大文化工程。该工程于1999年启动,首都图书馆成为“中国数字图书馆工程首家示范单位”。
1998年,教育部立项并开始建设中国高等教育文献保障系统,即CALIS。早在90年代前期,全国高校图书馆迫于外文图书期刊年年涨价的压力开始筹划大规模的文献资源共享系统,1996 年,北京大学向教育部提出了建设文献保障体系的初步建议,1997年,教育部将其纳入“211工程”公共服务体系的设计中,在1998年立项后,2003年、2009年CALIS再次、三次在“211工程”中立项。
1998年10月,文化部与国家图书馆,启动了中国国家数字图书馆工程,该工程由“中国数字图书馆有限责任公司”负责,标志着中国数字图书馆工程进入实质性操作阶段。
1999 年年初,国家图书馆完成“数字图书馆试验演示系统”的开发。同年3月,国家图书馆文献数字化中心成立,扫描年产量3000万页以上。与此同时,部分省、市的数字图书馆研究项目也开展起来,如辽宁省数字图书馆项目、上海数字图书馆项目的研究。
2000 年起,北京大学、东北师范大学等院校相继成立数字图书馆研究所,在全国范围内掀起了数字图书馆建设和研究的高潮。同年,北京大学开始招生第一批计算机方面的研究生,从事数字图书馆相关技术研究。
2000 年年底,文化部在海南召开“中国数字年图书馆工程资源建设”工作会议,讨论制定《中国数字图书馆工程一期规划(2000—2005 年)》,推荐使用资源加工的标准规范。
2001年5月23日,国家重点科技项目“中国试验型数字式图书馆”通过专家技术鉴定。中国数字图书馆已经进入初步实用阶段,中国的数字图书馆研究、建设已经初具规模。
2004年,国家计委批准立项“全国党校系统数字图书馆建设计划”,总投资达1.9亿元。
与此同时,各地陆续开始建设数字图书馆,各级政府不断加大经费投入力度,一些全国性、区域性、行业性数字图书馆项目纷纷规划或立项建设。
经过十几年的探索和努力,在网络平台建设、关键技术研发、数字资源建设和数字图书馆服务等方面均取得重要进展,为加快数字图书馆建设积累了丰富的经验,打下了坚实的基础,服务体系初步形成。2001 年,经国务院批准,在国家图书馆实施国家数字图书馆工程。国务院要求,工程要“联合各部门和各地区有条件的图书馆参与建设,共同构建分布式的全国数字图书馆总体框架体系”。经过近几年的建设,国家数字图书馆在软硬件平台建设、标准规范建设、数字资源建设与数字图书馆服务等多个方面均取得了长足发展,一个内容丰富、技术先进、覆盖面广、传播快捷的国家数字图书馆服务网络初步形成。
作为数字图书馆的早期服务形式,全国文化信息资源共享工程也已形成了覆盖城乡的服务网络。与此同时,一个覆盖全国的数字图书馆服务体系已初步形成,包括国家级的国家数字图书馆工程,教育部建设了面向高等院校师生的中国高等教育数字图书馆,中国科学院建设了国家科学数字图书馆,科技部等六部委联合建立的国家科技图书文献中心,全国党校系统和部队系统也建设了各自系统的数字图书馆,各地方政府也纷纷将数字图书馆建设纳入本地区信息化建设和公共文化服务体系建设的总体规划。目前已建设了一批省、市、县级数字图书馆,在为区域用户提供数字图书馆服务方面做出了突出成绩。特别是各地方结合区域特点,做了许多有益的探索,形成了多元化建设模式。一个覆盖全国的数字图书馆服务体系初步形成。