首页 > 文章中心 > 正文

开放存取资源元数据管理案例分析

开放存取资源元数据管理案例分析

1OAPS概述

OAPS是由清华大学、香港城市大学、台湾逢甲大学三校图书馆于2Oo4年7月共同发起的一个联合式机构仓储计划,即学生优秀作品仓储计划。目前已经加盟的成员有清华大学、香港城市大学、台湾逢甲大学、南洋理工大学、厦门大学、上海交通大学,并建立OAPS联合机构仓储网站_1]。该联合机构仓储的目的在于更广泛地传播和利用各个成员机构的优秀作品资源,实现优秀作品快速、有效地交流和共享,激发学生的兴趣和思考,提高学生的学习能力和研究能力。OAPS联合机构仓储网站是以开源软件DSpace系统为基础。通过应用OAIHarvester2.0元数据收割软件和本地开发XMLParser软件,收割各成员机构利用DSpace系统建立的本地机构仓储元数据(及数字对象)的方式建立并提供服务的仓储网站。OAPS面向全球提供免费元数据检索。并通过OpenURL技术链接至各成员机构的全文资源。

2OAPS元数据标准的选择

建立OAPS联合机构仓储网站的首要任务是确定其元数据标准.由于OAPS采用了DSpace系统,而DSpaee默认的元数据标准就是DC元数据,因此DC元数据自然而然地成为OAPS的首选标准。虽然OAPS的成员机构仓储都采用了DC元数据标准,但各成员机构在应用时的元数据结构又有所不同,因此OAPS联合机构仓储网站采用取合集的原则,尽量保留各成员机构仓储的所有元数据字段。另外,OAPS联合机构仓储网站充分利用了DC元数据的特性,根据自身情况采用了DC元数据的14个基本元素,并增加了Degree和Course元素。OAPS联合机构仓储网站的元数据方案如表1的DSpace-DC列所示。表1也给出DC元数据与OAPS联合机构仓储网站DSpace—DC的对应关系。

3OAPS元数据的生成

OAPS联合机构仓储网站的各成员机构的元数据主要通过表单提交元数据的方式生成。当然.OAPS各成员机构都规定了只有获得授权的用户才能提交元数据表单。用户只需参照各成员机构DSpace帮助项中的“submit”指示提交元数据,“sub—mit”中对每个元数据元素的填写进行了明确的说明。虽然DSpace系统利用元数据提交表单生成元数据很方便快捷,但是在提交的过程中,缺乏自动纠错功能。如填写Tide元素时,出现词汇错误,DSpace系统的提交程序无法自动检测,只有通过管理员的审核工作才能发现。OAPS联合机构仓储网站的元数据生成主要有2种途径:一种是收割成员机构仓储中的元数据;一种是远程直接提交元数据。收割生成方式将在下节阐述。远程直接提交元数据方式与各成员机构的元数据提交方式相同,在此不再赘述。

4OAPS元数据的

OAPS联合机构仓储网站以及各成员机构仓储都采用了DSpace系统,DSpace系统通过OAICat作为一个数据提供者向外元数据资源。OAICat是OCLC开发的一个开放源代码软件,遵循OAI—PMH协议。因此,OAPS联合机构仓储网站以及各成员机构仓储的元数据能够被诸如GoogleScholar、Scirus、OAIster之类的网络搜索引擎检索。

5OAPS元数据的收割与解析

OAPS联合机构仓储网站的元数据收割主要通过遵循OAI—PMH协议的OAI.Harvester2.0软件实现。0AIHarvester2.0的主要功能是作为一个服务提供者(ServiceProvider)从遵循OAI—PMH协议的仓储中收割元数据。OAIHarvester2.0遵循OAI—PMH协议的技术框架,它通过HrrP协议向数据提供者发送请求,数据提供者根据相应的请求返回一个XML文档,发送的H11、P请求不同,返回的XML文档内容就不同。OAIHarvester2.0主要通过请求动词和时间戳控制其收割的元数据范围。截止到2011年5月13日。OAPS联合仓储网站已经收割到1614条元数据记录。OAIHarvester2.0将收割到的元数据存储至本地服务器。为了将收割到的XML文件解析为DSpace系统能够导人的格式。需要利用元数据解析技术对XML进行解析。OAPS联合机构仓储网站自行设计开发了一个XMLParser软件。设计者在开发时。考虑到不同数据提供者在提供的xML文档数据格式存在一定的差异,因而在XML—Parser开发过程中,采用了通用性和适应性原则。由于OAIHarvester2.0收割到的是DC元数据元素名称,但DSpace系统可接受的DSpace—DC元数据既有元素名称又有修饰词,XMLParser在解析数据时,对二者的关系进行了映射处理。另外,考虑到各成员机构仓储提供的元数据有所差别.XMLParser为针对每个仓储建立了专门的映射文档,以便准确地解析出元数据。

6OAPS元数据的增值

OAPS联合机构仓储网站将收割到的DC元数据转换为本地统一的DSpace—DC元数据,通过统一的界面对元数据进行了索引。从而解决了由于不同成员机构仓储元数据结构和索引方法的不同.给用户带来的资源难发现、难检索的问题。OAPS以用户服务为中心。对收割来的元数据进行了不同角度的聚类,如从主题、题名、作者、日期等角度对元数据进行聚类。这样用户可以根据自己不同的需要,选择不同的检索浏览方式。

7对OAPS元数据管理的评价

0APS联合机构仓储在发展的过程中得到了各成员机构的大力支持和重视,自成立以来,成员机构每年都会组织召开相关会议。讨论OAPS的发展事项.积极探讨有关OAPS的相关技术问题,如元数据标准及共享方案等技术问题。OAPS联合机构仓储网站采用DSpace系统作为资源组织的基础,遵循了OAI—PMH协议,统一了元数据标准,实现了仓储之间的互操作,并对元数据进行了一定的增值处理。虽然OAPS联合机构仓储网站在元数据发展方面取得了一定的成果,但也存在一定的问题。与同样利用DSpace软件开发的香港科技大学机构仓储相比,首先。OAPS联合机构仓储缺乏明确的相关元数据政策说明,不便于用户对其元数据细节的相关了解和使用。而香港科技大学机构仓储中有明确的元数据使用政策说明、元数据提交政策说明,比如其在元数据使用政策中规定任何人可以免费获得元数据,同时规定在非商业应用的情况下,只要提供其OAI标识符或原始元数据记录链接,就可以在没有获得事先许可的条件下以任何方式使用其元数据『3_。其次,OAPS联合机构仓储缺乏相关元数据技术说明,而香港科技大学机构仓储在其系统特征中明确说明其采用的是OAI—PMH协议和SRW协议。便于用户对其元数据互操作技术的了解。最后,OAPS联合机构仓储缺乏对DSpace已有元数据提交界面的修改.而香港科技大学机构仓储针对DSpace本身提交界面太复杂的特性,在其基础上进行了重新设计,使得元数据提交更便捷,也更符合用户习惯。由于DSpace系统本身存在一些元数据处理方面的缺陷,比如DSpace在元数据扩展问题上,只能完成对新元素的注册,并不能在资源提交过程中自动添加新注册元素的属性描述项_4]。这就造成采用DSpaee系统的仓储在元数据管理上难免有些不足,因此.需要对DSpace系统进行不断的完善和修正,以增强其元数据管理功能。