首页 > 文章中心 > 科学数据资源

科学数据资源

科学数据资源

科学数据资源范文第1篇

社会科学院图书馆是社会科学信息的集中地,为人们提供各种有关社会科学方面的信息资源。现在很多高校、社区图书馆都陆续实现了数据化和网络化,对于社会科学院图书馆也要加快建设自己的图书馆数据库,特别是各个地方社科图书馆里所藏有的特色资源,分布在不同地方,人们要查阅时不可能挨个地方去找,所以就要建立起具有特色资源的数据库,方便需要的人快速查阅,实现资源的共享。本文就从社科院图书馆特色资源的数据库建设方面入手,对其必要性和可行性进行了分析,对如何建立数据库提出了自己的意见并对未来进行了展望。

建设社科院图书馆馆藏特色资源的数据库是符合时代脉搏和潮流的。现今的时代是信息的时代,人们处在信息社会,一切都是快速便捷的电脑网络信息化处理,图书馆作为最大的信息集中地,只有符合跟随整个时代的潮流,进行信息化的改革、创新和建设,才能不被社会所淘汰。建设社科院图书馆馆藏特色资源的数据库是便利科研人员,促进社会发展的,是非常必要的。各地社科院图书馆馆藏的特色资源因各个地方而不同才被称为特色,在过去没有建立数据库时候,人们如果想要查阅某个地方的独有资源的详细确定信息则需要到当地的图书馆中去查阅相关的纸质资料才能办到,这样既耽误时间,效率又低,十分不方便。如果建立了特色资源的数据库,人们在相关的图书馆网站的数据库中就能查阅到详细信息,不用东奔西跑,加快了信息的流动和传输速度,这样既提高了效率,又推动了社会的发展。

建设社科图书馆特色资源的数据库又是可行的。现在计算机技术和信息存储技术发展很快,并已经到达一定的水平,对于信息的录入和信息的整理已经在很多步骤上省去了人力的麻烦,为数据库的建立节省了时间和人力,技术的不断提高也为数据库的管理界面的更加友好提供了保障。再有,社科院图书馆里丰富的特色资源是数据库建立的基础,没有丰富的资源做基础,数据库即使建设起来也只是一个空壳子,没有实际内容,就得不到充分的利用。我国的图书馆特色资源非常丰富,从中央的大型图书馆到地方图书馆,都有自己特色的图书资料资源,为我国图书馆特色资源数据库的建设打下了坚实的基础,提供了可行性。

特色资源的数据库的主题确立。特色资源的数据库既然是各个图书馆的特色,那么主题的建立就要体现出图书馆的特色来,主题要突出数据库的特点,使人对这个数据库的主要方面有个基本的认识,例如浙江的社科院图书馆的特色资源数据库就要体现出浙江社科院的特色和主题,这是与其他相似的数据库区别开的标准,想查阅浙江当地的名人、经济等的详细状况,就会想起到这个特色数据库去查阅。数据库主体的确立要综合考虑自身图书馆的重点项目,数据库的代表性以及对当地经济和社会发展的作用等几个方面,综合起来考虑,最终确立出一个既能代表本馆特色,又能体现时代潮流,促进当地经济、政治、文化、社会等方面发展的主题。

特色资源的数据库的标准规范化。既然要建设数据库,那么就要符合数据库的建设标准,所建设的数据库要规范化、标准化,只有标准化和规范化的数据库才是真正能够为科研提供服务的数据库,促进经济和社会发展的数据库。为此,在建设社科图书馆特色资源的数据库之前,要对建库人员实行集中的培训,和规定统一的标准,对建设数据库所使用的软件系统、信息输入格式、信息的表达格式和用户界面进行统一的规范和执行标准,以求建立起来的数据库能够成为标准的、界面友好的数据库典范。同时,在进行数据库的建设时要考虑到国外读者的浏览,适当的建立中外通用的特色数据库资源,为其服务。

特色资源的数据库的完整性和完善性。数据库不仅要实用,还要数据完整和不断完善。如果一个数据库,只是将图书馆的数据排列出来,点进一条信息里面的内容并不完整,并且数据库不进行适时的更新,那么这个数据库就是失败的,很快就会被人们所遗忘。所以说,数据库的信息不仅要完整还要有一定的深度广度,如果随便在网上百度一下就能得到的内容,那也没有必要使用数据库的信息了。同时数据库的信息要及时的进行更新,不断的加入新的信息条目,同时对老的已经存在的条目中过时的信息进行更新,保证数据库的数据完整性和完善性,只有让用户看到你的数据库的不断发展性和完善性,用户才会继续支持你的数据库,数据库才能够得以发展下去。

科学数据资源范文第2篇

【关键词】数字资源;数字资源建设;社科信息

计算机的大规模普及和因特网的畅通为图书馆数字化发展提供了条件,也为图书馆数字资源的建设提供了物质保证,社科院图书馆数字资源建设是一项长期积累,不断完善的过程。本文结合新疆社科院图书馆的实际,就社科图书馆数字资源建设谈谈自己的看法。

一、社科数字资源建设的意义

数字资源是文献信息的表现形式之一,是将计算机技术、通信技术及多媒体技术相互融合而形成的以数字形式、存取、利用的信息资源总和。商业化的数据库、机构或个人建立的数据库、各种网络免费资源等都属于数字资源。

同印刷型文献相比,数字资源类型更为丰富。从资源提供者来看,有商业化的数字资源和非商业化的数字资源两大类。前者包括数据库商、出版商和其它机构以商业化方式提供的各种电子资源,如:Elsevier公司的SDOS、EBSCO公司的AcademicSourcePremier、中国期刊网等数据库,图书馆需要支付一定的费用后再提供给一定的读者群,或者读者个人通过读书卡和其他方式购买数据库的使用权。这些数字资源内容丰富、数据量大,是目前图书馆馆藏资源建设中的重要内容。后者主要指机构自建的特色资源库、开放获取资源、机构典藏和其它免费的网络资源,这些资源或者由图书馆自行建设,或者可以从网络上免费获取,当然,图书馆特色资源库在建成之后也可以以商业化方式进行运作,此时,对其它图书馆而言,也可以称之为商业化数字资源。

数字资源建设的主要形式有缴送(随书/刊附送的电子出版物;电子出版物、数据库和音像制品)、购买(音像制品和光盘及网络数据库)、自建与转换(自建中文书目、全文影像及多媒体资源库;将音视频产品进行数字化转换与迁移)网络资源采集(分主题、有重点地采集政府网站、电子报刊)等。

社科信息广泛存在于图书馆和其他文献信息机构中,社科院图书馆的数字资源建设工作是一项以社会信息需求为依据,对广义的社会科学范畴的处于无序状态的各种信息进行有机集合,以推进信息资源优化配置,建立强有力的社会科学信息资源保障体系的活动。其作用表现在为发展和繁荣社会科学提供信息保障,为领导决策及社会科学研究提供信息支撑,为社会主义物质文明建设提供精神动力和智力支持。

二、新疆社会科学院图书馆数字化现况及用户需求

了解新疆社会科学院的实际及图书馆用户需求是数字信息资源开发利用的前提和依据。新疆社会科学院图书馆数字化工作可以简单归纳如下:2004年底开始进行局域网建设;经过近些年的不断升级改造,基本满足院内所有用户的上网及网站正常运行的需要。2005年成立电子阅览室,提供上网服务和检索电子版的《人大复印资料》全文数据库;2006年我馆购置了图书馆管理软件(简称ECO);2007年挂牌成立“新疆哲学社会科学”(维汉两版)网站;2008年引进电子数据库――“人大复印资料”数据库(光盘版);2009年4月正式启动图书馆数字化工程――计算机编目工作。一个具备现代化设备和先进技术的图书馆,才能够给信息需求者带来现代化的服务方式和服务手段,并可以随时随地接受网上检索、浏览、咨询、馆际互借、专题研讨等服务。从上述归纳可以看出,本馆的数据资源建设只处于刚起步阶段。从近些年尤其是从笔者进入图书馆工作这两年来看,社会科学院各研究部门的社科信息需求随着社会的变革和社会科学研究的发展变化,呈现出复杂多元的倾向。从社会科学研究的发展趋势看,社科信息需求呈现出综合化、社会化、国际化的特点。从社会科学研究需求的文献类型看,除了有对会议论文、科技报告、内部刊物、政府文件、学位论文、档案文献、市场信息等文献类型的需求外,也有对全文检索的需求。并仍旧保持着对纸质文献的需求。因此社科院图书馆的数字资源建设应充分考虑各种需求及开发利用资源所具备的基本条件,做好规划,逐步完善。

三、新疆社会科学院数字资源建设思路

改善硬件是数字资源建设的基础

图书馆数字化发展硬件要先行,硬件建设要有前瞻性,在完善已有的硬件设施外,要考虑到图书馆以数据处理和应用为主,应最大限度地满足所有用户的各种需求,在扩容时,技术和产品选择应具备一定的先进性,要考虑到即时扩展,且易于维护等因素。

人力资源是数字资源建设的关键

数字资源建设需要既具有扎实的图书馆学知识,又兼备计算机技术、网络技术、通讯技术知识,并通晓知识产权保护和网络安全维护知识的复合型人才。因此,要有选择地引进一批这类人才,同时要加大现有人员的培训力度,为数字资源建设做好人力资源储备。

规划引领是数字资源建设的保证

社科信息数字资源是本地区、本部门的宝贵财富,应统筹规划,通过一系列的行之有效的规划和政策鼓励社科数字资源的建设和开发利用。要加大对数字资源重点单位特别是特色数据库建设的扶植和支持,包括在人力、物力、财力上的投入。规划应立足本单位实际,逐步推进,以避免网络资源重复建设造成资源浪费。

特色数据库的建设是进行有针对性的服务和提高本馆声望的有效途径

科学数据资源范文第3篇

[关键词]高校图书馆 数字资源 数据库

[分类号]G250.7

1 我国高校图书馆数字资源建设现状分析

为了较全面客观地反映我国高校图书馆数字资源建设与开发利用的现状,2008年9至12月,笔者选择107所国家211工程重点建设大学作为重点调查对象,从这些高校的数字图书馆信息门户人手,对各馆数字资源的数量、数字资源的种类、数字资源的整合与开发利用等多方面进行较系统全面的调查,并对调查所得的数据进行了统计分析。调查的数字资源类型主要有引进数据库、自建特色数据库、学科导航库、光盘资源、图书馆采集的网络数字资源等。调查途径主要是网络调查、电子邮件咨询和电话咨询。

1.1高校图书馆拥有数据库总量情况

通过调查,107所重点高校中有3所高校图书馆由于权限、网络等问题无法链接其主页,其余104所大学图书馆的数据库数量分布统计结果见图1。

观察图1,我们会发现我国高校图书馆数字资源的数量分布大致可以分为高、中、低三个层次。只有少数重点高校图书馆拥有数量非常丰富的数据库,而绝大多数高校图书馆只拥有少量的数据库。在我国重点高校图书馆中拥有100个以上数据库的图书馆只有18个,仅占统计总量的17%。排在前10位的图书馆是清华大学、北京大学、四川大学、南开大学、复旦大学、北京师范大学、浙江大学、暨南大学、重庆大学、吉林大学的图书馆。这说明只有具备充裕的资金支持、高素质的技术管理人才和先进的数字图书馆建设理念等必要条件,才能做好数据库建设工作,而在我国只有少数重点高校图书馆同时具备这些条件。在我国高校图书馆数据库建设中处于中等层次的图书馆共计有82所,占统计总量的79%。而重点高校图书馆中还有4所拥有数据库总量不超过20个,说明这些图书馆存在资金、人才、设备、管理、思想理念等多方面的制约因素,数据库建设处于较低水平。

1.2中外文数据库引进情况

下面以中文数据库被引进的次数进行统计,结果如表1所示:

从表1数据来看,调查的所有高校图书馆都引进了中国期刊全文数据库,92%的高校图书馆引进了中文科技期刊数据库,其次是超星电子图书、方正Apabi电子图书、人大报刊复印资料等数据库。从表1中数据可知,我国高校图书馆引进中文数据库主要是综合性数据库,数据容量也比较大,专业性数据库引进的比较少。例如中国学术期刊全文数据库和中文科技期刊全文数据库,是引进最多的两个数据库。

外文数据库被引进的次数的统计结果如表2所示:

由表2可知,所调查的高校图书馆共引进外文数据库708个,被引进次数比较多的有施普林格的电子期刊和电子图书Springer LINK,EBSCO公司生产的PQDD学位论文全文数据库和EBSCO Host、AmericanPhysical Society(APS)等数据库。从表2来看,有综合性数据库,也有专业性数据库,与引进的中文数据库相比较而言,外文专业性数据库明显多于中文专业性数据库。

1.3自建特色数据库情况

在调查的104所高校图书馆中,有1所高校图书馆由于网页链接问题无法访问特色数据库,有11所高校图书馆未建立特色数据库。对92所高校图书馆自建的特色数据库进行统计,结果自建特色数据库数量排名前10位的图书馆名单如表3所示:

经调查统计,所调查的高校图书馆共建有600个特色数据库。建立特色数据库最多的是清华大学图书馆,其次是华南师范大学图书馆,特色数据库数量均不少于20个。大部分高校图书馆都建立了本校的学位论文提交系统、教学参考资料、随书光盘数据库等。这些高校图书馆主要是根据本校的学科发展特点和特色的馆藏资源,或者是围绕学校所在地的政治、经济、文化等建立相应的特色数据库,如:武汉大学图书馆建立的长江三峡资料数据库、长江资源库、环境资源法数据库、中国水力发电工程特色数据库;清华大学图书馆建立的清华网络学堂、红色网站、明理法律、建筑数字图书馆;吉林大学图书馆建立的东北亚研究数据库、汽车工程信息数据库、满铁资料库、亚细亚文库、东北地区地学文献数据库;北京师范大学图书馆建立的京师文库全文库、解放前师范学校及中小学教科书全文库、民国图书全文库、中文珍稀期刊题录库、全元文篇名作者索引等。

1.4学科导航库建设情况

学科导航是以学科为单元对Internet上的相关学术资源进行搜集、分类、描述、组织和序化,建立分类式资源组织体系、动态链接、学科资源数据库和检索平台,于网上,为用户提供网络学科信息资源导引和检索线索的导航系统。学科导航库的建立可以方便各个学科读者查询本学科网络信息资源,让学科特别是重点学科领域的师生快速地了解本学科领域前沿研究动向、发展趋势和国际动态,节省其搜索网站的时间和网络通讯费用。

在调查的107所高校图书馆中,有6所高校图书馆由于权限限制或者无法链接而打不开图书馆主页或者无法链接学科导航,实际调查数量为101所高校图书馆。其中有39所图书馆未建立学科导航、或者正在建设、或者是简单链接其他高校的学科导航,占调查总数的38.6%。

从表4可以得知,仅有武汉大学图书馆学科导航库所导航学科数量超过20个,其他有6所高校图书馆超过10个,剩下的高校图书馆学科导航库所导航学科数量不足10个。从调查统计数据得知,平均每所高校图书馆学科导航数据库数量只有4.1个。作为211重点高校图书馆,有重点学科建设的优势,也有技术、人才、资金的优势,学科导航库的建设尤显薄弱。

2 我国高校图书馆数字资源建设存在的问题

2.1个别高校图书馆引进数据库数量较少

所调查的104所重点高校图书馆共引进中、外文数据库6615个,平均每个图书馆引进数据库63.5个,其中平均每个图书馆引进中文数据库24.7个、外文数据库38.8个,外文数据库明显多于中文数据库。在引进中文数据库方面,仅有2所高校图书馆引进中文数据库超过100个,还有10所高校图书馆引进的中文数据库不足10个。在引进外文数据库方面,仅有6所高校图书馆引进外文数据库超过了100个,也有9所高校图书馆引进外文数据库不足10个。

2.2数据库重复建设较为严重

一方面,数据库自身建设重复。比较中国学术期刊全文数据库和中文科技期刊全文数据库就可知,两个数据库包含的期刊都有8000多种,中国学术期刊全文数据库主要收录的是社会科学方面的期刊,兼收

有部分科技类核心期刊,而中文科技期刊全文数据库主要收录的是科技方面的期刊,兼收有部分社会类核心期刊。两个数据库收录的期刊有大部分都是重复的,但各有侧重点。如果学校是综合性院校,文理科都是重点学科,那么图书馆在购买数据库时就要考虑同时购买这两个数据库,势必造成重复购买某部分数据。

另一方面,自建数据库重复建设情况也很严重。例如,在学科导航库建设方面,存在多个高校图书馆同时建设同一学科的情况。上海交通大学、北京航空航天大学、北京工业大学、电子科技大学、清华大学5所图书馆就同时都建设了材料科学与工程学科的学科导航库。

2.3自建数据库数量少,质量不高

在调查的104所高校图书馆中,共引进中外文数据库6615个,自建数据库600个,单从数量上比较,自建数据库只占数据库总量的8.3%。以清华大学、北京大学、武汉大学为例,清华大学图书馆共引进中外文数据库448个,自建数据库28个,自建数据库占总量的5.9%;北京大学图书馆共引进中外文数据库206个,自建数据库6个,自建数据库占总量的2.8%;武汉大学图书馆共引进中外文数据库97个,自建数据库11个,自建数据库占总量的10.2%。在调查的各高校图书馆自建的数据库中真正具有较高价值、形成特色的寥寥无几。

2.4数据库容量较小

我国高校图书馆数字资源建设的范围比较广,虽然各馆均在开发特色馆藏资源,但是数字资源建设的容量较小,大部分数据库的容量在10-100MB之间,且链接的资源较多。数据库的规模与发达国家相比差距甚远。如美国的OCLC拥有300多种语言的书目数据4000万条,馆藏信息5亿条,而“中国学术文献网络出版总库(CNKI)”收藏了8200多种中文学术期刊,学科专题数据库才3000个,学位论文数据库70多万条,相比之下差距甚远。

2.5大部分高校图书馆未实现数字资源整合检索

在调查的104所高校图书馆中,都购买和建设了多种不同的数据库资源,特别是资金雄厚的图书馆都拥有大量的数字资源,但这些数字资源都是不同商家提供的异构数据库。尽管许多数字资源使用效果非常好,但当使用者在查询多个数据库时,需要重新登陆各个数据库、重复输入关键词,从而浪费了大量的时间和精力,而且效率也比较低,给访问数据库造成很大的瓶颈。

在所调查的高校图书馆中,只有24所图书馆实现了数字资源的跨库整合检索,真正实现了读者不用重复登陆、一站式的检索理念。但建立这种整合检索的图书馆只占调查总数的24.5%,所以说高校图书馆数字资源整合系统并不健全,在今后很长一段时间内数字资源整合将是研究热点。

3 我国高校图书馆数字资“源建设中存在问题的解决对策

3.1加大力度引进中外文数据库

中文数据库商出于自身利益的考虑,大部分数据库是大而泛,数据量比较多,购买费用也比较高。高校图书馆在引进中文数据库的时候要综合考虑数据库的使用效果、学科专业建设、重复引进、经费投入等问题,合理引进中文数据库。在经费允许的条件下,根据学科专业建设情况,尽量多引进专业性数据库,满足多学科的教师和学生的科研学习需要。

经调查,同国外现有的专业数据库相比,目前国内引进的外文数据库只有2%左右,这与顺应数字图书馆发展趋势是不相称的。因此,有必要不断加强外文数据库的引进力度,逐渐加大这方面的资金投入。

目前许多图书馆在引进数据库时缺乏主动性,绝大多数仍处在商上门推销的被动试用、接受阶段。我们应当通过多种渠道了解全球专业数据库的出版信息,变被动为主动,努力做好图书馆信息资源建设。

3.2加强自建数据库建设

在本文的调查中显示,我国高校图书馆引进的数据库比较多,而自建的数据库比较少,自建特色库的质量也比较低,本身数据库的资源也比较少,基于以上问题,要加强自建特色数据库的建设,笔者认为应该做好以下几方面的工作:

・集中精力搜集具有某种优势的信息资源。收集本校师生论文、著作,建成相应的数据库,在图书馆主页上建立链接,提供给读者检索,是构建特色数据库的一个可行方法。同时,收集文献被收录和被引用情况,既能反映出学校科研的水平,又能提升服务层次,更好地显示出本馆数字资源的特色。高校图书馆还可以结合本地地方特色资源,建设具有浓郁的本地特色的数据库。例如,吉首大学图书馆利用其地处沈从文先生故乡的优势,建立了“沈从文文献资料中心”;湘潭大学图书馆位居伟人故里,建立了“思想文献信息中心”,等等,不仅为本校的教学科研提供了优质高效的个性化服务,也为地区乃至全国性的图书馆数字资源共享打下了良好的基础。

・对所收集的文献信息进行深加工,形成一批质量较高的二、三次文献。深层次文献信息资源的开发不仅是为了充分揭示图书馆的馆藏文献信息资源,更主要的是为了更好地提供利用。要抓好图书馆的信息化建设,促进文献信息资源的深层次开发,必须根据信息量化程度的难易、数据量的大小,统一规范系统数据,制定各专业数据库的建设规划、发展、标准和实施步骤,分工合作、有条不紊、分期分批地进行文献信息资源的全面建设。

・根据重点学科、重点课题,对国内外该研究领域的新观点、新思潮、新动向进行跟踪,提供定性、定量的专题报告和论点汇编。高校图书馆具有文献资源优势,丰富的馆藏特色文献为重点学科、重点课题数据库的建立储备了良好的资源基础。图书馆担负着学科建设的资料存储和资源建设的重要任务。例如,清华大学的建筑数字图书馆、北京林业大学的林木育种数据库、内蒙古大学的蒙古学特色数据库等都与本校的重点优势学科紧密相连。

3.3加强高校联盟,实现资源共建共享

实现各高校数字图书馆之间的互连和资源共享,是数字图书馆发展的必然趋势,也是解决资金短缺的一个重要举措。资源共享的基础是共建,因此要在管理体制和资源配置方式上进行改革,变单一建设为集中建设,变封闭式管理为开放式管理,改变大而全、小而全的思想,避免重复建设,浪费大量的资金和时间。各馆要转变观念,树立全局意识,把自身建设放在资源共建共享的大环境中来考虑,积极参与数字资源的整体化组织与建设,通过紧密协作,统一规划,统一标准,在互惠互利的基础上制定高校数字资源建设的整体目标。另外要根据各个馆的功能和定位,确定数字资源的订购范围,合理分配各图书馆数字资源的建设规模,尽可能地把各个图书馆的经费投入集中起来进行数字资源的整体规划,形成资源共建共享的运行机制,建设“大图书馆”的数字资源,最终实现数字资源分布式存储和管理、集成化“一站式”检索和利用的格局。

3.4加强数字资源整合检索建设

数字资源整合是一种数字资源优化组合的存在状态,是依据一定需要,对各相对独立的资源系统中的数据内容、功能结构及其互动关系进行类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的数字资源体系,数字资源的整合程度直接关系到其能否被高效吸收及利用。

数字资源整合主要有基于OPAC、跨库检索、资源导航、超级链接等形式的信息资源整合。以OPAC系统为基础的资源整合平台,可以让读者在不知不觉中跨越馆内资源和书目服务的局限,方便地使用馆外的或数字化的文献资源。目前每个数据库都有不同的检索界面和检索方式,给读者检索资源造成了相当的困难,对异构数据库进行资源整合与统一检索,将大大提高读者对信息资源获取的效率。资源导航系统的功能主要是帮助读者更加全面地了解信息资源,供读者浏览或按一定的特征来检索,并提供该资源的检索入口。利用网络超文本链接特性,可以将文献的有关知识点链接起来,达到将有关的信息资源链接在一起,形成一个具有内在联系的有机整体,以方便读者利用各类信息资源,这就是链接整合。

参考文献:

[1]王桂玲,网络资源学科导航与DC元数据,现代情报,2005(8):209―201。

[2]徐俐华,高校图书馆数字资源建设的再思考,图书馆,2006(6):97―98,116。

[3]余清芬,国外数据库引进现状、问题与对策,新世纪图书馆,2003(5):40-43。

[4]毛燕梅,高校图书馆特色数字资源建设值得注意的几个问题,图书情报工作,2004(12):89―91,97。

[5]谭芳兰,浅谈高校图书馆特色虚拟馆藏建设,情报探索,2006(7):109―111。

[6]韩亭,董泗利,网络环境下高校图书馆信息资源建设的原则与策略,现代情报,2008(1):61―63。

科学数据资源范文第4篇

关键词:中医药;科学数据

1科学数据共享工程

美国政府自20世纪90年代以来,在科学数据方面实行了“国有科学数据完全与开放共享国策”,联邦财政设立专项资金连续支持数据中心群的建设,利用法律手段保障其信息畅通。据有关资料统计,在数据共享国策实施的10年间,美国平均年经济增长率后5年比前5年增长了1.1%,其中0.5%是由于数据和信息的流通和应用所产生的[1]。目前,我国由各行业部门产生和积累的海量科学数据,得不到有效共享和利用,制约了我国科技创新和社会经济发展的进程。在这种时代背景下,面对中国社会和科技发展的需要,2002年,我国开始实施“国家科学数据共享工程”。科学数据共享工程是在国家科技基础条件平台统一规划、政策调控和相应法规的保障下,应用现代信息技术,整合离散的科学数据资源,构建面向全社会的网络化、智能化的管理与共享服务体系,实现对科学数据资源的规范化管理及其高效利用,从而为科技进步与创新、政府决策、经济增长、社会发展和国家安全提供科学数据资源的强有力支撑。它具有公益性、基础性、持续性和基于现代信息技术的数据内容服务的明显特征,是国家科技基础条件平台的重要组成部分,是国家创新体系中急需发展的现代科技基础设施之一。

国家科学数据共享工程建设的指导思想是围绕全面提升国家科技创新能力,实现推进现代化建设的国家目标,以科技创新为动力,以需求为导向,以政策、法规为保障,充分发挥国家长期布局的数据采集系统和各类国家科技计划项目产生与积累的科学数据资源优势,构建面向全社会的共享服务体系,实现科学数据资源的规范化管理与高效利用。以共享促进应用,最大限度地发挥科学数据的潜在价值,强化对科技进步与创新的支撑能力。

医药卫生科学数据共享网在国家科技部统一部署下,由四个主管部门联合推荐,六大科研院所联合申报,2003年在科技部立项,2004年4月正式启动。其总体目标是建立一个物理上分布,逻辑上高度统一的医药卫生科学数据管理与共享服务系统,为政府卫生决策、科技创新、医疗保健、人才培养、百姓健康和企业发展提供数据共享和信息服务。科学数据中心是数据集汇交、储存和提供数据共享服务的物理中心,到2006年已经启动的4个数据中心和依托单位分别是:基础医学科学数据中心——中国医学科学院基础所、临床医学科学数据中心——总医院和北京协和医院、预防医学科学数据中心——中国疾病预防控制中心、中医药科学数据中心——中国中医科学院。

2中医药科学数据中心的现状

中医药科学数据中心是国家医药卫生科学数据共享网的成员单位之一。自科学数据共享工程实施以来,围绕构建国家科学数据管理与共享服务体系、制定和完善科学数据共享政策、法规与标准体系、增强中医药科学数据资源积累,促进中医药科学数据增值的整合体系的目标,坚持“统一领导,统筹规划,统一标准”的指导方针,确定以中医药科学数据资源的规划为出发点,将资源的组织、分析、获取、调度、整合和共享服务工作贯彻工程建设始末。

2.1顶层设计

以医学卫生科学数据共享网为依托,在中医药科学数据汇交平台基础上研制中医药科学数据共建平台与中医药科学数据规范标准平台,整合与建立中医药科学数据主体数据库群,形成中医药科学数据共享平台,提供优质的中医药科学数据服务。全体系需要科学数据共建与共享的运行机制与管理;全工程需要信息网格的技术支撑。见图1。

2.2中心建设

按照科学数据共享工程的建设规则,由中国中医科学院中医药信息研究所承担中医药科学数据共享与服务的物理中心。依托国家中医药管理局中医药文献检索中心机构基础与国际互联网,在全国选择与建立了若干个分中心,形成了中医药科学数据建设虚拟专业队伍。到2006年底,由全国中医药院校与研究单位组建了20余家分中心,专业人员约300余人。物理中心与虚拟中心共同承担了中医药科学数据中心的建设。

2.3建立快速高效数据集成平台

为适应中医药信息化、数字化的需求,中医药主体数据库群组必须向多类型、多结构、快速信息存储与高度集成方向发展,最终形成全方位的系统工程。在不同优劣硬件设备上,利用同样的软硬件环境、建立统一的加工界面、采用一致的加工方式,整合来源统一,这样即保证数据信息的正确统一,又大幅减少重复劳动、节约信息采集费用,实现高速率的数据集成。所有成员单位基于统一平台,实现无障碍的所有数据信息交流与共享,信息及时存储与获得更新;数据加工采用统一格式,避免管理方式多种多样,节约大量的信息格式转换费用;所有参建单位基于相同的信息质量控制平台进行项目管理,极大缩短参建各方的技术水平差距,提高整个项目的管理水平,同时降低对管理人员的素质要求。利用数据共建平台,实现了中医药科学数据的快速集成。

2.4建立主体数据库

主体数据库是中医药科学数据中心的基本任务,是提供权威、可靠的数据内容服务的基本单元。它是通过整合集成科学数据资源和整合改造已有数据库而构成的。中医药数据库资源的主体数据库分为中药数据体系、中医数据体系、针灸数据体系与古代文献数据体系。目前,中医药科学数据中心数据存储量约120G,现代文献数据库收集年代跨越50年。

2.5标准和规范研究

规范化、标准化的建设是科学数据共享的前提,不仅可以保证工程建设伊始就能够自上而下地遵循规范化途径有序进行,还为科学数据的高度共享及其与其它应用系统的高速通信、联网创造必要的条件。

中医药科学数据中心研制中医药语言系统,集成中医药术语近11万条;修订了中医药主题词表8千条;研制了共建平台固化的标准词表29张。同时,制定了中医药卫生科学数据共享元数据标准与中医药科学数据分类标准。

2.6数据与共享体系

以多个大型数据库群与数据检索、统计能力为支撑,利用先进的计算机技术,构造了一个能够在Internet环境下融合各个自治、异质异构的中医药数据资源的,并能为用户提供一个统一的全局范围内数据检索环境的信息共享平台,以支持数据库资源的共享、综合利用与开发。支持数据库共享的主要数据为中药、针灸、突发公共卫生、古代文献等主体数据库群。其中中药数据占本领域数据量的80%以上。中医药科学数据中心可以实现的服务功能包括:对分布式数据库和数据集的统一管理、目录服务、数据服务、延伸服务等。

数据管理是利用分布式数据库技术、数据仓库管理技术、元数据技术和网络技术,建立以分布式为主、集成式为辅的数据管理系统,开展数据汇交、整理加工、存储和数据更新,实现对科学数据资源的有效管理。

目录服务是以元数据为核心的目录查询,它将通过元数据标准的核心元素将信息以动态分类的形式展现给用户。用户通过浏览门户网站提供的元数据摘要可以快速确定自己所需的信息范围,然后要求门户网站在该范围内进一步搜索。

数据服务是在目录服务基础上的数据内容服务,所提供的数据类型是多样的,能够对各种空间、非空间数据以及结构化、非结构化数据提供浏览、查询、下载和脱机服务等多种功能。

延伸服务是为用户提供一系列工具,以便在众多来源的海量数据中进行数据搜索、多源数据整合、数据挖掘,及时发现所需要的知识,提高科学数据的利用率。针对自身的优势,构建其有特色的服务体系,例如专题查询、统计分析等等。

2.7共享策略与运行机制

本着共建共享的原则,建立中医药科技数据的分布与集中管理方式,合理划分共享数据的有偿与无偿。逐步制定数据开发与管理分级制度。

3中医药科学数据中心的发展

当代科学技术突破频频诞生于学科交叉的前沿领域表明,科学技术向着多学科综合交叉的方向发展,而学科交叉与渗透需要多学科领域的知识、信息和数据的支持。在工程项目深入发展与技术需求强烈时,提出了若干值得思考的问题。

3.1中医药科学数据中心的功能扩充

中医药科学数据中心的定位决定了应该具备的功能。国家共享工程基础目标是现有的数据资源尽可能的实现共享与利用。但是,随着中医药信息资源的累积与增加,数据需求从量变发展到质变;从单纯的数据发现转变为知识发现,从数据应用到创新集成应用;这给数据中心发展提出了新的要求,特别是国家“十一五”、“973”等重大科学研究项目,对于知识发现与挖掘的需求更加强烈。这种需求变更不仅是中医药科学数据中心面临的问题,而且是具有一定代表性的问题[2]。

科学数据共享中心功能细化为三个方面:一为资源整合管理,包括数据资源调查、汇交整合与共建管理;二为技术研究,包括信息标准与语言系统研究、数据分析与挖掘研究、计算机技术研究;三为服务管理,包括数据利用与服务研究、网络平台服务以及共享分级研究。

3.2中医药科学数据中心的工程技术

中医药科学数据中心的功能实现,离不开工程技术的支撑,主要是计算机技术与信息工程技术,从数据资源整合与共建,到数据存储、服务、传送的全过程,需要完整的、流畅的工程技术保障。领域专业人员与专职计算机人员的紧密结合是工程实施的必要保证。

3.3优质品牌数据库的建立

当越来越多的系统建立起来的时候,可能并不是越多越好,反而会导致信息重叠、资源浪费、结果不统一,甚至相互矛盾。

建立数据库评价体系,科学评价数据库与数据质量,促进优质品牌数据库的建立,是解决数据有效应用的关键。提倡共建与联盟也是科学数据合理分布、有效管理的方法。中医药数据中心需要建立优质数据库与优质数据质量的评价方法与机制。

在建立优质数据库的评价体系的同时,应该建立科学数据共享平台评价体系,包括从共建、共享、服务、应用、发展等多方面进行科学评价。

3.4科学数据汇交机制

科学实验与科学研究的有效数据汇交是一个大问题,需要依靠政府与制度的保障,同时也需要科学数据中心对科学数据有效评价与认定。科学实验数据汇交与提交级别的认定、不同研究专业提交数据的具体原则,都是数据中心需要认真研究的,需要最大限度保障数据提交,又严格审查数据质量,有效筛选。

3.5促进全球科学数据共享

空间因素对信息资源共享活动的根本制约,诱发了人们利用信息资源观念的深刻变革,标志着中医药信息资源共享建设时代到来。中医药科学数据的共享目标与共享范围的设定直接影响共享的分级。在保证我国科研人员充分利用科学数据的同时,也为全球科学数据共享做出贡献,需要建立一种崭新的共享管理理念。

【参考文献】

科学数据资源范文第5篇

美国政府自20世纪90年代以来,在科学数据方面实行了“国有科学数据完全与开放共享国策”,联邦财政设立专项资金连续支持数据中心群的建设,利用法律手段保障其信息畅通。据有关资料统计,在数据共享国策实施的10年间,美国平均年经济增长率后5年比前5年增长了1.1%,其中0.5%是由于数据和信息的流通和应用所产生的。目前,我国由各行业部门产生和积累的海量科学数据,得不到有效共享和利用,制约了我国科技创新和社会经济发展的进程。在这种时代背景下,面对中国社会和科技发展的需要,2002年,我国开始实施“国家科学数据共享工程”。科学数据共享工程是在国家科技基础条件平台统一规划、政策调控和相应法规的保障下,应用现代信息技术,整合离散的科学数据资源,构建面向全社会的网络化、智能化的管理与共享服务体系,实现对科学数据资源的规范化管理及其高效利用,从而为科技进步与创新、政府决策、经济增长、社会发展和国家安全提供科学数据资源的强有力支撑。它具有公益性、基础性、持续性和基于现代信息技术的数据内容服务的明显特征,是国家科技基础条件平台的重要组成部分,是国家创新体系中急需发展的现代科技基础设施之一。

国家科学数据共享工程建设的指导思想是围绕全面提升国家科技创新能力,实现推进现代化建设的国家目标,以科技创新为动力,以需求为导向,以政策、法规为保障,充分发挥国家长期布局的数据采集系统和各类国家科技计划项目产生与积累的科学数据资源优势,构建面向全社会的共享服务体系,实现科学数据资源的规范化管理与高效利用。以共享促进应用,最大限度地发挥科学数据的潜在价值,强化对科技进步与创新的支撑能力。

医药卫生科学数据共享网在国家科技部统一部署下,由四个主管部门联合推荐,六大科研院所联合申报,2003年在科技部立项,2004年4月正式启动。其总体目标是建立一个物理上分布,逻辑上高度统一的医药卫生科学数据管理与共享服务系统,为政府卫生决策、科技创新、医疗保健、人才培养、百姓健康和企业发展提供数据共享和信息服务。科学数据中心是数据集汇交、储存和提供数据共享服务的物理中心,到2006年已经启动的4个数据中心和依托单位分别是:基础医学科学数据中心——中国医学科学院基础所、临床医学科学数据中心——总医院和北京协和医院、预防医学科学数据中心——中国疾病预防控制中心、中医药科学数据中心——中国中医科学院。

2中医药科学数据中心的现状

中医药科学数据中心是国家医药卫生科学数据共享网的成员单位之一。自科学数据共享工程实施以来,围绕构建国家科学数据管理与共享服务体系、制定和完善科学数据共享政策、法规与标准体系、增强中医药科学数据资源积累,促进中医药科学数据增值的整合体系的目标,坚持“统一领导,统筹规划,统一标准”的指导方针,确定以中医药科学数据资源的规划为出发点,将资源的组织、分析、获取、调度、整合和共享服务工作贯彻工程建设始末。

2.1顶层设计

以医学卫生科学数据共享网为依托,在中医药科学数据汇交平台基础上研制中医药科学数据共建平台与中医药科学数据规范标准平台,整合与建立中医药科学数据主体数据库群,形成中医药科学数据共享平台,提供优质的中医药科学数据服务。全体系需要科学数据共建与共享的运行机制与管理;全工程需要信息网格的技术支撑。见图1。

2.2中心建设

按照科学数据共享工程的建设规则,由中国中医科学院中医药信息研究所承担中医药科学数据共享与服务的物理中心。依托国家中医药管理局中医药文献检索中心机构基础与国际互联网,在全国选择与建立了若干个分中心,形成了中医药科学数据建设虚拟专业队伍。到2006年底,由全国中医药院校与研究单位组建了20余家分中心,专业人员约300余人。物理中心与虚拟中心共同承担了中医药科学数据中心的建设。

2.3建立快速高效数据集成平台

为适应中医药信息化、数字化的需求,中医药主体数据库群组必须向多类型、多结构、快速信息存储与高度集成方向发展,最终形成全方位的系统工程。在不同优劣硬件设备上,利用同样的软硬件环境、建立统一的加工界面、采用一致的加工方式,整合来源统一,这样即保证数据信息的正确统一,又大幅减少重复劳动、节约信息采集费用,实现高速率的数据集成。所有成员单位基于统一平台,实现无障碍的所有数据信息交流与共享,信息及时存储与获得更新;数据加工采用统一格式,避免管理方式多种多样,节约大量的信息格式转换费用;所有参建单位基于相同的信息质量控制平台进行项目管理,极大缩短参建各方的技术水平差距,提高整个项目的管理水平,同时降低对管理人员的素质要求。利用数据共建平台,实现了中医药科学数据的快速集成。

2.4建立主体数据库

主体数据库是中医药科学数据中心的基本任务,是提供权威、可靠的数据内容服务的基本单元。它是通过整合集成科学数据资源和整合改造已有数据库而构成的。中医药数据库资源的主体数据库分为中药数据体系、中医数据体系、针灸数据体系与古代文献数据体系。目前,中医药科学数据中心数据存储量约120G,现代文献数据库收集年代跨越50年。

2.5标准和规范研究

规范化、标准化的建设是科学数据共享的前提,不仅可以保证工程建设伊始就能够自上而下地遵循规范化途径有序进行,还为科学数据的高度共享及其与其它应用系统的高速通信、联网创造必要的条件。

中医药科学数据中心研制中医药语言系统,集成中医药术语近11万条;修订了中医药主题词表8千条;研制了共建平台固化的标准词表29张。同时,制定了中医药卫生科学数据共享元数据标准与中医药科学数据分类标准。

2.6数据与共享体系

以多个大型数据库群与数据检索、统计能力为支撑,利用先进的计算机技术,构造了一个能够在Internet环境下融合各个自治、异质异构的中医药数据资源的,并能为用户提供一个统一的全局范围内数据检索环境的信息共享平台,以支持数据库资源的共享、综合利用与开发。支持数据库共享的主要数据为中药、针灸、突发公共卫生、古代文献等主体数据库群。其中中药数据占本领域数据量的80%以上。中医药科学数据中心可以实现的服务功能包括:对分布式数据库和数据集的统一管理、目录服务、数据服务、延伸服务等。

数据管理是利用分布式数据库技术、数据仓库管理技术、元数据技术和网络技术,建立以分布式为主、集成式为辅的数据管理系统,开展数据汇交、整理加工、存储和数据更新,实现对科学数据资源的有效管理。

目录服务是以元数据为核心的目录查询,它将通过元数据标准的核心元素将信息以动态分类的形式展现给用户。用户通过浏览门户网站提供的元数据摘要可以快速确定自己所需的信息范围,然后要求门户网站在该范围内进一步搜索。

数据服务是在目录服务基础上的数据内容服务,所提供的数据类型是多样的,能够对各种空间、非空间数据以及结构化、非结构化数据提供浏览、查询、下载和脱机服务等多种功能。

延伸服务是为用户提供一系列工具,以便在众多来源的海量数据中进行数据搜索、多源数据整合、数据挖掘,及时发现所需要的知识,提高科学数据的利用率。针对自身的优势,构建其有特色的服务体系,例如专题查询、统计分析等等。

2.7共享策略与运行机制

本着共建共享的原则,建立中医药科技数据的分布与集中管理方式,合理划分共享数据的有偿与无偿。逐步制定数据开发与管理分级制度。

3中医药科学数据中心的发展

当代科学技术突破频频诞生于学科交叉的前沿领域表明,科学技术向着多学科综合交叉的方向发展,而学科交叉与渗透需要多学科领域的知识、信息和数据的支持。在工程项目深入发展与技术需求强烈时,提出了若干值得思考的问题。

3.1中医药科学数据中心的功能扩充

中医药科学数据中心的定位决定了应该具备的功能。国家共享工程基础目标是现有的数据资源尽可能的实现共享与利用。但是,随着中医药信息资源的累积与增加,数据需求从量变发展到质变;从单纯的数据发现转变为知识发现,从数据应用到创新集成应用;这给数据中心发展提出了新的要求,特别是国家“”、“973”等重大科学研究项目,对于知识发现与挖掘的需求更加强烈。这种需求变更不仅是中医药科学数据中心面临的问题,而且是具有一定代表性的问题。

科学数据共享中心功能细化为三个方面:一为资源整合管理,包括数据资源调查、汇交整合与共建管理;二为技术研究,包括信息标准与语言系统研究、数据分析与挖掘研究、计算机技术研究;三为服务管理,包括数据利用与服务研究、网络平台服务以及共享分级研究。

3.2中医药科学数据中心的工程技术

中医药科学数据中心的功能实现,离不开工程技术的支撑,主要是计算机技术与信息工程技术,从数据资源整合与共建,到数据存储、服务、传送的全过程,需要完整的、流畅的工程技术保障。领域专业人员与专职计算机人员的紧密结合是工程实施的必要保证。

3.3优质品牌数据库的建立

当越来越多的系统建立起来的时候,可能并不是越多越好,反而会导致信息重叠、资源浪费、结果不统一,甚至相互矛盾。

建立数据库评价体系,科学评价数据库与数据质量,促进优质品牌数据库的建立,是解决数据有效应用的关键。提倡共建与联盟也是科学数据合理分布、有效管理的方法。中医药数据中心需要建立优质数据库与优质数据质量的评价方法与机制。

在建立优质数据库的评价体系的同时,应该建立科学数据共享平台评价体系,包括从共建、共享、服务、应用、发展等多方面进行科学评价。

3.4科学数据汇交机制

科学实验与科学研究的有效数据汇交是一个大问题,需要依靠政府与制度的保障,同时也需要科学数据中心对科学数据有效评价与认定。科学实验数据汇交与提交级别的认定、不同研究专业提交数据的具体原则,都是数据中心需要认真研究的,需要最大限度保障数据提交,又严格审查数据质量,有效筛选。