首页 > 文章中心 > 正文

健康科学图书馆数据管理服务探究

健康科学图书馆数据管理服务探究

摘要:开放科学正逐渐改变传统科研范式,数据管理成为提升科学学术水平的重要环节。文章采用文献调研法和网络调查法,详细分析美国健康科学图书馆数据管理服务现状以及探讨医学高校图书馆开展数据管理服务的优势和意义。

关键词:健康科学图书馆;数据管理;实践;美国

0引言

随着数据密集型科研范式的到来、开放科学的不断推进,海量数据的传播与共享催生全新的科研环境。“科学数据素养”问题引起了图书馆业界的高度关注,并且带动了高校图书馆对数据素养教育和科学数据服务的不断探索。健康医学领域是科研数据管理和共享起源较早的领域,由于其科研数据的独特性和代表性及其对医学科研人员、医学工作者的科研和实践价值,成为备受关注的学科领域。目前,以欧美为代表的发达国家,健康医学图书馆纷纷开展了科研数据管理服务并已形成相对成熟的服务体系,成为一线医学科研人员以及临床工作者科研工作的坚实保障。

1美国健康科学图书馆数据管理服务实践总结

1.1健康科学图书馆独立开展数据管理服务

在美国,图书馆承担的数据管理相关服务通常分为两种形式:(1)数据素养教育,包括Libguides科学数据管理资源导航、科学数据素养通识教育、学科专题数据素养教育。(2)数据管理服务,包括数据获取、数据使用、数据挖掘、数据储存、数据共享、数据伦理等。以上两类服务在健康科学图书馆服务的实际开展中既有不同侧重,也存在服务内容的交叉,并且大多是围绕科研生命周期或科研数据生命周期展开的。网络调研显示,华盛顿大学健康科学图书馆[1]、马萨诸塞大学医学院LamarSoutter图书馆[2]、威斯康星-麦迪逊大学健康科学图书馆[3]、维尔·康奈尔医学图书馆[4]、纽约大学健康科学图书馆[5]、匹兹堡大学健康科学图书馆[6]等均利用Libguides建立科学数据管理资源导航,帮助研究者建立起对科学数据管理的初步概念,以便了解科学数据管理的方法、工具与可利用资源,而此项服务均由图书馆独立开展。此外,无论是围绕科研生命周期的以各种形式开展的科学数据素养通识教育或科研数据管理服务内容,所涉及内容均与科研项目息息相关。有关数据显示,QS排名前50的美国健康科学图书馆均已开展此类服务。例如:马萨诸塞大学医学院LamarSoutter图书馆[2]、华盛顿大学健康医学图书馆[7]、纽约大学健康科学图书馆[5]、匹兹堡大学健康科学图书馆[8]、俄勒冈健康与科学大学图书馆[9]等均提供贯穿科研生命周期的相关数据管理服务。并且,除了部分技术支撑以及应用工具的宣传推广服务需要通过其他部门的共同配合,基础性、常规性的数据管理服务完全是图书馆独立开展的。

1.2健康科学图书馆学科馆员嵌入式数据管理服务

在美国,健康科学图书馆的学科馆员通常具有生物医学、行为科学或生物科学的学科背景,又具有图书馆和信息科学的实践经验。交叉学科背景可以使得学科馆员以独特的视角研究科研数据的采集、存储、管理和使用,在嵌入科研过程的服务中发挥了重要作用。2011年4月,美国国家医学图书馆(NLM)了基金公告,宣布为现有已经接受美国国立卫生研究院(NIH)基金资助的研究团队提供学科馆员服务行政补助。该基金项目为8个课题组提供为期2年5万美元的资助,目的是:(1)增强协作,多学科的基础和临床研究,通过信息专家(学科馆员)融入课题组,以更好地获取、存储、组织、管理、整合、揭示和传播生物医学研究数据;(2)评估和记录学科馆员参与的价值和影响。此后,NLM分别于2012年、2014年、2015年和2017年共资助了33个科研团队提供学科馆员服务[10]。基于数据生命周期理论,从数据规划、数据咨询、数据获取与工具培训、数据组织和加工、数据存储、数据共享与重用等方面对33项受资助课题进行深入研究发现:首先,馆员在各个受NIH资助项目中开展的工作内容和工作量的大小、开展形式以及在整个科研项目中所占的比重不尽相同。然而,从宏观上看,馆员所提供的数据管理服务内容通常是围绕着科研生命周期以及数据生命周期而展开的。其次,数据规划、数据获取与工具培训、数据组织与加工、数据存储以及数据共享与重用相关服务所占比重较大,是学科馆员嵌入式数据服务的重要内容。虽然,此项调研是针对NIH基金资助的研究团队而展开的,不具有普遍代表意义,但一定程度上反映了美国健康科学图书馆员在开展嵌入式服务的过程中,涉及了数据生命周期以及科研生命周期的方方面面,服务内容涉及广泛且服务能力较为成熟。再次,进一步深入课题分析发现,部分的工作需要通过与其他学院或部门合作共同开展,例如:密歇根大学Taubman健康科学图书馆与该校公共卫生与信息学院共同参与的“环境因素、早期铁缺乏与儿童神经发育”、密歇根大学公共卫生学院合作开展的“城市样本中药物使用的代际传播”、辛辛那提大学信息专家联合开展的“声带不对称中旋涡、声学和振动的关系”课题的相关信息服务等。由此可见,尽管健康科学图书馆参与并在整个课题的研究中起了重要作用,也不乏其他部门的通力协作。

1.3健康科学图书馆合作开展数据管理服务

美国健康科学图书馆合作开展数据管理服务主要体现在数据管理在线课程的开发以及数据管理相关应用软件的培训和指导等方面。基于提升医学、自然科学等相关专业的学生数据素养水平的考虑,马萨诸塞大学医学院LamarSoutter图书馆联合伍斯特理工学院的乔治·戈登图书馆、美国东北大学等新英格兰地区大学图书馆开发了新英格兰数据管理协作课程(以下称“NECDMC”)[2],在调研实际需求的基础上,结合特定的学科背景来设置教学内容,以培养和提高研究人员和学生的数据管理能力。耶鲁大学HarveyCushing/JohnHayWhitney医学图书馆(CWML)的生物医学科学研究支持馆员与密歇根大学(UM)Taubman健康科学图书馆的生物信息学家通过建立合作关系,协作定制开源软件Cytoscape全面的教学课程内容[11],以研讨会的形式对生物医学科研用户进行专业培训,通过网络与表达谱、表型和其他分子状态进行视觉整合,将网络与功能注释数据库联系起来,此项服务受到了医学科研人员的广泛好评,同时,也增强和推广了医学图书馆馆员的生物信息服务技能。

1.4健康科学图书馆为主导,多部门协作开展多项数据管理服务

健康科学图书馆为主导、多部门协作开展多项数据管理服务是近年来兴起的比较新颖和独特的数据管理服务模式,其服务内容大多体现在对于新兴软件的课程培训以及服务的宣传和拓展方面。比较经典的案例包括:纽约大学健康科学图书馆(NYUHSL)数据服务部门与技术部门的RedCap管理员以及临床数据管理支持部门主管合作建立伙伴关系,面向医学院以及附属医疗机构提供基于RedCap的数据支持服务[12];华盛顿大学健康科学图书馆(以下简称“UWHSL”)推进多机构(华盛顿大学首席信息研究官和转化健康科学研究所(ITHS)、生物医学信息和医学教育系(BIME)、华盛顿大学医学信息技术服务(ITS)以及西北太平洋地区国家医学图书馆网络(NNLMPNR))合作的临床数据管理服务[13],通过建立以研究人员为中心的创新空间,设计临床研究支持服务的多个项目,促进临床数据管理实践,UWHSL主导的此项服务协作部门广泛,服务内容丰富多样且服务方式极具代表性和典型性,下文将重点阐述并作详细分析。

2医学类高校图书馆开展数据管理服务的优势和意义

2.1学科特殊性以及数据的重要性

生物医学是一门新兴的前沿交叉学科,它是综合了医学、生命科学和生物学的理论和方法等发展起来的。近年来,随着大数据的不断蔓延,先进仪器装备与信息技术等越来越广泛和深入地整合到生物技术中,生物医学研究中越来越频繁地涉及大数据存储和分析等信息技术,大数据时代的来临对生物医学研究产生了重大影响。健康医学领域是科研数据管理和共享起源较早的领域,并且,欧美等发达国家HSL数据管理的实践证实了其对医学科研以及人类医学进步的重要作用。

2.2科研人员迫切需要提升数据素养及技能

医学大数据的到来为科研人员开辟了新的研究领域以及科研模式。在开展数据管理相关服务的同时,美国健康科学图书馆从事数据管理服务的馆员也积极开展了对于数据管理服务的探索和思考。国立卫生研究院图书馆服务部馆员、信息专家LisaM.Federer对大数据时代研究数据管理过程中图书馆员的角色转变和工作机遇[14]、生物医学研究人员的数据素养培训需求[15]、临床和科研人员对于生物医学数据共享和再利用的态度等问题展开了研究[16];斯坦福大学医学院图书馆馆员对临床试验参与者对数据共享风险和益处的看法进行了调查和研究等[17]。对调研结果进一步分析可知:首先,基于生物医学科研数据存在海量和复杂异构的特性,健康图书馆数据馆员工作面临着极大的挑战,需要不断充实自身的业务水平来应对此项服务。其次,LisaM.Federer等馆员信息专家在一定范围内开展的调研活动虽然不具有普遍代表性,但在一定程度上反映了生物医学研究人员对于数据管理能力的缺乏以及数据素养水平提高的迫切性,同时也表现出对于数据开放、共享和重用的担忧和困惑。再次,学科馆员的生物医学、行为科学或生物科学的学科背景也得到了生物医学科研人员的认可,选择其作为数据素养提高的伙伴,可行可信且具有重要现实意义。

2.3机构知识库的建设为数据管理的开展提供空间保障

机构知识库(IR)作为一种新型的数据存储和学术交流模式,为不同的科研人员搭建了科学的学术交流平台。随着开放获取运动以及信息开放共享实践的不断深入,我国高校IR的建设正在迅速展开并进入快速发展期。

3结语

生物医学是关系全人类健康的重要领域,医学数据的共享和复用对于科学的进步和发展具有重要意义,如何打破数据孤岛、实现生物医学数据共享,是生物医学大数据面临的主要问题之一。尤其是出版商的垄断、高盈利模式阻碍了数据开放和共享的进程。正如加州大学教师学术理事会主席RobertMay指出:“知识不应该只提供给那些具备支付能力的人,如果我们真的希望维护这所大学的使命,那出版成果的开放获取是必需的”[18]。对于高等医科院校而言,IR的构建,一方面,有效地保存了机构内的科研成果。另一方面,医学研究发展日新月异,医学科研人员在打破信息及数据获取屏障的同时,也为其展示、共享以及传播最新科研成果提供了有效平台[19],增加了与国际国内领域同行对话的机会,有效促进知识的创新研究和医学事业的发展。

作者:王玲玲 单位:南京医科大学图书馆