前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机储存技术范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

关键词:计算机;存储技术;存储平台;二进制
现阶段,计算机信息技术开始逐渐在人们生活及工作等领域内应用,数据信息也就成为社会发展建设重要资源。企业在现代化发展建设内,信息数据所起到的作用越加显著。为了能够提升企业在市场内竞争力,企业就必须提升信息技术利用效率及质量,积极推动信息储存技术发展,加强信息数据资源利用效率。
1计算机信息技术存储形式
计算机信息技术在快速发展建设内,企业所需要处理的信息数据数量显著增加。信息数据主要可以分为两种类别,分别为数值型数据与非数值型数据。计算机主要通过二进制形式表示数据,二进制可以表示汉字,也同样可以表示数量值。由于二进制所表示的数据不同,进而二进制所存在的含义也存在差别。计算机信息技术储存也就是计算机存储设备内,实现信息数据储存功能。计算机内所具有的存储设备主要用途就是储存数据信息,包含四种存储设备,分别为光盘、软件、内存及硬盘。存储设备在存放数据信息内,依旧以字节作为基础单位。每一个计算机所具有的内存容量存在差别,主要受到计算机系统主存总字节数量表示。现阶段,最为先进计算机外部存储容量已经可以超过几十吉字节。
2计算机存储技术设计存在的问题
现阶段,我国大部分企业都已经应用计算机存储技术,通过计算机存储技术开展内部管理工作,实际上就是对企业工作人员及内部运营信息采集整合,最大程度提升企业内部管理效率。而不同企业实际情况存在差别,进而对计算机存储技术要求也不同,造成计算机存储技术在应用内存在一定问题。计算机存储技术可以提升企业工作人员及内部信息管理效率,企业管理水平也就可以提升。所以,计算机信息技术存储平台在设计内,基本上都采取e-r模型。计算机存储技术在研发内,e-r模型是关键内容,可以有效拓宽存储技术应用范围。主要原因是由于e-r模型可以精确了解用户要求,根据模型分析结果,按照实际需求划分针对表格,同时根据不同需求点针对分析。计算机存储技术开发内,广泛应用e-r模型,可以增加不同实体之间关联,构建属性及关系集,保证存储平台结构逻辑关联,提升e-r模型完整性。e-r模型不同实体之间属性,菱形表示不同实体之间关系,矩形表示不同实体。
3计算机信息技术存储平台设计流程
3.1计算机信息技术存储平台需求设计
计算机信息存储平台开发设计内,设计阶段最为基础内容就是需求设计,并且也是计算机信息技术存储技术开发基础条件。主要原因是由于计算机信息技术存储平台在设计之前,必须真正了解用户实际需求,进而保证后期设计工作处于正轨下。所以,计算机信息技术存储平台需求设计分析内,必须客观了解用户实际需求,同时按照用户实际需求完善平台细节,保证计算机信息技术存储平台和用户实际需求相吻合。
3.2具体设计及开发流程
需求设计实际上就是了解用户实际需求。在这个过程中,用户需求还处于探索阶段,也就是这些需求稳定性得不到保证。计算机信息技术存储平台在实际设计内,设计人员需要将这些抽象概念定义化处理,同时了解不同概念之间关联,进而真正确认需求关联。除此之外,计算机信息技术存储平台概念理解水平,对于平台设计十分重要。该阶段工作实际上就是归纳整合用户要求,了解不同模型之间差别。在这个过程内,计算机信息技术存储平台在开发及应用内,还涉及到其他环节,例如计算机存储技术养护、计算机存储技术逻辑设计、计算机存储技术物理实现,这些流程在计算机信息技术存储平台开发内都具有重要意义。
4计算机存储技术开发和应用
计算机存储技术在每一个阶段设计内,每一个阶段都具有针对核心内容。计算机信息技术存储平台在开发阶段内,计算机自身必须可以存储数据信息。计算机所应用的存储技术相对较为简单,主要承担数据信息记录责任,同时对针对数据信息完成存储,数据存储阶段内,数据必须经过精确审核,进而完成数据存储功能。计算机存储技术在实际应用内,数据在正式录入之后,需要提升对数据存储录入重视度。计算机存储技术在存储数据内,应该加强不同数据信息之间整合,同时进行数据备份。计算机存储技术核心作用就是数据存储功能。一旦数据存储功能出现偏差,计算机存储系统正常运行也就受到影响。计算机在保护用户个人信息隐私权内,防止用户个人信息出现泄露情况,正常情况都将计算机文件存储形式设置为不可读。所以,计算机信息技术存储应用内,必须设置管理人员权限,进而有效保证用户个人数据信息安全,防止数据信息出现丢失问题,造成个人出现不必要经济损失。
5结论
计算机技术正在转变人们日常生活,同时也产生大量数据信息。企业在现代化发展建设内,需要提升对计算机存储技术关注度,借助计算机存储技术提升数据信息利用效率及质量,充分挖掘数据信息潜在价值。计算机信息技术存储平遥主开发内,需要深入了解客户实际需求,保证逻辑关系设计合理,最大程度发挥计算机存户技术优势。计算机信息技术存储平台具有良好发展前景,促进计算机信息技术存储平台发展,为社会大众提供更加优质服务。
参考文献
[1]刘京.计算机信息技术存储平台的开发与应用[J].电子技术与软件工程,2014(16):201-202.
关键词:计算机;云存储;数据迁移
中图分类号:TP333
同传统的虚拟化信息储存网络硬盘中,可以窥见信息存储之于计算机应用有多么重要的作用。在单个的存储环境之下,数据间要实现有效传输,对云存储的需求也在加大。数据之间,要想从完全虚拟化的场景中走出来实现高度动态的存储,就必须对其数据迁移进行详尽分析。
1 计算机云存储数据迁移的要求
云网络的连接功能,是数据迁移中,面临的首要挑战。数据迁移中的网络来接,是实现企业与云数据间快捷切换的有效途径。从其操作模式和格局来看,云数据在相当长的一段时间内,并不能完全实现数据的迁移的有效传输,同样的,对于网络连接能力的高低和本机的网络状况以及内部网络的安全现状必须实施仔细的分析。
数据云迁移在实现企业与云供应商之间数据的有效传输上,对于企业的核心数据以及一些不允许复制或者依靠其他方式迁移的数据,在云端,还必须实施安全防护和采取敏感措施防止秘密外泄。在实现企业数据迁移时,要以满足不同企业的要求,进行数据的传输迁移和链接选择。满足一般企业的相关要求时,云迁移供应商可通过人工模式满足一般企业的数据传输和迁移要求。
2 数据迁移的实现方式
云迁移工具的使用,是数据库到结构化数据使用中数据分析工具及迁移问题有效解决的必要措施。数据迁移工程中,数据的筛选和数据的转换,都是相当重要的问题。搭建云平台,实现应用程序和系统数据的兼容性,在后台使用中,对数据库的容量进行详尽的把握。
同传统的网络硬盘相比,云存储实现数据迁移是从其战略定位上来分析的。比如说金山快盘,全球首创的云桥设计、云相机等功能降低了普通用户的使用门槛,以其快速、安全、易用、实用的特性赢得了用户青睐,利用无需数据线即能实现跨平台同步数据迁移。
比如说数据迁移方案,使用表空间迁移。将表空间的元数据导出,和数据文件一起,复制到新库。执行元数据导入。一般来说,整个导入导出的数据量不到5M。速度相当快,但使用限制比较多。
导出时间:1分钟
导入时间:3分钟
导出文件:60M + 数据文件1.5G
3 数据迁移中存在的问题及对策
云存储的优势很多,但是,在使用过程中,不能忽略它的劣势产生的消极作用。云数据存储中的主要问题就是对其性能的考验。就连计算机IT行业的专业研发人员,也不能完全消除其性能这个瓶颈问题。首先是从宽带到web的连接中,对宽带性能的考验。网速对宽带性能的约束是最主要的,用户选择的宽带服务水平与其网络服务供应商的网络设备的性能,都会使云存储的速度较慢。
同本地存储和网络磁盘存储相比,使用本地存储复制两千兆字节的数据需要花几分钟,而对于云存储,同样的操作可能需要花几个小时来完成。云数据中心本身提供的性能以及整个网络的性能都会对云存储的速度设限。整个网络的性能,还受来自其他客户的web流量、共享基础设施和转移到远程数据中心的数据量,都会使云存储同其他丧失同本地存储和网络磁盘存储等量的价值。解决此种问题的主要原因是,以本地存储和云存储共用的双存储模式,实现远程用户或者分公司用户访问的异地访问记录。
安全问题,是云存储数据中,实施有效管理的重要考虑内容。尽管大多数云存储都提供VPN、加密或者其他的安全措施,但是,通过登录凭证就能通过任何网络端点实现数据迁移,也是比较常见的内容。尽管这不是云存储本身的问题,而是同大多数云存储设备相同技术的来接模式在其作用。其安全威胁和拦截威胁也在进一步加大。
采用安全性数据转移方案,除了云供应商的努力外,还要是实施监控功能。这要求使用云存储的用户必须谨慎考虑潜在的安全问题,并且部署适当的安全技术(例如额外的加密层或者两步骤身份验证),实施加密处理。
数据所有权问题,是云存储甚少考虑的问题。因为云存储的理论渊源是本地存储,IT专业人员对数据具有绝对的控制权,但是当数据迁移以后,数据中心根本就料及不到数据迁移的地点,未经授权的个人访问数据情形就会发生。在对其服务性质进行管理时,只能依靠专业人士制定的服务水平协议(SLA)来确定数据的状态。在停机事故发生后,云存储供应商来重新建立对用户数据的访问连接,就无法维持正常的工作。
从云存储的缺点进行了上述分析,对其可行性也进行了相关探究。建立在适当规划基础上的云存储设备,是当今企业最有利的信息化工具。他的逻辑性应用能够实现远程用户和移动用户建立文档、电子表格和其他文件的协作共享。 因为云存储的备份方案,对于一些计算机灾难事件,可建立迅捷化恢复方案保护数据免受自然灾害或者设施故障的影响。对于企业而言,还缺少备份替代。
4 服务商之间数据迁移的成功实现
因为云储存在实现供应商与企业间数据传输迁移的高端化服务场景中,有许多优缺点,不可避免的会遭遇到企业的不满意服务现象,这也是企业当前普遍遭遇到的问题。目前的云数据迁移,要实现更换迁移,还必须实施措施实施防护。
比如说:一客户换了邮件服务商,邮件的转换问题――问一家企业原来使用35企业邮箱,后来因不满意客户端是imap收信系统,想更换263供应商,实现邮件搬家,如何实现快捷化省时工程。可根据企业规模和资本,实施有效地服务器传输设备以规避数据迁移风险。根据数据量实施云存储迁移。
关于云终端故障处理方法则在云终端的登陆界面开机密码,隶属于windows 系统的内部密码,一旦设置。可以更改。但是一旦忘记密码,网络厨师化就会失效,就会影响云储存的正常使用。云登陆界面的MA地址的修改,会影响云终端的网络访问,密码一旦修改,操作界面就会相应的出现问题。
计算机云存储中数据迁移情况分析,很大一部分得益于云存储技术。同“超级计算机”相比,云存储处理技术通过数据迁移,由分布式处理和合并时处理以及网络计算收纳箱综合性技术,透过网络计算处理自动化程序自动分拆成无数较小的子程序,最终经由云服务端的系统处理将数据系统传导给用户。当然了。这在一定程度上,是个相当抽象化的概念,但同时又涵盖了云存储的价值和使用规程,比如说皆用广域网和互联网的结构互动,实现云存储的公用。就局域网来说,除了明确的知道其型号和配置外,对于交换即、端口、路由器和防火墙以及系统服务器中安装的操作系统和软件,他们之间采用的连接线缆等等,都要综合考虑。换言之,互联网和广域网云存储,正是只需要了解到接入网(运营商)用户名和密码,就能轻易实现数据的迁移传输。在现有的网络服务中,云存储的功效,就是无论在何时何地,只要通过简单的网络接入线缆和一个用户、密码,就可以接入互联网和广域网。在长项网络服务带来的足够便利的同时,通过应用软件或者应用接口,为用户提供一定类型的存储和访问服务。
5 结束语
云存储技术是计算机发展过程中的一项重要技术,其中数字迁移是从完全虚拟化的场景中走出来实现高度动态存储的必然条件,因此就必须对计算机云存储数据迁移进行详细的研究。对云存储中数据迁移的分析,主要是为了实现云供应商和企业间有效运作。
参考文献:
[1]孔兰菊,李庆忠,李晓娜.一种SaaS交付平台的多租户数据迁移策略[J].计算机应用与软件,2011(11):58-59.
[2]宿培成.关于计算机云存储中数据迁移的分析[J].信息安全与技术,2012(5):164-165.
[3]秦秀磊,张文博,王伟.面向云端Key/Value存储系统的开销敏感的数据迁移方法[J].软件学报,2013(6):225-226.
关键词:云计算环境 数据存储 核心技术
中图分类号:TP393 文献标识码:A 文章编号:1007-9416(2016)04-0000-00
随着Web2.0技术的发展和应用,网络当中的信息数据量正在爆发式的增长。为了更好的管理和存储如此海量的数据信息,在云计算的环境下,应当对数据存储技术进行细致的研究,从而提升云存储的能力,确保良好的云计算性能。
1云存储和云计算
1.1云存储
云存储是在云计算的基础之上所提出的,基于网格技术、分布式文件系统、集群应用等功能,在计算机网络当中,利用应用软件集中各类存储设备,使其共同运行,从而提供业务访问、数据存储等服务。在当前数据存储领域当中,云存储是一种创新模式,也是一种特殊架构服务。云储存技术具有良好的透明性,能够很好的融合存储设备、程序软件,而在存储设备之间的服务转变,也是通过这些应用软件所实现的。
1.2云计算
云计算是基于Internet技术的一种技术形式,是一种虚拟资源的计算模式。在云计算当中,在云计算当中,计算机之上分布了大量的数据信息,这些数据信息并不是在远程服务器或本地计算机当中,而是在互联网云端[1]。例如,在企业数据中心当中,类似于计算机互联网,因而能够在客观应用中切换资源信息,然后基于实际要求,访问计算机和存储系统。由此可见,云计算的出现,使得计算能力逐渐成为一种廉价、便利的商品,基于互联网平台中为用户提供服务。
2云计算环境下的数据存储架构
2.1 SAN块存储系统
文件保存在SAN当中之后,会分解成数据块,在这些数据块之间,可以相互进行访问。用户在请求访问的时候,节点会访问文件中不同的数据块,从而响应客户的请求。在SAN块存储系统中,如果用户发送越多的请求,响应请求的可用节点也会越多,并且也能够提高节点的性能。SAN存储结构的数据传输效率和扩展性十分良好,在云服务商对私有云服务器进行构建发的过程中,能够发挥出很大的作用[2]。不过,SAN存储架构具有较高的硬件价格,因此SAN结构提供的存储服务成本也会比较高。
2.2 NAS文件存储系统
在NAS文件存储系统集群当中,具有互补的节点,其中最小的单位就是文件。集群中保存文件之后,在其中的一个节点当中,会对文件数据进行存储,在其它节点当中,会对该文件副本进行定位,从而确保良好的冗余性。NAS文件存储系统具有较高的拓展性、良好的安全控制系统,并且价格较低。不过,如果用户发送了过多的请求,NAS服务器将会有所限制。
2.3 云存储的核心技术
(1)虚拟化技术。在云计算环境之下,数据存储技术最为重要的核心技术就是虚拟化技术,因而在云储存系统当中,虚拟化技术占据着不可替代的重要位置。以单台服务器为例,可以利用虚拟化技术来区分硬件资源,包括处理器资源、内存资源等。另外,利用虚拟系统,通过对虚拟平台池化技术的应用,能够以实际应用的情况为基础进行综合性和考量,并且进行相应的调整。在云存储效用计算的应用之下,能够对单个存储单元的使用时间加以明确。提供云计算服务的供应商在收费过程中,也可以以此为基础,正是基于虚拟化技术,才能够更好的计算云存储效用。
(2)存储管理系统。存储管理系统是云存储系统当中的一个重要部分,云存储管理系统的应用,能够使云存储的性能得到极大的提升和优化。例如,云服务商利用设备发现功能,能够对云系统服务器进行实时的维护与更新,不断提升云系统的配置水平。而利用故障管理功能,能够自动检测系统故障,一旦用户使用的云存储系统服务器发生故障,会对新的存储空间进行提供,并且对备份服务器中存储的用户资料加以恢复。利用分级存储功能,可以更好的控制成本,根据实际的数据存储需要,通过存储介质对在线、近线、离线的存储功能加以实现。具体的架构体系如图1所示,通过存储管理系统,能够更好的确保底层存储架构性能的充分发挥。
(3)云存储服务API。云存储服务API是基于云存储的功能,保证能够更加顺利的研发软件供应产品。与独立软件供应商相比较,基于云存储服务API的逐出,能够对存储数据的位置、方式等进行有效的控制,同时也能够对用户部署流程的时间成本进行更好的管理。这些效果和作用,与独立软件供应商的追求目标极为匹配,通过更好的控制新功能及其部署时间,能够极大的推进独立软件供应商的市场推广进程。
3结语
面对越来越多的信息数据量,云计算的产生和应用,能够有效的提升网络计算的效率和性能。而在云计算环境下,数据存储技术也十分重要,通过构建高效的云存储系统,为云计算提供更好的后台支持,从而使其能够发挥出更为良好的性能。
参考文献
[1]金琳.浅谈计算机信息系统安全技术的研究及其应用[J].计算机光盘软件与应用,2014,20:168+170.
[2]黄祥华.计算机信息系统安全技术的研究及其应用[J].科技创新与应用,2015,18:95.
关键词:云计算 分布存储 技术探析
中图分类号:TP393.08 文献标识码:A 文章编号:1007-9416(2015)09-0000-00
网络的大规模使用是目前的大时代环境。与时俱进是政府不断强调的技术进步的核心,计算机相关技术广泛应用在社会各个领域中,各种电子数据的数据量和数据类型均出现迅速增长。数据的存储及传输在数据应用中是一个颇为重要的分类,云计算与分布存储的结合应用是目前计算机技术的一个新的开拓方向。
1 云计算的定义及其特点
云计算是以互联网为基础发展的关于互联网络服务的交付与使用模式,通常是指一种虚拟化的资源。目前,对于云计算的基本定义仍然存在多种不同说法。对于云计算的定义,能够找到高达约100种解释。[1] 在现在这个阶段多为社会各界所接受的一般概念是美国国家标准与技术研究院(NIST)共同进行定义的,云计算是指按照其总使用量为计费标准来付费的模式,它能够有效快速地为用户提供可用性较高、可靠性更高、针对性更强的网络引擎访问,能够直接进入配备相关配置的资源共享池,使用户所需的资源能够更加快速、更加具有针对性的被搜索到,且由于是网络控制,因此只需要投入较少成本的管理工作,或者与服务的供应商进行少量的交互即可。云计算具有以下几个明显特征,也是其优势所在。
(1)规模大。“云”并不是指某一个具体的东西,而是一个概念。而云最明显的特征之一就是其超大的规模。Amazon、Yahoo等知名公司均拥有几十万台服务器,Google云计算已拥有100多万台服务器。而一般企业的私有云基本拥有成百上千台云计算服务器。成倍的扩大了用户的计算机处理能力。(2)可靠性高。“云”采用了数据同时拥有多副本制,计算机节点同为可进行互换等措施,有效的防止了数据的丢失和错漏,增加了其可靠性,也为用户带来更好的数据体验。(3)通用性和可扩展性。“云”是一个虚拟的存在,不特指某一个硬件或软件,具体来讲,“云”是一种将私人数据上传网络但不一定共享的一个模式或者一种状态。不同的“云”可以帮助缔造万千种数据应用,同一种“云”也可以同时支撑数种应用及多个数据的运行和应用。由于“云”的虚拟性,它的存在是动态可拉伸的,而不是固定不变的,因此具有较强的可扩展性与适应性。(4)成本低廉且针对性强。“云”计算采用的是特殊的容错结构,由成本极其低廉的节点构成,且“云”采用的是自动化集中式管理模式,企业只需投入少量的人力资本和资金投入。由于“云”是根据用户的实际需求来进行计费,因此其具有较强的针对性,同时也提高了资源利用效率,并有效地节约了企业在云计算方面的投资。[2]
2 分布式存储
目前,社会活动中仍以集中式存储技术为主要存储方式,集中存储,是指在建立一个大数据库的基础上,将各种信息存储于数据库,功能模块围绕其周围对数据信息进行录入、搜索等。区别于集中存储的分布式存储,则是利用网络便于沟通交流的特点,使用分散存储在企业个体计算机的磁盘空间的数据信息构成一个虚拟的存储中心。这种结构使数据分散存储在个体中,减少了成本投入,便于管理,同时可以帮助用户可以按照其实际需求来进行数据的录入、查询及输出下载。分布式存储是以网络为基础存在以实现资源的存储与共享。云计算技术背景下的分布式存储最大的优势之一是强调了用户能够按需对数据资源进行购买或租赁,这样可以使用户最大可能的在节约成本投入的前提下满足其对数据资源的需求。同时,由于分布式存储的存储是以各个单体计算机的硬盘存储为基础的,有效的减少了系统崩溃导致数据丢失的情况。
3 云计算环境下的分布式存储
(1)产生背景。随着社会各方面的深入发展,单独的数据库已不能满足社会生产的要求。云计算就是在这种困境下为适应现代计算机的技术进步及各行业对数据资源需求而产生发展的。云计算背景下的分不存储,强调的是用户按需购买,以实现在满足用户数据资源需求的前提下尽量节约成本投入。(2)以交换机为结构核心。云计算背景下的分布存储技术发展起来之前,多数用户均采用交换机作为其数据中心。其采用的架构是树形结构,包括核心层、聚合层、边缘层三个层面。其主要优势体现在具有可操作性,连接简单,扩展弹性大等特征,但其存储空间有限,并不能满足大数据环境下的今天人们对数据资源的要求。因此,云计算技术的发展可以很好地弥补这个缺陷。由于“云”是一个虚拟的存在,并没有固定的容量及存储空间,因此在存储容量上,它具有无限的可能。以交换机为结构基础的存储技术的可操作性结合云计算在存储空间上的优势,能够更好地满足用户的数据资源需求。(3)扩展弹性大。在云计算技术支持下的分布存储发展之前,用户采用的数据存储方式多以计算机服务器为主,这种方式的存储方式主要通过不断提高其扩展性增加存储容量以满足数据录入及输出功能。而云计算技术背景下的分布存储拥有天然的存储空间庞大的优势,在存储模式选择中具有相当大的竞争优势。现今,数据存储中心的数据资料一般以BP及EB为计量单位来进行简单运算。[3]云计算背景下的数据规模正在随着社会的发展呈指数型函数出现爆发性增长。云计算背景下的分布存储具有相当大的扩展弹性,能够根据数据资源及用户需求的实际情况对数据库进行调节。
4 结语
云计算技术的不断深入研究,带来更多在计算机领域上的拓展思路。发散的思维帮助云计算实现更多的可能。基于云计算技术基础的分布式存储的核心技术是计算机的兼容问题及数据存储的冗余问题,在探究这些问题的过程中,提高数据的筛选水平更是一个基础问题。准确有效地为用户提供数据服务是云计算环境下分布式存储的发展目标。
参考文献
[1]程宏兵.容淳铭.杨庚.曾庆凯.基于路径映射加密的云租户数据安全存储方案[J].南京邮电大学学报(自然科学版),2015.06.02.
[2]刘月.云计算环境下分布存储关键技术研究[J].江苏科技信息,2015.03.30.
[3]郭苹.基础设施云关键算法研究与实现[J].信息与电脑(理论版),2015.01.08.
关键词:云计算 图书馆 海量数据存储 存储技术 虚拟技术
中图分类号:G250.73 文献标识码:A 文章编号:1003-6938(2010)03-0099-003
Research on the Library Mass Data Storage Based on Cloud Computing
Du Haining (Library of Lishui College, Lishui, Zhejiang,323000)
Abstract:As a result of mixing and evolving of many technologies, the new kind of commercial computation model---cloud computing---has many advantages such as being safe and reliable, capable of mass data storage, as well as easy and convenient to use. Distributed data storage technology and related virtual technology of cloud computing are used by the libraries so as to have a reduction of the storage and maintenance costs besides acquiring the benefits of being reliable and safe in storing the date and convenient in sharingdata between different devices.
Key words:cloud computing; libraries; mass data storage; storage technology; virtual technology
CLC number:G250.73 Document code:A Article ID:1003-6938(2010)03-0099-003
网络时代中,信息爆炸使得信息量呈指数型增加,近几年世界范围内磁盘存储系统的容量仍将以每年近80 %的速度递增。作为信息资源中心的图书馆面临与日俱增的信息资源存储问题,增大图书馆的信息资源存储能力,更大程度的实现信息资源的长效保存和资源共享成为图书馆人思考的一个问题。作为一种新型的基于互联网的商业计算模型,是多种技术混合演进的结果,成熟度较高,又有大公司推动,云计算已越来越成为人们热议的焦点话题。在云计算的模式之下,图书馆的海量数据可以存储在通过互联网连接的任何一台电脑或终端设备,并通过网络来高度共享使用,[1 ]能解决困扰图书馆的数据存储和共享等问题。
1 图书馆数字资源存储现状概述
1.1 图书馆数字资源存储方式及比较
目前,国内图书馆数字资源存储方式主要包括DAS(Direct Attached Storage,DAS,直接附加存储)、NAS(Network Attached Storage,NAS,网络附加存储)、SAN(Storage Area Network,存储局域网络)三种。
(1)直接附加存储(DAS)。直接附加存储是指主机与存储设备之间的直接连接,存储设备通过SCSI或ATA作为数据接口的存储方式。[2 ]是目前国内比较成熟的数字资源存储方式,具有标准统一、兼容性好等优点,但面对指数型增长的信息量,DAS存储方式存在可靠性和安全性较低的缺陷。当存储服务器出现故障时,将会导致存储设备中的数据不能被读取。其次,DAS的扩展性差,因为DAS 没有独立的存储操作系统,不能提供跨平台的文件共享功能,各服务器不能共享原有的DAS设备。另外,由于受服务器性能的局限,以及DAS数据存储模式是分散的,各系统下的文件必须分别存储,容易形成信息的孤岛,不利于资源的共享。
(2)网络附加存储(NAS)。网络附加存储是指直接接在网上的存储设备,实际上NAS是一台专用的存储服务器,数据通过网络协议进行传输。[3 ]网络附加存储支持异构服务器间的数据共享,在资源存储的可靠性方面也有所改善,但NAS的数据备份时消耗较多的通信带宽,导致数据传输速度过低,另外NAS不支持数据库服务,因此不适合大型数据库的应用。NAS依然存在扩展性较差的缺陷,由于受到设备容量的限制,新增加的NAS设备与原有的设备不能很好的集成,这就导致NAS对数据的备份恢复实现起来相当困难。除此之外,NAS技术所需投入的成本很高,因此不能得到较为广泛的应用。
(3)存储区域网络(SAN)。存储区域网络是独立于服务器网络之外的高速存储专用网络,其将存储子系统网络化,实现真正的高速共享存储目标。[4 ]SAN是继DAS、NAS之后出现的新兴存储技术,其具有传输速度快,扩展能力强,共享能力高以及可靠性、安全性好的特点,因此SAN成为现在社会主流的存储解决方案。尽管如此,SAN依然存在难以改变的缺陷:由于SAN是在DAS和NAS的基础上发展起来的,其技术必然复杂难懂,技术实现要求也过于苛刻。庞大繁杂的技术要领必然带来软件升级困难和投资成本过高的问题。
1.2 图书馆数字资源存储存在的问题
各种存储技术没有统一技术标准是目前国内数字资源存储存在的首要问题,使存储系统从立项到实施均无据可循,建设效果千差万别,阻碍了计算机与存储设备之间的高速互联,甚至难于实现大容量数据共享的解决方案。其次是数据快速备份和恢复能力的缺乏。现阶段各图书馆的海量数据存储系统或大或小的存在系统不稳定的问题。由于各存储技术不同程度的存在着该技术不能攻克的技术缺陷,任何技术都无法保证存储系统百分百无故障。在这样的情况下,为了保证数据的安全性就必须建立切实有效的数据备份和恢复方案。最后,为了达到图书馆数字化、信息化的要求,各图书馆对海量数据存储系统建设的资金投入不理性。盲目追求现代化主流技术导致图书馆没有清楚的了解自身需求,并且对建成后系统运行维护费用等缺乏理性分析,因此造成所建存储系统后期投入更多或投入大量资金却无法满足自身需求的现象。
1.3 图书馆数字资源存储的需求
随着网络信息服务的发展和数字信息资源的指数增长,人们在追求信息存储系统容量扩增的同时,开始越来越多的关注信息存储在有效性、安全性和存储效率等方面的问题。针对目前社会较高的数字资源存储要求,图书馆作为信息资源中心为用户提供各种信息服务,必然要在数字资源存储上迎合社会发展的需要。
(1)高性能的存储系统。将传统图书馆资源数字化并通过现代化存储技术进行存储的目的在于提高图书馆信息资源的使用效率,在此基础上建立的存储系统、存储服务器必须拥有较高的性能。目前图书馆用户对信息的需求量增加迅速,导致存储系统的访问量较大,这就要求相应的数据流量也比较大。为了加快存储系统的数据相应时间,必须采用高性能、实用性强的存储系统。
(2)可靠完整的存储方案。在实际工作中,各种不可抵抗的自然灾害和人为破坏都有可能造成存储系统的崩溃,为了提高数据存储的安全性,图书馆必须保证数据存储在任何条件下都保持可靠完整性,存储系统或存储设备出现故障时也不会出现数据损坏和丢失的现象。这就需要图书馆的信息存储系统建立一个能应对这些危机的存储方案,如:本机、本地备份,异机、异地备份,甚至是远程容灾系统等,以保证存储数据的安全可靠。[5 ]
(3)高度的扩展性存储接口。由于国内图书馆资金有限,对数字资源存储系统的投资不可能一次性到位,所以存储方案必须考虑高度的扩展性。一方面存储系统必须适应多厂商、多平台和多系统的持续发展,支持异构环境下的多系统多平台服务;另一方面,考虑到图书馆业务的发展必然导致数字资源的增长,因此存储系统的建设必须充分满足数据增长对存储系统扩容的要求。
(4)适度投资的存储原则。图书馆在海量数据存储问题上应该量力而行,根据图书馆的规模及财力选择适合本馆的海量数据存储方案。若存储方案没有考虑图书馆已有数字资源存储设施,而另行开发建立新的存储方案,这样不仅造成重复建设浪费资源,而且增加了许多不必要的资金浪费。因此,如何保护原有存储系统建设,减少海量数据存储的投资成本是构建海量数据存储时要考虑的关键问题。
2 基于云计算的图书馆海量数据存储
2.1 基于云计算的图书馆海量数据存储技术需求
在图书馆海量数据存储中的云计算技术是以计算服务器为核心,动态部署虚拟的硬件服务器。用户可以实现“无处不在”的访问,同时也和Web云上的用户共享流量和计算能力。[6 ]满足实现图书馆海量数据存储和操作需求的云计算关键技术需要:
(1)采用分布式存储进行数据存储实现云计算对图书馆海量数据的存储,并采用冗余存储的方式来保证存储数据的可靠性。通过云计算这两个技术将每个图书馆所有数字资源存储在“云”中,并由“云”来管理和调度这些海量数据,利用分布式的数据存储技术和与之相关的虚拟技术使得整合后的图书馆海量数据更加统一有序,实现图书馆数字资源的完全整合。
(2)为了满足多用户对数据的操作,云计算的数据存储技术必然具有高吞吐率和高传输率的特点;同时云计算要求硬件资源与软件资源能够更好的被共享,且具有良好的伸缩性。这就要求云计算在图书馆海量数据存储系统开发时必须具备多用户技术。此技术主要表现在两方面:其一是基于云计算的海量数据存储系统能够服务于大多数用户,且具有非常容易的伸缩性;其二是该技术提供的附加业务逻辑可以使用户对SAAS平台进行扩展来满足图书馆多用户同时进行数据操作。
(3)云计算环境下对海量数字资源进行实时监控和管理,解决图书馆中的资源种类多、规模大,对资源实时监控和管理困难的问题。从云计算技术的资源调度的粒度来看,虚拟机内部应用的调度是云计算技术中最受人们关注的技术。
2.2 基于云计算的图书馆海量数据存储系统特点
(1)确保了海量数据存储系统的可靠性和数据安全性,用户不必再为数据丢失、系统瘫痪等问题感到困扰。在确保存储系统可靠性的问题上,云计算技术最大限度地降低了服务器的出错概率。云计算模式中海量数据不再是存储于某个图书馆的服务器上,而是存储在“云” 中的上百万台服务器,因此即使“云”中的某台服务器出现故障,在云端会有其他服务器作为替补来代替崩溃的服务器进行工作。显然云计算模式下不会造成数据的损坏和丢失和图书馆海量数据存储系统的瘫痪。
(2)通过云计算,图书馆可以轻松的实现不同设备间的数据共享。图书馆作为信息资源具有向用户传播信息、使用户以最大的限度获取知识和信息。传统模式下,用户在特定的图书馆中只能获得该图书馆提供的资源,即使该图书馆与其他馆之间有共享工程建设,用户获得共享资源的程序也相当繁琐,且非常有限。通过云计算模式,相关图书馆之间可以共同构筑图书馆的共享空间,来自于任何图书馆的数字资源统统存放在“云”中,用户只需将其电子设备连接至互联网,就可以访问和获取所需的任何数据。
(3)基于云计算的图书馆海量数据存储方式提高了信息资源的更新速度。只要是通过云计算技术来开发海量数据存储的图书馆都会经常修改和添加新的信息资源,这种图书馆间互相补充的信息存储使用户可以获取到世界上最新的资料和信息。
(4)云计算的出现使图书馆存储系统的扩展能力得到大大的提高。因为“云”提供无限的空间和计算能力,使得图书馆在社会变迁过程中不必再为海量数据存储系统的扩展问题烦恼。同时也防止了图书馆海量数据存储系统扩展时对原系统的摒弃和对存储系统的重复建设。
(5)各图书馆无论规模大小都存在资金不足的现象,云计算模式的出现大大降低了海量数据存储系统建设和维护成本,而云计算技术可以通过少量的费用让图书馆获得“云”中上百万台服务器提供的服务。云计算对用户端的设备要求很低,图书馆管理员无需担心相关硬件升级的问题,另外在“云”端有专业的工作人员维护硬件,无需图书馆管理员劳神。
3 云计算图书馆海量数据存储的思考
云计算将图书馆海量数据存储带入了新的时代,是图书馆海量数据存储的变革性突破。然而时代在变迁,图书馆及其用户对海量存储系统的要求也在不断地提升,因此无论多么完善的技术都会遇到瓶颈问题,云计算技术当然也不例外。为了使图书馆海量数据存储的云计算技术走的更远,图书馆应该从各个方面找到云计算已经遇到或可能遇到的瓶颈问题,对其进行改进,使其更好的为图书馆和用户服务。首先,在云计算模式下,各个加入云计算模式的图书馆之间可以通过有关的协议共享彼此的信息资源。[7 ]虽然这样丰富了信息资源的内容,但同时也带来了版权纠纷的问题。因此,为了解决版权问题尽快制定合理的解决方案乃当务之急。其次,云安全问题一直是人们心中的疑虑,云中上百万台服务器提供了数据快速备份和恢复机制,但云端的安全性是否也同样值得我们信任呢?为了进一步保证设备和数据的安全,必须严格加强云端安全机制的建立和完善。
云计算为图书馆用户提供了一个更为简单、廉价的资源共享模式。然而任何事物都是机遇与挑战并存,为了使云计算技术更加完善的应用,它就必须迎合了大部分用户的需求,不断解决云计算在应用过程中遇到的各种问题。只有这样才能使云计算的图书馆海量数据存储真正发挥其本身的价值。
参考文献:
[1]黎春兰,邓仲华.论云计算的价值[J].图书与情报,2009,(4):42-46.
[2][3]周敬治,修蔽蔽.数字资源存储系统的构建模式及比较研究[J].情报杂志,2006,(11):106-108.
[4]刘姝.对高校图书馆建设数字资源存储系统的思考[J].大学图书馆学报,2008,(6):75-78.
[5]严庄.图书馆数字资源存储技术方案研究[J].四川文理学院学报,2007,(6):108-110.
[6]周舒,张岚岚.云计算改善数字图书馆用户体验初探[J].图书馆学研究,2009,(4):28-30.