首页 > 文章中心 > 数据库论文

数据库论文范文精选

数据库论文

数据库论文范文第1篇

关键词:资源整合异构数据库互操作联邦式数据库

1引言

异构数据库互操作问题作为数据库领域的研究热点和难点课题,在国内外的学术界和工业界都引起了广泛的关注。自20世纪80年代以来,国外许多公司和科研单位对异构数据库的集成进行了大量研究,取得了不少成果,但国内对异构数据库集成的研究还处于开始阶段。

2异构数据库互操作的概念

异构数据库(HeterogeneousDatabase)集成是数据库技术从完全集中到逻辑集中、物理分布(传统分布式数据库)乃至逻辑分布、物理分布(异构数据库)这一发展过程的结果,也是兼顾已有系统自治性并实现新的数据共享这一现实需求的有效手段。

异构数据库的异构特征包括两个级别:系统一级的异构和语言一级的异构,主要体现在以下几个方面。

(1)计算机体系结构的异构:各个参与的数据库可以分别运行在大型机、小型机、工作站、PC或嵌入式系统中。

(2)操作系统的异构:各个数据库系统的基础操作系统可以是Unix,WindowsNT,Linux等。

(3)数据库管理系统的异构:一种是数据库概念模式的异构:有层次、网状、关系和面向对象4种;另一种是数据库物理模式的异构:指概念模式相同,但数据结构不同,比如Oracle与SQLServer同属关系型,但结构不同。

异构数据库互操作的实现包括三个功能要素:(1)为用户提供功能强大且操作灵活的互操作可视化界面,通过它用户可以直观地对多个异构数据库进行透明访问;(2)提供高级语言数据库访问调用级接口,至于调用级接口的实现层次可由设计者视具体清况而定;(3)支持环境开放性,可能的话还应该支持实现语言开放性。

异构数据库系统的目标在于实现不同数据库之间的数据信息资源、硬件设备资源和人力资源的合并和共享。异构数据库系统集成就是要将数据库系统的不同,操作系统的不同,操作平台的不同或者底层网络的不同进行屏蔽,使得用户就可以将异构数据库系统看成普通的数据库系统,用自己熟悉的数据处理语言去访问数据库,如同访问一个数据库系统一样,对其进行透明的操作。

3实现异构数据库互操作的途径

面对异构数据库的互操作需求,主要从两个方面同时进行努力:一是建立标准,即建立统一的数据库规范,消除由于标准的不完善而造成的各数据库系统间的差异;二是构建异构数据库互操作平台,实现对多个异构数据库的透明访问。

随着对数据库互操作问题的深入研究,基于不同角度,许多研究者提出了可行的异构数据库互操作途径,这些途径在实现互操作的深度、广度和高度上各不相同,都有各自所适应的特定环境和需求。从异构数据库的核心思想出发,把实现互操作的途径归纳为两大类。

3.1系统级异构互操作

对于DBMS系统一级异构的网络环境下的数据库互操作,主要有四种实现途径。

(1)数据库网关(DatabaseGateway)

数据库网关是一种中继器,它能提供应用级的异构数据库集成的手段。网关的主要作用是转换和通信。

数据库网关可以建立比较稳定和透明的数据库互操作,但是其缺点也较为明显。诸如不关心如何屏蔽数据库之间的异构性,不支持事务处理,资源冗余,用户受限于数据库厂商,不能任意选择客户机平台及目标数据库等问题。

(2)公共协议/数据转换协议技术

公共协议是异构数据库进行通信时采用的公认的数据协议,即公认的系统间传递SQL请求和结果的形式。最常见的协议是ANSI/ISO的关系数据存取(RDA)标准、SGA(SQLAccessGroup)规范和IBM的分布式关系数据库结构(DRDA)。与数据库网关相比,公共协议更具有可扩充性和开放性,能较好地实现异构数据库的透明访问、支持多种网络协议和多种客户平台,是实现异构数据库互操作的有效途径之一。

公共协议/数据转换协议的缺点是协议本身的低效率带来的速度问题。

(3)公共编程接口

公共编程接口包括客户应用编程界面(CAPI)和服务器应用编程界面(SAPI)。CAPI是一组过程库,通常驻留在客户端,通过装载后端专用的驱动程序访问不同的数据库。SAPI提供一个应用编程界面,控制服务器与客户应用请求和目标数据库之间的交互。如Microsoft的ODBC、Oracle的SQL*NET以及IDAPI。其优点有:由于提供了统一的调用级接口,使用户免除了应用程序随数据库改变而改变的痛苦;通过API可使应用程序直接操纵数据库中的数据。数据库访问API的缺点是:针对每一个数据库都需要有一个与其对应的驱动程序;由于不同的驱动程序所支持的数据类型和对数据的操作都不相同,其完全透明地访问异构数据库的能力有限;实现效率过分依赖于驱动程序,而驱动程序将标准语法转换成相应数据库的命令语法要花费大量的时间。

(4)中间件技术(MiddleWare)

中间件是处于应用程序及应用程序所在系统的内部工作方式之间的软件,它的基本思想是在各后端数据源和前端应用程序之间建立一个抽象层。把应用程序与系统所依附软件的较低层细节和复杂性隔离开来,使应用程序开发者只处理某种类型的单个API,而其他细节则可以由中间件处理。这样就使系统对每个不同数据源的操作变成对单一的中间件的操作,而后再对中间件进行异构处理。使用中间件技术解决异构数据库集成的问题,将会给系统集成带来很多的好处。这是因为中间件不仅能够使得前端用户访问后端的异构数据库实现透明化,并且保证了访问接口的开放性,这样可以使系统在以后功能上的扩展更加方便。通过中间件来访问数据库的另一个好处就是所有的客户端的请求都发送到了中间件上,减轻了数据库服务器的负担,保证了数据库服务器的性能不会降低。同时,中间件的采用极大地提高了系统的可维护性,在系统内部的某个逻辑发生变化时,只要改变中间层的相应处理程序,前台用户界面不需要做任何的改动,这样就大大降低了系统维护的费用。

3.2数据结构与语义级异构互操作

目前,对于数据结构和语义一级异构的数据库互操作的研究有紧密耦合和松散耦合两种思想,具体体现于多数据库系统、联邦数据库系统和分布式数据库系统三种方法。

(1)多数据库系统

所谓多数据库系统就是一种能够接受和容纳多个异构数据库的系统,允许各个异构数据库的“自治性”。多数据库系统是一个广义的概念,是相对于如集中式数据库系统或分布式数据库系统那种逻辑上具有同一管理系统而言的,它以多元和分布为主要特征。多元是指它多个彼此区别的集中式或分布式数据库系统;分布则是指数据分布在不同场地的数据库系统中,由各自的管理系统进行管理。

多数据库技术的目标是为在多个数据库之间实现互操作,解决数据库资源共享找到一种技术途径。一般采用分布、异构、自治三个特性作为尺度来刻画多数据库系统。使用这种方法,用户需要显式地指明所要访问的数据库。多数据库系统采用自下而上的方法来实现。

(2)分布式数据库(DistributedDatabase)

分布式数据库的基本思想是抛弃原有的数据库系统,在网络环境下建立分布的数据库系统,在体系结构、事务处理模型等方面重新设计从而解决信息共享与互操作问题。分布式数据库系统分为同质分布式数据库和异质分布式数据库。像Oracle、Sybase、Informix等都是同质分布式数据库系统,这类系统的实现相对来说比较容易一些。异质分布式数据库管理系统大多是在已有的一些数据库管理系统的基础上实现的。

(3)联邦式数据库(FederatedDatabase)

联邦式数据库系统是网络技术和分布式数据库技术发展的必然结果,它是由一组能协调工作,又可以独立自治的部件数据库组成。它可以是原先不分布的,又可以是分布的,具有分布性、自治性、异构性三大特性。

联邦式数据库与分布式数据库系统的区别在于:分布式数据库系统虽然在物理上是分散的,但因为有统一的数据模型及全局数据模式,所以它在逻辑上却是集中的,因此用户感觉到的是一个完整的数据库。显然,这种系统可用于某个专用领域的系统,但不适于不同领域间的异构系统的集成。相反地,联邦式数据库系统是由在不同结点上松散耦合分布的异构成员数据库构成,各联邦成员间的一种松散结合。构成联邦成员的可以是一个集中式数据库,也可以是一个分布式数据库,它们可以根据需要(按某种组合)加入联邦或者根据需要退出联邦。联邦式数据库没有全局模式,各子系统(即联邦成员)按自己的需求建立各自的数据模式。其成员之间的数据共享关系,通过由协商确定的输入/输出模式来建立,单个成员有权拒绝或允许其它成员结点对它的访问。因此,它能够支持多库系统的分布性、异构性和自治性,使之产生满意的集成。超级秘书网

异构数据库的互操作技术使得数据库在原有技术领域发挥重要作用的同时,在未来新的应用领域也有着重要的影响,如地球观测系统EOSDIS、电子商务、保健信息系统、数字出版、协同设计等领域。

参考文献

[1]萨师煊,王珊.数据库系统概论.北京:高等教育出版社,2000.2.

[2]张水平,万映辉等.异构数据库的集成与互操作.计算机应用研究,2000(1).

[3]郑振楣,于戈等编著.分布式数据库.北京:科学出版社,1998.

[4]刘艳梅.基于COM/DCOM组件标准实现异构数据库的联合使用:[博士学位论文].北京:北京理工大学,2000.

[5]唐巍,周俊林,李晓.异构数据库集成方法初探.计算机应用研究,1999(8).

[6]王艳君,王运格,吴丽红.异构数据库间数据集成的方法.烟台师范学院学报,1999,Vol.15(4).

数据库论文范文第2篇

本文所说的数据库中,首先是用户数据,而用户数据主要包含的是档案管理部门工作人员的信息,即其用户名与密码。相关工作人员在对文件进行管理前应当先进行身份认证,通过后方可进行操作。为了保证档案管理系统的安全性,在用户正常登录时,session对象中将用一个变量保存对应的用户名,但是非法请求管理页面时,那么对象中的用户名变量为空将页面重定向到登陆页面强制登陆。接着是文件数据,文件数据记录的包括一般属性与几个重要的附加属性。一般属性即是档案的成文时间、收文时间、文件题目、文件字号与类别等,而附加属性包括文件类型,就是标志该档案是以何种方式提交的,图形还是文本,附加属性还有文件状态,即档案是公开还是保密,或是针对哪些级别公开哪些级别保密。一个单位的档案一般都是繁多而复杂的,往往有许多历史类档案,而这些档案如果全部以文本的形式加以呈现,且完全由人工进行管理,那么必将会出现效率低下的问题,同时也很难将档案的价值完全发挥出来,所以我们应当将档案系统与现今科技发展相结合,比如对文件进行扫描,然后将其传入数据库,这样一来又省事又省时。但是与此同时我们不能忽略的另一个重要问题是两种格式的文件如何在一个数据库中进行统一,针对这样的问题,我们可以这样解决,即在文件表中增加一个文件路径,针对图片格式的档案,可以将该档案中的图片文件保存成磁盘文件,接着还需要再创立一个磁盘文件按照顺序记录各个图片的路径,数据库中记录该磁盘文件的路径。而对于文本类的档案,可以将档案的主体内容存入一个磁盘文件中,数据库中记录该文本的路径。

二、档案管理系统的设计档案管理系统

是由不同的动态网页所构成的,而该系统的各项功能也借助动态网页得以实现,档案管理人员、档案使用人员以及档案管理系统和后台数据库之间的交互,从而实现单位管理与文件管理的功能,而档案管理人员可以在经过身份验证后对这些档案进行管理。对档案进行的管理包括对档案的添加修改以及删除。其中添加页面与修改页面比较相似,但是修改页面上的控件已经有了初始值,而添加页面中的数据控件默认是空值,所以添加、修改页面可以在同一个页面中得以实现,在引用比较具体的页面时的区分方式是利用URL后的查询字符串。在对这些档案数据进行操作管理时,也有需要注意的地方,比如在页面提交前应当首先进行客户端的验证,从而保证提交数据的完整性与准确性,其次为了避免重复记录在数据提交到服务器后还要进行服务器端的验证。在对数据库中的图形文件进行处理时也有许多应当注意的问题,首先是图形文件的修改,这是文件管理中一个比较难操作的模块,在对图形文件进行修改时,我们一定会重新上传图片,与此同时也要显示出原来的图片,但是此时图片的大小与数量尚未确定,可能会是档案管理系统的页面出现排序混乱的现象,所以该档案管理系统中只有删除图形文件的功能,没有修改图片的功能。而添加图形文件时也有其比较特殊的部分,即我们无法确定这个文件中具体的图片数量,即页面中无法固定文件上传控件的数量,此时我们可以在进入添加图形文件页面前先向服务器提交一个数据表明这个文件包括多少图片,而后服务器根据这个数据去生成相应数量的文件上传控件,对于文件上传我们可以利用程序从提交的数据中分离出图片信息,或者是使用特定的文件上传组。与此同时还有客户端的验证问题,针对这种问题我们也有相应的解决方案,那就是利用服务器端脚本去生成客户端脚本。在对该系统进行开发时,我们可以利用MicrosoftVisualInterDev作为系统的开发工具。该工具可以对某些对象的属性方法进行自动处理,提高了拼写的准确率与编程速度。同时这个工具还能够将档案中的某些关键词句进行蓝色加粗显示,极大地方便了我们的阅读。在系统完成后,必须应经过相应的测试,模拟实际工作进行测试,保证无问题后可投入运行。

三、档案管理系统更新的意义

数据库论文范文第3篇

【论文摘要】本文就高校建设专业特色数据库的方案、内容、服务以及注意的问题进行了研究和阐述。

随着我国高等教育体制改革进程的加快,我国原有高教体制上存在的条块分割、专业单一、低水平重复办学的弊端被逐渐打破。通过高校间的合并、重组,各高校都相应调整了专业结构,加强了重点学科建设,增强了自身竞争和办学优势,突出了办学特色,相互之间形成了学科交叉、优势互补的局面。而各高校图书馆为适应和配合学校的这一系列转变,必然相应地加大对重点学科特色专业文献资料的收藏和开发力度,这也使高校图书馆之间形成了各有所重、各有所长、各有特色的局面。而另一方面,当前各高校的网络化程度已相当高,校园网、教科网、因特网已相继开通使用,而且部分省市已经准备在本地区高校图书馆之间架设光纤,把各馆相互连通,用于馆际文献传输。如何更好地利用当前先进的网络技术、信息技术,使那些内容丰富、各具特色的馆藏文献充分发挥它们的价值,做到馆文献资源共享、优势互补,是值得我们认真研究和巫待解决的问题。高校图书馆专业特色馆藏数据库的建设,为此提供了一个很好的解决途径。

1建库的方案及原则

1.1建库的方案

目前,高校图书馆已经开始建设或准备建设各自的全文数据库。在建设过程中大都缺乏组织机构的统一规划和协调分工,数据库的建设停留在各自为政、自建自用的状况。这种各自为政的状况以及各馆在技术、资金、人员、管理等方面的原因,造成了大量低水平的重复投资、重复开发,不仅人力、物力、财力浪费严重,而且使数据库普遍存在结构单一、标准不统一、涵盖面窄、内容重复、共享度低、通用性差的问题,这对图书馆网络化服务水平的提高及文献资源共享的实现起了一定的阻碍作用。因此,我们在建库时,首先要考虑到建库的方案问题,是各馆独立开发还是联合协作开发?本人认为专业特色数据库的建库方案可以参考目前各地区在建设的CALIS联合目录数据库的方案,走联合开发的道路,采取地区网络联合数据库的方案。首先,建立本地区的组织协调机构,实行“统一目标、统一规则、统一标准、统一管理”的模式。在对各院校学科特色和馆藏特色进行调查研究后,对其数据库开发进行统一指导和协调。具体操作中可把学科门类分为几大块,如理工、财经、医药、农林等等,然后再由几个同类型院校共同承担该学科数据库的建设.当然,其中还需相互分工,各有所重。其次,各馆应打破原有的封闭现象,改变以往各自为政、孤军作战、小而散的建设方式,在组织机构的指导下相互联合、有计划、有分工地共同开展建库工作,对信息资源进行有效配置和可持续的开发。各馆在建设各自所承担的特色数据库的过程中,则可按照分工要求自行开发,进行建库的设计、源文献的收集整理、文献的数字化处理、提供应用服务的方式。当然,在联合建库的形式上还可参考国外的一些联合建库模式。

1.2建库的原则

1.2.1实用性原则

专业特色数据库的建设要考虑其是否具有实用价值、需求有多大、投人和产出是否相宜,即是否具有良好的社会效益和经济效益,不能盲目上马。因为特色数据库的建立从其目的来说是为了更好地发挥图书馆的功能和特色优势,使之产生良好的效益,充分体现图书馆存在的价值。因此,专业特色数据库的建设要在充分的调查研究的基础上进行。

1.2.2趋势性原则

建立专业特色数据库要顺应专业学科和数据库本身的发展潮流,包括国内与国际的发展趋势。如:规模、形式、多媒体化、网络化等。把握这一原则可以让我们有更好的发展空间,寻找到适合我们自身特点的位置,避免一些不必要的失误。

1.2.3共建共享原则

即联合开发、资源共享。

2专业特色数据库建设的内容

各高校馆丰富的特色馆藏是专业特色数据库的主要信息源。经过长期的学科建设,各校在自己的重点学科领域已显示出独特的优势。各馆同时也收录了大量相关文献,并且重点收藏、重点建设、优先投人那些专业性、学术性、权威性的文献资料,使之尽可能的丰富、系统、完整,形成各馆的特色馆藏。

2.1专业文献资料

内容包括本专业的国内外核心期刊、科技期刊会议录、其他报刊和内部报刊中有学术价值的本专业文献,以及经过加工整理后的网上文献资料。

2.2法规、专利、标准

主要包括国际上各行业及国际组织颁布的最新标准,国家颁布的有关政策法规索引,国家颁布的各行业标准、产品标准及国内外的专利文献。

2.3专家科研成果

本学科著名专家教授的研究方向、研究状况、研究成果和特色。主要应收录其发表在核心报刊中的论文、研究交流报告、学术演讲报告等文献群体。

2.4学位论文

博士、硕士学位论文对于相关学科的研究开发具有重要的参考价值,但它的分布较为分散,读者难以查找,故应予重点收录。

2.5学科综合信息

系统全面地反映学科信息,展示国内外科学技术发展动态和科研成果.如:863计划项目、国家自然科学基金项目、省市重大攻关项目、工程应用和设计项目,目前最新的具有影响的各种科技产品、近年来有关学科已完成的成果及获国家和省市的科技奖的科研项目等。

在对数据库文献源的收录过程中还要注意它的时效性与过期可获得性,要对文献源进行充分的分析研究,严格的收集、加工和筛选,为读者提供更新更多、更准更全的文献数据。

3良好的服务功能

特色数据库的建设不仅仅是简单地把传统纸质和其鸽载体形式的文献数字化,而且有其最本质的特征,即智能化的检索。相对于传统的特色文献来说,特色文献数据库与其最大区别就是强化了其信息服务功能,在其基础上实现了质的飞跃。数字化是相对传统文献而言的信息形式上的改变,最本质的改变仍在服务质量上,而这也正是读者和用户最为关心和希望得到的。因此,数据库必须实现智能化检索,为读者用户提供快捷、全面、准确的检索工具,真正做到以读者为中心。

3.1检索界面

检索界面应该简洁、清晰,没有繁杂的检索步骤,可操作性强。帮助功能应具有实际指示作用,并提供留言功能。

3.2检索方式

数据库系统应提供关键词、主题词、题名、著者、出版机构等多种检索途径。可以根据需要进行单项检索、组配检索、模糊检索,并可使用截断符、接近符、省略符、替代符指明词间关系或扩大、缩小检素范围,也可增加一些限制功能,如:限制时间、馆藏地点等。

3.3检索选项

3.3.1跨库检索

用户可以根据需要选择使用一个或多个数据库,实现一个检索命令跨多个数据库自动检索,以获得交叉学科、相关学科的信息。

3.3.2多年检索

应可以同时检索最新文献和过期文献,使用户在二者之间方便进行切换。

3.3.3检索历史

让用户可以保存、查看自己的检索历史,在当前检索区可以利用和修改以前的检索。工作人员则可利用它跟踪用户的需求或将其加工成某些动态信息。

3.3.4主题词表

数据库应提供主题词表检索功能,即利用主题词表进行检索词的规范选择,并根据主题词的上下位关系、相关关系和替代关系调整、确定检索词,然后直接启动检索。还可根据需要修改主题词表,或通过对用户检索词的统计扩充主题词表。

3.4检索结果

检索结果的实现包括排序、显示浏览、聚类、套录、打印、E-mail发送等。超级秘书网

4建库过程中需注意的一些事项

4.1要注重全文数据库的一些技术特征

包含内容的原始性、信息检索的彻底性、所用检索语言的自然性、数据相对的稳定性、检索结果的准确性、数据结构的非结构性。

4.2数据准备

要注重对文献源数据的收集、整理、筛选、归类。

4.3文本预处理

要做到统一著录标准,规范格式和标引。

4.4数据维护

要定期对数据内容进行更新追加和清理修正以及对所用词表、存储空间的利用统计和调整。

4.5统计功能

提供各种统计数据和用户信息,量化各项指标,使之成为决策依据。

4.6做数据库的宣传工作,提高数据库的利用率

5培养一支高素质的复合型人才队伍

其素质包括:对某学科及其分支有充分研究,对某专题领域的相关信息源有丰富的使用经验和了解,熟练掌握网络环境下的信息资源的获取技能,有较强的创新能力、分析能力和综合应变能力。

参考文献

1吴晓骏.大学图书馆丈故信息数据库建设中应注意的几个问题.现代图书情报技术,2001(4)

2谢琴芳,白祈萍.书目资源的共建、共知和共享.大学图书馆学报,1999(2)

3魏建华.奋共图书馆自建数据序的原则与方向.图书馆论坛,1999(2)

数据库论文范文第4篇

二十一世纪是我国进行西部经济大开发的世纪。在这场伟大的世纪大开发中,不仅需要人才、物质、财力方面的支撑,更需要准确、畅通的信息障碍。近年来,我国针对各行业的数据库层出不穷,对数据库建设的各个方面的论述屡见报刊,但对地方文献专题数据库的建立却重视不够,鲜有涉及。然而,地区经济的研究、开发、发展却离不开地方文献的支持,建立具有地方特色文献数据库已是图书馆、情报所等文献信息机构不可忽视的问题,需要共同研究并付诸行动。

一、地方文献在地区经济发展中的作用

地方文献是以一个地区为论述对象且反映该地区特色的文献资源,是了解和研究该地区的政治经济、科教文化、历史地理等方方面面的主要情报源,它对于发挥该地区传统优势、促进该地区经济发展和文化教育事业的繁荣具有重要作用。

l为该地区经济发展规划的制定提供历史借鉴和决策依据。地方文献是对一地的综合反映,其内容包容了该地区在各个时代各方面的情况。地方各级政府和有关经济部门只有以此为基础,全面了解、掌握本地区的自然、历史、经济、文化等方面的状况,并进行认真仔细地分析,结合对当前现实情况的调查研究,才能减少失误,制订出符合本地实情、发挥本地优势的科学的规划与措施,加快地区开发的步伐。

2直接服务于本地经济建设。地方文献记载了丰富的关于本地的地理、矿藏、物产、名胜古迹、民族民俗方面的文献资料,为本地的经济开发提供了重要的信息源。该地区内各不同区域的开拓者、创业者可据此寻找、开发适合本区域的经济增长点,创建区域经济优势,进而推动该地区经济建设。如地方文献中记载的山野特产、种植养殖、矿产挖掘、自然风景、人文景观、民俗风情等等,都是拉动、繁荣本地经济的重要途径。

3为本地文化繁荣服务。文化与经济,历来是矛盾的统一体,它们相伴相生,既互相对立,又相辅相成。西部开发,不仅仅是经济的大开发,同时也是科学文化的大开发。地方文献与地方文化具有天然的密切联系,地方文献的内容反映着地方文化,其本身也是地方文化的一个重要组成部分,具有深厚的文化内涵。因此,建立地方文献数据库,首先有利于保存地方文献资料,有利于保存、弘扬地区民族优秀的传统文化;其次,为进行爱国主义、革命传统教育提供生动的教材,促进地方精神文明建设;第三,为具有地方特色的文化艺术创作提供丰富的素材,为文艺创新服务。

二、地方文献数据库的信息源

由于高新技术的不断发展,文献信息的载体日益丰富,除了注重收集传统的纸质文献以外,应加强对以下载体形式的信息源的采集:

l缩微文献。如缩微胶卷、缩微胶片等。自1986年以来,国家对历史文献抢救、保护而进行的历史文献缩微工作,取得了丰硕的成果,为补充采集地方文献提供了充分的条件。

2视听文献。如电影拷贝、录像带、录音带、电视节目等等。其中,电视将书籍、报刊等文字传媒的记载功能、广播的言说功能及电影的影像直观功能汇于一身,其关于区域性新闻时事、经济发展、文化教育等的节目具有典型的地方特色,是反映本地情况及本地与外界关系的重要信息源。

3电子文献。这是指信息存储在磁带、磁盘和光盘等载体上,须借助于计算机才能浏览阅读的文献信息源。如电子图书、电子报刊、软件读物等等。一张5寸光盘可存放20多卷本百科全书,一张1.2兆软盘存储量相当于一本60万字的书的内容,它们巨大的存储量是纸质图书无法比拟的。

4网络信息源。近些年来,因特网迅猛普及,数字化技术飞速发展,使得网络信息资源异常丰富,网络化文献资源层出不穷,主要有各种网络数据库、数字图书馆,以及各专业网站上的信息源等。

三、地方文献数据库的类型

地方文献数据库的建立,就是利用多媒体技术、数据库技术、数字压缩技术、光盘存储技术、网络技术等手段,将传统图书馆、情报所等单位收藏的上述各种文献信息资源,转化为自成一体的数字化文献的过程。数据库的建设尤其是全文数据库的建设,需要一定的人力、物力、财力的支撑。因此应根据文献所涉及的内容、质量以及用户的需求程度,建成不同类型的数据库。

l全文数据库。全文数据库包括文献的书名(篇名)、作者、正文、图像、参考文献及摘要、关键词等数据,用户可通过多种途径检索到一份文献的全文内容。我们应选择那些学术价值、史料价值、使用价值高的,内容丰富、富有代表性的文献资料,编制成全文数据库。它揭示的内容深,可满足用户多层次检索的需求。

2文摘数据库。随着科学技术的发展,文献的载体不断发生变化。地方文献在以传统的印刷书籍占据主角时,更多的非书资料正逐年增加。这部分非书资料虽然内容繁多,但其本身的检索使用都较方便,故不必要建成全文数据。然而非书资料仅从外表又看不出其具体收藏内容,故需要对原始文献进行深层次的挖掘,加工成文摘或提要式录入,以向用户简要介绍文献的主要收藏内容,建成摘要数据库供用户选择使用。当然摘要式文献部分还应向用户提供原文献出处及其收藏地,以便用户及时找到原文,获取更详细信息。

3题录数据库。地方文献是有关某一个地方的一切资料,除我们常看到的白色文献外,一些单位的半机密资料数据或机密文件等灰色文献或黑色文献亦是地方文献的收藏对象。这部分资料不便于广大用户公开查阅,需要使用的用户可以同有关单位联系,根据具体的使用办法及注意事项查阅,所以只提供题录比较合适。为便于用户查找获取原始资料,题录式数据须注明具体的收藏地或收藏单位。再者,地方文献中除图书、杂志、报纸、手稿等常见资料外,还有图片、画片、表格、票据等资料,这部分文献一般从其名称即可知其内容,没有必要建成全文或摘要。建成全文型也困难,故也可建成题录式数据,并准确注明其收藏地。

四、建设地方文献数据库的途径

l自建。就是根据本地实际情况,以突出本地特色为宗旨,以自主知识产权为主体,集中本地一定的人力、物力、财力,以本地某一图书馆或情报所为龙头,其它各馆、所等机构配合,分工协作,将地区内各单位所收藏的地方文献,以及从各种途径所获得的文献资源数字化,建成数据库。

2购买。主要是指购进光盘数据库。对于作为对自建数据库的补充,以及限于自身力量而无法建立的数据库,直接购买是最佳选择,也是很有必要的。近年来,我国光盘数据库发展迅速,为我们建设特色数据库提供了丰富的来源。但我们选择这些数据库时,要从多方面加以考虑,必须对其将产生的社会效益、经济效益。

有所预见。首先,要选择那些与本地状况最为相似的数据库入藏。既然是各具地方特色的文献,就绝无完全相同的面貌,只能从中选择相似点最多、相似面最广的数据,以最小的付出获取最大的效益。其次,注意所选光盘数据库的检索功能、标引深度、标引质量、标准化程度等方面,以检索点多、标引深且质量高为优先。这样购进的光盘数据库,既有很强的针对性,又节省了有限的经费,可最大程度地充实地方文献数据库。

3网络利用。在因特网迅猛发展的今天,网络信息资源丰富异常,应予以充分的开发利用。这其中既有集中有序且稳定的信息资源,也有分散无序且多变的各种信息。对于前者(诸如各种远程网络数据库),可根据需要购买其全部或某一部分库的网络使用权,这样既无需过多的硬件投资、维护,又不需进行数据库的管理、维护,可避免时间、人力的不必要的浪费;对于后者,收集时注意筛选、甄别,仍以相似相关性、参考价值大小为主要标准。这些下载下来后的信息,必须对之进行综合处理、深度加工和重新组合,使之转化为有序的、方便利用的数据库资源。超级秘书网

五、应注意的问题

作为网络资源的数据库建设,是一项持续性的工作。数据质量的控制体现在生产的每一个过程。从数据的采集、著录、标引、加工、录入等每个程序着手,制定出一系列的规章制度和业务工作细则,并配以科学的工作流程来层层把好质量关,是建立一个高质量数据库所必须面对的问题。因此,这一工作既需要投入大量财力、物力,又需要拥有既懂手工编目又懂机读目录和计算机操作的专门人才和信息开发人员,以便组织一支有较高综合素质的业务骨干队伍,以全面高效率地承担起各种文献的采集、整理、编目、著录、输入等工作。同时,还必须制定出以数据统一化、标准化为前提的质量控制措施,设定专门人员定期进行数据库建设的标引、著录工作的检查,确保数据质量。

参考文献:

[l]谢永顺.论地方文献资源体系建设高校图书馆工作与研究,2002(3)

[2]李华.高校图书馆数据库建设中的问题与对策..成都大学学报,2002(l)

数据库论文范文第5篇

0、引言

随着电力管理信息化的不断普及和深入使用,在电力营销、地理信息化、供电收费方面都已经实现系统化管理。而电力营销系统——每时每刻记录着每一终端用户的用电情况,更是整个供电系统的重中之重。

本文根据营销数据库使用的实际情况,以集群和ORACLERAC技术为出发点,分析了相关技术的基本原理,在此基础上设计了OracleRAC的实施方案,取得了较好的效果。

1、ORACLERAC并行集群

1.1集群技术概述集群是一种并行或分布式的处理系统,由相互独立的、通过高速网络互连的两个或多个计算机(节点)组成,通常集群可以划分为以下两类:

1.1.1高可用性集群,通常采用主、备两台服务器,由主服务器对外提供服务,当主服务器断电或系统异常时,集群软件自动将集群应用切换到备份服务器,在切换过程中对外服务将发生中断。

1.1.2负载均衡(并行)集群,负载均衡集群与高可用性集群相比最大的不同在于负载均衡集群中的所有节点都是活动节点,都能对外提供服务,没有主备之分,同样当集群单个或部分节点异常时,剩余节点将接管故障节点对外提供服务。

1.2ORACLERAC并行集群简介Oracle集群实质上就是使多个服务器访问同一个Oracle数据库,这样一方面可以避免一个服务器宕机时数据库不能访问,同时也可以进行并行运算和负载均衡。

从软件组件上来讲,一个Oracle集群由多台服务器组成,每台服务器有自己的,用于监听自己的网络端口;每台服务有自己的OracleRAC服务,用于数据库的集群访问;每台服务器有自己的集群就绪服务,用于集群管理;所有的服务器通过自己的操作系统访问一个共享的存储设备。当有客户端访问时,由上而下依次调用相应的软件。

从逻辑结构上来讲,集群中的每台服务器有一个实例,每台服务器上的实例都对应到同一个数据库。在集群中有两台服务器,每台服务器拥有一个实例,每个实例都访问同一个数据库,数据库存储在共享磁盘上。

Oracle10gRAC采用服务漂移、VIP漂移和TAF透明故障切换等新技术,有效的解决常见的软硬件故障引起的宕机,如SQL语句故障、用户进程故障、网络故障、用户错误故障、实例故障和介质故障等。

2、RAC集群规划

2.1硬件规划

2.1.1服务器方面采用2*560A,IBMSystemp5560A中型服务器拥有出色的性价比,它基于POWER5系列CPU下具备了大型机的可靠性、可用性等。

2.1.2磁盘阵列使用DS4700,DS4700是一款中级存储服务器,其存储能力能够达到33.6TB,使用最新的存储网络技术,能够提供端到端的4Gbps的光纤通道解决方案。

2.2网络规划

2.2.1由于无论各节点间的心跳信息传递,应用对数据库的访问等都对网络传输速度以及稳定性有较高要求,拟采用H3CS5500千兆光纤交互机作交换。

2.2.2由于主机的网络通讯部分亦需要考虑冗余,拟对每一节点的服务器网卡使用绑定技术两两绑定,保证网络畅通。

2.3存储规划

2.3.1磁盘阵列方面采用RAID1+0模式划分,综合使用条带化技术和镜像技术,前者把连续数据分割成数据库,分布存储到各硬盘上加快速度,后者把数据镜像都其他磁盘上加强冗余。

2.3.2共享存储设备的存储机制拟采用ORACLE自带的自动存储管理(ASM),使用ASM兼顾了裸设备的快速IO和OMF文件的方便管理这两个优点。ASM可以在磁盘间IO的负载均衡,完成数据的条带化和镜像,并执行联机磁盘配置和动态重平衡等,提高I/O的性能和数据可靠性。

3、RAC集群实施

3.1按照系统规划图搭建系统软、硬件平台,安装AIX操作系统,连接光纤存储,绑定网卡,划分存储硬盘。

3.2按照ORACLE系统要求安装操作系统补丁,建立oracle用户和dba、oinstall组,以及修改系统参数。

3.3修改/etc/hosts文件,按照网络规划添加VIP、Privat-Ip、Public-Ip。

3.4配置节点之间的双机互信,以便双机能够互访。

3.5在ORACLE用户下按要求设置对应环境变量。

3.6安装ORACLE集群软件,并根据规划设置VIP。

3.7以集群模式安装数据库应用软件。

3.8创建ASM实例,按规划把对应的裸设备磁盘加入磁盘组,由于阵列划分的时候已经做了镜像,在这里只使用ASM的条带化功能。

3.9创建ORACLE实例,并使用crs_stat_t命令查看集群状态。

3.10使用DBCA创建TAF服务。超级秘书网

4、RAC集群测试

4.1TAF测试①使用服务器上TNSNAME.ORA里面的TAF参数,配置链接数据库。②使用SQLPLUS链接数据库,执行一个大的查询(几万条)。③查询gv$session视图,确认当前链接所对应的实例。④使用srvctl等命令关闭当前链接对应的实例。

测试结果:数据表查询过程中出现几秒钟的中断,然后查询继续进行,查询完毕后显示的记录数目与表中数据的实际数目一致;查询gv$session视图显示链接已经转移到另一节点,在当前活动的实例节点上使用NETSTAT命令查看,发现关闭实例节点的VIP已成功漂移。

4.2负载均衡测试通过Loadrunner模拟每隔1秒登录一个用户并运行不同的SQL语句;查询gv$session视图动态跟踪两节点相关的session数量变化信息。

测试结果:发现两节点上的session数量均衡分布,新增加session会自动连接到相对较为空闲的节点上。这说明应用负载被自动均衡分布到所有的节点上。

5、结束语

OracleRAC作为一种出色的高可用性集群,在容错、负载均衡以及并发处理方面都有突出特点。本文根据某市电力营销系统的建设情况,结合ORACLERAC技术,为前端应用系统提供了较好的后台数据库支撑。

参考文献:

[1]王强.Oracle10gRAC技术在OPENAV系统中的应用,机械工业信息与网络,2008年第3期.

[2]Auguet,ORACLERAC概念介绍51CTO技术论坛.