首页 > 文章中心 > 库存管理的概念

库存管理的概念

库存管理的概念

库存管理的概念范文第1篇

关键词:MYSQL;数据库;学生信息管理系统

中图分类号:TP311.52 文献标识码:A 文章编号:1007—9599 (2012) 14—0000—02

一、引言

构建学生信息管理系统,需要从多个角度进行考虑。不但要编写面向对象的程序,还要对系统数据库进行设计。

该系统的核心功能是对学生的相关数据进行读取和处理,而作为对学生信息进行收集、组织、加工、处理的数据库,对本系统来说起到至关重要的作用。一个布局合理的数据库,可以减少系统开发的时间,增强系统的性能,提升数据存储的利用率,增强系统的可扩充性。因此,数据库的设计是否适合,与系统的优劣有直接的联系[1]。

本系统采用Java语言进行程序设计,Java语言提供了通用的应用程序编程接口。Java语言通过该接口,可以很方便的和数据库取得连接,并进行各种操作。像Oracle、SQL Server、MYSQL这些数据库除了在和Java的连接语句上略有不同外,其他方面基本上都是相同的。

二、数据库介绍及选择

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,是用来存储一些结构化的、无危害的或不必要的冗余的数据的集合,并为之提供各种应用及服务。它产生的历史可以追溯到50年前,随着IT和市场的发展,特别是在20世纪90年代,数据库管理不仅体现在各种用户管理所需的数据存储和管理上,而且转化成各种数据管理的方式。数据库具有多种类型,从简单存储不同的数据表到能进行海量数据存储的大型数据系统,已被广泛使用。目前使用最广泛的是面向对象的数据库模型。

数据库软件产品有很多种,比如DB2、mySQL、Oracle、Informix、Sybase、SQL Server、PostgreSQL、Access等数据库。

Oracle数据库是数据库领域中的领先者,是世界上最流行的数据库平台之一,并且能很好的紧密结合网络技术。但是价格非常昂贵,不适用于本系统。微软公司的MS—SQL和Microsoft Windows操作系统能够完美兼容,符合大多数用户的使用习惯,功能强大,但是购买其软件仍然是不小的开销。

MYSQL数据库是一个小型关系型数据库管理系统,已被广泛应用于因特网上中小型企业。由于其体积小,速度快,总体拥有成本低,尤其是开放源码的特点,被很多中小型企业采用。MYSQL数据库特点是,具有可扩展性和可移植性,优越的稳定性、灵活性和强大的数据保护功能,可以支持大型数据库。最关键的,MYSQL数据库是一个用户可以直接从网上下载的完全免费的产品。所以,经过多方面的比较和考虑,本系统的数据库选用了MYSQL数据库。它不但能完全满足我校学生信息管理的需要,而且使用成本低,减小学校资金压力。

三、数据库设计的目标

数据库设计是一项繁复、详细的工作,数据库设计的目标是为用户和各种应用系统提供一个信息基础设施和高效的运行环境。高效的运行环境包括:数据库数据的存取效率、数据库存储空间的利用率、数据库系统运行管理的效率。

数据库的设计必须满足以下几点:首先是数据的共享性和独立性;数据独立性是指数据库中的物理数据、逻辑数据与应用之间要相互独立;其次是尽可能的减小数据冗余,这样可以提高用户的响应速度;第三点是确保数据的安全性、准确性,有效性,一致性和及时性;最后一点是要灵活的对数据进行检索和存取[2]。

数据库设计表达的方式目前主要有实体—关系图(E—R模型)和对象定义语言两种,在本文中设计将用实体—关系模型来实现。在学校这个特定的环境里,从用户对系统信息的需求出发,对信息进行概括的描述,得出实体与实体之间的关系,绘制出E—R图,建立出最优化的概念模型。建立观念模型可以借助数据库模型设计的软件工具,只需要把用户需求转化为概念模型,而概念模型转化成数据库设计完全可以由软件自动完成。在此基础上进一步开发,最终构造出系统数据库及相应的数据表。

四、数据库逻辑设计E—R图

采用E—R图来画出概念模型,它能充分的反映现实世界,易于理解,将现实世界的状态以信息结构的形式方便的表示出来。E—R模型由实体、属性和联系三个主要部分组成。

实体:客观存在并且可以相互区分的事物称为实体。实体既可以是具体的对象,也可以是抽象的概念。本系统中的实体主要包括学院、专业、班级、学生、课程等。

属性:描述实体某个特性的值叫属性,属性反映在数据表中表现为字段。例如,学生实体具有代码、姓名、性别等属性。

联系:联系是两个以上实体之间的连接。采联系可分为“一对一联系”、“一对多联系”、“多对多联系”3种类型[3]。

在对系统进行需求分析,了解了使用者的需求之后,采用E—R图对数据库进行建模,直观的描述了现实世界的概念模型[4]。

五、数据库表的设计

设计规范的数据库表可以提高数据库操作效率,特别在数据较多的时候,如果表的结构不合理的话,条件会变得相当复杂。所以,为了简化SQL,表的内外部的关系要尽可能的设计合理,为每一条记录加上主键。

为了建立数据库连接,本系统创建了一个数据库文件以方便对各表之间进行查询。该数据库中,包含的信息应该有学校及学生的一些基本信息。所以,为了提高数据库操作效率,建立了多个在逻辑上独立的数据表,以便于扩展和修改。

六、数据库表之间的联系

当数据库的表确定之后,使用PowerDesign为数据库建模的主要和关键的工作是建立正确有效的概念数据模型。PowerDesign将实体、属性、关系和数据表中的字段、主键、外键一一对应,实现了概念模型到数据库表之间的转换。PowerDesign支持MYSQL数据库管理系统,将UML统一建模语言和数据模型无缝集成,显示了数据库表之间关系的详细信息,如图2所示。

七、结束语

数据库设计是学生信息管理系统的基础,在初始阶段就要严密规划、精确设计,考虑未来的扩展和不断增长的数据量,考虑设计后的维护工作[5]。

本文将用户需求抽象为概念模型,然后由概念模型产生数据库的逻辑结构设计。使用数据库建模工具PowerDesign建立概念模型,得到表与表之间的关系,设计出合理的数据库。本系统数据库设计简洁实用,为学生信息管理系统的后续开发提供了支持。

参考文献:

[1]崔娅萍,杨靖新.利用MySql实现学生信息管理系统的后台数据管理[J].赤峰学院学报:自然科学版,2012,8:39—40

[2]孙爱娥,朱玲.基于JSP的学生信息管理系统的设计与实现[J].农业网络信息,2008,4:63—64

[3]魏婧,温振宏,郭琛.基于PHP+MySql的学生选课系统设计[J].中国科教创新导刊,2010,35:200—201

库存管理的概念范文第2篇

关键词:地理信息系统;测量;数据管理

一、新时期地理信息系统测量数据管理方式

新时期地理信息系统对测量数据的管理提出了新的要求,随着科技的发展和进步,数据管理方式的改变已成为不争的事实。

伴随着地理信息系统由低级向高级的发展,数据测量仪器也经历了由落后到先进的科技历程。传统的测量仪器经过几十年的革新换代,已经由纯手工操作的常规光学经纬仪发展到具有自动安平、电子自动记录等功能的电子自动经纬仪。现代的电子经纬仪能够通过内置芯片把测量到的数据记录在其电子记录簿上,与计算机连接后可将数据传输给计算机存储利用。电子经纬仪采集的数据在计算机上可通过电子经纬仪厂商提供的图形软件显示出来,紧接着计算机技术人员通过对显示内容稍加编辑,电子经纬仪收集的数据就形成了一副数字地形图。这种高科技设备的发明将大量测绘人员解放出来,同时由于才有电子设备进行测绘,减少了人为主观误差,提高了测量精度,对于地形测绘和修测的提高意义重大。

在大家享受自动经纬仪带来便利的同时,也打来了一个困扰测绘人员的问题:测绘产生的大量数据均散列存放于计算机某个数据库中,调查的数据处理存放于图表中,这样一方面在客户需要数据时,无法快速确定测量时间以及测量数据的内容;另一方面也不能了解整个测绘区域的全貌。电子经纬仪的发明,节省了图纸存放所消耗的空间,同样减少了手动搬动图纸进行检索的劳动强度,但是没有解决相应的计算机数字地图管理和检索工作。新时期地理信息系统的出现使这个问题迎刃而解,心事地理信息系统更加先进、高效,为测绘数据的采集和处理带来新的跳跃。

二、空间数据的无缝管理

现代测量均是将需要测量的地区按照一定的比例尺划分成若干副块进行分割,对于整体的把握和了解不够细致,同时在测区的综合浏览方面也不够直观。在对地理信息管理系统可以进行多种数据管理进行了解以后,再详细了解地理信息系统空间数据结构的无缝管理,就可以将原本分散的测区图副块连接起来,使用户对整个测区都能直观的看到,如图所示。

图 无缝空间数据库原理图

无缝空间数据库是指那些存在于地球表面的在真实世界具有无缝特征的客观对象,这些对象在数据库中可被表达为具有唯一几何标识和地物标识的对象,能够抽象表达现实世界中完整的地球表面对象,从而形成能够存储大量数据的数据仓库或者数据服务器。在传统的地理信息数据库组织中,当地球表面的真实对象被不同的图幅分割时,在地理信息系统的不同图幅中同一个客观对象就具有不同的OID码,如果恰好在进行某项工作时需要此图幅,那么检索工作将涉及多块图幅和不同的专题,大大增加了检索难度;传统的地理信息系统缺乏无缝管理,很难维护地理客观实体的完整性和一致性,同时也不便于数据库的分布式管理;传统数据库系统对地理数据的有效获取存在缺陷。

实现新时期新的地理信息系统既无缝空间数据库的设计需要经过两个阶段,第一个阶段是逻辑概念上的“无缝”组织阶段。逻辑概念上的“无缝”组织是指从用户视角进行观察分析的数据库,这种思想是基于Morton码的瓦片式大型地理空间数据库设计思想,并且在此基础上建立起了一个“无缝”地理信息系统数据库。其在物理概念上的存储管理仍然按照传统地理信息系统的图幅块进行,对同一个地球表面真实体在多个几何标识和同一地物标识件进行后台关联处理,这些过程对用户来说都是不可见的,因此会被成为逻辑概念上的“无缝”组织。

第一阶段逻辑概念上的“无缝”组织存在其优缺点、有点主要为在一定程度上解决了传统地理信息系统空间对象数据库的组织弱点,同时从用户角度出发,该地理信息系统简单易操作。缺点:未进行物理“无缝”连接,因此其物理底层依然采用传统地理信息系统的分幅方式管理整个地图,地球表面实体的标记依然依靠多个几何标志和一个地物标识进行后台关联后进行,因此系统的灵活性很低;地理客观实体的完整性和一致性很难得到维护;数据在此阶段进行分步管理。每当数据库中输入新的数据,这些关联机制就要进行相应改变,工作量很大。由此可以看出在概念逻辑上的“无缝”组织还远远没有实现。

实现无缝空间数据库的第二阶段是在实现逻辑概念“无缝”组织的基础上完成物理上的客观“无缝”处理。物理概念上的“无缝”组织则是从设计开发者的角度实现了地理数据无缝组织,解决了传统地理信息系统中分幅块管理的问题。物理概念上的“无缝”使得地球表面客观对象在地理信息数据库中能够被唯一的几何标志和物理标识进行识别,这样可以从本质上使地球上的客观实物唯一完整的在计算机中被存储。经过无缝空间数据库的第二阶段,此时的数据库不仅在用户视角中是无缝的,在设计者视角中其物理结构也是无缝的。

物理阶段的“无缝”组织使得该系统由逻辑概念到物理概念都实现了“无缝”设计,从根本上将传统地理信息系统的组织弱点进行清除。但其它缺点主要是无缝空间数据库中对数据的格式、内容要求的严格,因此要提高所有测绘人员的专业素质,这一要求在某些情况下很难实现。如果确定采用无缝空间数据库,那就要对原有的地理信息系统进行改造,而改造地理信息数据系统是一个非常庞大的工程。

结语:

本文通过对地理信息系统中测量数据与无缝管理方式进行分析其优缺点,并提出了采用无缝空间数据库的测量数据管理方式,为测量工作者及相关研究人员在进行相关工作时能够有所借鉴,对于地理信息系统中测量数据的管理方式研究具有积极意义。

参考文献

库存管理的概念范文第3篇

本文结合日常图书查询系统的实际需要,通过对C/S模式、PowerBuilder6.5开发工具、数据库以

及SQL语言的深入学习及实践,主要完成了局域网图书资料查询系统的需求分析、数据库设计、应

用程序设计的工作。

首先,在绪论部分介绍了局域网图书资料查询系统的应用背景、开发环境以及选用的开发工具与

数据库的关系,阐明了局域网的概念。并对数据库的体系结构、DBMS进行了介绍。

第二章的开始介绍了关系型数据库的基本概念,着重说明了几个关键概念的定义;然后对SQL语言

作了一个介绍说明;最后通过两个例子介绍了PB6.5用PowerScript语言调用SQL的方式。

第三章从特点和功能入手,介绍了开发工具PowerBuilder6.5;并且介绍了C/S模式的概念、特点

以及C/S模式与开发工具PowerBuilder6.5的联系;在这个章节的最后简单介绍了PB6.5对数据库的

操作。

第四章用软件工程的方法分析了局域网图书资料查询系统,对整个系统进行了需求分析、功能模

块划分,并通过ER图对数据库进行概念设计、用Microsoft Access对数据库进行逻辑设计。

第五章是对局域网图书资料查询系统的具体设计。描述了整个系统详细的功能模块划分,描述了

登录模块、模糊(分类)查询、多条件(组合)查询、数据编辑更新模块以及数据维护模块的实

现过程,并对设计源代码进行了注释分析。

设计充分利用PowerBuilder6.5的PowerScript语言对SQL语言的操作特性,灵活运用数据窗口技术

、以及PB的控件技术等,提高了程序设计质量。

关键词:C/S结构,局域网,数据库,SQL语言,PowerBuilder6.5

目 录

摘 要 ………………………………………………………………………………… I

第一章 绪 论 ……………………………………………………………………… 1

§1.1 数据库应用系统开发简介 ………………………………………………… 1

§1.2 局域网图书资料查询系统……………………………………………………3

§1.3本文所作工作 …………………………………………………………… 4

第二章 数据库理论基础 …………………………………………………………… 6

§2.1 关系型数据 ……………………………………………………………… 6

§2.2 SQL语言介绍 ……………………………………………………………… 9

§2.3 PB6.5对数据库的操作 ………………………………………………………11

第三章 PB 6.5及其数据库编程……………………………………………………… 13

§3.1开发工具PowerBuilder6.5……………………………………………………13

§3.2 PowerBuilder与Client/Server体系结构………………………………………16

§3.3 PowerBuilder6.5数据库编程 ……………………………………………… 18

第四章 局域网图书资料查询系统设计分析 …………………………………………21

§4.1 应用需求分析 ……………………………………………………………… 22

§4.2 系统功能模块划分 ………………………………………………………… 23

§4.3 系统数据库设计 …………………………………………………………… 24

第五章 局域网图书资料查询系统应用程序设计 …………………………………29

§5.1 系统模块组成 ………………………………………………………… 29

§5.2登录模块的实现……………………………………………………… 30

§5.3查询模块的实现 …………………………………………………………… 33

5.3.1模糊(分类)查询的实现 ………………………………………………39

5.3.2组合(条件)查询的实现 ………………………………………………44

5.3.3更新打印模块的实现 ………………………………………………… 51

§5.4 数据维护模块的实现…………………………………………………………56

第六章 结束语 ……………………………………………………………………… 63

致 谢 ………………………………………………………………………………… 64

参考书目 ……………………………………………………………………………… 65

第一章 绪 论

§1.1 数据库技术

数据库技术作为数据管理技术,是计算机软件领域的一个重要分支,产生于60年代末。现已

形成相当规模的理论体系和实用技术。优秀的数据库设计是应用成功的基石。万万丈高楼平地起

,数据库设计如同高楼的基石,是开发高品质应用的前提。

1.1.1 数据库的体系结构

数据的体系结构分成三级:内部级(Internal),概念级(Conceptual)和外部级(External)。这

个三级结构有时也称为“三级模式结构”。

l 外部级:最接近用户,是单个用户所能看到的数据特性。单个用户使用的数据视图的描述称为

“外模式”。

l 概念级:涉及到所有用户的数据定义、是全局的数据视图。全局视图的描述称为“概念模式”

l 内部级:最接近于物理存储设备,涉及到实际数据存储的结构物理存储数据视图的描述称为“

内模式”。

数据库的三级模式结构是数据的三个抽象级别。它把数据的具体组织留给DBMS

去做,用户只要抽象地处理数据,而不必关心数据在计算机中的表示和存储,这样就减轻了用户

使用系统的负担。

1.1.2 数据库管理系统(DBMS)

数据库管理系统(DBMS)是指数据库系统中管理数据的软件系统。DBMS是数据库系统的核心组成

部分。对数据库的一切操作,包括定义、查询、更新及各种控制,都是通过DBMS进行的。

在不同的计算机系统中,由于缺乏统一的标准,即使同种数据模型的DBMS,它们在用户接口、系

统功能方面也常常是不相同的。

用户对数据库进行操作,是由DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而

操作存储器中的数据。DBMS的主要目标,是使数据作为一种可管理的资源处理。

库存管理的概念范文第4篇

1 零库存的概念

1.1 零库存是个微观概念

需要说明的是,上面所讲的零库存是针对微观经济领域内经营实体(如制造企业)的库存状况而言的一种库存变化趋势,它属于微观经济范畴。从全社会来看,不可能、也不应该实现零库存。为了应付可能发生的各种自然灾害和其他各种意外事件,为了调控生产和需求,通常国家都要以各种形式(其中包括以库存形式)储备一些重要物资(如粮食、战略物资、抢险救灾物资等)。因此,在微观领域内,某些经营实体可以进行零库存式的生产和无库存式的销售,但整个国家或社会不能没有库存。

1.2 零库存并非针对所有的“库存”

从库存的用途来分,库存可以分为经常性库存、安全库存、季节性库存、促销库存、投机库存和积压库存,零库存主要是针对积压库存和经常性库存而言的。对于企业为了消除产销分离、供货短缺、运输迟延、需求波动、套期保值等原因而进行的库存不但不能为“零”,而且要有适量的库存来满足正常需要。

1.3 零库存并非没有库存

值得注意的是,零库存并不等于没有库存,亦即某些经营实体(如生产企业)不单独设立仓库和不库存物资,并不等于取消其他形式的库存。实际上,企业(包括生产企业和商业企业)为了应付各种意外情况,必须要储备一定数量的原材料、半成品和成品,只不过这种储备不是采取库存和自行库存的形式罢了。例如,时下流行的VMI(供应商管理库存)相对于需方来说,就是实现了零库存,但实际上只是库存转嫁而已。因为根据供应商管理库存的定义,它是指供应商等上游企业基于其下游客户的生产经营、库存信息,对下游客户的库存进行管理与控制。换句话来说,VMI库存管理系统就是供货方代替用户(需求方)管理库存,库存的管理职能转由供应商负责。

1.4 零库存并非适合所有企业

不要以为丰田、戴尔、沃尔玛能实现零库存,所有企业就都能实现零库存,关键要看企业所处的商业环境是什么,自己经营的是什么产品。例如,丰田汽车装配线确实可以做到生产环节的零库存,但除了本身先进有效的管理手段和方式之外,就是它的周围有上百家零配件供应商和原材料仓库。可见,零库存是基于“零”距离供应之上的。另外,丰田经营的是汽车,是逐渐走向个性化的大件商品。假如经营的是非个性化商品(如大众化的家用电器)实现零库存就是不合算的,因为生产和销售都是批量进行的,消费是连续和随机的,并且随着生产技术的进步,这种商品的价值越来越低,单位库存商品占用的资金越来越少,而实现了零库存要增加单位商品的生产、交换和消费费用,所以,这类商品应该实行适量库存而不是零库存政策。对那些个性化商品、价值很高的商品实行JIT和零库存是比较合算的。对于医院等公益性较强的企业,是否应该追求零库存,很值得研究。

1.5 零库存并非仅仅是量的概念

零库存不单是量的概念,同时还应注意结构的合理性。如果把零库存仅仅看成是仓库中存储物的数量变化或数量变化趋势而忽视整体结构的合理性,那么,降低成本的目的就很难实现。因为在库存结构、库存布局不尽合理的状态下(例如,行行层层设库,库存相当分散),即使某些经营实体个别的库存物资数量趋于零或等于零,也不能说明库存是合理的,因为仓储设施重复存在,用于设置仓库和维护仓库的资金占用量并没有减少。

从上所述,从物流运动合理化的角度来研究问题,零库存概念应当包含这样两层意义:其一,库存对象物的数量趋于零或等于零;其二,库存设施、设备的数量及库存劳动耗费同时趋于零或等于零(即不存在库存活动)。而后一种意义上的零库存,实际上是社会库存结构的合理调整和库存集中化的表现。就其经济意义而言,它并不亚于通常意义上的仓库物资数量的合理减少。

2 零库存管理的主要方法

2.1 委托保管方式

即受托方接受用户的委托,利用其专业化的优势,以较高的库存管理水平、较低的库存管理费用代存代管所有权属于用户的物资,从而使用户不再设有仓库,甚至可以不再保有安全库存,从而实现零库存。这种零库存方式主要是靠库存转移实现的,并不能使库存总量降低。但是委托方省去了仓库规划、建设及库存管理的大量费用,集中力量于生产经营,体现了专业化特色,是目前国内企业发展零库存的主要趋势。

2.2 看板方式

看板方式是准时方式中的一种简单有效的方式,要求企业各工序之间或企业之间或生产企业与供应者之间采用固定格式的卡片为凭证,由下一环节根据自己的节奏,逆生产流程方向,向上一环节指定供应,其主要目的是在同步化供应链计划的协调下,使制造计划、采购计划、供应计划能够同步进行,缩短用户响应时间,节约采购资源,降低原材料和外构件的价格,提高企业的适应能力。在具体操作过程中,可以通过增减看板数量的方式来控制库存量。

2.3 按订单生产方式

企业的一切生产活动都是按订单来进行采购、制造、配送的,仓库不再是传统意义上的储存物资的仓库,而是物资流通过程中的一个“枢纽”,是物流作业中的一个站点。物是按订单信息要求而流动的,因此从根本上消除了呆滞物资,从而也就消灭了“库存”。这与传统意义上的为“库存”而生产,生产出来产品进入“库存”后再等待订单是根本不同的。

2.4 JIT配送方式

即企业及时地将按照订单生产出来的物品配送到用户手中,在此过程中,通过物品的在途运输和流通加工,减少库存的方式。企业可以通过采用标准的JIT供应运作模式和合理的配送制度,使物品在运输中实现储存,从而实现零库存。

3 零库存管理方法的的运用及其实践意义

传统库存管理方法是建立在物料需求是连续均衡的、对各种物料的需求是相对独立的等一系列的假设条件之上的。由于企业面临的经营环境的变化,传统库存管理方法的许多假设条件的真实性越来越差。所以,仍然单纯采用传统库存管理不仅不能帮助企业提供可靠的数据,相反会误导企业的库存管理。其次,零库存,没有资金和仓库占用,只能是库存管理的理想状态。

库存管理的概念范文第5篇

同时,众多的应用系统所带来的身份的认证和管理的复杂性既使得管理成本不能降低,又使得整个系统的安全性、可整合性降低,这已成为电子政务信息管理系统进一步发展的瓶颈所在。因此,要想改变电子政务信息化水平的现状,整合信息资源,解决“信息孤岛”问题,就必须建立一个公共数据平台,它是在政府部门原有的各业务系统层面上搭建的一个高层应用平台,将各业务系统的异构数据集成应用,向下屏蔽各异构信息源异构性,向上提供数据集成基础服务,实现各种信息系统的互通互联和数据共享、数据的一致性,并在此基础上实现规范的信息管理。近年来,随着语义Web的发展,其核心技术本体在数据集成方面得到了应用。本体作为共享领域概念模型,可以通过定义领域内一致的术语和术语间的关系来描述异构信息源的语义信息,从而消除异构数据源的语义冲突。

在国外,对本体的研究较早,本体已经应用到各个领域。相比国外,国内对本体的研究起步较晚,尤其是在电子政务方面,缺乏一致的本体模型,相关的应用也少。目前,本体技术很少在电子政务信息化建设中应用,因此,如何把本体技术应用到电子政务异构数据管理集成中,采取何种策略进行构建,消除电子政务各信息系统异构数据库模式的语义冲突,从而解决电子政务中异构系统导致的信息孤岛问题,构建统一的数据平台,以便提高政府管理效率,就显得尤为重要。

1电子政务与本体

1.1电子政务与本体概述

电子政务是政府机构广泛深入地应用现代信息和通信技术,将政府内部和外部(社会)的责权与职能通过计算机网络硬件和软件技术进行集成、整合、优化、重组,做到跨越时间和空间,突破部门分割和传统组织、工作方法与工作流程的限制,力求全方位地、有效地施行与提供安全、高效、优质、规范和符合国际水准的管理与服务。本体是为了某种目的描述世界时的一组抽象化概念,并且该组概念是得到广泛认可的、以规范化形式描述的。根据定义描述本体时目的的不同,本体可以分为多种类型,依照领域依赖程度,可以细分为顶级(top—leve1)、领域(domain)、任务(task)和应用(application),这里研究的是领域本体,领域本体由属性、对象、关系和子领域本体组成。引入本体的思想,借助本体对领域知识进行详细描述,以抽象出概念化的语义层次,为进一步研究语义化的信息交互提供了基本的语义层次2J。从形式上来说,本体由概念、关系、函数、公理和实例5种元素组成。本体中的概念可以是一般意义上的概念,也可以是任务、功能、行为、策略推理过程等;关系表示概念之间的关联;函数则是一种特殊的关系;公理用于表示一些永真式;实例是指属于某种概念的基本元素,即某概念类所指的具体实例。

1.2本体在电子政务中的应用案例

美国印第安纳州电子政府建设是很多文献介绍的典范,其成功之处在于利用本体方法建设电子政府数据库J。美国印第安纳州电子政府IndianaFamilyandSocialServicesAdministration(FSSA)本体,属于最上层的域本体设计,它在“家庭与社会服务”这一本体下定义了9个本体(即低收入、处于危险的儿童、精神病与吸毒、弱智、区域健康与人性化服务、医疗补助、政府机构、法律实施及财政),建立了最上层的概念关系,并用图形和箭头形式标示出了各下层本体之间的关系以及在一个专业本体里所包括的术语。

1.3电子政务中本体的核心概念及抽取方法

目前,大多数本体学习方法和本体学习系统都是直接将术语识别为概念。术语的抽取被认为是进行本体自动构建的关键。针对术语抽取的研究主要有基于语法规则的方法、基于统计的方法、ICT—CLAS系统法J。利用语法规则的方法来进行术语抽取具有提取术语准确度较高、处理过程简单、计算量较小、能够有效提取低频术语等多项优点。但是,由于语言学规则本身难以掌握,尤其是针对开放性的语料,语言学的规则更是难以准确应用,利用人工来研究语言学的规律越来越难以实现;使用统计的方法来抽取术语可以高效地识别领域术语,只要一个词在文本集中出现的频率高,就可以被有效抽取出来,可移植性较好。但是,这种方法计算量大,在处理低频术语的时候,效果较差;ICT—CLAS系统法主要采用ICTCLAS系统对内容进行分词处理,然后对分词进行抽取处理,这样抽取的优点是抽取内容比较全面,但效率比较低,并且需要人工手动处理。

以上抽取方法都有优缺点,在本体抽取中单独地使用其中一种方法都不能达到最优的效果,笔者把以上多种方法混合起来,采用程序自动分词合并方式,加入TF—IDF算法,增加对领域术语的相关度的计算,筛选出与领域相关度低的术语,从而提高领域术语抽取的正确率。基本步骤如下:

1)采用语法规则的方法提取相关候选术语;

2)采用程序自动处理方式,对相关候选术语进行分词;

3)采用统计法对分词进行统计,根据频度提取术语;

4)使用TF—IDF算法对提取的词进行相关度计算,求出每个候选术语在政务领域文本中的相关性,抽取出政务领域独占性强的词作为政务领域术语。

2电子政务公共数据平台架构

为了确保异构数据获取和更新的准确性,同时又不改变原有硬件设施和人力资源,要想实现真正意义上的异构数据库间信息资源的共享,集成后的数据必须保证较高的集成性、一致性和完整性,这是公共数据平台建设的重要环节。

2.1本体模型构建

电子政务中大量不同的应用系统,其异构是普遍存在的,要想向下屏蔽异构数据,建立数据中心,向上提供公共数据平台,就必须构建本体模型对元数据进行抽象概念化处理。电子政务本体构建中的2个核心问题是概念抽取和概念关系的获取,概念抽取是对数据源进行分析,抽取出概念集合和每个概念的属性集合。概念抽取本体有很多方法,可以由领域专家手工进行,也可以利用领域概念词典,自动抽取数据源中的概念。概念关系的获取可以通过2种方法实现,即基于语言规则的方法和基于统计的方法。在对所有数据源进行分析的基础上,找出其中所涵盖的术语,进行概念抽取,定义共享的词汇表,根据相关本体规则进行本体抽象和语义处理。

2.2公共数据平台架构

使用公共数据平台的好处在于所有的共享数据被存储在中心数据库,可以向上层提供统一的数据,便于资源共享和集中管理,而电子政务网内各应用系统中异构数据库就拥有了完全的自治性,这样首先需要对底层异构数据库进行本体抽象处理,向下屏蔽异构数据,然后采用数据交换技术和数据同步技术保持中心数据库数据和底层异构数据库数据的实时同步。

电子政务公共数据平台架构分为应用层、异构数据集成层、本体模型层和异构数据本体库层,如图2所示。异构数据本体库层主要包含各大应用系统异构数据库,通过不同的连接器及适配器向本体模型层提供本体的元数据;本体模型层对元数据进行概念化,按照本体规则进行抽象处理和语义处理;异构数据集成层在本体模型之上利用AGENT同步模块对数据进行交换、同步而实现数据集成,公共数据都集中到中心数据库,向上层提供公共数据平台;应用层主要是用户访问层,针对不同用户提供统一身份认证,实现单点登陆。

3电子政务公共数据平台设计

3.1构建电子政务领域本体的方法步骤

W3C组织推荐的在语义网上应用的标准本体表示语言是OWL,目前本体的构建方法主要有TOVE法、骨架法、KACTUS工程法、SENSUS法、IDEF5法、七步法等。这些方法大多数是以不同领域为背景,从个案的开发过程中通过逆工程总结出来的J。例如:TOVE专用于构建TOVEOntology,是关于企业建模过程的知识本体;骨架法专门用来构建企业本体;KACTUS是指“关于多用途复杂技术系统的知识建模”工程,目的是要解决技术系统生命周期过程中的知识复用问题-l;SEN。SUS法是开发用于自然语言处理的SensusOntolo。g)r的方法路线¨;IDEF5法是用于描述和获取企业本体的方法-l。;七步法是斯坦福大学医学院开发的,主要用于领域本体的构建_l。这些方法各有特点,但都不是针对电子政务领域的,没有充分考虑电子政务领域的特点。笔者结合电子政务领域特色,提出基于电子政务业务模型,抽取概念,建立电子政务领域知识本体的方法,步骤如下:

1)需求分析,确定电子政务领域本体应用的目的、范围、表示方法和用途等。电子政务领域本体建设要以应用需求为牵引,要对人类在认识世界过程中形成的不同“本体”(知识体系)进行认真分析,最终达到需求分析的定位准确、涵盖得当。

2)概念化及抽取,通过各种渠道获得电子政务领域本体的主要概念,确立概念间等级关系,并用精确无歧义的语言加以描述,形成该领域本体的核心语义内容。获得领域信息最根本的方法应该是考虑复用已有本体的可能性。通常的也是最行之有效的方法是复用已经广泛使用于各个学科领域的主题词表和分类表。

3)概念间联系,确定电子政务领域本体概念间联系,如属性、种属关系、总体与部分关系、领域中的特有关系;对所收集的名词术语进行规范,罗列重要的词和短语,并将其归类。还要确定概念间结构,定义类别和等级结构。

4)本体生成,采用SFCA算法,对概念之间的关系进行分析,自动生成局部本体,再采用PROMPT算法,把局部本体合并,生成全局本体,存放在本体管理器中。

5)本体编码,利用形式化描述语言对“概念化”的电子政务领域本体进行编码,使机器易于处理,尽量将相关领域已存在的本体集成到要构建的政务领域本体中,既避免重复建设,又可以形成领域内共享的本体。

6)确认、维护与评价。对电子政务领域本体按照一定的标准进行确认和评价,包括本体的清晰性、一致性、可扩展性等;随着电子政务领域知识的增加,本体要不断更新、不断进化,增加本体概念,完善本体概念间的语义关系。

3.2电子政务公共数据平台设计

电子政务公共数据平台是在原有的各业务系统层面上搭建的一个高层应用平台,将各业务系统的异构数据集成应用,向下屏蔽各异构信息源异构性,向上提供数据集成基础服务,实现电子政务各应用系统的数据共享和数据一致性,有效解决信息孤岛问题,并在此基础上实现规范的信息管理。设计基于本体的电子政务公共数据平台,首先研究数据集成方法与本体技术及基于本体的语义集成,在此基础上构建公共数据平台异构数据库集成框架,基于本体的异构数据库集成框架是设计公共数据平台的基础。目前数据平台的建设主要有3种模式:全局中心数据库模式、数据交换模式和共享数据中心模式。全局中心数据库模式:建立一个数据中心,各应用系统直接应用于该数据中心之上,逐步取消原有业务数据系统;数据交换模式:保持原有业务数据系统,用数据缓存的模式进行各业务数据系统之间的数据转换和抽取;共享数据中心模式:原有各业务数据库保持不变,通过触发器或者开发数据接口抽取需要共享的数据,并且进行转换,汇总生成共享数据库。上面的模式各有所长,但也存在不足,这里提出一种统一公共数据平台模式,即制定统一信息编码标准,从而建立核心数据库,存放最基本的公共信息,保留原各业务数据系统。这样公有数据存放在中心数据库,一方面可以实现资源的最大共享,另一方面各专业数据仍保留在原系统中,保证了数据独立和安全。平台结构如图3所示。公共数据平台建立在中心数据库之上,中心数据库中存放的公共数据可以通过数据交换、数据同步的方式更新到各业务系统数据库中,数据的同步更新采用事件驱动方式,通过触发器和AGENT同步模块来更新数据。AGENT同步模块基于本体模型之上,本体模型层对元数据进行概念化,按照本体规则进行抽象处理和语义处理。