首页 > 文章中心 > 系统运维服务方案

系统运维服务方案

系统运维服务方案

系统运维服务方案范文第1篇

畅想全面运维

对于运营商来说,一旦信息系统建设达到一定规模,其整体信息系统资源的监控和管理就成为必须考虑的问题。其中涉及基础网络设备、安全设备、网络优化设备、网络加速设备,以及网络管理设备等,称之为信息系统的全面运维。从长远考虑,用户需要一个全面运维的解决方案,来帮助他们加快信息化的建设。

据悉,神州泰岳软件股份有限公司日前在京了基于IT运维管理的全线产品,共八款新产品。这一事件表明:在中国运维管理市场,具有自主版权的全面运维管理解决方案已经诞生。

这八款新产品诠释了神州泰岳的业务方向――专注于运维管理领域的系统网络管理、服务管理、安全管理和数据管理四大业务,它们分别是服务管理流程方面的电子运维管理系统、IT服务管理支撑平台、统一投诉管理系统;系统网络管理方面的综合监控管理平台、系统管理软件和服务水平管理系统;信息安全管理方面的安全运行管理中心、统一身份及访问安全管理系统。

坚定业务方向

早在1998年3月,当国内用户对“网络管理”还不太了解的时候,神州泰岳就开始从事高端系统网络管理软件的研发与服务。随着企业的逐步壮大,神州泰岳得到了客户的广泛认可。IBM、BMC、CA、HP等领先的软件公司陆续与神州泰岳合作,共同拓展这一市场。

2002年5月,羽翼渐丰的神州泰岳在了完全自主版权的系统网络管理平台Ultra-NMS1.0之后,董事长王宁决定走自主研发的道路,同时也确定了公司的定位――专注运维管理领域,做中国的运维管理专家。基于运维管理的定位,神州泰岳在确定了网络管理、服务管理、安全管理和数据管理四大业务方向之后,相继组建了系统网络事业部、信息安全管理事业部、服务流程管理事业部和数据应用管理事业部,进行自主知识产权产品的研发,形成了具有自主产权的运维管理产品。

在运维管理界耕耘多年之后,神州泰岳在国内运维管理市场上拥有最广泛的客户群.成功实施了数百个运维管理项目。比较典型的电信行业应用包括:中国移动五省BOSS网管项目和十四个省数据网管项目;中国移动总部电子运维管理系统(EOMS)项目;中国联通三十一个省综合数据网管项目;中国网通总部EDC综合网管和DCN网络的安全运行管理中心项目等。

主导中国市场

在实施运维管理项目的过程中,神州泰岳的技术水平和服务水平不但得到了客户的认可和高度评价,还得到了业界的一致好评。

系统运维服务方案范文第2篇

关键词:校园网;运维;DTSM

中图分类号:TP1 文献标识码:A 文章编号:1671—7597(2012)0510159-02

0 引言

近年来,许多学校把信息化的水平作为学校竞争力的核心要素之一,加大了信息化基础设施、数字化校园和各类应用系统的建设投入。随着数字化校园网建设的深入推进,信息系统的规模不断扩大,校园网用户对网络的体验和和依赖性不断加深,对校园网服务品质要求不断提升。随之而来的,是对承担学校信息化建设和校园网运维工作的网络中心(或信息中心)等部门,提出了更高的工作要求。

1 校园网的运维现状

1.1 运维特点

1)响应要求高,因校园网用户群体普遍比较年轻和活跃,对网络的依赖性很强并且网络体验较深,对网络质量和服务品质有较高的要求;

2)链路层故障比较集中,因设备室基础环境较差、线路老化和标识不清等原因,50%以上的网络报障集中在链路层面;

3)网络安全和行为管理工作很重要,

因校园网用户群体普遍比较活跃、文化教育程度很高,很多人喜欢尝试各类技术探索,如此一来,规避潜在的计算机网络业务风险,保障校园网信息平台系统高效的、安全的运行则是一项重要的工作;

4)缺少统一的运维系统,受限于经费和意识等因素,学校没有部署统一的运维系统,部分学校也仅部署了网络监控系统,即便如此,监控的层面和颗粒度都远远不能适应服务要求。

1.2 运维需求

按照运维的技术广度和深度,校园网运维问题主要体现在四个核心需求层面上,即核心层网络层面、接入层网络层面、应用数据层面和用户服务层面。

1)核心层网络层面包括:核心网(城域网)网络维护服务、机房环境(含动力系统)维护服务、服务器设备维护服务、网络安全服务等;

2)接入层网络层面包括:链路维护服务、接入层网络维护服务;

3)应用数据层面包括:数据库系统、应用系统和门户等;

4)用户服务层面:就是在教学、科研和生活方面提供优质快捷的网络质量和网络服务。

1.3 运维模式

校园网运维模式不尽相同,以淮安地区为例,主要运维类型包括以下三种:

1)自行维护:采用设备自行维修,维护工作量最大的链路维护交由学生团队,团队由网络中心的老师管理。这种维护模式最大益处是可以节约些经费。但网络中心困扰于从事低技术含量、重复性的工作等问题。

2)第三方专项维护:把服务器设备的维修维护、或则把网络链路的新增维护、或则把动力系统分包给第三方。这种维护模式的益处是让学校的老师有更多的精力从事业务系统和关键系统的维护,花较少的经费把工作量大而繁琐,技术含量较低的工作交由第三方负责。但也存在流程脱节、服务不到位等问题。

3)第三方整体外包维护:学校把核心层网络层面、接入层网络层面和用户服务层面整体打包给专业的第三方机构,网络中心的老师主要关注于业务系统、应用数据层面和科研。这种模式的益处非常明显,服务方通过各类规范机制,能够预警或则第一时间处理各类问题,可给用户提供高质量的网络、高水平的网络服务,学校的各个群体对此都很满意。

2 基于点易科技运维体系的统一运维方案

点易科技运维体系遵循ITIL国际规范和ITSM规范,以IT资源配置管理为核心,紧密围绕校园网用户的各项需求,进行了全面的设计。在面对用户日益复杂的IT环境,整合IT资源,通过运维体系实现对IT基础架构的统一全面监控和管理,能够及时采集各类告警数据、性能数据和配置数据,进行集成统一的分析、查询、报告和展示,帮助运维管理人员方便有效的定位系统问题,直观快速的诊断和分析问题,将运维模式由被动的支持转为主动式服务。通过服务台接收各类告警事件,按照预先定义的事件管理流程完成事件的处理。建立故障管理、问题管理、变更管理、配置管理等八个服务工作流程,通过管理人员、技术和流程的有机结合,实现IT运维管理标准化和规范化,形成一个整体的IT运维体系。

该体系实现了IT服务支持过程的标准化、流程化、规范化,极大地提高了故障应急处理能力,提升了信息部门的管理效率和服务水平。

2.1 统一运维服务体系

整个运维服务体系包括运维技术力量、管理人员、IT综合资源和IT运维系统(DTSM)四大部分。通过IT运维系统的标准化、流程化的管理方法,实现人管流程,以客户为中心、以流程为导向的运维服务目的。

2.1.1 统一运维管理体系

统一运维管理采用基于ITIL的服务管理方法论作为指导,建立完善的IT资源综合维护管理体系。主要包括:服务台、事件管理、问题管理、资源管理、变更和管理、服务水平管理、知识库/方案库管理和绩效考核管理等。

2.1.2 统一运维技术力量

按照统一运维技术力量的分布方式和专业性特点,分为一线、二线和三线服务团队。

1)一线服务团队:一线服务团队是指现场驻点或最靠近现场的所有技术维护人员、服务台人员、项目经理和相关其他服务人员组成的服务团队。通过统一的运维服务中心对整个校园的各种信息化设备和系统资源进行运维。

2)二线服务团队:二线服务团队支持是指点易科技流动服务团队。具有较高水平的故障分析能力以及丰富的实践经验。

3)三线服务团队:三线服务团队支持是指合作伙伴和合约厂家。三线服务团队具有较高的专业技术水平以及丰富的专属产品实践经验和解决方案。

2.2 校园网运维管理平台(DTSM)

点易科技校园网综合运维管理平台(DTSM)是为整合校园网系统运行环境、网络、服务器与业务应用等的分割管理,实现对IT资源的集中、统一、全面流程管理的专业平台。平台系统设计遵循FCAPS、eTOM、ITIL等国际服务管理标准和规范,达到技术、功能、服务三方面的有机整合。以IT资源基础架构为基础,实现对各种IT资源的管理、数据采集和实时监控。通过服务台管理、事件管理、问题管理、变更管理和知识库管理等各种规范流程和管理方法,实现IT运维的自动化、标准化和规范化。有效融合IT运维管理中的IT资源、监控、运维流程、人力资源和服务各个重要元素。有效提高故障应急处理能力,提升系统运维的管理效率和服务水平。实现校园网用户入网流程管理、网络服务流程管理、网络资源管理和各种视图展现,平台能够与收费系统和主流802.1x厂商认证系统对接并实现数据交互。目前该平台已经部署在国内多所高校,管理运行情况良好。

2.3 校园网统一运维的特点

校园网实施统一运维后,主要特点包括:1)统一IT运维门户,资源管理、资源监控、运维流程和服务一体化;2)应需而动、随需而动的动态业务平台;可以根据客户要求二次开发;3)与主流802.1x厂商认证系统对接并实现数据交互;4)可视化、仪表化、智能化导航管理的运维模式;5)丰富的行业经验、专业的服务管理。

3 校园网统一运维应用案例

3.1 案例说明

某高校有大学城、本部两个校区,网络信息点60000多个,接入层设备2000多台,服务器100多台,安全和出口设备若干台,出口带宽2G。学校的网络与现代教育技术中心承担校园网、数字化校园应用系统、基础教学实验室和300多间多媒体课室的建设、管理和维护。在2010年度之前各类故障的响应和处理占据了老师和相关技术骨干的主要工作时间。

自从2010年点易科技接手该大学统一运维后,利用前期的调研结果,即着手部署运维平台(DTSM)、采集和建立统一资源配置库,建立和规范相关管理制度和流程。将各种IT管理活动按照流程的方式加以组织,并且赋予每个流程以特定的目标、范围和职能,从而加强了IT管理的全面性和综合性。

1)采集和建立IT资源配置库,从工作区的端口编号到设备间的配线架表和对应的接入层交换机、中心机房的服务器、安全设备、应用系统、数据库、机房动力系统和统一录入和配置到运维系统的资源配置库。

2)完善IT资源监控系统和运维系统,通过统一资源配置库,对网络设备、服务器设备、服务应用、数据库系统等资源进行实时采集和监控。值班人员能做通过统一展现平台,提前发现和解决问题。

3)根据用户IT管理的特点而建立的各类制度。建立和执行中心机房管理和巡检制度、变更制度、风险和应急管理制度和服务台制度。

3.2 校园网统一运维的成效

通过点易统一运维体系实现对IT基础架构的统一全面监控和管理,以及建立基于流程的标准化服务体系,使该大学IT系统得到稳定、可靠、安全的运行,使该校校园网运维工作步入一个有序的、规范的层次,使IT系统更好的为该大学校园网业务系统提供服务,从而提高整体运行效率,提升运行服务水平。

参考文献:

[1]王革明、肖琳,基于ITIL的校园网运维服务体系设计与实践[J].西北工业大学学报(自然科学版),2010(12).

系统运维服务方案范文第3篇

【关键词】 中国移动集团 电子运维系统 整合

一、引言

在中国移动集团的电子运维部中,有两大工单系统,即电子运维系统和集团NOC,系统的开发商也是不同的。对于集团电子运维系统,负责处理生产指挥及客户保障相关事宜;对于集团NOC工单系统,则负责处理网络中的故障。根据未来发展的趋势以及集团内部的发展目标而言,这两大体系今后将会从集团内部开始,逐步实现整合,在外部设施中主要表现出一个完整统一的电子运维体系(EOMS)[1]。

二、系统现状及存在的问题

对于科大的电子运维体系和集团NOC系统,是两个独立的体系,需要分别进行建设。他们均在J2EE的B/S架构的基础上进行的,在其他方面有较大差异。目前,有以下问题。

1、两个系统给运营与维护带来不便。相对于移动集团内部的运维工作人员来说,可以登录这两个大系统进行各项功能的实现,不过,使用起来也不是很方便。为了逐步实现工单流转的情况,一般是采用系统接口的形式,将省集接口与集团的电子运维体系进行对接来实现。

2、流程不能贯通。对于流程往往不贯通,选取移动故障申告处理流程作为例子来说明,目前,CNOC以科大电子运维系统为核心,采用科大的电子运维体系,来收取一些客户的申告,如果出现了移动故障,都是由集团内部的NOC工单系统进行维修处理,由此可见,这是两个分离的程序,在管理上,这两个流程需要对接,最终实现协同监控与处理。

3、缺乏互操作性。在两个系统之间,有些需求得不到满足,尤其功能调用方面。比如说,在移动集团中的NOC工单体系,经常会使用到呼叫中心,这就需要运维体系进行作业规划,以实现这些功能。而这两个系统被整合为一个统一的集团电子运维系统,对外提供功能模块供集团和省运维人员访问,包括:生产指挥、客户保障、网络保障等,其中,原厂商开发这些对应的功能模块[2]。

三、系统整合方案

3.1 同质紧耦合方式

同质紧耦合的方式运用的系统是集中式的,作为一种彻底性质的整合,在其内部系统,耦合的程度是比较高的,能够在系统内部进行很方便的调用。同质紧耦合方式一般有两种设计方案,他们都选取一样的数据库、J2EE应用服务器以及流程引擎。唯一不一样的就是在流程引擎上,方案1选择的是BPS 6.0 for J2EE,方案2选择的是BPS 6.0 for EOS。以方案 1 作为案例来说明,在同质紧耦合的方式下,在同一个平台上,系统进行开发和部署,各个模块之间能够自由地被调用,所以,一些问题都轻易地就解决了。

3.2异质松耦合方式

异质松耦合方式,这是对于现在的系统改造影响最小的一种手段。根据移动集团电子运维体系的现状而言,最可行的方案为:不改变系统的总体架构,运用Web Service接口来将双方的操作流程联系起来,都由一个门户去完成界面的展现以及单点登录。在外是一个统一的体系,在内则是独立的两个系统。运用此种方式能够实现目标,做出的改造成本也最低,不过在接口服务的开发上相对复杂一些,不能很好地实现同现有的业务之间的重复使用。

3.3基于SOA的同质松耦合方式

SOA(面向服务的架构)的同质松耦合方式是最佳的解决方案。而且未来的系统架构演进的方向就是SOA。是集团电子运维系统将来在系统框架方面的一个演进方向。SOA一般接受Web Service标准(如SOAP或REST),这些标准拥有相互之间的可操作性,不受一些专有软件的限制。

现在这两大系统都不支持SOA。不过EOS6.0能够支持SCA1.0规范和SDO2.1规范,在其内部有企业服务总线(ESB),它和BPS6.0联合后便能够形成一个理想的SOA中间件平台。一个最为可行的方案就是把J2EE之上的各个层面都弄到EOS6.0上,运用一样的SOA中间件,流程引擎也是一样的。这样在SOA的系统间进行相互之间的操作就会很容易,可以很快速的Web Service,从而能实现各个系统之间的协作。当系统需要被调用的时候,构件也能被分布成具体的服务,进行远程操纵,实现信息的互通[3]。

综上所述,采用紧耦合的集中系统虽然能够实现系统的整合目的,但是厂商之间的协调问题难以建立。采用松耦合的分布式系统,虽然内部不需要进行架构的改变,但是运用Web Service技术来实现系统之间的操作和贯通,难以整合到一起,很难整合现有的业务逻辑。采用基于SOA的系统,能够很便捷地把业务逻辑构件进行成为一项一项的服务,进行分布式扩展,这是目前很理想的一种整合方式。

参 考 文 献

[1] 梁礼方.松耦合(上)[J].金融科技时代.2013(03)

系统运维服务方案范文第4篇

关键词:MOF;ITIL;运维管理;服务管理功能;系统监控

中图分类号:TP315 文献标识码:A 文章编号:1009-3044(2012)35-8364-03

随着信息化应用的不断深入推进, 信息系统已成为支撑各单位运作不可缺少的一部分,由于业务工作越来越依赖信息系统,信息系统发生故障所带来的负面影响也越来越大, 传统粗放式的IT运维管理已不能满足全面管理信息系统的要求。因此,以系统化和规范化手段实现运维管理从被动式服务转变为主动预防服务,以流程贯穿整个运维管理过程,切实保障系统可靠、稳定、高效地运行是目前单位信息化建设急需解决的问题。

微软运作框架(Microsoft Operation Framework,简称MOF)是微软公司以ITIL为基础,联合业界专家、合作伙伴等开发的IT运营管理方法。MOF主要是为更好地运营微软公司的产品和服务而开发的,但它对于非微软公司的IT产品和服务的运营管理同样有积极的指导作用。

笔者所在单位针对现有的基于微软产品及解决方案的基础平台IT环境,基于MOF的微软最佳实践及方法论、结合业界标准规范,在对基础平台建设与运维现状评估基础上设计了基于MOF的运维管理体系,并作了初步的实践和探讨。

1 MOF概述

1.1 基本介绍

MOF是Microsoft Operations Framework 的简称,是一个流程最佳实践集合,用户可以根据它来设计有效操作 IT 基础结构所需的步骤、控件和角色。MOF 基于信息技术基础架构库 (ITIL),它增强了 Microsoft 平台的针对性,最新版本是v4.0于2008年4月发行。

MOF 提供有关如何规划、部署和维护 IT 操作过程以支持关键任务解决方案的指南。并提出了一套完整的模型,包括过程模型、团队模型、风险模型等。MOF作为通用模型,在将其用于具体行业时还必须修改许多建议。

1.2 过程模型

MOF提出的过程模型所讨论的IT服务周期包含三个阶段和一个基础层,具体是:

Plan规划阶段:遵循业务战略,规划及优化 IT 服务;

Delivery提交阶段:设计及部署 IT 服务;

Operate操作阶段:持续提供服务运维及支持;

Manage管理基础层:进行运维管理、规章、制度的制定及推行,最佳实践设定,确保 IT 投入在可控的风险范围内实现期望的商业价值。管理基础层Manage Layer 的目标是建立一个整合的IT服务管理的软环境,以协调Plan、Delivery及Operate三大阶段中的相应服务管理职能(Service Manage Function,简称SMF)高效运作。

1.3 MOF与ITIL的关系

ITIL是信息技术基础架构库(即Information Technology Infrastructure Library)的简称,由英国政府商务办公厅(OGC)编纂的业界公认的信息系统运维的最佳实践指导方针。涉及业务管理、服务管理、IT基础构架管理、应用管理、安全管理、IT服务管理规划与实施等IT运作管理的各个方面。Accenture、Avanade、Fox IT、惠普、朗讯科技/NetworkCare专业服务、微软顾问咨询服务(MCS)和微软操作运转与技术支持集团(OTG,原名信息技术集团[ITG])等知名公司多年积累的宝贵IT操作运行经验均被ITIL所收录。

MOF 是基于下列各项的结构化的灵活模型:

-Microsoft 咨询和支持团队及其与企业客户和伙伴合作的经验以及 Microsoft 内部 IT 操作组;

-IT 基础架构库 (ITIL),它描述了提供关键任务解决方案所需的过程和最佳实践;

-来自国际标准化组织 (ISO) 的 ISO/IEC 15504,它提供了用以评估软件过程成熟度的规范化方法。

MOF又有别于ITIL,在ITIL的基础上,增加了多个服务管理职能,具体提供了有关部署各种 Microsoft 产品(如 Microsoft Windows Server、Microsoft Application Server、Microsoft System Center等)的操作指南和最佳实践。

2 基于MOF 的运维管理体系框架设计与实践

2.1运维管理体系基本框架

设计的基于MOF的运维管理体系主要是以MOF的“过程、团队、风险”三大模型作为理论依据;通过清晰梳理日常IT 运维服务管理过程中遇到的各类问题,以”人员、流程和技术” 为三大核心因素,力求使IT 运维过程变得有序连贯,建立包括组织、制度、流程、技术支撑、绩效考核的IT 运维体系,以全面提高运维服务的质量和水平,保障系统高效、稳定、安全运行和对用户应用的优质服务。

结合MOF服务管理功能SMF的要求,制定、完善相应的管理规章制度,规范操作流程;根据MOF团队模型,对系统运维团队角色做出更为明确的职责分工和定义所需技能要求;基于风险管理模型强化应急预案系统建设,一方面完善信息安全监督机制,另方面强化安全产品的及时升级及监控、维护,确保安全防范切实、有效,逐步建立、完善关键业务应急灾备信息系统,用以在紧急情况下保障关键业务信息系统的正常运行。

2.2 运维管理支撑平台架构

根据提出的运维管理体系框架来设计并搭建了本单位的运维管理支撑平台,提供保障信息系统运行维护管理流程改进、整体高效运转的技术手段,围绕核心服务管理功能SMF模块,选用模块化设计。

运维管理支撑平台以MOSS(Microsoft Office Sharepoint Server)门户、System Center 中的系统监控和服务管理等模块产品为基础,结合统一用户管理、多渠道通讯平台、工作流和报表服务等公共应用平台,根据运维体系阶段性业务需求,逐步定制开发相应的业务功能模块,最终以统一的运维门户与运维团队、最终用户进行交互。

2.3 运维管理支撑平台基础服务组件

运维支撑平台的基础服务组件基于微软成熟产品并结合基础平台进行构建。

MOSS门户提供灵活的表单定制功能和强大的内容管理功能。配置管理数据库基于门户进行定制,不但可以实现配置数据的存储而且可以实现配置信息之间的关联。部分服务管理功能中的表单和过程可以通过门户的列表和工作流定制完成。相关基础服务组件如SCOM监控系统中产生的报表及视图也可集成在MOSS门户中统一展示。

利用System Center系统监控软件SCOM,自动化完成网络、软、硬件管理和监控功能,监控数据可以通过门户统一展现,同时集成多渠道通讯平台,在特定事件发生时,及时通知运维人员。

利用SCOM系统提供的先进、实用、高效工具, 运维管理人员可以实时监控各系统的运行状态,包括对服务器、网络、数据库和应用系统的运行状况进行实时监控,如服务器的CPU、内存和磁盘空间使用情况;网络设备的接口利用率、数据流量和丢包率等;分布式应用系统业务视图中各节点状态的监控。当系统超过设定阈值自动报警时, 通过系统间的关联分析, 运维管理人员可以主动发现并解决故障; 并通过系统产生的报表进行趋势分析, 寻找潜在故障, 防患于未然, 有效支持了业务工作的顺利开展。通过SCOM监控管理平台的建立,用电子巡检方式代替了人工巡检,大大缩短巡检周期,提高了工作效率。同时为性能指标设定不同级别的报警阈值, 当性能超过阈值时,系统将自动详细记录报警信息,并自动通知相关运维管理人员,逐步改变了以往被动服务的局面,提高了系统无故障运行时间。

2.4 运维管理支撑平台功能模块

问题管理模块将管理问题的描述、重现环境、解决方案、关联的配置项等信息。对于IT系统的变更阶段以及运行过程中发现的问题,需要通过问题管理模块进行跟踪、管理。相关运维管理人员可以通过问题管理模块,对新提交的问题进行分析,寻找解决方案,并记录入系统,同时,问题管理模块还需要支持发现解决方案后,问题汇总并触发变更请求(RFC),在下一个该IT系统版本中修复已知问题。

变更请求管理可以帮助用户跟踪与设计更改关联的风险。团队成员可以提交更改请求,并向项目负责人通知与更改有关的风险。通过该应用程序模板,团队成员可以批准或拒绝请求。此外还有IT团队工作区、知识管理、风险管理、考核评估以及文档管理模块。

3 结论

通过对基于MOF的IT运维管理体系和技术支撑平台的实施,本单位在提升IT运维管理能力方面取得了初步成效。一方面,主动运维方式可以使设备和系统维护的效率及平均无故障时间得以提高,缓解了技术力量缺乏的问题;另一方面,规范化的IT运维服务管理使运维团队中的各个角色与职责有了较清晰的定义,使维护责任和安全责任落到实处,在实现IT运维服务质量逐步提高的基础上,也将使得IT运维服务的成本得到有效控制。当然,要使运维管理从传统的单一、被动和低效的管理方式彻底转变为统一、主动和高效的管理模式,全面提升运维管理水平,还有待于在工作中通过持续的实践探索对运维管理体系进行不断更新。

参考文献:

系统运维服务方案范文第5篇

关键词:Hyper-V;虚拟机;Oracle数据库

中图分类号:C93 文献标志码:A 文章编号:1673-291X(2012)06-0233-02

一、矿、队级Oracle数据库服务器管理面临的问题

随着厂内应用程序的推广加强,Oracle数据库的应用范围日益扩大,矿级Oracle数据库系统发挥的作用越来越大。在硬件方面,矿、大队的Oracle服务器基本上都是在2000—2001年配备的服务器,这部分机器服役时间长,硬件老化现象严重,正处于高危故障阶段,部分机型厂家早已停产,配件难寻,价格也很高,造成对这部分服务器的维修成本甚至会出现超出新购机器的现象;在软件方面,Oracle数据库软件在过去的十年里先后推出了V8、V9、10G、11G不同的版本,信息中心先后在矿队级单位推广应用了这些产品,不同版本的数据库管理界面与功能界面存在着一些差异,这些差异也加大了数据库在矿、队级层面的管理难度;在人员方面,信息中心要求1~7矿与试验大队配备专门的数据库管理员,而在实际工作中,这些管理员都是身兼多职并且工作量很大,导致矿队级单位对Oracle数据库系统维护比较吃力,经常遇到技术问题而无法解决,因此需要有一个全面的解决方案解决上述问题。

二、研究部署解决方案

全厂4 000多个局域网计算机用户,每天有大量的生产数据要进行处理运算,大部分是直接在厂数据库进行处理运算,但也有相当部分数据在各生产矿的Oracle数据库服务器上进行初步的计算,经过核实以后再上传到厂数据库服务器,如地质数据、站库数据、部分作业数据以及矿内自己开发的应用系统数据,因此,矿级生产数据仍是厂级开发生产的重要数据基础。

目前矿Oracle数据库服务器是在2000年配备的T350联想服务器,设备老化,故障率高,在2009年内八个矿有四个矿出现了服务器不正常工作,已经严重的影响生产数据情况。为解决上述问题,提出了三个方案:

方案1:建立一套Oracle数据库系统,按用户分配给八个采油矿。

方案2:硬件升级,给各矿分别配备新的服务器,建立多套Oracle数据库系统。

方案3:利用少量的服务器设备,采用微软虚拟服务器技术Hyper-V Server 2008r2,建立多套Oracle数据库系统。

通过论证分析对比,认为方案1节约开支,便于管理。但单一数据库资源有限,不能满足各矿的实际情况;方案2数据库资源充足,但维护难度加大,一次性投入高;方案3数据库资源充足,维护方便,初始投入不大,但技术难度相对较高。

通过比较分析,确定了实施方案3,针对矿级数据库应用范围的加大以及服务器维护难度逐年加大的问题,提出在信息中心建立统一管理部署的Oracle数据库主服务器系统,为各矿建立虚拟机Oracle数据库子系统方案,它不仅可以减轻二级单位服务器管理人员的工作强度,降低服务器维护成本,还可以统一数据库备份机制,加快数据库版本升级,提高运维效率。

利用微软的虚拟机技术搭建厂内的矿级Oracle数据库服务器管理平台,充分利用目前的先进技术,提高信息中心数据管理质量和对硬件设备的先瞻性管理。该项技术的应用可以提高Oracle数据库管理水平,完善矿级生产数据的备份制度。Oracle数据库虚拟机的部署在经过大量测试及试验的基础上,最终确定为选择Windows版的11G产品,该版本的数据库运行稳定、速度快、数据备份方便快捷。

方案3同时还具备如下优点:统一了服务器操作系统版本,统一了Oracle数据库版本,统一了数据库参数,统一了各个数据库的备份机制。

通过减少Oracle数据库的维护环节,保障各个数据库系统的高效运行。提高服务器资源的利用率,逻辑上的虚拟机可以最大限度的使用实体物理计算机的高性能硬件资源,降低硬件维护更新成本。

三、矿级Oracle数据库集中管理模式应用部署

为确保Oracle数据库从物理机到虚拟服务器的无缝迁移,首先要确保的是Hyper-V虚拟环境的性能及稳定性,为此,信息中心搭建了模拟环境进行了大量的试验与测试工作。其中压力测试表明,在服务器硬件足够强劲的基础上,可以并行20个不同的系统,此时服务器无明显的延迟现象,系统资源分配合理,系统内存使用80%,CPU占用低于10%(此数值会根据并行系统的运算能力而发生改变)。在应用测试方面建立了6个并行系统,其中有Windows Server 2003R2、2008R2,有基于X86,也有基于X64平台。这些应用系统运行平稳正常,事件日志没有特别的消息提示,网络数据交换、内存使用、CPU负载均在安全线以内,3个月的模拟运行表明,虚拟机中运行的Oracle数据库服务性能接近于硬件指标。

四、矿级Oracle数据库集中管理模式的主要优点

该项目的投入运行,可以减少矿级计算机服务器管理人员工作强度,对矿级Oracle数据库统一管理,减少因硬件原因而出现的数据访问故障发生的频率,降低服务器维护成本,减少给矿级单位配备服务器的支出。

1.减轻了矿级数据管理人员的工作量:在应用该平台之前,二级单位需配备专人维护服务器,建立服务备份机制,对生产数据进行手工备份,验证备份数据有效性,监控服务器硬件运行状态。实际上,二级单位对这部分资源的管理还存在一定的技术差距,加上机房岗位限制,在服务器系统管理上逐渐的显得力不从心,且负担很大。应用该平台之后,上述问题都由信息中心统一解决,二级单位只考虑应用而不用再考虑运维方面问题,减少了大量工作量同时也提高了工作效率。

2.方便了系统与数据的组织与备份工作:在项目实施后,统一了服务器系统版本,统一了数据库的版本,统一了数据库参数,统一了各个数据库的备份机制。通过减少Oracle数据库的维护环节,来保障各个数据库系统的高效运行。项目研制完成后可以有效的减轻二级单位服务器管理人员的数据库的技术性投入,在工作强度上也将大幅度减轻。

3.节约了大量的硬件资源及后续维护性费用:现在矿Oracle数据库服务器是在2000年进的T350联想服务器,设备严重老化,故障率相当高,有一定的风险,在2009年一年内8个矿有4个矿出现了服务器不正常工作,已经严重的影响生产数据情况。如果把矿级数据库服务器更换成高性能服务器数十万元,本项目实施后,不但节约了大量的一次性更新成本,还将节省维护费用。

4.不再受各矿网段干扰,运行更平稳:矿级数据库接替完成后,独立于各矿的生产网络环境,集中在厂核心服务器专用网段,有效的降低了病毒感染、恶性攻击的发生几率,使矿级数据库的系统故障发生率接近零。在矿级数据库服务器高效运行的同时,也在一定范围内提高了矿级生产数据应急预案的运行效率,保证了在极端环境下,能快速有效的恢复生产数据的正常传输、应用。

五、技术应用前景

Hyper-V带有内置网络与虚拟技术,旨在为组织所使用的服务器基础设施提供增强的可靠性和灵活性。它不仅可帮助企业降低成本、提高硬件虚拟化程度,同时还能优化基础架构,并改进服务器的可用性。Hyper-V具有的诸多优势会加快此技术在油田企业中规模化进行应用部署的进程,它对硬件资源分配是单一系统无法做到的。公司信息化工作刚开始时,硬件就落后于软件发展,经过这么多年升级换代后,硬件平台配置已经超过了软件系统,硬件资源平均利用率还不到10%,而 Hyper-V正是解决这一问题的根本所在,通过把硬件资源进行重新划分,即合理利用资源,又减少服务器购置数量,成本降低的同进也减少了维护性工作量。

六、结论与认识

Microsoft Windows Server虚拟化技术集成了多种特性,能解决众多高难度的虚拟化技术难题,其中包括:确保整合型服务器的安全,满足动态工作负载的需求,实现虚拟化工作负载的高性能运行以及简化管理等。WSv将高度的安全性与强大的虚拟机隔离技术完美结合在一起,使用户能在 WSv 主机服务器上整合异构工作负载的同时,还能确保灵活性和安全性。64位Hypervisor架构为WSv形成了坚固的基础,为高强度工作负载提供了高性能。此外,Windows Server 2008、System Center Operations Manager以及System Center Virtual Machine Manager等还拥有功能强大的集成管理特性,能够在各种不同虚拟化环境中实现高效率的自动化控制。虽然功能强大,但Hyper-V也有某些不足之处,它不能构架在32位平台上,对CPU也要求虚拟功能支持,不能提供单独的USB设备访问功能。但瑕不掩瑜,合理的管理与部署此项技术,对于解决硬件资源紧张、提高硬件利用率、降低硬件购置成本等问题提供了一个切实可行的解决方案。

参考文献: