首页 > 文章中心 > 数据运维管理

数据运维管理

数据运维管理

数据运维管理范文第1篇

一、运维管理流程

1.规划数据中心运维体系,提高各流程的集成性和可执行性,建立流程改进路线图

回顾运维管理流程的继承性和可执行性,和组织角色定义结合,完善流程的接口和衔接。定义服务交付管理流程要素,并制定服务流程建设和改进路线图,分级分步的进行,使其渐进形成可预测,可用和可度量(级别,成本等)的服务管理流程体系。支持未来服务级别、服务目录等面向服务的IT技术设施运营模式。

2.建立基于流程的运维工作管理办法,规范化流程的执行和日常工作,平滑流程的衔接

应建立运维工作管理办法,达成面向服务的数据中心运维职能和管理模型,形成数据中心运营,支持,行政,管理的职能;达成基于流程的数据中心运维管理过程,包括事件,问题,变更,,配置等管理流程和日常工作的融合。

运维工作管理办法应建立较完善的数据中心运维管理过程,包括运维中的主要工作和管理过程;过程间的接口;运维管理服务过程的关键保障环节。

上述职能,模型,过程要以数据中心运维管理制度和规范的形式落地,这些制度和规范包括操作规程,设备管理,机房管理,安全管理,服务支持,外包管理,行政管理,灾备管理等等。

3.建立统一的系统的应急管理办法

应急管理已经是现代企业,特别是金融企业不可或缺的管理工作。IT运维同样需要应急管理流程来提高应急处理的有效性和及时性。IT技术设施的应急管理,需要把业务的应急管理要求协同到IT基础设施上。从组织,职责,流程,技术等方面,建立数据中心应急管理办法。应急管理办法总体需求包括:

(1)数据中心应急管理办法――规定总体事件分级,报告,处理,职责等;

(2)应急预案――定义具体业务系统、设施、事件应急处理过程;

(3)和灾备管理的衔接。

应急管理办法的主要内容应包括:事件分级、处理流程、组织体系和职责、处理资源、应急演练等。最后应急管理办法中还应包括实施贯彻建议,包括培训,宣贯,演练等。

二、运维管理技术工具

全面规划集中的统一的运维监控平台,尽可能覆盖企业现有IT基础设施,包括主机设备、网络设备、存储设备、备份设备、数据库、中间件、应用软件、桌面系统等;尽可能考虑对现有监控系统(包括业务监控系统)的集成;集中化管理提供故障处理、配置数据处理、性能监控等标准的系统监控功能,同时进行数据分析和整合,并以适当的形式进行呈现,支持维护人员进行的故障定位、诊断和解决,同时为运维管理提供基本信息;统一的平台提供统一的配置管理数据库,统一的管控流程;统一展现;统一分析处理;统一采集;

监控指标体系规划,分为平台和业务两部分,平台包括生产系统的网络设备、主机、中间件、数据库、存储和备份设备,业务为各类业务系统;监控指标需要包含定性的和定量的;反映监控对象工作是否正常的功能指标;反映监控对象工作性能的指标;反映监控对象资源使用情况的指标;反映监控对象安全状态的指标等。监控指标体系是对整个监控对象技术状态的静态和动态的量化描述,通过监控指标体系的阈值定义,也是刻画整个监控对象正常运行的范围;监控指标体系的规划要综合考虑业务要求,技术特性,设备配置和业界最佳实践;同时,监控指标体系也应该能随同事件/问题处理的积累进行调整,逐步加强指标体系对预测的支持;

监控系统布署规划;对监控体系框架中不同的层次(数据层、采集层、功能层和展现层)的部署规划,包括部署的部件、位置、配置、接口、网络配置(需求)等。部署当中要考虑到多地区部署、跨地区部署、部署变更、配置管理等因素;

自动化运维监控管理技术建议。根据一体化信息监管平台建设的需要,将运维管理系统按功能划分进行现有主流产品及集成分析,推出产品选型原则。这些功能要覆盖业务服务管理平台、网管平台、安全管理平台、桌面管理平台;服务流程管理平台及自动化运维管理平台;统一的资产配置数据库,资产生命周期管理;服务交付管理平台等主要部分;从集成框架和要求出发,从技术接口、协议标准、服务咨询、技术开发等方面,对主流产品的集成能力进行分析建议,并适时进行一体化监控平台的建设路线。

三、运维管理组织

1.在IT服务管理体系中规划服务组织,定义角色,角色职责,接口。整个服务组织规划中要考虑:

(1)层次化管理功能:在集团,分支机构营业部,子公司等不同层次上,不同组织特性上,分层组织功能;

(2)集中和分散的平衡:统一指挥,分级管理;

(3)面向服务的IT运维管理功能结构:从面向服务的IT运维架构出发,建立运行、支持、行政、管理等围绕服务提供的组织功能;

(4)流程导向是基于流程管理的运维组织架构:建立组织架构和事件管理,问题管理,变更管理,配置管理等服务管理流程的协同;

(5)各组织功能描述,各组织间接口定义;沟通与配合渠道;

(6)岗位定义,岗位职责和工作内容,考评,岗位培训计划。

2.规划数据中心运维体系,提高各流程的集成性和可执行性,建立流程改进路线图。回顾运维管理流程的继承性和可执行性,和组织角色定义结合,完善流程的接口和衔接。定义服务交付管理流程要素,并制定服务流程建设和改进路线图,分级分步的进行,使其渐进形成可预测,可用和可度量(级别,成本等)的服务管理流程体系。支持未来服务级别、服务目录等面向服务的IT技术设施运营模式。

3.建立基于流程的运维工作管理办法,规范化流程的执行和日常工作,平滑流程的衔接。应建立运维工作管理办法,达成面向服务的数据中心运维职能和管理模型,形成数据中心运营,支持,行政,管理的职能;达成基于流程的数据中心运维管理过程,包括事件,问题,变更,,配置等管理流程和日常工作的融合。运维工作管理办法应建立较完善的数据中心运维管理过程,包括运维中的主要工作和管理过程;过程间的接口;运维管理服务过程的关键保障环节。上述职能,模型,过程要以数据中心运维管理制度和规范的形式落地,这些制度和规范包括操作规程,设备管理,机房管理,安全管理,服务支持,运维管理,行政管理,灾备管理等等。

4.建立统一的系统的应急管理办法。应急管理已经是现代企业,特别是金融企业不可或缺的管理工作。IT运维同样需要应急管理流程来提高应急处理的有效性和及时性。IT技术设施的应急管理,需要把业务的应急管理要求协同到IT基础设施上。从组织,职责,流程,技术等方面,建立数据中心应急管理办法。应急管理办法总体需求包括:

(1)数据中心应急管理办法――规定总体事件分级,报告,处理,职责等;

(2)应急预案――定义具体业务系统、设施、事件应急处理过程;

(3)和灾备管理的衔接。

应急管理办法的主要内容应包括:事件分级、处理流程、组织体系和职责、处理资源、应急演练等。最后应急管理办法中还应包括实施贯彻建议,包括培训,宣贯,演练等。

四、运维管理体系中的PDCA

为实现现代企业数据运行中心的云计算及大数据技术的蓝图规划,我们可以从流程、工具、技术及数据的标准化入手,不断完善IT运维管理体系,最终使其满足企业业务发展需求,并且完成IT技术引领业务发展的目标。而本文作者想强调的是,我们完全可以借助PDCA管理方法,缩短优化这一改进过程。

企业数据中心的建设管理体系,可分为战略管理、实施管理、运维管理,这三种管理均可通过PDCA的方法进行管理优化。

1.数据中心战略管理(P)

数据中心建设管理规划是企业信息化建设的关键,其必须符合信息化建设的总体方针和战略。因此企业数据中心的建设管理规划可涵盖以下几点:

(1)评估企业未来的业务发展战略目标;

(2)评估企业业务流程再造的可能性及具体需求;

(3)分析调研数据中心对于改进业务流程的关键支撑点;

(4)确定该企业数据中心的战略目标;

(5)本企业数据中心技术发展现状以及同业数据中心情况调研;

(6)确定数据中心未来发展的体系架构(包括硬件环境及应用系统)和运维管理模式;

(7)对数据中心现状和目标的管理模式和技术架构进行差异化分析;

(8)分析如何实现数据中心建设管理目标,并制定实施计划。

2.数据中心实施管理(D)

企业数据中心的实施管理应包括硬件环境部署、网络环境部署、业务系统实施、应用系统升级等方面的工作。所有的实施内容都应遵循数据中心的建设管理战略规划(P),并严格按照制度流程,规范化、标准化的进行实施作业。我们可参照项目管理中通常使用的管理方法,对数据中心的实施管理进行相关的操作。

3.数据中心运维管理(C & A)

数据中心运维管理的重点是确保各业务系统的安全稳定运行,保障应用系统的业务连续性,并提供给客户高效准确的信息化服务。生产系统必须具备高可用功能,如双机热备、集群管理等,并且当业务系统出现故障时,应该能够尽快恢复正常的生产运行。对应于PDCA管理方法,数据中心的运维管理可分为监控管理和变更管理。

数据运维管理范文第2篇

【关键词】综合数据网;运维管理;研究

0.概述

当前,电力能源在人类的生活中占有着重要的地位,电力供电需求也越来越大,导致用电方面的矛盾相对凸显。变电站作为整个电网输配电调度体系中最重要的环节,同样面临着调度智能化及信息化不断提升需求,为了保证变电站的调度及信息系统的正常运行及维护电网的正常工作,大多数电网企业均依托信息化手段建设了变电站综合数据网,有效的保证变电站电力资源的高效调度。在目前的现实应用中,变电站综合数据网管理也是架构信息化电力系统管理的基础平台。任何一个系统,都具有其优点,也存在一定的缺点,对于变电站综合数据网而言,同样存在一定的问题需要进行及时的发现并维护,才能保证系统的高效运行。为了有效的推动电力系统的运行,加强变电站综合数据网的运行维护管理,是电力系统设备管理研究中必不可少的重要部分。

在某电网供电局的变电站运行体系中,综合数据网作为变电站各类应用系统正常运行的网络基础,承载着该局下辖的100多座变电站的生产管理系统、办公自动化系统、软交换系统、变电站各类在线监测系统、图像监控系统等应用系统的业务流量;每个变电站都配备了综合数据网网络交换机,用于接入并传输各变电站应用系统流量,这些变电站的综合数据网流量均汇聚至供电局变电站综合数据网的核心设备,这些变电站综合数据网在运的交换机设备均已过保。如变电站综合数据网出现故障,必须及时检查处理,消除缺陷。为确保该供电局变电站综合数据网络的正常可靠运行,必须对变电站网络开展维保,本文将以该局情况为例,对电网企业变电站综合数据网运维管理中存在的问题进行探讨。

1.电力综合数据网的特点

电力综合数据网主要由电力调度数据网和电力综合业务数据网两个独立的数据网络构成。在电力行业的信息化管理服务中,电力综合数据网络是主要的传输网络。它包含着以下几个方面的特点:

1.1网络覆盖广

在信息化时代,对于电力企业而言,设备管理水平对相关的信息技术和信息管理系统完善的依赖变得越来越强。综合数据网作为信息化系统的基础,能够及时将电力系统内各厂站、收费厅和变电站等生产营业场所的数据进行传输,保证系统实现真正的信息化,其网络覆盖面将会越来越广。

1.2设备管理智能化

在电力综合数据网中,对设备管理实现了智能化。在智能化条件下,设备管理人员只需要观察相关设备的性能参数的变化,就能对设备的情况进行有效的掌握,当设备发生故障时,系统也会自动的给出预警信息并进行相应的处置,使得设备管理人员能及时对故障采取排除措施。

1.3网络运维要求高

对于该局而言,在电力综合数据网中,网络的安全性要求较高,必须要采取加强网络安全性的措施,对网络潜在的安全隐患及时发现并消除,提高网络的稳定性、可靠性和安全性,这就需要运维人员做好相应变电站和供电所现场设备巡检与运维工作;保证网络设备24小时不间断的稳定运行,实现生产MIS业务不中断。同时要求对网络故障及时响应,保障人员及备件能及时到位,保证网络系统出现故障时,能在最短时间内得到恢复。如此高的要求也是变电站系统综合数据网网络运维的主要特点之一。

2.影响综合数据网运维管理的因素

在电力企业的发展中,根本的原则是要保证电力设备能够安全高效的运行。对于供电局变电站综合数据网络管理而言,只有实现对综合数据网的高效运维管理,才能有效的保证电力设备的安全高效运行。运维管理主要是在规划管理的基础上,结合现有的电力和网络信息技术手段,对网络设备进行适当的配置,提高设备的生产利用水平,这样才能促进企业的发展。结合目前供电局变电站的运行情况,对影响综合数据网运维管理工作水平的因素进行分析,主要有如下几个方面的制约:

2.1技术管理手段不强

目前,由于电力企业的变电站综合数据网网络覆盖的范围都是以单个站点为单位,网络设备的数量与日增多,网络结构也越来越复杂。

此供电局所辖100多座变电站的本地局域网分别通过地区泰科、华为光环网和租用运营商2M链路的方式接入到供电局局域网,在供电局大楼传输机房落地后,汇入供电局变电站网络汇聚层交换机。变电站所使用的综合数据网交换机并没有统一设备类型,并且承载流量的传输网络也不是同一种技术和设备,随着变电站接入的设备及业务类型不断增多,使得综合数据网承载的网络流量不断增大,整个网络不断复杂化。以上因素都会导致综合数据网的网络运维管理难度直线上升。而实际上由于缺乏有效的技术手段做支撑,仅仅依靠有限的管理人员进行运维管理,使得管理水平没有达到相应的高度,导致运维管理效果较低。

2.2管理人员技术力量不足

在该局的电力综合数据网络运行维护中,需要针对该局所辖的变电站、集控站的生产MIS接入交换机进行分片区巡视检查工作,确保设备及系统运行正常。主要工作包括:

(1)对设备进行日常硬件检查。

(2)查看设备日志,发现设备潜在问题,并及时解决。

(3)记录设备CPU和设备内存利用率,以及时发现设备或网络潜在的问题。

(4)检查设备端口可用性和设备指示灯的正常性。

(5)检测设备运行状况,及时解决因设备故障而导致的业务中断。

(6)检查MIS生产业务的可用性,确保业务运行正常。

(7)检查设备的上行链路状态,保证上行链路可用。

(8)检查设备基本配置是否完整可靠并备份。

(9)确保设备安全,及时发现、处理设备故障和隐患,保障现场生产的稳步运行。

(10)网络系统运行中如发现问题及时做相应处理,保证网络系统的正常稳定运行。

以上工作都是电网企业变电站综合数据网运维管理工作的内容,要想将如此繁多的运行维护内容做好,不仅需要具备全面的管理人才,而且还需要大量拥有相关知识的技术人员才能实现。但是在实际的运维工作中,由于人员的流动性较大,专业素养水平高的运维管理人员和水平高的技术人员几乎不存在,导致在运维工作的开展中,运维人员数量不足、管理人员素质不高和运维人员技术水平并不牢固,导致运维管理工作并没有取得重要发展,更谈不上运维工作水平有效提升,运维工作没有得到很好的开展。

2.3数据信息分享平台欠缺

在信息化管理中,最重要的就是工作人员对于电网运行数据信息要及时掌握,因此,需要实现数据信息的分享,才能保证彼此能够高效协作,更好的完成整个电力综合数据网络的管理。在电力企业综合数据网日常运维工作中,需要通过建设统一信息平台,实时最新综合数据网运行情况拓扑图,并提供自助网络测试等功能,进而为综合数据网运行维护提供有效的信息数据,进而形成透明化的整体网络运维管理,促进综合数据网的运维与管理,但现阶段并没有功能完善的数据信息分项平台。

3.综合数据网运维管理的发展前景

3.1加强技术管理手段

在变电站综合数据网运维管理工作的发展中,通过技术手段的改善,提升综合数据网的运维管理效率,是一个十分重要的步骤。如部署网络流量监控设备能及时观察网络性能的好坏,对综合数据网网络流量进行有效控制,确保网络稳定、高效的运行。尤其是对综合数据网的设备互联端口进行流量监控,能帮助判断网络故障及网络安全等状况,进而使得运维工作人员及时采取有效的技术手段进行管控,保证整个电力数据网络正常工作,促进网络管理水平的提升。

3.2加强综合数据网运维人员的素质培养

结合平时在综合数据网运维工作中出现的人员技术力量不足的问题,可以采取相关的拓展培训课程,依据运维工作的实际需要对运维人员进行培训,具体的培训内容应从网络基础、数据结构、数据分析以及电力专业知识等方面入手,使他们首先能认清电力供应正常的重要性,加强自己思想方面的重视。其次,应积极学习专业知识,提升使用和维护系统的能力,积极提升他们的实际工作水平,使他们能很快适应日益更新的电力通信系统,促进综合数据网运维管理工作水平的提升。

3.3加强信息共享措施

在综合数据网运维工作中,积极利用其它方面的信息,整合数据信息系统,建设专门的数据信息的分享平台,实时的综合数据网运行情况的拓扑图,使得这些数据信息能够保证电力的正常运行,同时,也能促进相关的运维人员对网络进行有效的维护。

4.总结

对于变电站而言,综合数据网运维工作水平的效率,对于变电站的电力供应和调节工作有着决定作用。因此,相关运维人员应积极认识运维工作的重要性,采取有效的措施提升综合数据网运维工作水平,促进电力信息化水平的进一步提升。

【参考文献】

[1]谷明英,张雁,魏明海.陕西电力通信网运维管理模型研究[J].电力系统通信,2012,05:70-75.

数据运维管理范文第3篇

关键词:大数据;风电场;运维管理;应用前景

大数据是需要新处理模式才能够具有更强的决策力、洞察力和流程优化能力,从而适应多元化的信息资产。大数据时代的到来,风电场装机容量逐渐增大,电力网架比例不断攀升,机组设备不断更新,对风电场运维提出了新的要求。因此加大力度探讨大数据在风电场运维管理中的应用,在推进风电事业发展方面具有重要的现实意义。

1 风电场运维管理的特点

风电场建设往往规模大,分布区域相对广阔,随着设备配件的不断更新,运维管理过程中存在一些不容忽视的特点。

1.1 设备台数多,高空作业难度大

每一个风机都是一个发电单元,故障几率大,工作点分散,再加上风电场多分布在广阔的野外,地域宽广,给工作人员操作带来了极大的困难;其次,风机作业属于高空作业,每次都需要爬至少70米高的塔筒,作业面狭窄,相对地面有一定危险性,极大的工作强度造成一定的压力;另外,从电气、机械到自动化,风机虽小,五脏俱全,所有的发电系统及能量传动链都需要同一批人员维修维护,对人员的素质及经验有一定的要求。因此,多种因素导致风电场运维管理难度大,在一定程度上给风电场后期生产运维造成了很多不确定因素。

1.2 岗位条件差,运维管理人才少

目前而言,我国风电场规模在逐步扩大,但从发展进程来看我国风电行业仅仅处于初始阶段,工作岗位不稳定,不能有效的吸收具有专业才能大学生的目光,由于地处偏远地区,工作条件差。另外,风电场设备较多,不仅需要专业才能,更需要长期的工作经验和积累,而许多风电场建在高山峻岭的偏远之地,恶劣的工作条件,让很多有着丰富经验和精湛技术的工作人员望而却步,最终导致越是偏远地区运维管理人才越稀缺,无法满足运维管理工作需求,给风电场的安全管理埋下隐患。

1.3 运维管理模式旧

风电产业在中国的发展仅仅二三十年的历程,各种管理还处于摸索阶段,就目前而言,我国风电场的前身是火电厂,在风电场的运维管理中,管理模式多采用原有火电厂的管理模式进行,然而风电场与火电厂相比,在设备运行上存在很大差别,这种“拿来主义”无法实现运维管理工作的最优化。

2 大数据在风电场运维管理中的应用

2.1 提高风电的可靠性

在现代信息技术发展环境下,大数据在风电场运维管理中的有效应用,促进了大数据分析与天气建模技术的有机融合,全面提高能源电力系统的稳定性,从而保障风电场运行及维护的可靠性。传统模式下,风能资源预测精准度较低,风能无法贡献预期功力时,需要以火电作为后备力量。此种情况下,电网往往对风电的依赖程度较高,导致风电场建设后备电站的成本较高。一旦启用火电站,就不免会向大气环境内释放一定量的碳排。而大数据时代的到来,数据分析精准度更高,数据分析速度更快,基于温度、湿度、降雨量、风向和风力等变量能够对风电进行精准预测,便于电网调度人员结合风电场实际情况及时做好调度安排,从而有效提高风电场运维管理的有效性。

2.2 改善风机性能,实现风电场效益最大化

通过大数据在风电场运维管理中的有效应用,便于相关工作人员对风机的运转数据以及风电场运营数据进行准确的检测和采集,进一步改善风机性能。风电场相关数据信息往往分散于风机制造商、风场业主、系统运营商以及运维服务商等多个环节内部,大数据的有效应用,有助于实现利益的合理分配,为风电场业主追求效益最大化提供可靠的依据。

2.3 细化风电场运维管理基础性工作

就设备管理方面来看,大数据在风电场运维管理中的有效应用,有助于规范风电场建设中的相关操作,充分做好设备选型及风电场规划工作,并加强风电场设备的重点维护管理,通过对大数据技术的有效应用,定期组织开展检测和检修工作,降低风电场设备的故障发生率,保障风电场设备的安全稳定运行。由于风机其所处环境恶劣,维修检测困难,导致设备运维管理中的难度较大。而大数据的有效应用,有助于及早发现风电场设备运维管理中的异常情况,早发现早处理,及时排出风电场安全隐患。

就技术管理方面来看,大数据的有效应用,便于将风电场运维管理的具体情况进行准确的记录,促进标准化、模板化的运维管理方式的形成,从而确保在第一时间排查风电场故障问题,并建立动态的信息系统,应用于归档记录和查询,为后期风电场运维管理提供可靠的依据。

2.4 转变管理模式,充分发掘风电场运维管理综合效益

大数据在风电场运维管理中的有效应用,促进了集控式、智能化管理模式的形成,一定程度上转变了风电场运维管理中的资源配置方式和技术支持特点,促进资源优化整合,实现风电场业务整合一体化运作,促进集控管理、协作制约的管理模式的形成,提高了风电场远程监控的有效性。大数据技术在风电场运维管理中的有效应用,便于及时发送风电场预警信息和故障信息,在实际运行过程中有效的提高了工作效率,节约企业成本,提高资金回笼的效率,全面提高企业的综合实力,充分发掘风电场运维管理的综合效益,推进风电事业的稳定发展。

随着大数据技术在风电场运维管理中的有效运用,未来风电场的管理模式将更加趋向于数字化、网络化和智能化,融入多项高科技技术,积极引进先进的管理理念,并采用现代化的管理方式,全面提高风电场运维管理效率和管理水平。通过网络视频功能指导风机维修操作,并通过远程操控为风电场事故提供解决方案,并结合风电场的实际情况,积极制定高校的预防措施,通过对大数据的有效应用,基于智能化操作系统对风电场进行科学合理的故障诊断,将风电场事故发生率降到最低,在此基础上,将风电场风机运行与电网协同进行柴油机结合,准确高效的完成电网调度指令,通过对大数据的有效运用,加强风电场运维管理的智能化和精细化,从整体上推进未来风电场的稳定发展。

结束语

风电场运维管理工作的顺利开展,应当基于当前风电场的实际情况,加强风电设备、技术及操作人员等方面的运维管理,积极探索大数据时代下的运维方式,积极加强技术创新,坚持与时俱进,充分发挥大数据在风电场运维管理工作中的应用价值,为企业潜能的发挥提供可靠的保障,推进风电事业的稳定发展。

参考文献

[1]姚剑平.浅论风电场日常管理中的四个关键控制项[A].中国农业机械工业协会风能设备分会2011年度论文集(上)[C].2011.

数据运维管理范文第4篇

0 引言

为了提升中国大唐集团公司(以下简称大唐集团)“数字燃料”管控平台运维工作管理水平,实现“数字燃料”管控平台运维工作的制度化、标准化、流程化、规范化,根据中国大唐集团公司“数字燃料”管控平台建设特点和业务特点,湖南大唐先一科技有限公司(以下简称大唐先一)成立“数字燃料”管控平台运维中心,设计适用于“数字燃料”管控平台的运维运维体系,从而实现运维管理目标,并有效支撑“数字燃料”管控平台长期稳定运行,为用户提供更快、更优质的运维技术服务。

1 “数字燃料”管控平台建设特点

大唐集团“数字燃料”管控平台实现了燃料收、耗、存环节的全过程管理,并且把燃料的量、质、价等数据及时、动态、准确地传递到相关管理信息系统,借助信息化软硬设备,使燃料管理过程科学规范,堵塞了管理漏洞,减少人为干扰,降低劳动强度,企业生产经营决策得到真实可靠的数据支撑,保障企业效益快速增长。

大唐集团“数字燃料”管控平台全方位、多层次、系统性的考虑了燃煤从入厂煤场化验室的总体框架和内容,同时对燃料管理从燃煤计划、入厂、堆取、掺配、制样、化验、统计等进行了全过程管理,对影响燃料数据的人员、设备、环境等因素等进行了过程控制,并且依据大唐集团下发的燃料管理制度和办法,对燃料的过程管理和标准化流程管理进行了精心设计,每个操作环节和流程都保留了操作痕迹。

2 “数字燃料”管控平台运维管理体系

基于“数字燃料”管控平台的建设特点和业务功能特点,本文从运维的作用、运维组织架构、运维管理制度和工作流程、运维事件和故障处理工作流程、业务变更及流程和运维监测体系等六个方面详细介绍“数字燃料”管控平台运维管理体系。

2.1 运维的作用

“数字燃料”管控平台作为大型的软硬件系统平台完成部署后进入系统运行阶段,为了保障“数字燃料”管控平台能够运行稳定,系统业务逻辑正确,各种业务数据和错误信息能够及时有效地处理,在“数字燃料”管控平台进入运行阶段后还有大量的维护工作需要完成。

“数字燃料”管控平台的运维工作主要包括对硬件设备部分和软件集成部分的运维。其中硬件设备维护包括生产类设备和信息类设备的维护,生产类设备指用于实现燃料采制化流程的运行设备,包括采样机、汽车衡、轨道衡、衡器附属设备、斗轮机识址设备、皮带秤、制样设备、化验设备、测高装置、防作弊设备、视频设备、门禁设备和存样柜等,需要进行定期维护保养,延长设备使用寿命和提高设备使用效率;信息类设备主要用于实现燃料数据信息化所需的相关辅助设备,包括计算机服务器、网络设备、无线AP、台式电脑、隔离网闸、数采通、打印机、扫描枪、存储设备、短信猫和读卡器等,需要定期进行巡检,记录设备的运行状态,并及时维护设备故障和缺陷。软件集成维护包括生产类设备上位机控制软件集成维护、接口软件的维护、“数字燃料”管控平台的集成维护和量质价数据校验维护。

2.2 运维组织架构

大唐先一依据“数字燃料”管控平台的建设要求,“数字燃料”管控平台运维体系以“两级两线”为基础,设置相应的“数字燃料”管控平台运维岗位和运维人员,明确岗位职责和运维服务内容。

其中,“两级”是指建设大唐先一燃料运维服务监控与管理中心和五个区域级技术服务团队的两级运维服务组织机构,“两线”是指搭建“一线负责系统运行维护、二线负责技术支持”的双层稳固的运维技术服务体系。

为了集中优势技术服务力量,体现专业化服务原则,在大唐先一本部设立的一级“燃料运维服务监控与管理中心”为运维管控层,全面负责整体运维管理工作,包含运维体系的建立,运维事件调度、协调、评审,运维问题处置等运维管理工作;“数字燃料”管控平台运维的第二级为运维执行层,具体工作由五个区域级技术服务团队承担,区域运维团队负责收集和整理电厂层存在的具体问题,然后根据职能划分反馈至公司相应的组织团队提供技术支持并解决问题,最后由公司质量组和回访组落实问题的处理结果和客户满意度回访。

根据对“数字燃料”管控平台的运维需求,一线运维主要由运行组负责,对包括计算机网络设备和“数字燃料”管控平台进行技术支持和运维;二线运维主要由与“数字燃料”管控平台有关的其他软硬件平台厂商提供技术支持,如采样机、汽车衡、轨道衡、皮带秤、识址计量等采制化设备硬件运维和上位机控制软件平台的技术运维支持。

2.3 运维管理制度

根据大唐集团有关规定,制定出标准统一、逻辑有序、执行力强的“数字燃料”管控平台运维管理制度和规范的工作流程,通过创新管理制度和优化工作流程,使得运维服务队伍的管理水平和服务质量得以有效提升。

“数字燃料”管控平台运维服务工作主要分为系统业务运维和系统运行运维。其中系统业务运维主要通过电话、E-Mail、传真或者其他远程支持方式解答平台业务类问题,指导基层电厂用户快速定位问题并使之获得有效解决;系统运行运维主要是监控系统平台日常运行情况,以及处理日常巡检中出现的运行异常情况,记录巡检日志,使得“数字燃料”管控平台可靠稳定运行、硬件设备的缺陷和故障处理跟踪都得到可控在控。

大唐先一燃料运维服务监控和管理中心建立了一套规范化、流程化和标准化的运维管理制度和操作规程,建立了包括系统运行管理、安全管理、存储备份管理、网络管理、故障管理、培训管理和应急管理等运行维护工作制度。运维工作按照制定的管理制度和操作规程执行,实现各基层电厂“数字燃料”管控平台运维工作标准规范、运维质量可靠稳定。

2.4 运维事件和故障处理工作流程

“数字燃料”管控平台运维事件和故障处理工作流程如图2所示。

2.4.1 事件、问题或故障接收

在“数字燃料”管控平台日常巡检和运行监控过程中,由系统运行组把发现的系统缺陷、故障/问题,在公司PMS录入并分类划分为一般事件、问题或故障,根据处理级别配置对应的优先级,再根据流程将故障流转到对应的人员。

2.4.2 事件处理

一般事件由系统运行组负责处理,处置过程中发现不能解决时可向燃料运维服务监控管理中心申请提供技术支持,并可由燃料运维服务监控管理中心协调二线软硬件平台厂商和区域运维服务团队提供远程或者现场技术支持,要求系统运行组在事件处理完成后编制或者更新技术文档,并对事件处理相关细节进行。事件如果演变成问题或故障,该事件处理则按照问题或者故障处置办法进行处理。

2.4.3 问题或故障处理

系统运行过程中出现的问题或者故障需要上报至燃料运维服务监控管理中心,启动应急预案流程,并对应急人员和物资进行统一调度安排,投入相关资源进行进行应急处理,现场技术支持由二线软硬件平台厂商和区域服务团队组织并在第一时间介入处理,应急处理完成后,问题或故障处理的技术文档和应急处置报告由区域服务团队负责编制提交。一线运行组成员和区域运维服务团队应结合故障现象、处置过程、故障分析得出结论,并通过报告的方式向燃料运维服务监控管理中心进行汇报,区域运维服务团队同时更新应急处置预案并处置结果。

2.5 业务变更及流程

“数字燃料”管控平台业务变更及流程如图3所示。

2.5.1 接收业务变更

电厂关键用户向分公司分管部门提交业务变更申请,分公司审核通过后提交给大唐集团公司分管部门完成审批,系统运行组或者区域运维服务团队接收电厂的业务变更申请单和批复内容,并在PMS中记录业务变更内容。

2.5.2 实施业务变更

业务组从PMS中读取业务变更内容,编制计划并提交审核,燃料运维服务监控管理中心审核通过后,由业务组和研发组根据业务变更内容分别编写业务设计和功能设计,并且要与电厂方关键用户在业务需求理解上达成一致,防止需求分析和业务设计偏离实际,研发组在公司进行研发和单元测试,业务组进行系统功能验证。

2.5.3 业务变更

系统运行人员取得通过测试的程序版本后更新至现场测试环境,电厂关键用户按照业务组编写的测试用例进行测试验证,系统运行人员更新用户使用手册并提交燃料运维服务监控和管理中心完成审核,电厂关键用户测试验证通过后,由系统运行人员在电厂的生产系统中完成程序版本的更新和配置,并对更新配置信息进行记录归档。

2.5.4 结束业务变更

文档资料统一由质量组进行整理并归档。最后,系统运行组反馈基层电厂用户并关闭该变更事件,同时,系统运行组要对关键用户和最终用户进行系统操作培训。客户回访组确定完成情况并完成客户满意度调查。

2.6 运维监测体系

建立标准化、流程化的运维监测体系并有效运转,保证“数字燃料”管控平台在基层电厂应用过程中出现的业务和技术层面的问题/故障能够得到及时发现和处理,减少运行维护人员从事简单重复的周期性工作。通过建立定时检查和日巡查机制,对所有需要检查的计算机网络设备、采制化设备、系统平台等,明确检查方法、内容、标准、周期以及责任人,在日常巡检过程中,要求运维服务人员主动分析各类设备和系统平台是否存在管理和技术问题,并分类整理上报PMIS,保证对事件和问题快速跟踪和消除隐患。

依据运维监测体系建设要求,还进一步制定了运维指标考核标准。主要分为了业务和运行两大类。其中业务类考核指标主要从“数字燃料”管控平台的事件处理的及时率、规范率、解决率三方面进行考核监测;运行类考核指标主要进行量化考核监测,包括非法启停系统次数、安全事故发生次数、未处理系统问题故障次数和不规范进行系统更新操作次数。通过建立指标量化、考评合理的运维监测体系,保障了大唐集团“数字燃料”运维服务管理工作的可视可控和在控。

数据运维管理范文第5篇

【关键词】分布式 通信网络 运维管理

随着我国信息化建设的快速推进,各类通信和计算机网络的规模持续扩大,技术体系不断更新,应用服务的种类日益增多,网络运行维护管理的难度大大增加。光缆网、卫星网、移动网、电话网、数据专网、互联网等网系的运维模式、评估体系和管理手段差异较大,通信管理部门对全网进行集中监控和统一调度的难度较高,无法有效掌控全网运行态势和信息资源。为解决以上问题,可综合利用现有资源和技术手段,建设基于B/S模式的分布式通信网络运维管理系统,为各专业网系运维管理提供统一的接入、存储处理和操作平台,实现全网运行态势的集中显示、信息资源的统一管理和性能指标的综合评估。

一、主要功能

(一)网络运行管理

以B/S模式在统一的平台上实时显示光缆网、卫星网、电话网、移动网和互联网等网系的运行情况,以图形化的方式呈现局站、节点、线路的拓扑结构、网络组织、告警和故障等信息,可从设备侧提取网络运行实时告警并进行分析处理,自动生成或手工录入故障报告,并提供地图缩放与拖拽、距离和面积测量、分级显示和图层筛选等功能。

(二)网络性能分析

系统自动从设备侧提取网络运行质量数据,并可根据用户设置的性能门限、检查指标等参数进行综合分析,将结果按照时间、单位等自定义条件以图表的方式集中呈现和报表输出。

(三)网络资源管理

可以按系统、按局站、按节点查看系统基本信息,包括代号、容量、制式、通达方向等;可管理通道资源、线路资源、地址资源、频率资源、号码资源、中继链路和中继路由,以及维修机构、维护器材、维护力量等信息,提供便捷的录入、修改、查询和统计功能,实现对各网系物理资源、逻辑资源和维护资源的综合管理。

二、系统结构与组成

系统可根据现有网络运维管理体制,采取分级分布的组织形式,依托数据专网,分两至三级部署,其物理结构如图1所示。

通信管理部门部署全部类型的服务器和用户终端,各级维护机构仅部署WEB服务器、数据库服务器和用户终端;GIS服务器和适配服务器为各级用户提供集中化的后台服务,各专业网管系统和管理终端通过数据专网与适配服务器进行交互,经系统处理后分发至各级数据库服务器;通信管理部门的数据库服务器存储完整的运维管理数据,维护机构数据库服务器仅存储与本单位相关的运维管理数据,各级数据库采取数据同步机制保持一致性;各级WEB服务器仅为本级用户提供信息服务,并与本级数据库服务器做1+1备份。

系统在逻辑上可分为设备层、服务层和应用层,其结构如图2所示。

各专业网管系统的运维数据和告警信息,由适配服务器中的适配模块和数据告警采集模块通过数据专网提交给数据库服务器和WEB服务器,WEB服务器通过加载GIS服务器上的地图引擎,利用WebSocket把数据库中的信息实时展现在电子地图和动态图表上,用户根据需要即可进行查询统计、资源管理和信息等操作。

三、技术实现

(一)数据采集与适配

数据采集和适配主要包括数据的收集、整理和预处理,采用消息服务机制作为各模块之间通信的数据总线,保证数据采集、分析、汇总、核查、补差等一系列工作的迅速稳定。各专业网管系统数据通过CORBA、DB、SNMP和WebService等接口提交给数据采集、告警接收和数据分析等模块,各模块之间通过消息服务机制对原始数据进行分析处理并存入数据库,同时将告警信息通过WebSocket推送给前台,显示在用户界面上。

(二)B/S架构

系统采用B/S模式运作,用户通过WWW浏览器即可访问Web服务器上的各类数据和信息,结合WebSocket、Ajax、Web Service等技术,可为用户提供更加丰富的前台应用。利用WebSocket技术,后台可以随时向前端推送消息,将光缆瞬断、拨测不通等几秒钟内发生的事件随时记录下来,并以弹窗形式显示在用户界面上,使管理人员能在第一时间掌握故障情况并做出处置。

(三)Web GIS

系统采用Web GIS技术,以GeoServer做为地图引擎,谷歌地图做为数据源,Oracle 11g空间数据库做为后台支撑,为用户提供地理信息服务;用户无需安装任何客户端软件即可在浏览器中对电子地图进行拖拽、缩放、距离和面积测量、图层筛选等操作,且响应时间短,定位准确,系统资源占用少。