前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇数据运维管理范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

随着信息化建设中大数据、云计算等技术的发展应用,数据的安全也逐渐成为人们关注和重视的问题,为了进一步规范数据信息的安全管理,提高数据安全管理水平,有必要建立一套安全运维管理平台,实现对信息全方位的安全保障,使其能够有效的支撑业务系统稳定运行。
1 数据安全风险分析
网络数据的安全是数据管理需要重视的问题,但是由于大数据库中数据的复杂性、动态性和不确定性,使数据安全会有各种风险产生。
1.1 数据传输风险
由于数据的传输离不开网络,因此网络的缺陷都会为数据带来各种安全威胁,例如黑客入侵、非法操作等,数据会通过网络被监视或窃听,目前已经采用相关技术对数据进行加密,或建立可靠的安全连接,但是这些技术仍然存在一定的风险。
1.2 数据存储风险
目前随着云计算的应用,许多重要数据都是存在云端,由云服务商对数据进行集中统一的管理以保障期安全。但是云服务商也面临对庞大数据的存储安全问题,因此要考虑云服务商对于数据的安全保障能力、企业信誉以及行业标准、国家政策等。
1.3 数据使用风险
虽然在云计算技术的发展下,极大的有利于数据资源的传输和共享,但是同时也增加了数据被非法访问和使用的风险,由此可能导致知识产权等问题。一些云服务商可能利用法律的漏洞整合自己云端的数据,也有用羰褂霉ぞ叨允据进行恶意下载、复制以及扩散,这些都增加了数据的使用风险。
1.4 数据终端风险
数据终端使用户能够更加便捷获取数据资源,但是随着科学技术的发展,数据终端也朝向多元化、智能化的方向演变,逐渐发展出了智能手机、平板电脑等手持终端,由于技术上受限,常见的终端上总会存在一些漏洞,这些漏洞也会严重的威胁终端数据的安全。
2 数据安全应对策略
2.1 数据存储安全策略
目前数据的存储大多采用虚拟化的海量存储技术,因此对其进行安全存储的必要环节是对其进行加密,通过安全套接层协议层(SSL)技术对其进行加密,可以在关键节点、数据上传下载以及应用程序中对数据进行移动保护,还可以利用隐私保护和外包数据计算屏蔽来自网络的恶意攻击。同时,还可以分离密钥和加密数据,将数据使用与保管密钥进行隔离。此外可以使用过滤器对数据进行监控。最后可以通过数据备份实现端对端的数据保护和安全管控。
2.2 数据应用安全策略
可以针对高级持续性威胁(APT)攻击,设计实时监测功能和历史查看功能的全流量审计方案,及时的发现隐藏病毒的应用程序;控制用户的访问,根据数据的保密程度以及用户的需求,对用户和数据设置不同的权限等级并进行严格的控制;为保证大数据应用安全,可以整合连接企业或业务线的工具,设计标准的数据格式整合流程,防止预处理的数据溢出;可以融合多个领域技术实现数据实时分析引擎,从而能够及时的检测出各类安全事件并发出预警。
2.3 数据安全管理策略
对数据的安全进行管理也是关键的环节,首先是规范建设,建设一套标准的平台来促进数据管理的正规有序;其次是建立以数据为核心的安全系统,使数据管理者能够对数据进行有效的控制;最后是融合创新,结合数据挖掘、人工智能、机器学习等新技术进行融合创新,积极创造大数据技术融合平台。
3 数据安全运维管理平台建设
数据安全运维管理平台,是集合了安全管理、日常业务以及服务管理的一体化系统,能够基于实际需求,以安全管理、资源管理以及服务流程管理为主的综合性管理,以规范化和标准化的管理模式,提高日常运维管理效率。具体的功能如下:
3.1 信息采集分析功能
该功能是采集不同类型的日志信息,并对采集到的安全信息进行性能、可用性、配置、风险以及全局态势的分析。其中,风险分析主要是对缺陷、资产价值、威胁和影响进行分析;全局态势是对业务的健康、热点和主要安全指标进行分析。该系统实现流程如下:首先是根据采集前从网络设备、服务器、数据库、应用等的安全资源、事件、信息以及配置等采集相应的安全事件,其次是将这些安全事件按照一定的标准转化为一致的描述形式,借助规则关联、情境关联、行文关联等技术对其进行分析,并将日志量及需要预警的时间显示在系统的拓扑结构图当中,使用户在点击该图时能够及时的查询和获取安全事件,并能够从可视化的视图展示出获取到安全问题的相关信息。
3.2 数据安全监控功能
该功能能够对互联网路由的交换设备、安全设备、数据库、服务器、应用进程以及端口进行全面的监控,管理人员通过此功能可以及时的实时的监测互联网的实际运行,从全局把握互联网架构,最终对安全事件的关联性分析的基础上,制定相应的管理策略和处置流程。
3.3 数据安全预警功能
该功能是在数据安全事故发生之间进行合理化的管理,包括对安全隐患的预警控制,对系统漏洞的扫描控制以及系统主动攻击和测试等,使用户能够借助该功能及时的得到预警数据信息,可以对可能会受到严重影响的数据进行科学的研究分析。在对系统的漏洞进行扫描后,通过定期的攻击测试,将扫描结果和数据之间进行合理的匹配,最终协助运维管理人员建立安全配置体系,保障数据安全配置的标准化与自动化。
4 结语
综上所述,数据安全运维管理平台能够有效的改善数据安全面临的风险问题,使各类用户能够对系统进行多维度的整理以及分析评估,从事后的处理逐渐转变为事前的防范,实现信息系统的持续安全运行。
参考文献
[1]张先哲.信息系统安全运维管理平台建设研究[J].软件工程师,2015(05):38-39.
[2]景义琼.基于ITIL的网络运维管理系统的设计与实现[D].复旦大学,2010:15-18.
【关键词】大型数据中心 智能化运维 一体化运维 云化架构
doi:10.3969/j.issn.1006-1010.2016.14.014 中图分类号:TN929.5 文献标志码:A 文章编号:1006-1010(2016)14-0066-05
引用格式:邓颂清,程尧. 大型数据中心一体化运维管理平台的建设模式研究[J]. 移动通信, 2016,40(14): 66-70.
[Abstract] In order to build and run a data center with high efficiency, based on the analysis of the challenges currently facing the base operation and maintenance management, combined with the development trend of existing management tools, the paper introduced construction mode for large data center integrated operation and maintenance management platform from aspects of system architecture, organizational structure, technical architecture, and network structure, thus realizing the goal of intelligent operation and maintenance, cutting costs while increasing efficiency.
large data center intelligent operation and maintenance integrated operation and maintenance
[Key words]Cloud architecture
1 引言
随着移动互联网、大数据、云计算的飞速发展,全国各地数据中心的规模迅速扩张,如何建设和运营一个高效的数据中心,是数据中心管理人员的重大挑战[1]。
DCIM(Data Center Infrastructure Management,数据中心基础设施管理)是近年兴起的数据中心基础设施管理工具,不同的机构有不同的解读。本文在DCIM的理念基础上,针对大型数据中心(即在全国各地拥有多个基地的大型数据中心),就其一体化运维管理的建设模式提出探讨性方案。
2 基地运维面临的挑战与趋势
数据中心运维管理的主要目的是保障基础设施的可用性及降低风险,提高资产的利用率,降低能耗消耗和运维成本,提高服务水平以及数据中心的效率和效益[2]。
作为承载信息系统运行的数据中心,运维管理的关键是对IT设备以及支撑IT设备运行的风火水电等场地基础设施的管理,包括:对这些基础设施的日常监控和维护;对这些设备进行全生命周期的管理;运维业务管理的流程与规则;对数据中心内基础设施日常运行数据的分析、对比与挖掘。
对于大型数据中心产业基地,特征为辐射全国、规模分布、虚拟资源、弹性调度、安全防护、绿色节能。随着数据中心的发展,功能需求越来越多,管理的规模越来越大,系统间的数据交互越来越广,系统对接口的复杂度急剧上升。由于业务、维护复杂,对管理系统的要求也更高。
现阶段大型数据中心运维面临的挑战如下:
(1)经济性:资源如何有效利用,包括网络、空间、动环资源;如何缩减运行费用,包括能源、维护人员。
(2)灵活性:如何识别及降低过度部署和冗余;如何灵活扩展容量(空间、制冷和供电);如何更快响应业务。
(3)可用性:如何实现精细化管理;如何及时排除隐患,处理复杂故障;如何实现动态资源管理和电子流管理。
(4)管理性:需要有效的数据分析支撑决策和规划;如何实现系统一体化,统一协作、快速响应;如何满足大客户SLA(Service-Level Agreement,服务等级协议)和自服务管理。
面对以上挑战,数据中心应建设“集中化运维、一体化管理、智能化分析、流程化控制”的IT支撑系统,才能实现智能化运维的管理目标,减少运维人员和维护成本,优化资源管理,提升运维效率。
3 平台系统架构、组织架构和技术架构
3.1 平台系统架构
一体化运维管理平台系统架构采用“集中化、一体化、智能化”的设计模式,分层设计,实现功能总集成、流程总调度、资源全监控。一体化运维管理平台系统架构图如图1所示:
基础设施、IT系统全方位监控:包括IT设备和供配电、空调环境、消防等场地基础设施的日常运行监控及数据采集。总部综合监控管理人员全方位管理与监控,对用户、权限进行配置管理,对整体运行情况查询、分析,对故障原因分析判断、智能决策。各基地监控中心人员进行基地全局监控、资源管理、分析报告。机房运维值守人员对运行状态、性能、系统告警进行监测,从而进行运维管理、故障处理[3]。
资源管理系统3D可视化:实现对所辖数据中心的资源信息管理、调度和配置。基于物联网技术(RFID、二维码等)实现对IDC(Internet Data Center,互联网数据中心)资源自动化全生命周期管理,同时为其它应用管理系统提供有效的资源信息共享[4];基于3D可视化进行机房状态显示、监测、数据展现及交互管理;通过与监控系统的集成,建立业务拓扑、应用拓扑、基础设施拓扑,定义所涉及到的服务器、数据库、中间件之间的资源配置逻辑关系;为业务规划、业务开通、IDC运维保障等提供全面的支撑[5]。功能包括:资源信息、资源容量、资源配置、资源管控、资源生命周期、资源服务请求、资源可视化、电子盘点等功能。
流程管理系统的设计符合ITIL(IT Infrastructure Library,IT基础架构库)规范:依照ITIL规范,建立ITSM(IT Service Management,IT服务管理)体系;建立完整的电子工单流(包含各类服务请求及标准流程);实现自动化运维[6]。
统一运行门户:统一门户作为一体化运维管理平台的统一入口,通过界面集成、数据集成及功能集成等技术将各个子系统中的功能和信息有效组织起来,提供统一的信息服务功能入口以及用户、授权、认证管理,并根据需求定制开发各种呈现内容[7]。
运维大数据分析:针对数据中心基础设施和网络的日常运行建立数据仓库;采用聚类算法,全面应用数据挖掘技术;建立完整的案例库,深度分析,以提升运维质量[8]。
安全监控系统:物理、网络、信息等安全保障,建立IDC/ISP(Internet Service Provider,互联网服务提供商)信息安全监控系统[9]。
3.2 平台组织架构
运维管理平台搭建一级结构,实行集中管理、模块化发展的建设思路。管理中心集中设置,分支被管控点为各基地,在远景规划中可建设备份管理中心。以机房为单位进行扩展,增加被管机房只需要相应增加采集模块即可实现。一体化运维管理平台组织架构图如图2所示:
3.3 平台技术架构
系统采用IT云化架构,远端的桌面用户或大屏显示终端只需要通过IE浏览器登录到各子系统服务器即可访问和浏览各子系统,无需安装独立客户端。平台包含三部分,系统硬件由虚拟的和物理的计算、存储、网络资源组成;系统引擎由统一数据库以及中间件组成;平台应用由各功能系统组成。一体化运维管理平台技术架构图如图3所示。
4 平台接口关系
系统内部接口包括统一门户系统、流程管理系统、资源管理系统、集中监控系统、运维大数据分析系统、安全监控系统之间的信息交互,可向ESB(Enterprise Service Bus,企业服务总线)开放的API(Application Programming Interface,应用程序编程接口)实现互联的方向发展。一体化运维管理平台内各系统接口关系示意图如图4所示:
一体化运维管理平台内各系统之间的接口关系如表1所示。
5 平台组网方案
运维管理平台采用虚拟技术搭建,单独建设资源池(专享云)。采用基于X86架构的服务器构建,建议以计算节点和存储节点合设的超融合方式建设[10]。
网络建设主要分为业务网络、存储网络、管理内网及带外管理(IPMI)网络;从物理组网来看,网络建设分为业务及管理接入网络、带外管理(IPMI)接入网络和汇聚网络。
业务网络:承载资源池内部之间的网络互访流量以及用户访问外部网络的业务承载,建议采用万兆网络承载,同时考虑双链路实现冗余保护。
分布式存储网络:用于存储业务数据及系统数据,计算服务器需频繁与存储交互,建议采用万兆网络承载,同时考虑双链路实现冗余保护。
管理网络:用于资源池内部计算服务器、存储服务器之间管理流量,在计算节点上创建集群、创建虚拟机、添加存储等以及与管理平台的互通。物理组网上建议可与存储网络共用。
带外管理网络:目的为方便维护管理人员及时地远程维护,千兆网络承载即可。
一体化运维管理平台网络拓扑示意图如图5所示。本网络中局域网为二层互通,所有业务流量、存储流量、IPMI流量、管理流量和外网网卡流量规划在不同的VLAN(Virtual Local Area Network,虚拟局域网)中。
6 结束语
随着时代的发展,传统运维模式正向“一体化、集中化、智能化”方向发展。本文通过介绍建设一体化运维管理平台,实现集中一体化监控和各系统数据信息的透明、关联、共享,从而实现智能化处理、自动化管理,以达到快速响应、高效管控、增值降本的目的。同时,能实现数据整合与智能分析,多维度运维大数据的采集、统计、分析及深度挖掘,实现智能运维;建立能力优势,增强服务提供能力、保障能力、成本控制能力、跨技术协同能力,从而进一步增强云数据中心的竞争能力,提高各种业务的业务量,增加企业的经济效益。
参考文献:
[1] 肖建一. 中国云计算数据中心运营指南[M]. 北京: 清华大学出版社, 2013.
[2] 中国数据中心工作组. 数据中心基础设施管理技术白皮书[Z]. 北京: 中国工程建设标准化协会, 2015.
[3] 康楠. 数据中心系统工程及应用[M]. 北京: 人民邮电出版社, 2013.
[4] 陈庆. 大型数据中心IT基础设施3D可视化管理探讨与实践[J]. 中国金融电脑, 2015(5): 68-70.
[5] 孙罡. 云数据中心――资源管理与调度技术[M]. 北京: 科学出版社, 2016.
[6] 赵晨,干红华,蔡晓平,等. IT服务管理[M]. 北京: 人民邮电出版社, 2013.
[7] 王管冲. 浅谈一体化业务平台的统一门户架构[J]. 福建电脑, 2014,30(3).
[8] Bart Baesens. 大数据分析――数据科学应用场景与实践精髓[M]. 柯晓燕,张纪元,译. 北京: 人民邮电出版社, 2016.
关键词:电力;信息通信;运维管理;系统;应用
前言
运维管理系统是指运行维护管理系统,简而言之,运维管理系统的主要工作就是对电力信息通信系统的运行与维护,是保证电力信息通信系统正常运行的关键,由于电力信息通信系统较为复杂,维护难度较大,因而做好运维工作,预防各种可能存在的问题,及时发现,尽快修复十分重要,做好运维管理工作,实现运维管理系统的有效应用是保证电力信息通信系统正常运行的关键。
一、电力信息通信运维管理工作存在的问题
(一)运维管理工作不规范
电力系统快速发展,对运维管理工作的要求越来越高,运维管理中的问题也逐渐显露,其中最严重的问题就是运维管理工作不规范问题,运维管理工作不规范导致了一系列问题。例如,影响了系统报告的准确性,使系统报告无法提供有效、全面、科学的参考依据,影响电力信息系统运行效果,阻碍电力信息通信系统的进步发展,其次,降低工作效率,影响工作质量,不利于运维管理工作的开展实施[1]。运维管理工作不规范主要体现在以下几点,第一,未建立健全的规章制度,工作处理流程不标准,致使运维管理工作存在不规范现象,影响运维管理工作的实施效果。第二,涉及的知识不准确,技术较为落后,在运维管理过程中,对一些数据的分析主要依靠相关人员的经验,公式缺乏科学性,致使运维管理工作缺乏技术的有效支撑,工作缺乏可靠性,管理工作存在不规范等问题。
(二)电力信息通信中运维管理系统缺乏全程化管理
全程化管理是指一系列系统的管理,在电力信息通信中,对运维管理系统进行系统化管理至关重要,是保证运维管理系统管理效果的关键,但当前大多数运维管理系统还较为落后,无法做到全程化管理,严重影响了管理效果[2]。例如,在开展检修工作时,全程化管理要求各个部门都需要配合检修工作,对检修过程、检修处理进度、检修处理结果进行详细的记录与跟踪,不仅如此,还需要制定运维检修工作计划,保证检修工作的顺利实施。但是,在实际操作过程中,对检修过程、进度的记录工作、对检修计划的制定等工作都被节省掉,只有检修部门进行原因分析,以及维护检修工作,工作内容单一,系统功能单一,不仅运维检修效果一般,还影响了运维管理效率,为以后系统的检修以及维护工作增添了难度。由此可见,缺乏全程化管理,系统功能单一,影响了电力信息通信中运维管理系统的效率,不利于实现有效管理,降低了管理能力。
(三)电力信息通信中运维管理能力有待提高
电力信息通信中存在的主要问题就是运维管理能力以及运维管理系统的服务水平有待提高,当前,电力信息通信中运维系统的服务模式较为单一,绝大多数系统只能提供故障检修工作,还不能有效进行预警,只能在发现故障后,才能够进行检修服务,导致出现了成本较高、效率较低等问题,并不能避免故障损失。由此可见,运维管理系统的管理能力以及服务能力都有待提高,是电力信息通信中存在的主要问题,研究提升运维管理能力与服务水平的措施,有效进行电力信息通信中运维管理系统建设,促进运维管理系统更好的发展与进步,使其不断完善迫在眉睫。
二、电力信息通信中运维管理系统的建设与实现
(一)数据采集
数据采集是运维管理系统建设的关键,通过数据采集能够为运维管理提供信息支持。运维管理系统不是一个孤立的系统,是一个互相连接的全面系统,不仅包括设备检修、故障处理,还包括日常运维工作的开展实施,因而,做好数据采集工作十分重要。进行数据采集工作需要做到以下几点。第一,建立统一的资源标识,在数据采集过程中,统一的资源标识能够有助于资源的采集,保证数据采集的有效性,以便保证运维管理效果的准确性,达到理想的运维管理效果。第二,制定统一的数据采集标准,建立健全的数据采集制度,通过明确的数据采集标准与流程,能够提高数据采集的有效性与准确性,保证工作计划的有序开展,为数据库的建立提供数据资源,保证运维管理系统的正常运行,提高运维管理能力[2]。第三,通过资源与业务特点,实现数据的自动采集,业务具有关联性,资源具有相关性,根据此特点可以实现数据的自动采集,通过智能设备进行配置,将信息自动进行匹配与导入,将数据信息导入数据库中,实现数据的有效采集工作。
(二)数据建模
数据建模工作的实施过程如下,首先,确定建模的对象,通过确定建模对象,确定时间维度以及物理存储内容,确定建模对象是数据建模的基础,需要考虑较多内容,其中主要分为以下几大类,第一类,设备自身固有属性,网管、速率、生产厂家、容量等内容,第二类,设备管理属性,设备定级、维护单位、投运与退运时间等,第三类,描述设备的状态属性,缺陷、故障、告警以及性能等,第四类,设备的应用属性,信息通信方式、调度、设备连接,其次,建立各类记录规范模型,记录规范模型主要分为资源模型、业务模型、数据模型与表单模型,有助于实现模型的规范化,保证数据访问的规范化。
(三)运维管理系统功能
电力信息通信中运维管理系统具有重要的作用,其主要功能主要w现在以下几个方面,通过运维管理系统功能的实现,能够提高运维管理系统的管理能力,形成运维管理系统的功能图,有效进行运维管理系统的设计整理与分析。运维管理系统功能主要体现在以下几点,第一,检修计划管理,检修计划管理主要包括三项内容,检修计划上报、整体汇总、时间管理,通过检修计划管理,能够对检修工作进行有效的安排与协调,提高管理效果。第二,故障、告警管理,通过故障告警管理,能够对告警,故障结果进行有效的处理分析,保证检修工作的有效开展,告警、故障管理属于流程管理,是运维管理系统中的核心功能,通过规范其流程,能够提高工作效率,保证运维管理系统的有效实施。第三,专家库,专家库是运维管理系统的重要组成部分,通过专家库,能够对信息通信网发生的故障进行统计与整理,有效进行分析报告,为运维人员提高信息资料,帮助运维人员总结经验,提升运维人员的维修能力。
总结
本文从电力信息通信运维管理工作中存在的问题以及电力信息通信运维管理系统的建设与实现两个方面着手,阐述了电力信息通信运维管理工作的重要性以及必要性,研究了更好实现电力信息通信系统运行的措施,提高了电力信息通信中运维管理能力与水平,促进了电力信息通信技术的发展。
参考文献
[1]刘飞鹏,张旭,王佳佳.浅论新形势下网络技术在电力信息通信中的应用[J]. 通讯世界. 2016(20)
一、建立标准规范的运维机制
一是制定、完善营销业务运维、厂商管理、运维评价等相关办法,明确岗位职责,规范运维管理内容,使运维工作有章可循、有据可依,使营销运维管理更加规范化、标准化;二是建立、完善运维客服机制,设立统一营销系统运维客服电话,统一问题入口,严把入口关,采取“堵疏相结合”方法做好各基层单位、省公司服务支撑;三是规范问题、需求、测试、操作流程,加强问题合规性把关、需求合理性审核、测试通过性验证、安全性审查,同时做好各环节记录存档,真正实现运维全过程闭环管理、有迹可循;四是采取省市两级审批,针对重复类问题开展专项整改,不断提高问题质量;五是建立运维建议及投诉流程,及时受理市县公司反映的建议及意见,不断进行改进,使运维服务更加优质、顺畅。
二、实行三线客服模式
建立三线客服模式,一线客服负责受理用户电话或RTX咨询类问题,指导用户操作;二线客服负责处理常规问题或功能需求类问题;三线客服负责处理系统缺陷、功能需求类问题。同时开展营销业务运维7×24小时无缝隙电话受理服务,全天候受理各单位反馈的问题,有效避免用户因购电、业务办理等紧急问题引发的社会投诉事件。
三、搭建运维支撑平台
营销系统运维支撑平台作为营销系统统一运维体系中重要的支撑工具,从技术方面减轻了维护人员和管理人员的压力,有力地支撑了营销工作的顺利开展。通过建立起全省统一的运维支撑平台,以数字化的手段实现全省营销自动化的统一咨询、统一维护、统一升级,从而实现横纵一体化的运维支撑体系。
四、建立营销运维知识库
建立营销运维知识库,梳理运维常见问题,整理典型案例,总结、提炼全方位运维知识点,整理成标准式答复,不断充实、完善运维知识库,供一线人员学习;对运维知识库中点击量较多的问题,定期开展系统操作或业务培训,提升运维技能。
五、建立运维问题常态分析与专题分析机制
定期开展常态分析,找准实际工作中影响指标问题点、风险点,制定可行性措施及时进行纠正。多维度开展运维事件专题分析,及时发现市县公司专业薄弱环节并进行专业指导,支撑营销专业管理;加强后台操作管控,每月开展专业后台操作需求综合分析,固化共性操作为前台功能,实行多部门协作、全过程记录的管理模式,彻底杜绝后台对重要信息的直接操作,提高系统安全性和业务执行效率;针对重复类问题开展专项整改,进行系统优化或数据整改,不断提高服务效率及数据准确性。
六、建立运维监控质检机制
为做好工单处理时限监督,提高营销运维效率、质量及满意度,在运维平台现有基础上增加运维问题超期预警及质检功能,同时建立营销运维监控质检机制。每天对工单处理时限超期情况进行监控,督促即将超期工单及时处理;以月为单位对超期、满意度低、重复回退等问题进行质检、分析,挖掘潜在问题原因,制定相应处理措施。
七、建立运维评价体系
营销系统运维是一个完整全面的、不断提升的过程,建立完善的评价体系,可以提高运维工作的水平,体现运维工作的价值,实现运维工作的动态与闭环管理。健全基层单位、运维厂商、系统全过程评价体系,深入开展营销系统运维全流程评价,加强问题处理质量管理。及时跟踪问题各环节处理及时性,加大问题处理质量及超期工单考核力度,定期对运维问题进行归类、统计、分析,形成运维评价报告,作为评价运维工作质量的依据,推动营销业务整体水平提升。同时,深入挖掘系统、管理、操作等方面存在的问题,提出指导性改进及培训建议,为营销业务的顺利开展提供有效支撑。
八、加强数据质量及安全管理
加强营销数据质量管理。对运维过程中问题较多业务数据异常类问题进行分析,制定详细整改方案,并开展专项数据整改;同时增加校验规则,从源头上彻底进行解决。加强营销数据安全管理。数据安全主要是对电力营销过程中具有的行业特点、营销数据的信息安全、电力营销管理权限的保密信息等进行安全运维管理[2]。加强后台数据操作审批,建立数据导出及修改分级审核标准,有效杜绝违规操作和用户敏感信息外泄;加强营销数据库后台操作合规性监管,搭建营销数据库审计系统,借助有效的数据库审计技术,及时发现、制止违规操作,整体实现事前审核、事中预警、事后审计;定期开展系统账号专项治理,对废旧账号、大权限账号及人员变动账号进行梳理,并及时组织相关单位完成整改,最大程度保证数据的完整性、准确性。
九、加强系统安全管理
加强系统管理,对于因系统缺陷或需求进行的程序调整、补丁等操作严格程执行报批制度,按照所涉及部门进行分级审批,同时严把测试关,确保系统安全性;建立营销业务系统服务监控功能,实现服务器和网络状况在线监控和短信自动预警;定期开展系统运行状况评估,有效避免各类事故发生;远程在线监控自助、POS终端等相关外联设备,发现问题第一时间联系市县公司进行抢修,切实保障营销系统设备安全。
十、应用成效
关键词: 运维管理; 三层结构; 权限管理; 系统设计
中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2017)04-50-04
Abstract: Operation management platform can improve the operation efficiency, standardize operation management behavior, and provide better services for enterprises. Based off the operation management needs of an enterprise, an operation management platform is designed and realized. The system uses B/S structure, select VS2010 and server SQL 2008 as the development tools. The system functions is discussed in detail, the extended three-tier architecture is used to design the software structure of the system, and the code of three-tier architecture is optimized through the integration of CURD operations. After testing, the system runs well and has good stability and expansibility.
Key words: operation management; three-tier architecture; authority management; system design
0 引言
随着IT技术的不断发展,企业规模的不断扩大,硬件环境和软件环境日益复杂,对硬件和软件系统的依赖性也越来越强,IT风险也越来越大,给企业运维管理人员带来了极大的压力[1]。传统的运维管理完全依靠手工方式对大量的硬件、软件系统进行监控与管理,实时性差,无法保证各种硬件和软件的正常运行,无法保证企业硬件、软件和网络环境的稳定性,无法采集设备的状态信息,无法进行故障预警、跟踪和快速处理[2-3]。为了规范IT运维管理方法、提高运维服务质量,国内的一些大型企业引入了ITIL、ISO/IEC20000等IT服务管理方法和标准理论,使管理有章可循,降低IT风险[4]。
目前,一些大型软件开发企业也进行了运维管理平台的开发,但是还没有形成统一的标准[5]。运维管理平台主要以“IT业务模型”和“运维管理需求”两个核心进行开发,有机的整合了企业的各种IT基础设施如:网络设备、计算机硬件、软件系统等,能够对运行的设备或系统进行实时监控并以日志的形式记录系统故障,以短信或其他方式通知相关维护人员,缩短故障恢复时间,降低IT风险,提高服务质量[6]。大多数运维管理平台采用B/S架构,只需进行服务器端的部署,使用简单,便于操作,并内置了多种运维管理辅助模块,如各种运维流程管理、可视化的图文报表等[7-8]。本文以某企业的实际运维需求出发,利用Visual Studio 2010平台和SQL Server 2008数据库软件,采用三层体系结构设计了一个运维服务平台。
1 系统功能设计
通过对某企业进行需求调研,分析企业运维管理系统主要包括:运维流程管理、运维护知识库管理、用户资源管理及基础数据管理等四大功能模块。系统功能模块如图1所示。
⑴ 基础数据管理
基础数据管理主要是系统中原始数据的维护,包括设备、故障原因、设备类型、子系统和节点等信息的管理。
⑵ 运维知识库管理
知识库管理主要包括对设备资料的管理,运维标准管理、应急预案管理以及知识库管理。这几种类型的管理主要是文档的管理,都有内容描述,解决方案,以及附件等,直接单一模块化实现,通过type区分各个类型。主要包括增加文档,更新文档,删除文档,查询文件的功能。
⑶ 运维流程管理
运维流程管理是系统的核心模块,包括运维计划管理、故障维修管理以及统计汇总管理。运维计划是一个创建计划到巡检实施的过程,主要包括计划和巡检。运维故障维修管理是系统最核心的业务实施过程,也是一个企业、运维主管及维修人员相互交互的工作流程,从申报故障,到派工,维修,申请费用审批,最后总结并评价运维护人员的工作绩效。
⑷ 用户资源管理
用户资源管理包括员工的信息管理、部门信息管理、运维制度管理、运维绩效评估,以及系统角色权限管理等。管理员通过对用户进行角色授权,实现系统的权限分配。
2 软件体系结构
考虑到运维管理平台的扩展性和迭代开发流程,在设计运维平台时,后端采用当前最流行的三层架构进行设计,并结合成熟稳定而且迅速的开发技术扩展应用。前端网页渲染和处理,采用jQuery技术、Json技术和DWZ框架进行实现[9-10]。图2为该系统的软件体系结构。
⑴ 客户层
客户层通常响应浏览器发来的Hmtl请求,或者Ajax发来的Xhr请求,交由容器进行处理(容器一般是IIS结构的一体化Web服务器)。
⑵ 过滤层
容器将请求传递到过滤层进行登录验证,或者权限判断,验证用户请求的合法性,若不合法则返回错误结果,若合法则交由表示层的Aspx处理器或者Ashx处理器进行处理。
⑶ 表示层
对于普通的查询请求,主要是由Aspx处理器进行解析,而对于增、删、改及导入等特殊功能,则由Ashx处理器进行解析,解析器主要完成请求参数的验证和构造业务环境的工作。
⑷ BLL业务处理层
请求处理器调用根据请求,调用BLL层的业务接口进行业务处理,如故障、计划、巡检等业务处理,或者知识库、用户等业务的处理,又或者一些数据统计汇总的处理,又或者是文件请求处理,报表打印的处理等。
⑸ DAL数据处理层
BLL层是大粒度的业务流程管理,业务的处理会对应到各个数据表的读写等操作,在进行适当的业务处理过程,BLL业务接口将调用DAL层一个或多个DAL模块读写数据,如故障管理的业务功能可能会同时使用故障表的读取,设备表的读取。
⑹ 数据连接池
为了方便统一数据连接池的管理,对数据库底层进行一层封装,这样在系DAL模块读写数据的时候,一方面可以减少连接池或缓存的请求,另一方面可以设计统一的事务管理,保证数据库的完整性。
是面向对象的开发技术,系统为每个基本数据实体设计了实体对象类,对数据库进行一层ORM转换,将基本数据数据映射成标准的对象结构,方便于整个系统API的调用。
3 系统关键技术实现
3.1 三层结构的实现
本文在软件系统的开发过程中尝试对三层架构的代码进行优化处理,通过继承机制以及泛型机制,将各个模块通过CURD操作进行抽像统一处理,使各模块之间水平上分层,垂直成为一个整体。
首先为DAL层定义一个BaseDal基类,整合所有的通用的数据库CURD(Create、Update、Retrieve和Delete)操作,即增加、删除、修改和查询操作,同时包括批量更新,批量删除以及特殊SQL语句的转换等,底层数据库由BaseDal进行控制并转换成对象结果集。
其次为BLL层定义一个BaseBll基类,也将所有通用的业务操作,如增加,删除,更新,分页查询等操作,在继承处理上,采用泛型操作,每个子类继承其父类,并指定具体的实体对象,从而实现对不同实体表的CURD操作。
当定义新的模块,如增加Fault管理模块时,则可以创建Fault实体对象,定义FaultDal类继承BaseDal基类并设置泛型对象为Fault,同时定义FaultBll为继承BaseBll基类,设置泛型对象为Fault,这样系统将为FaultDal及FaultBll自动生成一系列针对User实体增删改查的数据操作,一系列针对用户的业务操作,并可以被表示层直接调用处理。
3.2 SQLHelper类的实现
SQLHelper类实现系统所有数据的操作,是系统对底层数据库操作的接口,供DAL层调用,使用的SqlConnection类、Dataset类、SqlCommand类、SqlDataAdapter类、IDataParameter类进行SQLHelper类的封装,实现执行SQL查询和添加、删除和修改操作,还可以执行查询和增删改存储过程。以下为SQLHelper类的函数:
⑴ SQLHelper:构造函数读取web.config文件中的数据库连接语句;
⑵ GetDatasetBySQL:执行SQL查询语句,返回数据集;
⑶ ExecuteNonQuery:执行增删改SQL语句;
⑷ GetDatasetByProc:执行带参数的查询存储过程;
⑸ ExeProc:执行带参数的存储过程。
由于以上函数的参数都是SQL语句或存储过程名称,跟具体的数据库和表无关,因此SQLHelper类具有很好的通用性,可以一次编写,多次使用。
4 结束语
本文详细阐述基于某企业运维管理工作的需求,以和Web技术为支撑,M行了软件工程的开发流程设计,实现了运维管理平台。利用扩展的三层体系结构对系统进行了软件体系结构设计,并利用CURD操作对三层结构进行了优化,以提高软件的可扩展性。经过测试,项目运行效果较好。下一步将从运维管理工作的工作流优化,数据报告的挖掘和实现,系统开放接口的设计和实现,以及运维平台的手机系统开发等方面着手开展研究工作。
参考文献(References):
[1] 宋莹,潘振祥,王志勇.政府部门外网运维管理研究[J].电子设计工程,2012.11(20):32-35
[2] 邢守志.企业运维服务管理系统在线告警子系统设计与实现.计算机与数字工程[J].2013:5(41)858-861
[3] 万润泽,张兴艳,李亮.基于ITSS的故障智能诊断和处理系统的设计[J].计算机与数字工程,2014.1(42)145-149
[4] 文必龙,赵晶浩,张璇,赵满.IT系统运维管理研究[J].计算机系统应用,2013.3(22):1-5
[5] 陈 林,崔 糖,袁德砦.基于Web的运维流程管理系统的设计与实现[J].计算机应用,2015.1(35):189-191
[6] 武佳宁.云计算环境下IT运维管理模式研究[J].信息技术,2015.8:51-53
[7] 周宇洁.大数据时代动环集中运维管理浅析[J].信息技术,2015.11:144-146
[8] 赵建华.数字化校园建设下大数据时代高效IT运维管理[J].长春师范大学学报,2015.34(12):47-49