首页 > 文章中心 > 训练神经网络的优化方法

训练神经网络的优化方法

训练神经网络的优化方法

训练神经网络的优化方法范文第1篇

关键词:BP神经网络 遗传算法 粒子群优化算法

中图分类号:TP311.52 文献标识码:A 文章编号:1007-9416(2013)07-0100-02

1 引言

钢材轧制系统是一个非常复杂的非线性系统,相关工艺参数数据量巨大。传统的生产实践中,往往依赖工程师的个人经验,通过统计方法进行预报,花费大量的时间和精力,而且生产过程又不断受各种随机因素的干扰,无法通过对生产工艺参数的调整对产品的力学性能进行精确的预测。通过人工神经网络模型在线预报产品力学性能,可省去繁琐的传统数学模型的建立过程,利用大量在线采集的产品数据和各种参数实际值,使得产品在线预报力学性能达到的较高的精度,从而有效的降低了生产成本,提高了产品最终力学性能。

本文根据某钢铁公司Q235钢种的化学成分和轧制工艺同最终成品的力学性能之间的关系,基于BP神经网络模型,构建预测钢材力学性能算法。在节省投资、节约能源、保护环境及可持续发展等方面具有重要的经济意义和战略意义。

2 BP网络算法

1986年Rinehart等人提出了多层前馈网络误差反向传播(Error Back Propagation,简称BP)算法。他们通过对BP算法在数学上的详细分析和完整推导,系统地解决了多层神经网络中隐含层单元连接权的学习问题。

理论上单隐层BP网络可以任意精度逼近任意非线性曲线,因此本系统采用了单隐层BP网络构建神经网络模型,如图3.1所示。

网络输入为钢材的化学成分和工艺参数。钢材化学成分包括:碳、硅、锰、磷、硫等15个成分参数。工艺参数选用F4-F6三道次参数、终轧温度、卷曲温度、上冷却水温度、下冷却水温度、中间坯厚度等参数作为神经网络候选输入参数。神经网络采用单输出层,分别为:屈服强度、抗拉强度、延伸率。

BP神经网络是有导师类型的神经网络,采用误差梯度下降规则训练网络,导致网络学习速度慢且易陷入局部极值。由于网络结构的选择尚无完整的理论指导,初始权值阈值的选取和隐层节点的确定等都存在一定的盲目性,因此网络预测能力与训练能力的矛盾,易出现“过拟合”现象。为了加速收敛和防止震荡以及改善网络泛化能力,应采取相应的优化策略。

3 遗传算法优化BP网络

遗传算法是一种基于生物进化原理共享出来的搜索最优解的仿生算法。遗传算法优化BP神经网络是用遗传算法来优化BP神经网络的初始权值和阈值,使优化后的BP神经网络能够更好的预测函数输出。遗传算法优化BP神经网络的要素包括种群初始化、适应度函数、选择操作、交叉操作、和变异操作。

(1)种群初始化。个体编码方法为实数编码,每个个体均为一个实数串,由输入层与隐含层连接权值、隐含层阈值、隐含层于输出层连接权值以及输出层阈值4部分组成。个体包含了神经网络全部权值和阈值,在网络结构已经已知的情况下,就可以构成一个结构、权值、阈值确定的神经网络。

(2)适应度函数。根据个体得到BP神经网络的初始权值和阈值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出的误差绝对值之和作为个体适应度值。

(3)选择操作。遗传算法选择操作有赌法、锦标赛法等多种方法,本案例选择赌法,即基于适应度比例的选择策略。

(4)交叉操作。由于个体采用实数编码,所以交叉操作方法采用实数交叉法。

(5)变异操作。选取第i个个体的第j个基因进行变异。

4 优化算法性能比较

将基于自适应学习因子和附加动量项的BP神经网络应用于屈服强度力学性能建模。实际问题中,选用260组样本数据进行网络的训练,100组数据对训练好的网络进行测试。选定网络输入层单元16,网络输出层单元数为1,根据经验公式确定单隐层节点数的分别为13、14、15、16、17、18、19、20,然后用试凑法确定最佳的节点数18。网络中学习率自动调整[51、52],学习速率的调整准则是:在每个迭代步上考察所有样本的误差平方和较上次迭代是否有所下降,再对学习率加以调整。学习因子取0.15,动量因子取0.3,期望输出与实际输出的误差平方和作为代价函数。

遗传算法参数设置为:种群规模为10,进化次数为50次,交叉概率为0.4,变异概率为0.2。把最优初始权值和阈值赋给神经网络,用训练数据训练100次后预测抗拉强度值,预测误差曲线如图3.3所示。从图3.3可以看出遗传算法优化的BP网络预测更加精确,并且遗传算法优化BP网络预测的均方误差为,而未优化的BP网络均方误差为,预测均方误差也得到了很大提高。

遗传算法优化BP神经网络的目的是通过遗传算法得到更好的网络初始权值和阈值,其基本思想是用个体代表网络的初始权值和阈值,个体值初始化的BP神经网络的预测误差作为该个体的适应度值。通过选择、交叉、变异操作寻找最优个体,即最优的神经网络初始权值。

将基于PSO优化算法获得权值作为BP网络的初始权值训练网络并对抗拉强度强度力学性能建模,将训练后的网络应用于140组测试数据,结果如图3.5所示。

图3.5中(a)表示传统BP算法训练结果;(b)表示经过优化后的预测结果。由图3.5可以看出,经过优化后的神经网络,预测数据多分布在自适应曲线两侧,网络表现出较好的预测性能,并且优化后的网络训练速度也得到加快。

5 结语

本文针对BP神经网络采用梯度下降算法,导致的学习速度慢,算法容易陷于极小点及个别网络参数难以确定等缺陷,提出两种优化BP网络的方法:遗传优化算法和粒子群优化算法。分别应用两种算法优化BP网络初始权值和阈值,与传统的单隐层BP算法比较,验证了改进的BP网络预测效果较好。通过对比两种优化算法,粒子群算法优化神经网络可以达到更好的钢材性能预测效果。

参考文献

[1]刘维群,李元臣.BP网络中隐层节点优化的研究[D].洛阳:洛阳师范学院,2000,23-28.

训练神经网络的优化方法范文第2篇

Abstract: The paper puts forward the optimization method of fractional linear neural network based on genetic algorithm. It firstly optimizes the weight of fractional linear network by using genetic algorithm, and then, on the basis of genetic improved result, trains fractional linear network by fractional linear network back propagation (BP) algorithm, and gets the optimal weights of network. It is applied to build the fractional linear neural network model based on genetic algorithm for predicting the gas-oil ratio of original oil. The Comparative experiments show that the fractional linear neural network optimization method based on genetic algorithm is a kind of new modeling method.

关键词: 遗传算法;分式线性神经网络;预测模型;原油气油比

Key words: genetic algorithm;fractional linear neural network;prediction model;gas-oil ratio of original oil

中图分类号:TP183 文献标识码:A 文章编号:1006-4311(2013)28-0221-02

0 引言

BP网络是一种应用最为广泛的前馈神经网络。但是BP网络收敛速度慢,易陷入局部极小。遗传算法是一种自适应全局优化概率搜索算法,具有较强的鲁棒性,可以与BP网络结合避免其陷入局部最小。一些学者对BP网络进行了优化和改进,如吴清佳等[1]采用VC维方法确定网络结构,再用BP算法和基本遗传算法对暴雨量进行预测分析;张少文等[2]尝试用GA-BP算法建立了黄河上游降雨-径流神经网络预测模型。

由相关数学概念可知,线性函数的倒数是分式线性函数。文献[3]证明了分式线性神经网络具有比常见BP网络更强、更广泛的逼近能力。但是,分式线性网络反向传播(BP)学习算法也有不收敛或易陷入局部极小的可能。本文结合GA和分式线性网络BP算法的特点构建了基于遗传算法的分式线性神经网络模型并用于原油溶解气油比预测。仿真结果表明,这一模型可以用来预测原油气油比,因而基于遗传算法的分式线性网络可行有效。

1 分式线性网络神经网络模型拓扑结构

分式线性网络是具有m(m?叟3)层的前向神经网络,包括1个输入层,1个或1个以上的隐含层和1个输出层。

本文神经网络优化模型采用3层分式线性网络,即1个输入层,1个隐含层和1个输出层,其中隐含层神经元的输入函数是分式线性函数。

根据有关文献和溶解气油比实验结果,压力、温度、气体相对密度、原油重度与原油溶解气油比之间存在一定的非线性函数关系。本文把压力、温度、气体相对密度以及原油重度这4个参量作为网络的输入节点,气油比这个参量作为输出节点。因此,输入层节点个数为4,输出层节点个数为1。决定隐含层的神经元数量的选取多是通过实验不断调整数量和经验公式选取。根据本文设计思想和实验反复计算测试,设计输入层神经元数目为n,输出层神经元数目为1,隐含层神经元数目为(2n+1)=2×4+1=9。

2 基于遗传算法的模型初始权值优化设计

2.1 基本思想 为加快分式线性网络BP算法收敛速度,避免陷入局部极小,本文先对模型初始的权值、阈值编码,构成初始种群,然后借助遗传算子生成下一代种群,对种群中的最优个体解码后得到的权值做出评价,如果满足遗传算法性能指标,则输出此最优权值,否则继续遗传算法操作,直至某一代的种群最优个体满足性能指标,并输出对应的权值、阈值。此时得到的权值阈值是遗传算法优化后的分式网络初始解,再把得到的优化权值再传赋给分式线性网络再做进一步的优化。

2.2 设计方法

2.2.1 编码方法 本文遗传算法采用实数编码方法。将分式线性神经网络的权值和阈值按先后顺序级联为一个长串,串上的每一个位置对应着网络的一个权值和阈值,并用一个向量?孜表示:?孜=[W1,W2,B1,B2](1)

其中,W1为输入层神经元与隐含层神经元连接权值,W2为隐含层神经元与输出层神经元连接权值,B1为隐含层神经元阈值,B2为输出层神经元阈值,

取隐含层传递函数?椎(t)=■,设输入学习样本共有M个,记为Xp=(x■,x■,…,x■),p=1,2,…,M,对应的样本输出为Y■=(y■,y■,…,y■),p=1,2,…M,W■■,是对应第p个样本的输入层与隐含层神经元连接权值,W■■是对应第p个样本的隐含层与输出层神经元连接权值,B■■对应第p个样本的隐含层神经元阈值,B■■对应第p个样本的输出层神经元阈值。网络在学习样本下的实际输出为

■■=W■■■+B■■,p=1,2,…M

(2)

定义适应度函数的形式为:f=■=

1/■Y■-W■■■+B■■(3)

2.2.2 遗传操作 ①选择算子:采用基于正态分布序列选择的选择算子。②交叉算子:采用算术交叉算子。③变异算子:采用基于非均匀变异的变异算子。④进化代数:T=300。

3 模型构建

以东营市利津油田34口油井建立神经网络预报模型,对这些油井的溶解气油比作为分析对象,分别通过遗传算法进化分式线性网络模型和采用L-M训练算法的BP网络模型对比进行训练学习,对34口油井中的28个样本作训练样本建模,训练后的网络预测剩余6口油井的气油比,进而实现从输入段到输出端的非线性形式下的映射,预测6个测试样本的原油溶解气油比。(表1)

4 仿真实验

本文提出结合遗传算法的分式线性网络BP算法模型对滨南采油厂利津油田34个数据进行仿真实验。为构建分式线性函数,固定点取(a1,a2,a3,a4)=-1,由于设定输入层神经元个数为4,则隐含层神经元输入函数(分式线性函数)为I=■W1■(4)

其中W1为输入层神经元与隐含层神经元连接权值,xi为输入变量。

分式线性网络隐含层传递函数为Sigmoid函数?椎(t)=1/(1+e-t),输出层传递函数为线性函数L(t)=t,最终训练目标e=0.001,样本数目M=28,训练次数为1000。遗传算法的初始种群规模N=50,最大进化代数T=300。为对比仿真结果,同时对采用L-M训练算法的三层BP网络做仿真,输入层节点数为4,输出层节点数为1,隐含层节点数为10,训练函数为trainlm,训练目标?着=0.001,训练次数为1000,其余均取默认值。

GA优化结果:最大适应度f=26.2544,得到的权值阈值是矩阵形式:?孜=[W9×4,W4×9,W9×1,W4×1]其中,各个变量的定义同前述。

从表2可以看出,本文优化算法需要213步达到训练误差要求,而改进BP算法需要24步就达到要求,本文算法训练步数较长。

由表3可见,基于本文优化算法的模型可以预测原油气油比,其整体预测气油比的精度与基于改进BP算法的模型效果接近,因而本文优化算法预测数据是可行有效的。

5 结束语

本文将遗传算法和分式线性神经网络相结合用于原油气油比的预测,这对原油物性分析提供了一个借鉴和参考。下一步需要充分考虑其他因素的影响并不断改进模型,同时调整好GA算子和分式线性网络的参数以便提高预测的精确度和时效。

参考文献:

[1]吴清佳,张庆平,万健.遗传神经的智能天气预报系统[J].计算机工程,2005,31(14):176-177,189.

训练神经网络的优化方法范文第3篇

【关键词】 神经网络 故障诊断 遗传算法

1 神经网络用于故障诊断的流程及优势

故障诊断问题本质上是分类和识别问题的一种模式,即从特征空间映射到该故障的空间。最常见的神经网络BP算法是将学习输入输出的映射问题转变为一个非线性优化问题,使用优化中最普遍的梯度下降算法,用迭代运算修正网络权重,实现网络输出与期望输出间的均方误差最小化。BP算法由前向计算过程的误差反向传播过程组成。在前向计算过程中,输入信息从输入层经隐层逐层处理,传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望的输出,则转向反向传播,将误差信号沿原来的连接通路返回,通过修改各层的权重,使得误差信号最小。

2 神经网络在风机控制系统故障诊断的仿真

(1)建立神经网络模型。通过对双馈发电机在定子电流传感器和转子电流传感器进行分析,本文选取了风机控制系统输入量反馈电流传感器出现故障时对应输出量发生的变化,利用网络训练达到要求的精度后对传感器进行故障诊断。本文我们将模拟六种风电机组控制系统故障的类型,也就是定子、转子电流反馈传感器故障,电源电压不平衡故障,电源反馈通讯中断故障,速度传感器偏置,不断增益输出故障。

本文在研究控制系统的多个输入输出量在故障时值的变化的基础上,总结出六个与控制系统定子和转子反馈电流传感器发生故障时紧密相关的特征向量即udr、uqr、ids、iqs、idr、iqr,分别代表转子d轴电压、转子q轴电压、定子d轴电流、定子q轴电流、转子d轴电流、转子q轴电流,并用这六个特征向量作为神经网络故障诊断的输入,以定子d轴电流反馈传感器,定子q轴电流反馈传感器、转子d轴电流反馈传感器的偏差故障和恒增益故障为输出建立了18-21-6的网络来进行故障诊断。

(2)采用弹性梯度法的BP网络训练仿真。我们设置的仿真时间为20s来收集故障数据,当系统达到稳定,即从12秒到20秒。人为地使控制系统发生故障,我们分别在12.73s、14.74s,16.75s,18.76s收集风机电压传感器故障时的数值。我们可以看到,当网络收敛到429步时满足网络精度0.01的要求,且曲线平滑,收敛效果好。仿真结果如图1。

当我们模拟第四类故障时,网络的输出如下所示:

Y=[0.0201 0.0000 0.0165 0.9491 0.0121 0.0002]

而预期的输出值为:E=[000100],显然诊断网络输出的结果表示第四故障类型在误差允许范围内非常接近于理想值。

(3)神经网络训练过程出现的问题。在实际训练过程中发现无论怎样改变隐层或学习率等参数时,或者改变训练算法,网络训练始终避免不了陷入局部极小值,在81次实际训练过程中,有19次陷入局部极小,导致网络不收敛,即使是改进算法也仅是提高了网络的收敛速度,这是调整BP网络自身致命的缺陷,陷入局部极小结果如图2所示。

3 遗传算法优化的故障诊断算法

遗传算法优化网络是将遗传算法和BP网络相结合。在我们训练网络,我们首先使用遗传算法来找到正确的权值,以缩小搜索范围,然后训练BP网络解决准确。该方法不仅节省了训练时间,又能保证在很短的时间内网络训练,这在很大程度上避免了BP神经网络容易陷入局部极小值的缺陷。为此,我们建立12-15-6的神经网络进行网络调试,在多次实际的网络训练过程中,不仅提高了网络诊断速度和精度,并且很好的避免了陷入局部极小值。在实际60多次网络训练过程中,网络均没有陷入局部极小。

4 本文的创新之处

(1)针对网络输入数据规模较大或很大时造成的网络收敛速度缓慢、精度不高以及易陷入局部极小的情况,提出了将遗传算法与BP网络相结合,训练时先用遗传算法对神经网络的权值进行寻找,将搜索范围缩小后,再利用BP网络来进行精确求解,不仅提高了收敛速度、还可以快速高效达到全局寻优,并且能有效避免陷入局部极小问题。(2)建立了一种新型的基于遗传优化的风电机组控制系统神经网络故障诊断模型,并利用风电机组控制系统的仿真采集到大量故障诊断所需数据,成功诊断出了文中所述的六种故障。仿真结果表明了该算法的有效性。

参考文献:

[1]侯国莲,张怡,张建华.基于形态学小波的传感器故障诊断.中国电机工程学报,2009年14期.

训练神经网络的优化方法范文第4篇

为保证基础设施即服务(IaaS)模式云环境中资源的有效分配与高效调度,提出了一种基于集成模型-优化神经网络的资源需求预测方法(EMONN).分析了用户偏好以及资源配置需求,根据需求变化采用阈值法确定波动期与平缓期,通过基本预测器集成模型实现不同时期、不同需求的预处理.预处理结果经过加权,与历史数据共同作为神经网络(NN)的训练数据,保证预测结果精度.为改善神经网络的学习率与稳定性,采用自适应学习率以及动量方法对神经网络进行优化.采用统计指标对系统有效性进行验证,结果表明所提方法可以精确有效实现用户需求预测.

关键词

基础设施即服务(IaaS);资源需求预测;集成模型;神经网络;自适应学习率;统计验证

在IaaS模式云计算[1]中,高效精确地为用户分配资源是效益最大化的重要保证.云中心根据请求以虚拟机(VM)形式为其分配资源,为保证服务质量,有必要根据虚拟机运行状态实现资源动态调整.然而,准备和初始化实例需要一定时间,使得资源无法根据用户需求动态调度,导致无法有效地为用户提供弹性的资源管理[2],降低了云计算的服务质量,因而需求预测为资源动态管理与供给提供了重要参考[3].对资源需求和工作负载的预测已有许多研究工作,为了优化资源管理和任务调度,部分学者采用常规预测方法,例如基于移动平均线的长期趋势预测算法[4]、基于FUSD的指数加权移动平均算法[5]等实现云计算环境下的负载预测,有学者将模糊系统引入虚拟机负载和资源预测中[6-7],提升了系统鲁棒性,但是预测精度不够高.针对云环境工作负载的非线性特性,有学者引入神经网络并结合典型预测方法[8-10].上述预测方法难以对不断变化的情况进行自适应预测,其精确性和实时性有待提升.本研究提出一种基于集成模型-优化神经网络的预测方法,采用基本预测器集成模型对需求情况进行预处理,并分别从以下三个方面对神经网络进行了优化:利用集成模型的输出数据优化训练数据结构;通过优化神经网络传递函数改善网络权重更新过程;通过自适应学习率优化学习过程.

1预测系统结构与资源需求情况

1.1预测系统云计算资源预测系统结构如图1所示,图中VM为虚拟机.资源需求预测之前,首先分析历史数据库中的用户请求,包括数据结构、内容和数量,得到用户偏好性选择、需求描述等.为了实现精确有效的预测,对不同的资源需求情况进行分析,包括长期需求、短期需求和需求抖动情况,并给出了区分不同情况的方法准则.对资源需求采用基本预测器集成模型进行预处理,对集成模型预测结果进行加权后,输入至神经网络预测器中.神经网络同时采用历史数据序列和集成模型预测结果作为训练数据,以提升结果的精确性.引入自适应学习率以及动量法改善神经网络的收敛速度和稳定性.预测输出值用来指导IaaS云计算数据中心的资源分配.采用不同统计指标对预测效果进行评估,并将结果反馈至历史数据库中,为后续资源预测调度提供参考.

1.2需求平缓期基于平缓期的特点,采用二次移动平均法(SMA)[11]进行资源需求的预测,提高预测精度.图2所示为长度为L的滑动窗模型。

1.3需求波动期指数移动平均法(EMA)[12]是一种短期预测的有效方法,由于其响应的快速性,因此适用于非周期性的快速变化时间序列预测.EMA对当前测量值给予较大权重,而对于较早时刻的测量值给予较小权重,可以对短期资源需求以及需求抖动作出快速反应.

1.4波动期和平缓期确定进行需求预测时,须明确当前需求所处时期,定义波动阈值(hu)和平缓阈值(ha)界定平缓期与波动期.

2集成模型-优化神经网络资源需求预测

2.1总体结构通过集成预测模型可以对不同的需求情况进行预处理,而神经网络良好的非线性逼近能力和自组织特性可以提升预测结果的精度.将集成模型结果输入至神经网络,实现二者有效结合,是提升系统预测性能的有效方法.集成模型-优化神经网络资源需求预测方法核心是采用两层结构,如图3所示.第一层为基本预测器集成模型,第一层的输出值与历史数据共同作为第二层神经网络训练值,以优化预测结果.

2.2基本预测器集成模型在预测器基础上,集成模型引入自动回归模型(AR)和移动平均法(MA).设在时刻t预测器i的预测值为x(i)t,其对应权重为w(i)t,通过对上述预测结果进行加权,则集成模型输出值。

3实验与结果分析

3.1统计指标为了评估预测系统的性能,采用系列指标[13]包括平均绝对误差(MAE)和均方误差(MSE),误差区间数量统计值(PRED(x))对系统进行分析.MAE是测量预测值和真实值之间误差均值的指标。

3.2预测效果对比与分析基于集成模型-优化神经网络的资源需求预测方法EMONN的预测结果如图4所示,图中Q为访问流量.由图可见预测值与实际值符合较好,误差较小.根据指标(11)~(13),对多种预测方法进行对比实验,结果如表1所示.可知:对于平均归一化误差值和最大误差,EMONN均达到最小,EMA和SMA的预测结果与EMONN较接近,而仅采用神经网络时,预测效果较差;EMONN在误差能量方面低于其他方法,约为AR模型的1/4;EMONN方法处于±5%的误差点数最多,预测误差较小,预测性能优于其他预测方法.

3.3预测方法学习过程优化仅采用神经网络时预测性能不理想,原因主要是学习率不够优化,本节讨论自适应学习率对神经网络的影响.图5为不同学习策略下的神经网络性能对比,m为迭代次数.不采用自适应学习率的神经网络经过2000个学习周期,均方误差(Pa)接近8.66×10-3,采用自适应学习率后,经过相同训练周期后,误差为3.1×10-3,二者比率达到2.8.因此,采用自适应学习率后,神经网络的收敛速度有大幅提升,预测结果更加精确.

3.4集成模型对预测效果的影响图6所示为将集成模型预处理结果引入训练数据进行优化后的学习过程曲线.与图5相比,学习速度得到进一步提升,经过1600个训练周期即达到训练目标值0.001,远小于仅采用历史数据作为训练数据的预测方法,网络收敛速度得到有效提升,而且其训练误差值达到了0.001,性能得到进一步提升.采用不同训练数据结构的性能对比如表2所示.引入集成模型后,预测性能得到有效提升,尽管绝对误差仅仅降低了0.0031,但是提升了13.9%;优化前后的eMSE值分别为0.0012和0.0010,PPRED(5)值分别为302∶320,预测误差较表1有进一步降低.

4结论

训练神经网络的优化方法范文第5篇

摘要:针对电子政务绩效评估不完善及BP神经网络的收敛速度慢,需要较长的训练时间的缺陷,本文在前人研究的基础上建立了基于平衡计分卡的指标体系,针对BP神经网络的缺陷,将粒子群优化算法应用到模型中,改进了BP神经网络模型,提出了基于粒子群优化的BP神经网络原理及求解方法,并通过实际的例子对建立的模型进行了训练和验证。通过本文的研究,为相关部门开展电子政务绩效的评估提供了一定的参考依据,对电子政务的发展起到了一定的积极作用。

关键词 :电子政务;绩效评价;平衡计分卡;神经网络;粒子群算法

引言

20世纪60年代中后期,一些欧美的发达国家对政府进行改革,并强调政府行政的效率,为了衡量政府行政好坏,绩效评价成为了一项快速发展起来的政治活动。1992年美国政府为了进一步完善电子政务绩效的评价体系,颁布了相关的法律法规,通过立法进一步明确了电子政务绩效评价的概念和制度,而亚欧一些国家政府也效仿美国,迅速引进了相关的评价制度和工具。电子政务绩效评价指引了电子政务发展的方向,为政府开展电子政务提供了信息来源的平台,为了能够保证电子政务顺利的开展,我们就需要建立一个有效的、全面的、较为完善的电子政务绩效评价体系。本文在前人研究的基础上建立了基于平衡计分卡的指标体系,针对BP神经网络的收敛速度慢,需要较长的训练时间的缺陷,将粒子群优化算法应用到模型中,改进了BP神经网络模型,提出了基于粒子群优化的BP神经网络原理及求解方法,并通过实际的例子对建立的模型进行了训练和验证。

1、基于平衡计分卡的电子政务绩效评价指标体系的设计

结合定量分析和定性分析的方法来建立基于平衡计分卡的电子政务绩效评价指标体系,并不断的修正平衡计分卡的机构关系,不断的革新指标内容,从而建立电子政务绩效评价框架,修正后的电子政务绩效评价BSC框架主要从成本效益、服务对象、内部运营及学习与发展四个维度提出了相应的问题,如图1所示。

根据前面的分析,基于BSC的电子政务绩效评价指标体系见表1,指标数据的获取和计算方法见表1。

3、基于PSO-BP神经网络的电子政务绩效评价模型

3.1 数据的预处理

由于数据的获取难度较大,因此本文借用了相关文章的数据[4],选取了湖南省十一个省市的数据作为研究的样本,为了确保输入数据(包括训练以及将来要预测的数据)在比较接近的范围里,我们需要对数据进行归一化处理。本文的数据主要包括输入数据和期望输出数据,输入数据主要是湖南省十一个市的电子政务指标数据,包括16个输入维度,输出的是对电子政务系统的评价结果,主要包括:好、较好、一般、较差、差五个结果。利用下面的线性函数转换方法完成数据的归一化:

公式中的P为归一化处理后的数据,P1为原始数据,P1min为原始数据中的最小值,P1max为原始数据中的最大值。

通常情况下,用于测试的输入数据所对应的输出数据不是量化数据,比如本文中所提到的好、较好、一般、较差、差五个结果。因此本文的输出数据主要使用的是专家评价得出的分数,来对电子政务绩效做出评价,分数评价结果的对应关系为:1-3为差,3-5为较差,5-7为一般,7-9为较好,9以上为好。经过归一化处理过的指标数据和通过专家评价得出的评价结果如表2所示。

3.2 输入层、输出层及隐层节点的设计

由于一个三层的前向网络具有以任意精度逼近任意一个非线性函数的能力,因此,只需构造一个输入层、一个隐层和一个输出层的3层神经网络。本文中的电子政务绩效评价指标体系共包括成本效益、服务对象、内部运营及学习与发展四个指标维度,然后又将其细分成16项三级指标,也就是说神经网络输入层的维度为16,即输入层神经元个数Pn=16。输出层输出的结果是我们对电子政务系统的评价,而我们把评价结果好、较好、一般、较差、差作为网络的唯一输出,因此,输出层神经元个数为r=1。

1988年Cybenko[11]大量的研究表明在三层神经网络中一个隐藏层就可以实现任意分类的问题,以任何精度来实现任意非线性的输入和输出的映射。本文将隐藏层设置为一层。隐藏层节点的选择也是一个复杂的问题,如果隐层节点数比较少的话,则有可能导致网络训练者性能很差;如果选择较多的隐层节点数,虽然能够降低系统误差,但是会使网络训练的时间增加,而且也极易使训练陷入局部极小点而得不到最优点,最终会导致训练出现“过拟合”的现象。本文采用的计算公式为:

其中n为输入层节点数, m为输出层节点数,a 为1 ~ 10 之间的常数。

3.3 基于BP神经网络的电子政务绩效评价模型的设计

利用BP神经网络对电子政务绩效进行评价的主要步骤有:

第一步:根据电子政务发展过程中的相关影响因素,选取合适的电子政务绩效评价的指标数据,利用相关的算法对指标数据进行标准化处理[5],将处理后的指标数据x1,x2,x3,……,xn作为输入BP神经网络的输入值。

第二步:在输入层输入数据以后,数据会在神经网络中正向传播,数据在隐藏层进行一层一层的处理,然后会把处理后的数据传向输出层,输出层得到的数据就是实际的输出值Y。

第三步:当输出层得到实际的输出值以后,会和期望值进行比较,如果输出值和期望值不相等,那么会根据相关的公式计算出误差,然后把误差信号按照原来的路径进行反向的传播,通过不断的循环的传播来调整隐藏层神经元的权重,从而使误差越来越小。

第四步: 不断的重复前面的第二步和第三步,一直到误差可以小到某个阈值,然后停止训练和学习,只有选择的样本足够多时,神经网络的训练才更精确,输入的样本数据不同,得到的输出向量也会不同,当所有的数据样本的数据值和期望值误差最小的时候,综合评价结果更为接近,神经网络的权重值Wij就是BP神经网络通过训练和自适应的学习得到的一个内部的表示。

对选取的样本进行训练以后,我们就可以利用BP神经网络的训练模型对电子政务绩效进行评价,而且可以对大规模的电子政务进行绩效评价,因为神经网络具有一定鲁棒性[6],那么会导致出现主观综合评价值在一定的程度会与实际值存在少量偏差,但是这个偏差不会影响评价结果。

3.4 应用粒子群算法优化BP神经网络模型

1995年两位美国学者对鸟群的群体迁徙和觅食的过程进行了模拟,从而提出了一种智能的优化算法-粒子群优化算法[7](Particle Swarm Optimization,PSO),随着近年来粒子群算法的不断应用,已经逐渐成为一种新的优化算法。

PSO算法的速度和位置迭代公式为:

其中w为惯性权值,粒子群算法通过引入惯性全职可以实现对全局和局部寻优的能力的调整。合适的惯性权值可以避免陷入局部最优和远离全局最优。这里的惯性权值随迭代次数线性递减以保证收敛,计算公式为:

其中wmax为初始设置的一个最大的惯性权重值,将其设置成0.95;wmin为初始设置的最小惯性权重值,这里设为0.25;tmax为种群最大的迭代次数,这里将其设置成200次,ti为1:200的循环迭代。

粒子相继两次位置的改变取决于粒子当前位置相对于其历史最佳位置和群体历史最佳位置的变化。因此,若把网络的权值看作是PSO算法中粒子的位置,则在网络训练过程中,相继两次权值的改变可视作粒子的位置的改变。因而类比公式3,网络的权值改变量计算公式为:

其中式中,wkj(b)和wji(b)个体最优的网络权值;wkj(g)和wji(g)为群体最优的网络权值。

4、实例分析

首先利用基本的BP神经网络对选取的样本进行训练,这里选取了长沙、株洲、娄底、岳阳、永州、郴州、怀化、湘西等八个城市作为训练样本,训练之前要对训练参数进行基本设置,由于输入层和输出层节点数分别为16和1,那么隐藏层节点数可以选择5-14个,利用MATLAB经过多次实验,最终将隐藏层节点数确定为12个最为合适,误差相对较小。

利用PSO优化过的BP神经网络对十一个市的样本进行训练和测试,为了保证测试结果的一致性,这里我们依然选取以下八个城市作为训练的样本:长沙、株洲、娄底、岳阳、永州、郴州、怀化、湘西,然后利用剩余的城市作为测试样本。训练过程如图3所示,得到的实际输出和期望输出如表4所示。

优化后的数值更加接近期望值,而且误差会比PSO优化前的BP神经网络的训练更小,优化前后的测试的结果对比如表5所示。

本文在结合了BP神经网络和粒子群优化算法建立了PSOBP电子政务绩效评价模型,取得了较为满意的结果,然而本课题依然遇到了诸多的困难和问题,比如:数据获取困难;另外本文算法中的许多参数都是用了默认值,没有考虑到优化前后初始权值和阈值的不一致性是否会影响结果,这也同样成为了后续的研究重点。

参考文献:

[1] 曹振飞.基于绩效棱柱的电子政务绩效评估研究[D].北京:北京交通大学,2010

[2] 王杰华.海关电子政务绩效评估体系构建[D].上海:复旦大学,2010

[3] 彭赓,陈杰.基于相关者理论的电子政务绩效评估体系[J].管理现代化,2008,15(1):37-39

[4] 侯卫真.电子政务[M].北京:电子工业出版社,2013[5] Duncan Aldrich, John Carlo Berrot, Charles R. McClure.E-Government: initiatives, developments and issues [J].Government Information Quarterly. 2002,(19): 349-355

[6] 丛爽.面向MATLAB工具箱的神经网络理论与应用[M].北京:中国科学技术大学出版社,2003

[7] 范娜,云庆夏. 粒子群优化算法及其应用[J].信息技术,2006,2(1):53-57

[8] 吕培超.电子政务绩效评估研究[D].厦门:厦门大学,2009

[9] 徐强.电子政务流程再造绩效评估理论与实证研究[D].南京:南京大学,2010

[10] 张泽旭.神经网络与MATLALB仿真[D].哈尔滨:哈尔滨工业大学,2011