首页 > 文章中心 > 神经网络文本分类

神经网络文本分类

神经网络文本分类

神经网络文本分类范文第1篇

关键词:仿生态神经网络群 神经网络集成 车型识别

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2015)11-0000-00

Abstract: According to the similarity of ecosystem model and multiple neural network model, the paper proposed the model of bionic neural network group (BNNG) algorithm, which combines the feature extraction and AR model to improve the accuracy of the vehicle classification, and reduces the error rate.

Key words: Bionic Neural Network Group; Neural Network Ensemble; Vehicle Recognition

神经网络集成是计算机模式识别及群智能理论的研究主要方向,目前神经网络集成还没有形成统一的理论框架,集成的内部依然是一个黑箱问题,里面权值和结构到底发生了哪些变化,没有形成统一的结论。本文在研究多种神经网络分类识别的实验中,发现了神经网络集成理论同生态系统模型有着一定的相似度,故对其进行模型预测,同时利用交通车型识别来验证本模型的正确性。

1 仿生态神经网络群算法(BNNG)的模型提出

生态系统是自然界的一个完美的动态进化模式,其内部进化靠互助、竞争等规则来完成,神经网络群按照生态系统进化规则进行演变,故称之为仿生态神经网络群。

神经网络集成是用有限个神经网络对同一个问题进行学习,集成在输入示例下的输出由构成神经网络集成的各神经网络在此示例下的输出共同决定。需要经过大量数据的训练和检验才能够达到最终理想的输出,内部各网络之间是交叉相错的,彼此之间的依存、竞争同样使其结构达到最终的平衡。生态系统模型与神经网络集成有一定的相似性,本出简单模型匹配预测,具体如表1。

2 仿生态神经网络群算法(BNNG)数学模型构建

根据生态群落进化规则,本文将BNNG算法分为主体网络和激励网络,具体算法结构如图1。

传统神经网络模型分为输入层(input)、隐层(hide layer)和输出层(output layer),处理信息的基本原理是:输入信号通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号,网络训练的每个样本包括输入向量X和期望输出量T,网络输出值Y与期望输出值T之间的偏差,通过调整输入节点与隐层节点的联接强度取值和隐层节点与输出节点之间的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息,本次假设训练样本为,学习率为,第个样本的误差为。其中

输出公式: (2-1)

全局误差公式: (2-2)

隐层各神经元的权值调整公式为:?? (2-3)

输出层各神经元的权值调整公式为: (2-4)

而BNNG的输出公式为: (2-5)

3 仿生态神经网络群(BNNG)模型在车型识别中的应用

车型识别是交通量在线统计中的重要步骤,识别率的高低直接影响着整个系统的好坏,所以选取此类实验来验证具有重要价值,本文选择4种车型,各40个样本进行验证,具体如表2。

本次BNNG网络群的主体网络为BP(Feed-forward backprop)、CBP(Cascade-forward backprop)、EBP(Elman backprop)、TBP(Time-delay backprop)四种,激励网络由最基本的原始神经网络组成,如Perceptron、Radial basis(exact fit)、Radial basis(fewer neurons)、Generalized regression、Linear layer(design),验证方式为先单一网络分类,然后是主体网络分类,最后是将激励网络和主体网络融合形成BNNG网络后进行分类,通过正确识别率验证各种算法的有效性,具体结果如表3。

通过表3可以看出主体网络的识别率要比单一网络或单个网络的识别率要高,适当引入激励网络将大大提高车型的识别率问题,识别率可以提高到95%以上,其恰好是模型匹配进化的重要规则之一,验证了模型的正确性。

4结语

本文提出仿生态神经网络群(BNNG)算法一种新的模型,按照生态演变规则对网络进行建立、进化。通过实验数据分析得出仿生态神经网络群确实和自然界生态平衡模型存在着一定的相似性,比如竞争机制,演变结果的可能性,对单个物种作用低的处理机制等方面运行规则相似。经过实验验证能够为神经网络集成理论统一框架提供理论和实验参考价值,为在复杂情况下的模式识别提供新的方法和依据。

参考文献

[1]宋锐,张静.一种基于BP神经网络群的自适应分类方法及其应用[J].电子学报,2001年第12A期:1950-1953.

[2]王双维,陈强.不同车型的车辆声音与振动信号特征研究[J].声学技术,2007年第3期:460-463

[3]陈强,李江,王双维.基于AR模型的车型自动分类技术[J].吉林大学学报(工学版),2007年第2期:325-328.

[4]余佳,李益华.一种基于数据挖掘的车型自动分类方法的研究[J].现代电子技术,2012年第9期:119-121,124.

神经网络文本分类范文第2篇

Abstract: In order to improve the problem that single neural network model has slow convergence speed, we adopt combination neural network modeling method. We established a network model of the gas turbine performance simulation, and it was validated by experiment. In the course of modeling, the modeling object is divided into three relatively independent sub-networks. We use the training domain obtained by experimental data to train the network, and set up a combined neural network model that can be used for gas turbine control system simulation and fault diagnosis. The experimental results show that the average output error of this model is about 3% - 6%, the calculation time is less than 100ms, and it can be used for model-based gas turbine diagnosis system.

关键词: 燃机故障分类;故障诊断;组合神经网络

Key words: gas turbine;fault diagnosis;neural network

中图分类号:TK4文献标识码:A文章编号:1006-4311(2010)29-0138-03

0引言

燃气轮机是一种洁净、高效的动力装置。然而,由于燃气轮机设备结构复杂,影响其运行的因素较多,且其长期工作在高温、高压状态下,很多部件有可能发生故障。一旦设备出现故障停止运转,则需要投入大量的精力与时间来进行维修,带来巨大的经济损失,有时甚至会对工作人员的生命安全造成威胁。由于燃气轮机故障诊断能大幅度降低维修成本,同时也能大大提高机组运行的安全性和可靠性,所以对燃气轮机故障诊断系统的研究不仅有很大的理论意义,而且有较好的实用价值。

目前,对燃气轮机故障诊断的研究多采用基于BP神经网络的故障诊断方法。虽然BP单神经网络可以诊断多个故障,但它仍存在一定的缺陷:要实现对多个故障模式的诊断,网络需要对大量的故障样本进行学习,但构造反映多种故障样本的特征向量不是件容易的事;诊断多类故障的网络结构难以确定,即便确定了,往往也会出现网络节点过多、结构过于复杂等现象;当出现新的故障时,单神经网络的记忆必须全部消除,然后重新训练,工作量极大。针对以上几点,本文在BP神经网络的基础上将单神经网络按照一定原则进行分解,组成多个子神经网络,子神经网络结构相对简单,易于操作,相对而言更适用于大型复杂机械的故障诊断。

1组合神经网络模型的建立

1.1 组合神经网络模型简介神经网络能学习复杂、非线性关系,可以充当基于模型方法中的数学模型部分,还可以充当广义模式匹配器[1]。近年来,神经网络的研究和应用有了很大的发展,神经网络以其诸多优点,在故障诊断领域受到高度的重视,并得到广泛的研究和应用。

组合神经网络模型,即是将一定数量的个体神经网络组合在一起,并行的训练同一个任务,它最初是由Hansen和Salamon提出的。研究表明,由多个神经网络进行组合而构成的组合神经网络模型在泛化能力上得到了非常大的提高,效果明显优于单一网络模型[2]。组合神经网络模型结构如图1所示。

组合神经网络由多个子神经网络组成,子神经网络将单神经网络的诊断任务进行分解,负责诊断对象某个子系统的故障。子神经网络结构简单,训练所需的样本数量少,训练速度快。而且,当系统出现新故障时,组合神经网络可以通过添加新的子网络来进行处理,不需要重新训练,扩展性能强。

1.2 燃气轮机故障分类燃气轮机是一种简单开式循环双轴结构工业机组,它的设计和生产引入了模块的概念,使得燃气轮机的辅助系统分别设计、加工成标准模块,并对其标准模块进行试验,然后组装。这使得燃机具有可靠性强、适应性强、寿命长的特点。燃气轮机主要包含以下几个模块:燃气发生器、动力透平、、燃料、启动、监测和冷却系统模块。

由于燃气轮机结构的复杂性及其工作环境的多变性,导致其故障类型及故障模式纷繁复杂,从总体上看可分为3类:

1.2.1 性能型故障这种故障能导致机组性能的显著下降,性能型故障多表现在机组最大负荷下降,耗油率过高,部件效率下降,涡轮排气温度过高,压气机喘振等。

1.2.2 结构强度型故障这类故障的后果较为严重,表现为机组强度不足引起的破裂与损伤,高、低压疲劳损伤,热疲劳损伤等,如压气机叶片磨损及断裂。

1.2.3 辅助系统型故障这种类型的故障往往会诱发前述两种类型的故障,如控制系统的故障会导致压气机转速不稳定这类性能型故障,继而有可能导致压气机叶片断裂这类结构强度型故障。

根据从现场采集的数据资料,文中将燃气轮机经常发生的故障进行了筛选、分类,并绘制了表1。

上表中燃气轮机有两种类型的信号:状态量和连续量。状态量信号通常使用一维的数值就可以表示,例如,液体燃料阀开关(0表示该液体燃料阀开,1表示该液体燃料阀关)、油箱温度(66℃)。连续量信号是自变量为连续的时间变量的信号,燃气轮机信号中大部分信号均为连续量信号,如压力、压差等。

1.3 组合神经网络模型设计组合神经网络中的子神经网络结构简单,训练非常迅速,各子神经网络之间互不影响,各自诊断该子网络故障特征对应的故障。当系统出现新的故障特征及其对应的故障时,只需增加一个新的子神经网络或修正某一子神经网络即可,这样就大大提高了整个网络的扩展性和学习能力。

1.3.1 子网络的设计组合神经网络模型由若干个子神经网络组成,子网络的结构特性会直接影响组合神经网络的诊断效果。故而在设计子网络时,应遵循以下组成原则:使各子网络之间的相关性尽量小,即训练子神经网络的样本应尽量不同;不同测点上测得的各类故障声强信号之间的相关性很小,因此可按不同测点对样本进行分组,然后将分组后的样本分别用于子神经网络的训练;同时,计算每组样本数目在总样本数目中所占的比例,并将比例值作为每组子网络的可信度eg。

基于以上原则,我们将用于燃气轮机故障诊断的组合神经网络分为三个子神经网络:燃料子神经网络、子神经网络及透平子神经网络。

文中三个子神经网络的设计均采用了BP算法。BP算法将神经网络学习输入输出的映射问题转变为一个非线性优化问题,使用了最优化中最普遍的梯度下降算法,用迭代运算修正网络权重,实现网络输出与期望输出间的均方差最小化。该算法由前向计算过程和误差反向传播过程组成。

根据神经网络的要求和所要达到的网络输出目的,本文选择神经网络层间的传递函数为Sigmoid型函数,即为:f(x)=

其函数图像为:

1988年,Cybenko指出:当各节点均采用Sigmoid型函数时,一个隐含层就足以实现任意的判断分类问题,两个隐含层就足以表示输入图形的任意输出函数。这个结论对BP网络隐含层数目的确定具有指导性意义。根据实际情况,本文所设计的子神经网络均采用单隐层结构。

图2是组合神经网络中诊断燃料子系统故障的子神经网络。图3是组合神经网络中诊断子系统故障的子神经网络。图4是组合神经网络中诊断透平子系统故障的子神经网络。

1.3.2 子网络的整合Hansen和Salamon在Neural network ensembles一文中已经证明了:对于一个组合神经网络模型,如果一个模式正确分类的平均率小于50%,且组合神经网络模型中的个体网络的误差是独立的,则随着个体网络个数的无限增加,该模式分类的期望误差将逐渐趋于零。然而,这一假设在实际应用中很难实施,主要是因为实际操作中并不能保证各个体网络之间是相互独立的。

由于燃气轮机各个系统之间都具有一定的相互依存关系,不能保持绝对的相互独立,本文在保证个子神经网络相对独立的基础上,将燃气轮机故障诊断的组合神经网络结构设计如图5。

1.3.3 组合神经网络的训练组合神经网络的训练就是对网络中的子网络进行训练,本文为子网络输出的各个故障组织了3组样本进行训练。

这里我们将网络的输入信号进行了归一化处理,将信号处理到[0,1]区间内。

2结语

①针对故障训练样本采用归一化处理能很好地减小样本数据间的差异,提高网络诊断的正确率。②结合燃气轮机故障诊断的特点,用组合神经网络判别不同的故障种类,提高了网络的训练效率和诊断的准确性。通过对诊断实例的计算分析表明,用基于BP算法的人工神经网络模型作为基本分类器构建的组合神经网络在燃气轮机故障诊断中能够取得比较理想的结果,故障实例检测结果表明该算法判断模式、诊断结果均准确。

参考文献:

[1]张建华,张俊华,侯国莲.神经网络在故障诊断中的应用[J].电力学报,1998,13(4):1.

神经网络文本分类范文第3篇

关键词:图像分类;深度学习;Caffe框架;卷积神经网络

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)35-0209-03

Research and Implementation of Image Classification Based on Convolution Neural Network

WANG Chao

(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)

Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.

Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network

S着计算机与互联网技术的快速发展,我们已经进入了一个以图像构建的世界。但是面临有海量图像信息却找不到所需要的数据的困境,因而图像分类技术应运而生。通过各种机器学习算法使计算机自动将各类图像进行有效管理和分类,但是由于图像内容包含着大量复杂且难以描述的信息,图像特征提取和相识度匹配技术也存在一定的难题,要使得计算机能够像人类一样进行分类还是有很大的困难。

深度学习是近十年来人工智能领域取得的重要突破,在图像识别中的应用取得了巨大的进步,传统的机器学习模型属于神经网络模型,神经网络有大量的参数,经常会出现过拟合问题,因而对目标检测准确率上比较低。本文采用卷积神经网络框架,图像特征是从大数据中自动学习得到,而且神经网络的结构深由很多层组成,通过重复利用中间层的计算单元来减少参数,在特征汇聚阶段引入图像中目标的显著信信息,增强了图像的特征表达能力。通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示,通过实验测试,效果比传统的图像分类算法预测的准确度有明显的提升。

1 基于卷积神经网络的图像分类方法

1.1 人工神经网络

人工神经网络(Artificial Neural Network, ANN)是描述生物神经网络运行机理和工作过程的抽象和简化了的数学物理模型,使用路径权值的有向图来表示模型中的人工神经元节点和神经元之间的连接关系,之后通过硬件或软件程序实现上述有向图的运行[1]。目前最典型的人工神经网络算法包括:目前最典型的人工神经网络有BP网络 [2]Hopfield网络[3]Boltzmann机[4]SOFM网络[5]以及ART网络人工神经网络[6],算法流程图如图1所示[7]。

1.2 卷积神经网络框架的架构

Caffe是Convolutional Architecture for Fast Feature Embedding的缩写[8],意为快速特征嵌入的卷积结构,包含最先进的深度学习算法以及一系列的参考模型,图2表示的是卷积神经网络结构图。Caffe深度学习框架主要依赖CUDA,IntelMKL,OpenCV,glog软件以及caffe文件。本文使用的各个软件版本说明,如表1所示。

Caffe深度学习框架提供了多个经典的卷积神经网络模型,卷积神经网络是一种多层的监督学习神经网络,利用隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能,卷积神经网络模型通过采取梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,通过频繁的迭代训练来提高网络的精度。卷积神经网络使用权值共享,这一结构类似于生物神经网络,从而使网络的复杂程度明显降低,并且权值的数量也有大幅度的减少,本文使用这些模型直接进行训练,和传统的图像分类算法对比,性能有很大的提升,框架系统训练识别基本流程如图3表示。

1.3 图像分类特征提取

卷积神经网络的结构层次相比传统的浅层的神经网络来说,要复杂得多,每两层的神经元使用了局部连接的方式进行连接、神经元共享连接权重以及时间或空间上使用降采样充分利用数据本身的特征,因此决定了卷积神经网络与传统神经网络相比维度大幅度降低,从而降低计算时间的复杂度。卷积神经网络主要分为两个过程,分为卷积和采样,分别的对上层数据进行提取抽象和对数据进行降维的作用。

本文以Caffe深度学习框架中的 CIFAR-10数据集的猫的网络模型为例,如图4所示,对卷积神经网络模型进行训练。CIFAR-10是一个标准图像图像训练集,由六万张图像组成,共有10类(分为飞机,小汽车,鸟,猫,鹿,狗,青蛙,马,船,卡车),每个图片都是32×32像素的RGB彩色图像。通过对数据进行提取和降维的方法来提取图像数据的特征。

2 实验分析

将猫的图像训练集放在train的文件夹下,并统一修改成256×256像素大小,并对猫的图像训练集进行标记,标签为1,运行选择cpu进行训练,每进行10次迭代进行一次测试,测试间隔为10次,初始化学习率为0.001,每20次迭代显示一次信息,最大迭代次数为200次,网络训练的动量为0.9,权重衰退为0.0005,5000次进行一次当前状态的记录,记录显示如下图5所示,预测的准度在98%以上。而相比传统的图像分类算法BP神经网络网络的收敛性慢,训练时间长的,网络的学习和记忆具有不稳定性,因而卷e神经网络框架在训练时间和预测准度上具有非常大的优势。

3 结束语

本文使用Caffe深度学习框架,以CIFAR-10数据集中猫的网络模型为例,构建小型猫的数据集,提取猫的图象特征信息,最后和目标猫图像进行预测,并和传统的图像分类算法进行对比,预测的准确率有很大的提升。

参考文献:

[1] 杨铮, 吴陈沭, 刘云浩. 位置计算: 无线网络定位与可定位性[M]. 北京: 清华大学出版社, 2014.

[2] 丁士折. 人工神经网络基础[M]. 哈尔滨: 哈尔滨工程大学出版社, 2008.

[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.

[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.

[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.

[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.

神经网络文本分类范文第4篇

关键词:人脸朝向识别 学习向量量化 神经网络 特征向量提取

中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2016)05-0000-00

Abstract: Aiming at the low accuracy disadvantage of traditional facial orientation recognition algorithm, the paper employs the recognition method based on the Learning Vector Quantization neural network. By means of extracting the feature vector of eyes positions in the face images and studying the different facial image samples, the paper optimizes the weighting parameters of the LVQ neural network, which achieves good recognition result. The simulation results indicates that the facial orientation recognition based on the learning vector quantization neural network is feasible and effective, and the correct recognition rate can reach more than 95%. Besides, the paper ultimately proofs the accuracy and the validity of the learning vector quantization neural network is better than the Back-Propagation neural network.

Key Words: Facial orientation recognition, Learning vector quantization, Neural network,Feature vector extraction

人脸识别作为一个复杂的模式识别问题,是生物特征识别领域最困难的研究课题之一,其目的是从图像中剔除背景、提取人脸区域。人脸识别系统主要包括图像数据库采集、人脸图像预处理、人脸特征建模及识别匹配。计算机技术的告诉发展使人脸图像在人机交互中发挥着越来越重要的作用,由于实际应用中,人脸外形的不稳定性以及光照条件的多样性使人脸视觉图像在位置、朝向以及旋转角度等方面产生巨大的差异,因此对人脸进行准确识别变得异常困难。

学习向量量化(LVQ)神经网络是一种用于训练竞争层的有监督学习方法的输入前向神经网络,其算法是从Kohonen竞争算法演化而来的[1]。与其他模式识别和映射方法相比,它的优势在于网络结构简单,并且不需要对输入向量进行归一化、正交化处理,只通过计算输入向量与竞争层之间的距离,从而完成复杂的分类处理[2]。当人脸朝向与旋转角度不同时,眼睛局部特征与人脸图像的几何关系有较强的可区分性,因此提取人眼位置信息的特征向量并获得有助于人脸朝向分类的特征数据,将该特征信息作为LVQ神经网络的输入,可实现对任意给出的人脸图像进行朝向的识别,通过仿真可证明该方法的有效性。

1学习向量量化(LVQ)神经网络

学习向量量化神经网络是在竞争网络结构的基础上提出的,是自组织(SOFM)神经网络的一种有监督形式的扩展。在网络学习过程中加入教师信号作为分类信息对权值进行微调,并对输出神经元预先指定类别,LVQ神经网络实现了二者有效的结合,能够更好发挥竞争学习与有监督学习的优点。

1.1 LVQ神经网络结构与工作原理

广义学习向量量化神经网络由三层神经元组成,即输入层、隐藏的竞争层和线性输出层[3],其网络结构如图1所示。输入层与竞争层之间采用全连接方式,竞争层与输出层之间采用部分连接方式[4]。竞争层神经元个数通常取输出层神经元个数的整数倍,每个竞争层神经元有且只有一个输出层神经元与之相连接且连接权值固定为1,而每个线性输出层神经元可以与多个竞争层神经元相连接[5]。在学习向量量化神经网络训练过程中,当某个输入模式被送入网络时,竞争层的神经元通过竞争学习规则产生获胜神经元,获胜神经元调整权值的结果是使权值进一步向当前的输入向量靠近。当下次出现相似的输入模式时,获胜神经元更容易得到修改权值的机会。在反复的竞争学习中,竞争层的各神经元对应的权值逐步被调整为输入样本空间的聚类中心[6]。该神经元被激活后输出状态为“1”,而其他竞争层神经元的状态均为“0”。因此,与被激活神经元相连的线性输出层神经元状态为“1”。其余输出层神经元状态为“0”,从而实现模式分类与识别。

LVQ各层的数学描述如下:设神经网络输入向量,其中为输入层神经元个数;竞争层输出,表达式为;输出层实际输出为,表达式为,网络期望输出为。输入层与竞争层之间的权系数矩阵,其中列向量为竞争层第个神经元对应的权值向量;同理可得,竞争层与输出层之间的权系数矩阵为,其中列向量为竞输出层第个神经元对应的权值向量。

1.2 LVQ神经网络学习算法

向量量化是利用输入向量的固有机构进行数据压缩的技术,学习向量量化是在向量量化基础上将输入向量分类的监督学习方法[7]。LVQ网络在训练前指定好线性输出层的神经元类别,在学习训练过程中不再改变竞争层与输出层之间的权系数矩阵,而是通过改变进行学习。该算法实质是根据训练样本的特征进行“奖励与惩罚”的一种迭代学习算法,即对分类正确的样本,“奖励”与其距离最近的权值点。经过若干次训练后,得到的权值不再变化,说明网络达到收敛状态[8]。而竞争层神经元的数目输入待分类的模式样本测试,根据最近邻法则得到输入样本模式的类别属性。

LVQ1具体算法步骤为:

(1) 初始化输入层与竞争层间的权值,确定初始学习速率与训练次数;

(2)将输入向量输入网络,计算竞争层神经元与输入向量的距离并寻找获胜神经元:

(3)根据分类是否正确调整获胜神经元的权值:当网络分类结果与教师信号一致时,向输入样本方向调整权值;反之,其他非获胜神经元的权值保持不变。

算法直接利用最小欧式距离选择与输入向量最接近的矢量,因此不需要对权值向量和输入向量进行归一化处理。

在上述LVQ学习算法中,有且只有一个神经元获胜并得到更新调整权值的机会。为了改善分类效果,Kohonen对该算法进行了改进,并命名为LVQ2算法[9]。改进算法基于光滑的移动决策边界逼近贝叶斯极限,其特点是引入“次获胜”神经元,使得“获胜”神经元与“次获胜”神经元的权值向量都被更新[10]。

LVQ2具体计算步骤如下:

(1)初始化参数、计算竞争层神经元与输入向量距离同LVQ1算法;

(2)选择与输入向量距离最小的两个竞争层神经元;

(3)若神经元对应于不同类别且与当前输入向量的距离满足,其中为输入向量可能落进的接近于两个向量中段平面的窗口宽度,经验值为左右,那么若神经元对应的类别=输入向量类别,则,若神经元对应的类别=输入向量类别,则。

(4)若神经元不满足上述条件,则按照LVQ1步骤(3)中进行更新即可。

2基于学习向量量化神经网络的人脸朝向识别方法

2.1输入向量与目标向量的设计

观察大量人脸图像容易察觉,当人脸图像旋转角不一样时,眼睛局部特征在图像中的位置差异明显,因此仅需提取描述眼睛局部位置信息的特征向量并作为LVQ神经网络的输入,分别用数字1,2,3,4,5表示五个朝向左方、左前方、前方、右前方、右方,并作为神经网络的输出。搜集10人共50幅不同朝向的人脸图像,随机选取其中30幅图像作为训练集,剩余20幅作为测试集,因此目标向量为305的向量,其中每列只有一个“1”,其余均为“0”。

2.2人脸特征向量的提取

如上文所述,文中将420420的图像划分为6行8列,人物双眼的局部特征信息通过第二行的8个子矩阵描述,在利用Sobel算子对图像进行边缘检测后第二行8个子矩阵中值为“1”的像素点个数可较为准确的表示人脸朝向。

2.3 LVQ神经网络的创建与训练

LVQ网络设计的关键因素包括训练样本是否具有普遍性与代表性,训练样本容量能否满足需要,竞争层神经元数量、初始权值等网络参数取值是否得到优化。根据特征向量与训练图像数量可知输入和输出节点分别为30和5,竞争层神经元的个数通常取决于输入输出关系的复杂性。为防止因竞争层神经元数过多产生“死”神经元,竞争层节点数经验值为线性输出层节点数的24倍,本文选取15作为竞争层节点数;其次是选择合适的学习率,为保证算法的收敛性与稳定性,学习率取恒定值或随时间单调减小,通常取。本文期望误差取值0.001,学习函数用LVQ1,最大训练步数设为100,初始化参数后对LVQ神经网络进行训练,训练算法达到预先指定的误差容限后停止。训练过程曲线如图2所示,由图可知网络收敛性较好,满足误差要求。

3实验结果与分析

3.1网络测试识别率与训练次数、学习算法关系

将测试的20幅不同朝向的人脸图像输入网络,网络识别率如表1所示。由表1结果可知,LVQ神经网络识别人脸朝向可行且有效,总体上取得了较好的识别结果。从训练次数分析,在一定范围内训练次数的增加会提高分类识别正确率,所需训练时间也会增加,识别错误主要因为样本数据较为复杂。当训练集较少时识别率会相对较低,因此在防止出现过拟合的同时应尽量增加训练集的样本数目,可有效改善网络识别结果。

从算法角度分析,结果显示LVQ2算法虽然是对LVQ1算法的改进但同时引入了新的误差,因此识别结果较差;同时LVQ1算法运用简单,识别率较高,具体应用时应开发更好的优化学习算法,综合考虑性能指标作折衷处理。

3.2 LVQ神经网络与BP神经网络识别效果对比

由于BP神经网络的输出为非二值数据,因此采用四舍五入方法:若网络输出小于0.5则认为是0,反之为1;并提前利用三位二进制数编码对五个朝向进行表述,如表2所示。

设置训练次数为100次,BP神经网络仿真结果识别率仅为85%,并出现错误预测值 [0;0;0],该状态不属于表2中任何一种,从结果判断不出图像中人脸朝向,而LVQ神经网络不仅可以很好的规避这一缺点,同时算法识别准确率明显较高。

4结语

本文提出了一种基于学习向量量化神经网络的人脸朝向识别方法,该方法第一步提取人脸图像中双眼的局部位置特征向量,并将提取的向量送入网络进行训练测试实现人脸朝向的准确识别,然后通过仿真实验证明利用LVQ神经网络进行人脸朝向识别方法的有效性,该方法能够发挥竞争学习和有监督学者的优点,且网络结构简单,有效提高了识别率。

参考文献

[1] 秦恺,曹龙汉 等.基于LVQ神经网络集成的柴油机气门故障诊断[J].UPS应用,2014:47-50.

[2] 董妍慧.基于LVQ神经网络模型的企业财务危机预警[J].大连海事大学学报,2008,7(1):92-94.

[3] 胡波,王文娟.基于向量量化网络的煤矿瓦斯监控系统改造[J].电力学报,2010,25(2):162-164

[4] 朱玉斌,李华聪.基于LVQ网络的航空发动机气路故障特征提取方法研究[J].测控技术,2014,33(6):24-27.

[5] 律方成,张波.LVQ神经网络在GIS局部放电类型识别中的应用[J].电测与仪表,2014,51(18):112-115.

[6] 戴金辉.基于混合神经网络的入侵检测技术的研究[D].东北大学硕士论文,2010:37-39.

[7] 程剑锋,徐俊艳.学习矢量量化的推广及其典型形式的比较[J].计算机工程与应用,2006(17):64-66.

[8] 李琳,张永祥.学习向量量化(LVQ)神经网络在周期信号识别方面的扩展应用[J].机械设计与制造,2006,6:120-122.

神经网络文本分类范文第5篇

关键词:神经网络 地下水质量评价 应用

中图分类号:X824 文献标识码:A 文章编号:1672-3791(2016)08(b)-0000-00

1 前言

为解决包虫病影响百姓健康和经济发展问题,石渠县实施了大量打井取水工程。为了客观评价地下水质量,本文采取了人工神经网络算法模型,取得了理想效果。

2人工神经网络概述

近年来,人工神经网络取得快速发展,越来越多的应用于地质矿产、能源等领域。韩国人机围棋大赛,“AlphaGo”完胜李世石,让人工神经网络倍受众人关注。人工神经网络是一种模仿人脑神经网络行为特征,进行分布式并行处理信息的数学算法模型,通过调整模型内部节点间连接关系,达到处理信息的目的。

人工神经网络可以分为模型构建、训练和仿真三个阶段。模型构建就是根据数据的特征,有针对性的构建适于数据仿真的网络模型结构。模型结构包括输入层、隐含层和输出层,每一层由神经元组成。神经元是模型的基本单元,通过阈值和激活函数把上层信息传递给下层。模型训练是已知输入―输出数据样本,把输入数据代入模型计算,通过不断调整模型内部参数,使输出结果与已知输出数据误差减小至允许范围内,从而确定模型参数。训练样本越多、越有规律性,仿真结果就越真实。模型仿真即使用训练好的网络模型,用新的输入数据代入模型,得到输出结果的过程。仿真可以实现模拟人脑神经进行识别、判断、归类等功能。

3 地下水质量评价模型建立

本文采用Matlab建立一个三层的BP人工神经网络模型,包含输入层、隐含层和输出层。输入层为地下水评价因子,本文选取总硬度、溶解性总固体、硫酸盐、氯化物等21项主要指标作为评价因子,因此输入层有21个神经元。地下水质量分为5类,输入期望值为Ⅰ类(1,0,0,0,0)、Ⅱ类(0,1,0,0,0)、Ⅲ类(0,0,1,0,0)、Ⅳ类(0,0,0,1,0)、Ⅴ类(0,0,0,0,1),因此输出层神经元有5个。隐含层可设为5个神经元,则网络结构为2155(图1)。采用Matlab工具箱premnmx函数对数据进行归一化处理,newff函数建立BP模型,sim函数进行仿真。

4 样本数据准备及训练

模型训练阶段需要对足够量的样本进行训练,以赋予模型结构较为准确的内部参数。本文根据《地下水质量评价标准》随机生成足量样本数据。例如:总硬度、溶解性总固体、硫酸盐、氯化物四个因子,按地下水质量分类指标,在每一类区间随机生成3个样本,则5类共随机得到如表2所示15个样本。生成的样本数量应足够多才能提高仿真准确性和减少训练步数,但过多样本则影响计算速度。本文对评价的21个因子,按分类指标每类随机生成40个样本,共200个样本,输出允许误差设为0.01,训练到540步时就达到了目标。

5 模型仿真

本文的模型仿真对象为石渠县东区50口井地下水的化学分析数据,每口井1组样品,选取总硬度、溶解性总固体、硫酸盐、氯化物等21个主要评价因子。采用matlab的sim函数,把50组样品作为输入数据,得到输出结果。

以上输出数据显示5口井水质均为Ⅰ类。通过模型仿真,50口井水质均达到Ⅰ类水质标准,与《地下水质量标准》的综合评价评分法结果基本一致。

6 结论

人工神经网络运用的准确度,在于模型构建的合理性、输入―输出数据的相关性、训练样本的普适性。如果样本采集数据较窄,不能反映大部分背景特征,那么仿真时可能出现偏差。本文选取BP神经网络,按标准分类随机生成大量训练样本,保证了样本的普适性,使模型更可靠,运用范围更广。在石渠县包虫病区打井工程中的成功运用,说明了模型的可靠性和通用性,可进一步运用于其它工程和问题。

参考文献

[1] 焦李成.神经网络系统理论[M].西安:西安电子科技大学出版社,1990:6~16.