卷积神经网络的优点(精选5篇)

首页 > 文章中心 > 卷积神经网络的优点

卷积神经网络的优点

时间：2024-03-28 18:09:07

卷积神经网络的优点

卷积神经网络的优点范文第1篇

【关键词】深度学习卷积神经网络权值共享下采样 R-CNN Fast-R-CNN

1 绪论

随着电子信息技术的快速发展，芯片的设计与生产进入了纳米时代，计算机的计算能力与计算速度得到了空前的提高，但是人们的需求是无限的，要求计算机能更加任性化的服务于我们的生活，这也就要求计算机本身能像人一样识别与感知周围的环境，并对复杂的环境做出正确的判断。而图片信息是我们周围环境最直观的，最容易获取的信息，要求计算机能对为的环境做出识别与判断也就要求计算机能够智能的识别图像信息。深度学习是机器学习中的一个新的研究领域。通过深度学习的方法构建深度网络来抽取目标特征进而识别周围的环境。卷积神经网络对图像的处理具有平移，旋转，扭曲不变的优良特性。在处理图像是更加快捷和便利。卷积神经网络使得计算机在感知识别周围环境的能力有了巨大的提升，使得计算机更加智能。卷积神经网络拥有强大的特征提取能力，使得其在图像分类识别，目标跟踪等领域有着强大的运用。

1.1 国内外研究现状

1986年，Rumelhart和Mc Celland提出BP算法。BP算法反向传导神经网络输出误差进行训练神经网络。通过BP算法，神经网络能够从大量训练数据中的学习到相关统计信息，学习到的数据统计信息能够反映关于输入-输出数据模型的函数映射关系。

自2006年以来，Geoffery Hinton教授提出深度信念网络。从此深度学习在学术界持续升温。深度学习不仅改变着传统的机器学习方法，也影响着我们对人类感知的理解，迄今已在语音识别和图像理解等应用领域引起了突破性的变革。各种相关的算法和模型都取得了重要的突破，使得深度学习在图像分类，语音识别，自然语言处理等领域有广泛的运用。

2013年百度成立百度深度学习研究院以来我国的人工智能领域取得了长足的进步。在人工智能专家吴恩达的带领下，百度陆续推出一系列人工智能产品，无人驾驶技术，DuerOS语音交互计算平台，人脸识别技术，美乐医等优秀产品。此外Imagenet图像识别大赛中也诞生了一系列经典的神经网络结构，VGG，Fast-R-CNN，SPP-net等等，可以说人工智能技术在近几年得到了空前的发展。

2 深度学习概述

深度学习是机器学习的一个新方向，通过学习样本数据内在规律和深层特征深度，深度学习神经网络能够像人一样有分析和学的能力，尤其在文字处理，图像识别，语音等领域更加突出。能够自主学习一些新的东西。目前深度学习使用的典型技术是通过特征表达和分类器来进行目标识别等任务的。并在语音识别、图像处理、机器翻译等领域取得很多成果。

深度学习不同于以往的浅层学习，浅层学习模型值包含一个隐藏层，或者不存在隐藏层，深度学习则是由很多隐藏层组成的，上一层的输出作为下一层的输入，实验对输入信息进行分级表达。目前深度学习框架主要包含三种深度学习框架，如图1、2、3所示。

3 卷积神经网络

卷积神经网络的结构层次比传统的神经网络复杂，卷积神经网络包含大量的隐藏层，相邻的卷积核或者下采样核采用局部感受野全链接，神经元权值共享的规则，因此卷积神经网络训练参数的数量远比传统神经网络少，卷积神经网络在训练和前向测试的复杂度大幅度降低，同时也减少了神经网络训练参数过拟合的几率。卷积神经网络主要有两部分，分别是卷积核和下采样核。卷积核主要对上一层的图像进行卷积运算，提取图像特征，下采样核则是对上层的数据进行将为处理，减少神经网络的复杂度。

卷积神经网络中每一个神经元的输入与前一层的局部感受野相连，提取局部感受野的特征，比如图像的轮廓，颜色等特征，而这些特征不仅包括传统人类能理解的特征，也包括神经网络自身能够识别的特征，卷积核全职共享，因此这些特征提取与图像的位置无关。

图4是经典的LeNet5卷积神经网络架构，LeNet5架构中卷积核和下采样核交替出现，下采样核及时的将卷积核生成的特征向量进行降维，减少神经网络的运算量。LeNet5算法在1962年幼Hubel等人提出，在识别手写数字mnist中有极高的准确率。

4 R-CNN、Fast-R-CNN对比分析

卷积神经网络在对图像进行识别具有平移，旋转，扭曲不变的优良特性，并且能够实现高准确率识别图像，但是在现实生活运用中往往需要神经网络标记出目标的相对位置，这是传统卷积神经网络不具备的功能。因此在前人传统卷积神经网路基础上对卷积神经网络进行改进，产生了具有对图像中目标进行识别和定位的卷积神经网络R-CNN，Fast-R-CNN等改良算法。

4.1 R-CNN

R-CNN为Region Convoluntional Neural Network的缩写即对图像进行局部区域的卷积处理，其核心思想主要是利用候选区图像对物体探测中位置信息进行精确处理和利用监督式预训练和区域特殊化的微调方法，代替了传统的非监督式预训练和监督式微调。

在CNN中，全连接层输入是固定大小的，因此R-CNN用计算机视觉算法将每一张图片分割成1000-2000张的候选区图片后，要将这些候选区图片进行变换，生成固定大小的候选图片，在训练提取特征时一般采用经过预训练的模型参数进行finetuning，榱嗽黾友盗费本，模型在也将生成的候选框以及标定的标签作为训练样本进行训练。R-CNN采用SVMs分类器对特征向量进行分类，在训练SVMs时将候选框经过卷积神经网络提取的特征和SVM标定结果输入到SVMs分类器训练分类器模型。而在测试时将图像全部候选框经过卷积神经网络提取的特征输入到SVMs分类器中，得到每一类的评分结果。但是R-CNN在处理一张图片是要处理需要对一张图片1000-2000个候选区图像进行前向运算，保存所有后选取图片的特征值，要求计算硬件有大量的存储空间，同时处理每一张图片的时间也会增加。由于训练集庞大，本文采用hard negative mining method方法提高存储的利用率。

R-CNN的体现出了极大的优势，其中MAP也可以大幅度提高，但是正如本文上述，R-CNN计算的时间成本很大，达不到实时的计算效果，R-CNN在对候选区进行处理时会使得图像失真，部分信息丢失。

4.2 Fast-R-CNN

Fast-R-CNN则是再次改进的一种基于卷积神经网络目标跟踪定位算法。相比于R-CNN，Fast-R-CNN从单输入变为双输入，在全连接层后有了两个输出，引入了Rol层。

Fast-R-CNN在运行的时候同样会生成大量的候选区，同时将原始的图片用卷积神经网络进行特征提取，将原始图片提取的特征与生成的候选区坐标送入Rol层为每一个候选区生成一个固定大小的特征向量。最后将Rol生成的特征向量全连接层产生最终的LOSS。Fast-R-CNN中的LOSS采用多LOSS模式，SoftMax LOSS用于计算K+1分类的损失，K为第K个目标，1为背景；Regression LOSS计算候选区的四个角的坐标。

Fast-R-CNN在MAP上有了大幅度的提升，速度也得到了提升，但是在计算候选区是仍存在瓶颈，这也是限制Fast-R-CNN速度的因素。

5 实验测试

对于本文提出的卷积神经网络识别图像定位图像目标算法R-CNN，Fast-R-CNN，在本章给出实验结果。实验平台为基于Linux系统的debian8下运行caffe进行训练，采用显卡K620进行实验。

训练模型初始化参数在是服从高斯随机分布，R-CNN采用的网络结构如图7所示，Fast-R-CNN的网络结构如图8所示。

本次实现的训练样本为录制实验室视频数据，将视频数据转换成帧图片，对每张图片数据进行裁剪，裁剪后图像大小在256*256，共有500张，再将裁剪后的图片进行旋转，平移，扭曲，镜像，加噪声等处理，最后生成144万张样本图片，其中136.8万张图片作为训练样本，7.2万张作为测试样本。

6 总结

在目标识别定位领域，卷积神经网络具有强大的图像处理能力，对图像的识别定位具有很高度平移，旋转，扭曲不变形的优良性能。卷积神经网络架构R-CNN和Fast-R-CNN都有强大的图像处理能力。Fast-R-CNN在识别准确率上比R-CNN高。R-CNN算法复杂，对一张图片需要进行1000-2000次的卷积运算，特征重复提取。因此在训练和前向测试时，R-CNN用的时间长，不能很好的适用于处理实时图片数据，尤其视频数据。R-CNN在对每个候选区进行特征提取之后需要将提取的特征向量存入内存，降低训练测试时间的同时也需要耗费大量内存。因此从各方面分析可知，Fast-R-CNN性能优于R-CNN。

参考文献

[1]谢宝剑.基于卷积神经网络图像分类方法研究[D].合肥工业大学，2015.

[2]郑胤，陈权崎，章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报，2014（02）：175-184.

[3]陈先昌.基于卷积神经网络的深度学习算法与运用研究[D].杭州：浙江工商大学，2006（04）：603-617.

[4]李彦冬，郝宗波，雷航等.卷积神经网络研究综述[J].计算机应用，2016.

[5]Gibson.J J.The perception of the Visual World[J].Cambridge，England，1950.

[6]HORN B，SCHUNCK P.Determining optical flow[J].Artificial Intelligence， 1981，17：185-203.

[7]R.Girshick，J.Donahue，T. Darrell，and J.Malik，“Rich feature hierarchies for accurate object detection and semantic segmentation，”in CVPR，2014

[8]Ross Girshick，Wicrosoft Research. Fast R-CNN，.

[9]R.Girshick.Fast R-CNN. arXiv：1504.08083，2015.

卷积神经网络的优点范文第2篇

关键词：模式识别卷积神经网络 google earth 应用

中图分类号：TP39 文献标识码：A 文章编号：1007—3973（2012）009—087—02

随着科技的进步，许多发明、电子产品使人们的生活更加方便。生活经常见到的有：笔记本电脑的指纹锁、数码相机的人像识别功能、电脑手写板、语音录入设备、门禁中的虹膜识别技术等等，这些设备与技术中都包含了模式识别技术。这些看似抽象的技术与算法正与其他技术一起悄然的改变人们的生活。

1 什么是模式识别

人们的许多感官功能看似简单，但用人工的办法实现却比较困难。人与人见面相互打招呼。在看见对方的面部后，人能够很快的认定这张脸是个人脸，而且我认识他，应该和他打招呼。这个看似简单的过程其实并不简单，我们不仅仅要识别五官，还要扫描轮廓，而且还要判断是否认识等等。可见，很多看似简单的认知过程，如果试图用某一方法描述确实不宜。对人脸进行模式识别就可以解决这个看似简单的问题。

模式识别（Pattern Recognition）是指通过用计算机对事物或现象的各种形式的（光信息，声信息，生物信息）信息进行处理和和判读，以对事物或现象进行描述、辨认、分类和解释的过程，是人工智能的和信息捕获的重要组成部分。现在被广泛应用于计算机视觉，自然语言处理，生物特征识别，互联网搜索等领域。

2 模式识别与google earth卫星照片

在卫星图片中识别特定的目标，如道路，湖泊，森林等等，往往要运用模式识别技术，现在较为主流的是神经网络识别。上一代的技术室根据RGB提取的，在提取森林或湖泊的时候，有很多干扰颜色，对卫星照片精度有很高要求。根据RGB提取效果不是十分理想，而且计算量大，对硬件有一定要求。

随着神经网络识别技术的发展，现在计算机可自动识别目标。不必使用特殊的卫星波段影像，小型机计算，只要从GOOGLE EARTH获取的普通卫星影像就可以自动识别了。

Google Earth是Google公司开发推出的一款虚拟地球仪软件，它把卫星照片、航空照相布置在一个地球的三维模型上，是一款全球地图集成软件。Google Earth与模式识别技术的综合运用，使其卫星图片在道路规划，通信线路管理，土地勘察，遥感探测等等行业有着很大的运用。

在实际情况下对卫星图片进行模式识别，实现起来有许多困难，光线条件、大地背景、大气云层情况影响以及由于拍摄角度或空气密度等原因导致照片的被照物体的几何变形等都会对识别效果有直接影响。这些都对识别算法要求很高。本文选用的神经网络识别方法，具有识别率高、对不规则物体识别效果好等优点，被广泛运用在许多领域。本文使用改进的卷积神经网络对google earth 卫星图片进行处理，几乎不用对照片进行预处理。这大大节省了运算时间，而且避免了二次处理后对原始文件的污染，大量原始信号被最大程度地保留。

3 模式识别与卷积神经网络

卷积神经网络CNN（Convolutional Neural Networks）是近年发展起来并引起广泛重视的一种高效识别方法。神经网络是受动物神经系统启发，利用大量简单处理单元互联而构成的复杂系统，以解决复杂模式识别与行为控制问题。目前，CNN已经成为国内外科学家研究的重点方向，特别是在模式识别领域。它的优点是不需要对图像进行复杂的预处理，成为大家广为使用的方法。CNN的基本结构一般包括两层：（1）特征提取层。每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，与其他特征间的位置关系也随之确定下来。（2）特征映射层。网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。

4 卷积神经网络在卫星图片识别中的应用

为提高google earth卫星照片中目标的识别率，创造性使用卷积神经网络进行模式识别，其主要部分基本设计结构如图1所示。

图1中，整个结构模仿动物的神经结构，大量的单一识别单元被关联成一个网路。 C层则是由复杂（complex）神经元组成的神经层，它的输入连接是固定的，不可修改，显示接收信心被激励位置的近似变化。网络中C层的最后一层为识别层，显示模式识别的结果。S层为简单（simple）神经元组成的神经层，完成主要信息提取，其输入连接是不是固定的，可在训练的过程中不断修改。这个系统进过不断的训练，输入照片的格式和大小会自动地被识别，大大节省了前期的工作时间，提高了识别速度。

在训练集中同时需要常规积极样本和消极样本，样本包括卫星图片中房屋和道路的1000个图像目标积极训练集。大多数基于学习方法的目标物体识别使用一个大约为10？0的最小输入窗口，好处是可以做到不遗漏任何重要信息。为了达到稳定的效果，对所有原有的训练样进行色彩转换和对比还原转换，得到的积极样本训练集有2400个目标样本。

5 实验结果

分两个步骤进行试验，第一步对卫星图片进行定位和裁剪等预处理，第二步选取合格卫星图片200个样本图片训练卷积神经网络，训练后得到各层3个主要数据：阈值、权值及神经元细胞平面数，然后使用优化后的神经网络识别机对200个测试样本进行检查，其正确的识别率达到97%。实验要注意训练的时间，系统过度训练后，识别率会不断提高，但训练时间的不断增加，测试失败率到最小值后出现及其微细震荡，造成识别率的小幅波动。（见图2）

实验表明，卷积神经网络应用于卫星图片目标识别是完全可行的，训练样本越丰富则则识别率越高。与传统模式识别方法相比有更高的识别率和抗干扰性。本文采用一种改进的基于卷积神经网络的识别机制对卫星照片中的目标物体进行识别。该识别方法通过对目标物体图片的学习，优化了系统中的关键参数的权值。大大提高了目标物体的识别率。

参考文献：

[1] 高隽.智能信息处理方法导论[M].北京：机械工业出版社，2004.

[2] 高隽.人工神经网络原理及仿真实例[M].北京：机械工业出版社，2003.

[3] 边肇祺.模式识别[M].北京：清华大学出版社，1987.

卷积神经网络的优点范文第3篇

关键词：智能消防；火焰识别；卷积神经网络

一、智能装备简介

若想提高消防救援队伍的灭火救援效能，提高装备的智能化水平是必不可少的一步。消防装备的配备情况影响着战术和战术效果，甚至是直接影响救援成功率的重要因素。因此，提升装备的智能化水平、改善装备结构从而提升消防救援队伍的作战能力是关系广大人民群众生命以及财产安全的重要手段。消防装备智能化的研究工作任重而道远。本文着眼于图像法火焰识别技术，通过研究新技术，探讨将其应用于智能消防装备之中的可行性。

二、卷积神经网络的简介

（一）网络结构。卷积神经网络功能繁多，其中多层检测学习神经网是一种多层次的神经监测网络。其中心模块为卷积层，主要由隐藏层与最大池采样层组成，主要功能是特征提取。其中，连接层与传统多层感应器的隐藏层、逻辑归类器相对应。卷积神经网络的输入特征来源使卷积滤波器，而该神经网络的每一层都有多个理论上的神经元以及特征图。在给一个来自卷积和子采样层的输入统计滤波后，系统就提取了图像局部的特征，就可以确定它与其他特征之间的相对方位，上一层的输出值直接输入至下一层。通常情况下，我们可以通过特征层来得到卷积层（特征层是指：输入到隐藏层之间的映射）。（二）局部感受野与权值共享。局部感受野：由于图像空间的连接是局部性的，因此每个神经元都不需要感测全部图像，而只需感觉到局部的特征。然后，通过对较高级别感测量的局部神经元进行集成，可以得到整体的信息，并且减少了连接数量。权重分享：不同神经元之间的参数分享可通过降低求解参数，并通过放大器对图像的放大积获得多种特征图。实际上，权重共享图像上的第一隐藏层的所有神经元由于是在同一卷积上确认的，所以均能在图像的任意一个位置检测到毫无差别的特性。他的最主要的功能是能够通过适应小范围的图像和平移从而达到检测不同位置的目的，也就是良好的不变性平移。（三）卷积层、下采样层。卷积层：通过去卷积来提取图像特征，用来强化初始信号原属性，从而减少噪音。下采样层：由于研究人员发现图像下采样过程中，它能在保留信息的同时降低数据处理量，因此在发现某一特定的特征后，由于这个位置并不重要，所以样本会扰乱特定的位置。我们只需要知道这个特征与其他特点之间的空间相对方位，就可以处理类似的物体由变形和变型而产生的变化。（四）卷积神经网络的不足。如果网络层需要加深，每一个网络层增加的神经元数量会大幅增加，从而使模型复杂化，增大了调整参数的难度，也增大了过度拟合的风险。此外，在反向传播过程中，连续迭代会使梯度不断减小，而梯度一旦归零，权值便无法更新，导致神经元失效。（五）展望与总结随着研究人员对卷积神经网络相关的研究不断推进，其性能日益强大，复杂度也日益提升。目前，卷积神经网络的相关研究已经取得了显著成效。然而，一些人工扰动（如向原图片中键入噪点）仍然会导致图像的错误分类。如何解决这一问题，是今后研究的重点。此外，卷积神经网络的结构升级仍有很大空间，通过提升网络结构设计的合理性，可以完善量化分析能力。

三、图像分割

图像中包含很多数据，需要分割图像。然而，精确区分干扰是对整个系统亮度的精确分类和准确划类的前提。图像的分析技术是计算机视觉技术的基础。通过图像分割、提取特征参量等方法可以将原本的图像抽象化，从而便于分析和处理。多年以来，图像的分割技术研究一直是重中之重，研究人员给出了多种分割方法。一般而言，图像分割是将图像划分为不同的区域，给不同的区域赋予不同的权重，从而获取重要对象的一种技术。特征可能是灰度、颜色、纹理等，目标可能对应一个区或多个地方，这与特殊目的应用程序和特殊目的服务请求程序有关。一般而言，图像取值分割分析算法大致来说可以再细分为图形图像取值分割、边缘图像分割、区域分割和重复图像分析四大个门类。

四、火焰色彩虚拟模型的特征

（一）火焰色彩颜色类型特征。火焰色彩模型一般来说是基于某种火焰色彩类型模式，通过在图像阈值控制范围内通过设置某种色彩模型图像阈值来降噪提取火焰颜色特征图像。可以用任何提取静态火焰的特殊像素或者图案方式来精确描述一个静态火焰特征。然而，单纯地依靠颜色模型来进行火焰识别会导致严重的误判。火焰的颜色范围是非常大的，所以它很可能与其他物体颜色相近，导致模型将其混为一谈。（二）降噪在。火焰发展的初期过程中，是不断处于移动变化的。又一方面，火焰的全部运动都不会跳跃，也就是火焰满足相对稳定性。所谓燃烧火灾的相对稳定性，是指在火灾发生后，燃烧范围的空间会成一个相对稳定的扩增趋势扩增。通过分析火灾的相对稳定性，可以消灭许多虚假信号。（三）静态模型。在基于单帧图像识别的算法中，由于只使用了几个以火焰为基准的单一形状特征，因此算法复杂、误判率很高。因此，一个能够自主优化识别的模型就显得十分重要，图像静态特征提取的方法如下：由于曲率在人的视觉系统中往往是观测场景的重要参数，因此提取几何图像曲率等参数，并以此描绘火焰图像；根据测得的数据，描绘连续零曲率以及局部最大曲率、最高曲率正负值等集合特点。（四）动态模型在动态燃烧过程中，产生的火焰具有持续性。此外，根据火焰自身的特性和各种原因，火焰还会不断发生变化。然而，这种变化并不在单个帧图像中反映出来，而是在连续的多帧图像中只反映。因此，提取火焰的动态特征就是分析处理连续多帧图像。近年来，随着火灾科学的发展，从火焰的随机状态中发现了其规则性：1.火焰的面积增长性；2.火焰的形状相似性；3.火焰的整体移动。基于图像的火焰识别算法可划分为动态识别和静态识别。若将这两种算法同步进行应用，则定能增加工作效率。火焰形成的重要特点之一便是火焰形状。对于采集到的ccd火焰图像，首先进行两个连续的图像差分操作，然后通过分割方法获得连续帧的变化区域，使用扫描窗口得到的像素点数来记述连续帧变化区域。变化区域是指：图像处理中，在获得阈值之后，通过对高光度进行科学计算、实验分析，最终得到的区域。当其他高温物体移动到相机或离开视野时，所检测到的目标区域会逐渐扩大，并容易引起干扰，从而造成系统错误的报告。因此，需要将数据和其他图像的关键性特征进行一个高强度的结合，再深度进行挖掘。火焰的形状相似性：图像之间的类似性通常依赖于已知描述特点之间的差异度。该方法能够在任意复杂程度上建立相应的类似性量。我们可以对两个相似的元素进行比较，也可以对两个相似的场面进行比较，图像之间的相似性通常意义上是指场景以及结构上的相似性。在一般情况下，图像的结构相似度往往并不高，因此，我们倾向于选择更加典型的结构特点进行描述，如区域面积、区域亮度、线段长度等参数。虽然火焰的图像序列中火焰的边缘往往是很不稳定的，但图像的总体变化会被限制在一定范围内，而且一般的干扰信号模式包含了固定点或者光照变化，因此，在火焰识别的过程中，可以用初始火焰形状的变化规则与其进行对照。尽管火焰的变化通常呈现出不规则的特性，然而这种不规则在形态、空间分布等方面往往具有某种相似之处，因此，我们可以用连续图像的结构相似性来进行解析。

五、结语

各种高新技术不断飞跃式发展，这为我国消防智能化技术的开发以及与外国新型消防设备之间的碰撞提供了一个良好的契机，而消防装备的智能化已成为一个必然的趋势。自改革开放至今，我国所研究的有关装备智能化领域内取得的成果，已经为我们打下了坚实的发展基础，因此我们更应该加快消防智能化的进程，综合现有所具备的技术，取其精华去其糟粕，适而用之。由于研究条件和专业方向的局限，本文对智能消防装备中的火焰识别技术仍然存在不足。此次智能消防装备的研究方向主要是火焰识别领域，以建立模型的方法进行测算与研究，而对于理论性知识方面的探讨仍存在很大的不足。之后的研究可以从其他方面进行深入的探讨，探究其对系统化建模会产生哪些方面的影响。

参考文献：

[1]喻丽春,刘金清.基于改进MaskR-CNN的火焰图像识别算法[J].计算机工程与应用,2020,964(21):200-204.

[2]肖堃.多层卷积神经网络深度学习算法可移植性分析[J].哈尔滨工程大学学报,2020,41(03):420-424.

[3]郭昆.基于卷积神经网络的建筑风格图像分类的研究[D].武汉理工大学,2017.

[4]徐晓煜.极化合成孔径雷达舰船检测方法研究[D].西安电子科技大学,2017.

[5]黄忆旻.基于图像检索的导游系统的设计与实现[D].苏州大学,2016.

[6]宋戈.火灾自动检测技术在无人值守变电站中的应用[D].沈阳理工大学,2010.

[7]葛勇.基于视频的火灾检测方法研究及实现[D].湖南大学,2009.

卷积神经网络的优点范文第4篇

关键词：ROS；表面缺陷；图像采集；神经网络；模型训练

飞机蒙皮是包围在飞机骨架结构外且用粘接剂或铆钉固定于骨架上，形成飞机气动力外形的维形构件，在飞机正常工作状态下扮演着重要的角色，一旦飞机蒙皮出现缺陷等问题，需要及时的反馈出来并且维修。传统的飞机表面缺陷检测方式大多数是由人工来完成，会存在效率低、成本高等缺点，甚至会出现检测失误的情况。本文就针对铝合金表面缺陷检测方面，提出一种基于ROS的飞机表面缺陷检测系统，采用移动机器人底盘定位和导航技术，结合深度学习、图像处理等技术检测出存在缺陷的位置并标记出来，通过机器代替传统人工的方式，旨在提高检测效率和检测精度，为飞机表面缺陷检测提供一种方式。

1系统的总体设计

飞机表面缺陷检测系统主要由检测模块、ROS机器人模块、图像处理模块三大部分组成，系统的总体结构框图如图1所示。系统的具体工作原理为：在某一区域范围内，检测模块以树莓派为核心控制器，通过检测模块中的图像采集系统对铝合金材料表面进行图像采集，将采集到的图像通过TCP通信传输到图像处理模块上[4]。图像处理模块利用深度学习中设计的卷积神经网络进行数据训练，得到检测模型，将检测模型应用到图像预处理上。此时，OpenCV对检测模块得到的图像进行图像处理[5]，最终得到缺陷出现的位置。当前区域检测完毕后，通过ROS机器人模块的定位和导航功能，驱动运动执行机构工作，并移动到相邻下一块检测区域，直到所有位置都检测完毕。上述工作原理可实现飞机表面缺陷检测系统，下文将对其包括的三大模块进行说明介绍。

2检测模块设计

如图2所示，系统的检测模块主要是包括树莓派和摄像头，其中树莓派作为检测模块的处理器，搭建的有Ubuntu系统，是系统实现的重要组成部分。树莓派可以提供普通计算机的功能，并且功耗低。可直接在树莓派上安装Keil进行开发，具有很好的开发效果，运行稳定。本次飞机表面缺陷检测系统实现了树莓派将摄像头拍摄的图片发送到图像处理模块上，同时也搭载ROS系统实现了移动底盘的定位和导航功能。

3ROS机器人模块设计

ROS随着机器人技术发展愈发受到关注，采用分布式框架结构来处理文件，这种方式允许开发者单独设计和开发可执行文件。ROS还以功能包的形式封装功能模块，方便移植和用户之间的共享。下面将介绍其建图和导航功能的实现。

3.1建图设计

本文在ROS系统中使用Gmapping算法软件包实现建图[7]，在ROS系统中设计了建图过程中各节点及节点间的话题订阅/的关系如图3所示。在图3建图节点话题关系图上，其中椭圆形里代表节点，矩形基于ROS的飞机表面缺陷检测系统胡浩鹏（纽约大学NewYorkUniversity纽约10003）框里代表的是主题，节点指向主题代表着该节点了主题消息，主题指向节点代表着该节点订阅了主题消息。在建图过程中，主要涉及激光雷达节点、键盘控制节点、底盘节点、Gmapping节点和地图服务节点。

3.2导航设计

ROS提供的Navigation导航框架结构如图4所示，显然MOVE_BASE导航功能包中包括全局路径规划和局部路径规划两部分，即在已构建好的地图的基础上，通过配置全局和局部代价地图，从而支持和引导路径规划的实施。为了保证导航效果的准确，通过AMCL定位功能包进行护理床的位置定位[8]。获取目标点的位置后，MOVE_BASE功能包结合传感器信息，在路径规划的作用下，控制指令，控制护理床完成相应的运动。

4图像处理模块设计

图像处理模块设计主要分为图像预处理、模型训练和卷积神经网络三大部分，通过TCP通信协议进行通信，TCP通信是一种面向连接的通信，可完成客户端（树莓派）和服务端（PC）的信息传递[9]。下面主要对卷积神经网络部分进行介绍。

4.1卷积神经网络训练流程

通过相机采集到的缺陷和问题图像作为训练样本，这部分是检测飞机表面缺陷的关键一步，然后对训练样本进行训练，具体步骤如下所示。（1）训练标记数据：首先使用图像预处理中标记好的道路故障提取出来，通过卷积神经网络对标记框内的目标数据进行训练；（2）提取特征数据：将道路故障的类型统计并归纳；（3）误差反馈学习：对测试样本进行误差反馈学习，并进行测试；（4）优化训练数据：将得到的测试结果与设定的故障分类结果进行误差对比，不断优化训练集，最终得到理想的训练数据。

4.2缺陷检测流程

缺陷检测流程如图5所示，首先输入缺陷原始图像，通过特征提取网络，将处理后的图像使用检测器进行检测，其中检测器里为卷积神经网络训练后得到的模型，最终缺陷检测后得到的识别后的图像，并反馈出来。

4.3实验测试

铝合金表面缺陷主要有碰伤、刮花、凸粉、脏点等常见的缺陷，下面将以这四种为主要对象进行检测训练，各自训练集数量为1000张。通过卷积神经网络对缺陷的特征进行提取和分类，最终实现了缺陷的检测。本次实验测试的样本为200张，每种缺陷50张，均采集自铝合金材料表面且与训练样本一致，实验结果如表1所示。由表1可知，检测脏点的准确率高达98%，刮花和凸粉的准确率也达到94%，但碰伤的准确率相对较低，只有88%。可能造成的原因是：①硬件原因导致采集的图像清晰度比较低；②碰伤缺陷不明显，无人机难以识别；③训练的数据集较少，特征学习误差大；但最后结果是满足了设计需求，还需进一步改进。

5总结与展望

卷积神经网络的优点范文第5篇

思考之一：重组后的烟草企业到底该怎样整合？

在谈这个问题之前，先来看看河南的情况。

河南既是烟草生产的大省，也是烟草消费的大省，河南现有的三大烟草集团都是通过省内卷烟生产企业联合重组组建而成的，2003年7月9日成立，7月19日挂牌，其中由原安阳卷烟厂、原新郑卷烟厂和原洛阳卷烟厂三家组建而成的新郑烟草（集团）公司是省内最大的烟草工业企业，计划指标为117万箱，2003年卷烟产量完成105万箱（不含出口），拥有红旗渠和金芒果两个行业名优品牌，该集团也是长江以北最大的烟草生产企业，发展势头迅猛。由原许昌卷烟厂和原驻马店卷烟厂合并成立的许昌卷烟总厂次之，是河南主要的一类卷烟生产企业，年计划指标为75万箱，2003年卷烟产量完成72.8万箱，省优品牌帝豪发展强劲，2003年完成4万箱的产量，仅帝豪一类卷烟就占到了河南全省一类卷烟的70%（全国一类卷烟的比重为7.2%，河南省仅为2.13%）。由原郑州卷烟厂和原漯河卷烟厂合并成立的郑州卷烟总厂，年计划指标为70万箱，2003年生产卷烟67.799万箱，主要品牌为黄金叶和沙河，据悉，该公司目前已与红塔集团正式签署品牌代加工协议，为红塔生产一定数量的卷烟。

三大烟草生产企业组建已有一段时间，因此截止笔者采访调研之时，新集团都已正常运转。由3个烟厂合并组建的新郑（集团）公司的情况最为复杂，经过公开考试和选拔由安阳厂升任上来的集团办公室副主任杨晋卿告诉记者，去年10月份集团就正式运转了。他还笑着告诉记者，现在他们一家三口三地分居，能不能团聚就看赵总（集团总经理赵志正）的了。他说，像他这种情况在厂里很普遍。

组建以后，三大烟草生产企业都面临着品牌整合的问题，职代会开过之后他们各自也都确立了一些品牌发展战略：新郑是“一大一高一置换”，具体言之就是把红旗渠做大做强，把金芒果做成高端品牌，把低档烟都向洛烟置换；郑州总厂的品牌整合战略是“做强黄金叶，做大沙河”；许昌总厂为“一名（帝豪）一系列（金许昌）”。

河南的情况和年初烟草工作会议的精神都告诉我们，既然品牌扩张是资源有效整合和充分利用的最佳实现，那么实现烟草品牌扩张的前提和基础就是烟草品牌整合，实现烟草品牌整合，为名优品牌腾出资源和市场空间也是烟草品牌扩张的结果和意义所在。同时“品牌是企业的象征，是企业核心竞争力的集中体现”，“以品牌为纽带，通过品牌扩张来实现企业规模扩张”（姜成康报告语），从上述角度而言，其实，烟草企业的整合从根本上讲也还是烟草品牌的整合，烟草企业整合中最关键最困难的也是烟草品牌的整合。需要指出的是，整合后的烟草企业如何整合烟草品牌，整合后的烟草企业的一把手以及当地的中烟工业公司如何稳妥地实施“让名牌扩张、非名牌整合”的策略，如何抽调各种优势资源向优势品牌倾斜进而推动和促进优势品牌的快速升级和跨越发展，当前几乎还没有一个企业能够成功地解决这一问题。

应该看到，整合后的烟草企业进行烟草品牌的整合（包括名牌扩张）必将是一个长期的过程，绝对不可能在短期内完成，至少需要两到三年的时间，这一点应该引起业界的重视和注意。无论是已经完成整合的企业或是正准备进行整合重组的企业在烟草品牌整合问题上都应该胸怀全局，积极谋划，要有“长期整合、适时修正”的准备，至少应该消除诸如“以为烟草企业整合就是完成财务整合实现异地生产了，就可以完事大吉高枕无忧了”的不正确认识。

我们说，完成财务整合实现异地生产只是烟草企业整合的一个重要内容，烟草企业整合的终极标志就是最终完成烟草品牌的整合——不光是整合，而且是有效整合。这里的“有效”包含两方面的含义：其一是有效果，即能够实现1+1大于2的预期，能够正确贯彻“名牌扩张，非名牌整合”的政策，实施生产指标、人才、技术、管理等政策扶持和倾斜，确保名优品牌的快速发展和有市场潜力的主导品牌的培育和形成；其二是有效益，即能够实现优势品牌的跨越发展，能够实现重组企业的跨越发展，充分发挥各自优势，企业效益显著增强。

最后，还应该指出，品牌是企业的标志，它不光是衣服，更是企业的灵魂和精神气质，是浮出水面最为光彩耀眼的一小部分，因此企业重组之后，把主要精力集中到品牌整合上是对的，但也要顾及支撑品牌的人才、技术、管理方式、经营理念、实现目标的整合。实现了上述整合，就能很顺利地推进企业品牌的整合，并能有效提升整合后的品牌形象和质量。否则，缺少了支撑，没有了基础，浮出水面的品牌迟早会黯淡和覆没。

思考之二：网络如何培育品牌，应该培育哪些品牌？

在年初烟草工作会议报告中，国家烟草专卖局姜成康局长指出，“烟草商业企业同样面临着严峻的挑战，特别是面临着卷烟工业和零售客户两个市场主体的选择……流通企业要为卷烟产品市场准入创造公平竞争的环境，规范地进行交易，把培育品牌、引导消费作为一项重要任务。通过公平竞争，优胜劣汰，推动联合重组，培育出一批真正适应市场、具有较强竞争力的品牌”。

工商分离的实施客观上为网络培育品牌扫清了障碍，提供了政策和体制保障，但网络作为培育品牌的摇篮、为培育品牌服务，这里边同样有个选择和取舍的问题，即哪些品牌值得培育？哪些品牌能够培育？

我们说，行政指令从长远来看最终还是会屈从于市场规律，这一点在网络培育品牌的问题上会表现得尤其明显。网络虽然会根据上级指令，根据上级考核要求来选择进入其内部流通的品牌，但在网络培育品牌的问题上则会主要依靠市场的选择（前提条件当然是不进行诸如加价等人为的障碍设置）。具体来说，36个行业名优品牌再加上地方名牌不可能在每个网络每个地区都得到培育，不可能雨露均沾，网络必然会对所培育的品牌有所选择，有所侧重。反过来讲，工商分开以后，不管是行业名牌还是地方名牌，在网络上销售不畅的品牌，网络自然就会自动停止其流通。而流通一旦停止，品牌培育也将随之终止。

那么网络选择待培育品牌的依据是什么？在现行的地方考核体制和商业企业的经营模式中，从36个行业名优品牌中进一步精选出符合当地消费特点和自身网络优势的品牌虽然还不是商业企业的主要工作，换句话说，虽然商业企业还会依靠行政指令以及厂商关系疏亲等非市场因素做出选择，当前他们还不能意识到待培育品牌与自己的重大关系，但未来作为市场流通主体的市级烟草公司的命运是会和他们所经销选择的品牌的命运紧紧捆绑和联系在一起的，到那时，网络培育了品牌，品牌也会成就网络，提升网络，完善网络。

回到我们的问题上来，网络选择培育品牌的依据是什么？抛开地方的行政指令和考核任务，网络选择的标准是：（1）品牌在当地的接受程度（2）品牌在当地的销售基础（3）品牌的发展潜力（4）品牌的获利情况。

吸味不符合当地口感、品牌不被当地认知和接受、获利不佳、销售在当地不畅、没有培育潜力的品牌网络是不会选择的，被用来培育是没有意义的，被培育是对网络资源的极大浪费。引导只是引导，而更关键的还是接受，更何况地区间的消费差异性是一个不可忽视的客观存在。同时，作为市场流通的网络也是看重利益的，健全而良好的网络不仅需要不仅要依附于运转的成本，更需要利益来不断给养，不断提升网络的质量。

因此网络培育品牌本身是对的，但有了能培育品牌的网络，更需要选好被网络用来培育的潜力品牌，只有这样，网络和品牌才都能够良性发展互相促进相得益彰。从这个角度而言，网络培育品牌，或者直接说烟草公司选择卷烟品牌，尽管已经有了一定的范围（36个行业名优品牌包括当地省优品牌），但还需要根据当地消费特点和自身网络精心挑选，尤其是对行业名优品牌的挑选，在判断其有无亲和力、能否本土化后，还需要看其未来预期和增长潜力，这个过程多少有些像押宝或买股票，押对了，未来可能就会大大受益，否则，同样充满风险。把一棵小树苗培育成一棵参天大树，不仅需要有人长年累月地精心呵护它，更关键的在于你当初栽种的是一棵具有活力和生命的健康树苗。

对于烟草生产企业而言，虽然网络培育名牌更多的强调了工商分开以后商业企业的责任，体现了商业企业的主动性，但在网络培育品牌的过程中，工业企业同样也应该积极主动，有所作为。对于不是行业名优的品牌来说，要积极地争创名优；对于已经是行业名优的品牌来说，还要积极地研究消费者的需求，不断扩大市场销售区域，根据地区的差异性投放不同吸味的卷烟产品，采取不同方式的终端引导和促销活动，增强品牌在当地的亲和力和影响力，以便更稳固地成为当地网络的待培育的重点品牌。

在安阳调研中我们发现，在河南其他地区并不多见的贵州和陕西牌号的烟在这里都有销售，后来安阳烟草公司业务科的一位负责同志告诉我们，陕西牌号的烟是他们联系的，因为宝鸡卷烟厂的好猫也是名优品牌，但贵州牌号的烟是厂方主动的，经过试销，在当地还不错，于是便一直卖了起来。

本人愚见，网络培育品牌只是烟草品牌和市场发展的初级阶段（现在做终端推广活动的也大多为烟草生产企业，而烟草公司单独做的还很少），可以预计，随着烟草市场的逐步放开和以工商分离为突破口的烟草改革地不断深化，烟草行业必然会迎来一个工商联手打造名牌的全新时代——而那个时代也必将取代网络培育品牌的时代。工商分离，从长远来看不是疏远了工与商的关系，而是更加密切了工与商的关系，依靠市场规律和市场手段，利用利益的纽带，将它们空前地紧紧捆绑在了一起（关于工商分离，笔者另将专门论述）。

思考之三：上结构如何适应消费承受能力和满足市场需求？

上结构，增效益是烟草企业的共识。都知道生产四、五类烟（尤其是五类烟）不仅不挣钱，而且还亏钱；是生产一盒亏一盒（尽管有国家补贴）。可是在现实条件下，生产一盒一块钱的烟和生产一盒十块钱的烟的工艺流程差不多，国家补贴也仅能保证不亏钱而已，企业希冀依靠低档烟实现赢利是不可能的，怎么办？在生产成本无法降低、国家补贴一定的前提下，企业要想甩掉包袱，增加获利水平和能力，只能是大量削减四、五类烟的产量，多生产三类以上的中高档卷烟，这是唯一可行的办法，有些无奈。事实也正是如此，某资料显示，中上价格档次卷烟的比重大约每年增加一个百分点，中等档次卷烟的比重大体每年相当，中低档次卷烟比例大约每年减少1~2个百分点。

这是全行业的情况，整个河南省卷烟生产企业自然也不例外。但河南作为全国第一农业和人口大省，企业在上结构和大力发展中高档卷烟产品的同时更应该考虑消费承受能力，更应该格外看重本省低档烟的广阔市场。

市场就是市场，消费能力受制于消费者的收入状况，张家口卷烟厂代厂长师进辉说得好，“当地的基础消费决定了香烟的消费基础”。说白了，当老百姓兜里的钱还没有足够盈实的时候，还没有足够支付能力的时候，好烟是抽不起的。对于城市普通的工薪消费者而言，价位在4块钱的烟恐怕就是极限，而对于农村消费者而言，买2元钱一包的烟就会让他们感到很奢侈。这就是河南乃至全国许多地方的消费现实。宝鸡卷烟厂当年贸然对低档烟提价的做法在今天看来不能不说是个深刻的教训。

利润可以暂时不予考虑，但市场是决不能主动放弃的。时刻关注低档烟市场，在提高产品获利能力改善产品结构的同时，坚持不放弃低档烟的生产，既是河南烟草企业的责任，也是稳固当地市场的关键所在。在这一点上河南企业更要耐得住寂寞，禁受住外界的诱惑。如果因为当地卷烟产品价格超过了当地的购买力进而导致假私非超蔓延，不仅是当地商业企业的责任，更是整个河南卷烟生产企业的“罪过”。到那时，冲击的不仅是市场，损害的更是卷烟生产企业甚至是专卖制度的信任和信誉。南阳卷烟厂作为全国不多、河南唯一一家经过国家局批准认可的低档烟生产基地可谓说是明智的。

减少低档烟生产，提高产品结构是无可非议的，但上结构，提高企业效益，提高单箱利润率，不能超越消费承受能力，漠视市场需求。解决上结构与承受能力、市场需求的矛盾，需要我们长期研究和关注。

思考之四：品牌代加工为什么不仅是简单的品牌代加工？

品牌代加工是近年来烟草行业比较时髦的做法和话题，这一做法也在一定程度上解决了卷烟生产指标相对过死无法增加的矛盾，适应了资源优化配置和名牌扩张的需要，提高了资源利用率，减缓了部分卷烟生产企业产能过剩的状况。但随着品牌代加工的增多，也带来了当地消费者对加工品牌的信誉危机（尤其是那些实现地产销的代加工的品牌），甚至也出现了一些异地加工的个别产品存在质量问题的个别现象。

我们说实施品牌代加工可以充分利用闲置资源，解决部分名牌卷烟产品厂家产能不足的矛盾，但实施品牌代加工的前提是企业要有较强的管理、控制以及科技攻关能力，否则因为管理弱化、控制不力、生产工艺不能融合而带来的负面影响会严重影响到母品牌的形象和信誉，失去品牌代加工的初衷和意义。

上一篇：文明班级总结下一篇：民法典的亮点主要表现

卷积神经网络的优点

精品文章排行更多

相关期刊更多

数据采集与处理

北华大学学报

遥测遥控