首页 > 文章中心 > 直方图均衡化的基本原理

直方图均衡化的基本原理

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇直方图均衡化的基本原理范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

直方图均衡化的基本原理范文第1篇

关键词:直方图规定化;单映射规则;组映射规则

中图分类号:TP391 文献标识码:A文章编号:1009-3044(2007)18-31705-02

Analysis of Two Implementing of Method of Histogram Specification

LI Shao-jun,GAN lan

(School of Information Engineering,East China Jiaotong University, Nanchang 330013,China)

Abstract:Histogram specification can change the histogram of image into an specific form,and it can enhance the image of one gray range ,so as to give the information that users interested in. This paper introduces the basic principle of two classical implementing of method about histogram specification. By comparative analysis of the specification processing an example of image, the superiority of GML to SML has been proved.

Key words:Histogram specification; single mapping law; group mapping law

1 引言

图像增强的首要目标是改善图像,以使图像更适合于特定应用。图像增强的方法主要取决于图像希望达到的特定效果,一般来说,图像增强的方法分为两大类:基于图像灰度值统计的方法和基于图像空间频率的方法[1]。用灰度直方图增强图像对比度是基于图像灰度值统计的一种重要方法,它以概率论为基础的,常用的实现算法主要是直方图均衡化和直方图规定化。

直方图均衡化主要用于增强动态范围较小的图像的反差,基本思想是把原始图的直方图变换为均匀分布的形式,这样就增强了像素灰度值的动态范围,从而达到增强图像整体对比度的效果。直方图均衡化的优点是能自动地增强整个图像的对比度,但它的具体的增强效果不好控制,处理的结果总是得到全局均衡化的直方图。实际中有时需要变换直方图使之成为某个需要的形状,从而有选择地增强某个灰度值范围内的对比度或使图像灰度值的分布满足特定的要求,这时可以采用比较灵活的直方图规定化方法。

2 直方图规定化原理和算法

在直方图规定化的过程中,正确地选择规定化的函数有可能获得比直方图均衡化更好的效果,一般分为三个步骤:

(1)对原始图的直方图进行灰度均衡化

然后将ps(si)对应到pu(uj)去,由于这里每个ps(si)是分别对应过去的,故这种方法简单直观,但有时会有较大的取整误。

组映射规则(group mapping law, GML):设有一个整数函数I(l),l=0,1,N-1,满足:0≤I(0)≤...≤I(l)≤...≤I(N-1)≤M-1,确定使下式能达到最小的I(l)

这时,如果l=0,则将其i从 到I(0)的ps(si)都对应到pu(u0)去;如果l≥1,则将其i从I(l-1)+1到I(l)都对应到pu(uj)去[2]。

具体算法为(编程实现):

//计算原始图像到目标图像累积直方图各灰度级的差的绝对值,存放在一个二维数组里

for(j=0;j

{for(i=0;i

{diff[i][j]=fabs(dest[i]-scr[j]);

}}

//SML映射

for(j=0;j

{minx=0;

minvalue= diff [0][j];

for(i=1;i

{if (minvalue> diff [i][j])

{minvalue= diff [i][j];

minx=i;}}

HistogramSML[j]=minx;}

//GML映射

lastStartY=0;lastEndY=0;startY=0;endY=0;

for(i=0;i

{minvalue= diff [i][0];

for(j=1;j

{if (minvalue> diff [i][j])

{minvalue= diff [i][j];

endY=j;}}

if(startY!=lastStartY||endY!=lastEndY)

{for(k=startY;k

HistogramGML[k]=i;

lastStartY=startY;

lastEndY=endY;

startY=lastEndY+1;

}}

3 算法实现与举例

在实际应用中,希望能有目的地增强某个灰度区间的图像,即能够人为的修正直方图的形状,使之与期望的形状相匹配,经常用来校正因拍摄亮度或其它原因造成的图像差异,直方图规定化就是针对这种应用的图像增强方法,它是在运用均衡化原理的基础上,通过对应一定的规则将原始图的直方图向规定的直方图转化,从而弥补了直方图均衡化不具备交互作用的特性[3]。

设对一幅图像进行规定直方图变换,原始图及其直方图和所需规定图及其直方图如下图所示:

从原始图的直方图上可以看出原始图因光线不足而造成过多的低灰度像素点,图像显得比较灰暗,我们希望它达到规定图的效果。

我们先将原始图和规定图都均衡化,得到的图像及其直方图如下图所示。

然后,再按照单映射规则(SML)和组映射规则(GML)分别计算,分别得出的图像及其直方图如下图所示:

可见,虽然运用组映射规则(GML)得到的图像与运用单映射规则(SML) 相比虽无太大变化但从直方图分布和图像细节上更接近于规定的直方图。

4 结论

使用软件对此实例运用单映射规则(SML)和组映射规则(GML)得到的图像进行分析,重点在平均灰度值和亮度两个指标上,实验数据如下表:

有图表可知,运用组映射规则(GML)产生的误差要比单映射规则(SML)小,GML产生的图像更接近于规定图。

从理论上来说,量化的比较可借助映射产生的误差来进行,这个误差可用对应映射间数值的差值(取绝对值)的和来表示,和的数值越小,映射效果越好,理想效果下,这个和为0。在连续情况下两个规则都能给出精确的规定化结果,但在离散情况下精确程度常不一样,因为取整误差的影响,当把某ps(si)对应到pu(uj)时,运用SML映射规则可能会产生的最大误差是pu(uj)/2,而运用GML映射规则可能会产生的最大误差是ps(i)/2。因为规定直方图灰度级(N)

再从算法实现上来看,SML映射规则是一种有偏的映射规则,某些范围的灰度级会被有偏地映射到接近开始计算的灰度级;而GML映射规则是统计无偏的,从根本上就避免了上述问题的出现。所以结论是,GML映射规则总会得到比SML映射规则更接近规定直方图的结果。另外,因为直方图规定化是通过两次直方图均衡化实现,在实际应用中,若对图像灰度特征等有更多的了解,进一步的直方图规定化可以获得更好的视觉改善。

参考文献:

[1]赖剑煌,冯国灿. 数字图像处理疑难解析[M]. 北京:机械工业出版社,2005.

[2]章毓晋. 图像工程(上册):图像处理[M]. 北京: 清华大学出版社,2006.

[3]张娜.数字图像增强的方法[J].大众科技,2006, 8.

[4]韩殿元,陈子富.一种直方图规定化的组映射算法[J].潍坊学院学报,2005, 5(6).

直方图均衡化的基本原理范文第2篇

1什么是CBIR

传统的基于文本的图像检索(Text-Based Image Retrieval,TBIR)技术是先通过人工方式对图像进行文字标注,再用关键字来检索图像,这种方式耗时并且主观,无法满足大规模图像数据的检索需要。基于内容的图像检索(Content-Based Image Retrieval,CBIR)技术是根据图像对象的内容及上下文联系在大规模多媒体数据库中进行检索。

2神经网络的特点

神经网络是在现代神经学的研究基础上发展起来的一种模仿人脑信息处理机制的网络系统,它具有自组织、自学习和极强的非线性处理能力,能够完成学习、记忆、识别和推理等功能,它已在控制、模式识别、图像和视频信号处理、人工智能、自造应滤波等方面获得了应用。医学上,神经网络这一智能的诊断方法,能够排除各种人为因素,得到准确客观的诊断结果,对医学图像数据若用传统的线性处理模式通常不太好处理, BP神经网络是众多神经网络中应用最广泛的一种多层前馈神经网络,图1所示为三层BP神经网络。

3蚁群算法

蚁群算法[6](Ant Colony Optimization,ACO)是由意大利学者Dorigo等人于20世纪90年代初期通过模拟自然界中蚂蚁集体寻径的行为而提出的一种基于种群的启发式随机搜索算法。蚁群算法作为一种新型的智能仿生模型,近几年在图像分割、图像特征提取、图像匹配、影像纹理分类、图像检索等领域都取得了研究成果[8]。

4神经网络算法和蚁群算法在医学图像检索中的应用

CBIR检索过程是一个逐步求精的过程,其在医学上的应用可以看成是用户(放射学者、医师等)和医学图像数据库之间的一个交互过程。其基本原理是:对医学图像数据库中的每幅图像先进行特征分析,提取图像的特征;建立医学图像数据库的同时,建立与图像库相关联的特征库;在进行图像检索时,对给定的查询例图,先提取特征向量,再将该特征向量与特征库中的特征向量进行匹配,根据匹配的结果在医学图像数据库中搜索,即可检索出所需的图像。本文结合神经网络算法结合蚁群算法,将其应用于医学图像检索,见图2。

4.1医学图像预处理 在医学方面,图像预处理的主要目的是消除图像中无关的信息、增强有关信息的可检测性并最大限度地简化数据,从而提高医务人员对图像判读的准确性及效率。本课题中图像预处理方法由图像增强、图像分割组成。

4.1.1图像增强 图像增强[2]是进行图像检索的先行步骤,可以用公式 来表示,其中 是输入图像, 是增强后的图像, 是对输入图像所进行的操作。本文主要采用直方图均衡化方法来进行图像增强,直方图均衡化是将一已知灰度概率密度分布的图像,经过某种变换变成一幅具有均匀灰度概率密度分布的新图像。与其他方法相比,直方图均衡化方法适用范围广,易于实现,可达到较好的增强效果,暗区中的图像能清楚的显示出来,能够展示更多诊断信息。

4.1.2图像分割 医学图像分割是根据医学图像的某种相似性特征将图像划分为若干个互不相交的"连通"区域的过程。医学图像中,大多数情况下都需要对医学图像作分割,来突出需要的目标物体,如病灶。采用sobel算子计算医学图像边缘和阈值,在此基础上修改阈值使边缘更加精确,以此实现图像分割。

4.2神经网络算法(如图3所示)的实现。

基本步骤如下:①确定问题:对问题做出详细的调研,明确目标,然后考虑如何引入粗糙集从而更好地解决问题。②对数据进行收集,即采集经过图像预处理之后得到的特征数据。③数据处理:把要处理的数据建立成一张二维决策表,每一行描述一个对象,每一列描述对象的一种属性。在本步中,如果无法得到完备的数据表,就有必要将信息表进行完备化操作;如果初始数据是连续值,还要经过连续属性离散化操作。④根据粗糙集理论[5]对数据进行属性约简,利用属性重要度去掉数据表中的冗余条件属性,并消去重复的样本。⑤根据上步中得到的训练数据样本设计BP神经网络,根据约简结果确定神经网络的输入层单元数和隐含层节点数。采用一个 的3层BP神经网络。隐藏层神经元的传递函数设计为S型正切函数,输出层神经元的传递函数设计为S型对数函数。⑥用约简后形成的学习样本对神经网络进行学习,得到神经网络的权值。然后将测试样本输入网络进行测试,输出最终结果。本算法中,规定BP神经网络的训练指标为0.01,训练次数C<5000次。

4.3蚁群算法的实现(如图4所示)。

目前,CBIR方面现已有了大量研究,但CBIR的系统很少用于临床,如遵义医学院附属医院在进行医学图像检索时,更常用的方式还是传统的基于文本的图像检索方式,其最大的原因是CBIR方式检索速度慢,响应时间长。为此,如何保证医学图像数据检索的有效性和准确性是目前CBIR迫切需要解决的问题之一。本文将BP神经网络和蚁群算法结合起来,借助蚁群算法易于与其他算法相结合的优势,利用蚁群算法对粗神经网络算法的参数进行优化的同时,结合医学图像的特殊性,提出将神经网络算法和蚁群算法结合起来应用于CBIR中具有一定的现实意义。

参考文献:

[1]蒋历军.应用网格和水印技术对基于内容的肝脏CT图像检索的研究[D].上海交通大学,2009.

[2]冈萨雷斯.数字图像处理(MATLAB版)[M].北京:电子工业出版社,2012.

[3]史元春,徐光祐,高原.中国多媒体技术研究:2011[J].中国图象图形学报,2012.

[4]H Zhang, JE Fritts, SA Goldman.Image segmentation evaluation: A survey of unsupervised methods[J].Computer Vision and Image Understanding, 2008.

[5]蒋世忠,易法令,汤浪平,等.基于图割与粗糙集的MRI脑部肿瘤图像检索方法[J].中国组织工程研究与临床康复,2010.

[6]张小冬.蚁群算法在医学图像识别中的研究与应用[D].扬州大学,2009.

[7]李旭超,刘海宽,王飞,等.图像分割中的模糊聚类方法[J].中国图象图形学报,2012.

[8]Veenman C,Reinders M,Backer E.A Cellular Coevolutionary Algorithm for Image Segmentation [J].IEEE Transaction on Image Processing, 2003.

直方图均衡化的基本原理范文第3篇

关键词:数字图像处理技术;基本原理;应用

中图分类号:TN911.73 文献标识码:A文章编号:1007-9599 (2011) 10-0000-01

The Principle and Applications

of Digital Image Processing Technology

Yang Tao,Hu Dayong

(Daqing Oilfield Communications Company New Technology Development Center,Daqing163453,China)

Abstract:This paper on digital image processing techniques are outlined,and digital image processing techniques the basic principles of the analysis presented on this basis,the application of digital image processing technology.

Keywords:Digital image processing technology;Basic principles;Application

一、数字图像处理技术的概述

数字图像处理及时是指通过计算机对图像进行去除噪声、增强、复原以及分割和提取等特征的处理的方法和技术。该技术是伴随着计算机和数学的发展以及广泛的农牧业、林业、环境和军事等行业的发展而产生的。数字图像处理技术又叫计算机图像处理及时,它最早出现在20世纪50年代,数字图像处理技术作为一门专业的学科则是在20世纪60年代初。一般情况下,该技术主要运用于以下三个方面:一个是提高图像的视觉感质量,进行图像的亮度、色彩的调节,对图像进行几何变换等;一个是用于提取图像中所包含的某些特征或者特殊的信息,为计算机分析图像提供便利;还有一个则是进行图像数据的变换、编码和压缩,方便图像的存储和传输。其常用的处理方法主要是图像的变换、图像编码的压缩、图像的增强和复原以及图像的分割、描述和分类等。随着数字图像处理技术的不断发展,目前该技术被广泛的应用到各个领域当中,如航天和航空技术、生物医学工程和通信工程等,其发展前景非常广阔。

二、数字图像处理技术的基本原理

(一)去除噪声

数字图像处理技术的方法之一就是去除噪声,该方法的原理主要是:

1.均值滤波器。通过领域平均法的均值滤波器来去除图像中的噪声颗粒,这种方法主要是采用的空间平滑技术。2.自适应维纳滤波器。它能够根据局部的方差来调整滤波器的输出,其方差越大,滤波器的平滑作用就越明显。3.中值滤波器。其基本原理是把数字图像的值用该点的一个领域中各点值得中值代换,从而实现去除噪声的效果,它是一种极为有效的方法。

(二)图像增强

数字图像处理技术中最常用的方法之一就是图像增强技术,它能够改善图像的视觉效果,把图像处理成适用于计算机分析或者控制的某种形式,同时,它也可以消弱或者除去一些不需要的信息,从而达到改善图像的目的。图像增强的内容主要包括:除去图像噪声,抽取目标轮廓以及图像的勾边处理等等,以此来通过直方图均衡化技术实现图像增强效果。

(三)图像复原

图像复原是针对图像退化现象而提出来的,所谓图像退化是指图像因为质量变坏而导致图像模糊不清,因此,根据图像退化的原因来建立一个退化模型,运用各种处理方法,让复原后的图像符合某些要求,从而使的图像的质量有所改善,图像复原的目的也是为了改善图像的视觉效果,满足对图像的视觉要求。另外,从被污染或者畸变的图像信号中提取所需要的信息,将图片恢复到本来的面貌,实现图像质量的优化。

三、数字图像处理技术的应用

(一)HDTV高清晰度电视

随着电视技术的不断发展,人们对电视图像的要求越来越高,新一代的高清晰电视逐渐产生,它比普通的电视要大4到5倍,它的实现是数字图像处理技术被广泛应用的实例之一,它不需要研制许多摄像和显示的新器件,但是它需要利用数字处理技术对图像的压缩和传输来实现HDTV在传输线路中的传输和再现。

(二)多媒体系统中的数字图像技术

多媒体技术是目前广泛应用与社会生活的各个方面的技术之一,它主要是通过对图像的动态处理,实现图像、图形以及声音和文字的综合使用,来实现它的效果。数字图像处理技术被广泛的应用到其中,它需要对数字图像进行必要的处理,比如图像压缩技术和增强技术等等,从而活跃图像,增强效果。数字图像处理技术在多媒体技术中的广泛应用,是对多媒体技术的进步和发展。

(三)通信技术

数字图像处理技术在通信方面的应用主要有:图像传输、电视电话和电视会议等,数字电视的处理技术在这些方面的应用主要是通过图像的压缩方法来实现的。

除此之外,数字图像处理技术还广泛的应用到了宇宙的探测技术当中,它需要利用数字图像处理技术来获取大量的星体照片。另外航空遥感和卫星遥感图像也需要用图像的处理技术来帮助实现。

总之,数字图像处理技术的应用是非常广泛的,除了上述讲到的应用之外,它还广泛的应用于军事、视频以及工业生产当中。可以说,数字处理技术是其他任何技术都不能取代的,它对我们的社会生活有着不可缺少的意义和作用。

四、结束语

综上所述,数字图像处理技术的应用是非常广泛的,随着社会经济以及各项技术的不断发展,数字图像处理技术也将得到不断的完善和进步,同时也将运用到更多的行业当中。

参考文献:

[1]高守传,姚领田.VisualC++实践与提高――数字图像处理与工程应用篇[M].北京:中国铁道出版社,2006,6

[2][美]RafaelC.Gonzalez,RichardE.Woods,StevenL.Ed-dins,阮秋琦.数字图像处理(MATLAB版)――国外电子与通信教材系列[M].北京:电子工业出版社,2006,4

[3][美]Castleman,K.R,.数字图像处理[M].北京:电子工业出版社,2002,2

直方图均衡化的基本原理范文第4篇

关键词: 人眼疲劳检测; 人眼状态分析; 人脸定位; 人眼轮廓获取; Android

中图分类号: TN911.23?34; TP391 文献标识码: A 文章编号: 1004?373X(2016)24?0006?03

Design and implementation of human?eye fatigue detection terminal based on

Android platform

LI Chunjie, WANG Chun, WANG Quanhu

(School of Software Engineering of USTC, Suzhou 215123, China)

Abstract: A human?eye fatigue detection terminal based on Android platform was designed and implemented. It can acquire the driver′s face image data from the camera, recognize and locate quickly the face, and then locate the eyes. The Otsu is used to extract the human?eye target and the Robert Cross edge detection is used to acquire the outline of the human?eye to analyze the eye status. The PERCLOS principle is adopted to judge the fatigue status of human?eye. The development efficiency of the system is improved by means of the open?source vision library Android?OpenCV. The results of experiment in the indoor environment show that the terminal behaves well.

Keywords: human?eye fatigue detection; human?eye state analysis; face location; human?eye outline acquisition; Android

随着汽车的不断普及,交通事故也随之增多,全球每年约有1 800万人在交通事故中受伤或者丧生,经济的损失更是高达千亿美元计,交通安全事故极大地威胁着社会公众的安全和财产。仅2011年,我国交通事故发生总数超过210 000起,共造成62 000多人死亡,统计表明,疲劳驾驶造成的交通事故占总数的8%左右,因此开发一套实时的驾驶员疲劳检测系统具有深刻的社会意义和经济价值。

1 系统方案设计

1.1 系统层次框图

本文设计并实现的人眼疲劳检测系统是基于Android操作系统,采用开源的Android?OpenCV库进行的,其系统层次框图如图1所示。

1.2 疲劳判断原理

PERCLOS(Percentage of Eyelid Closure Over the Pupil Time)指眼睛闭合时间占某一特定时间的百分比[1?4],其数据能真正估计出疲劳,是疲劳评估测定的最好方法之一,其包含三种评价标准[5?8]:P70,P80以及EM,其中又以P80标准最优[5,7?8],P80标准:当人眼部瞳孔面积闭合超过80%作为判定闭合的标准。其示意图如图2所示。

图2中t1表示最大睁开到闭合20%所用的时间,t2表示最大睁开到闭合80%所用时间,t3表示最大睁开到睁开20%所用时间,t4表明最大睁开到睁开80%所用的时间。PERCLOS值的计算公式如下:

1.3 人眼状态判断

根据摄像头采集的人脸部图像进行实时处理,首先需要进行人脸部的检测和定位;随后将该区域设置成为感兴趣区域进行人眼部的定位,根据图像分割技术进行人眼的形状分离,二值化处理主要是将目标从背景中分离出来,而边缘检测是为了检测出图像的边缘信息,根据分离出的形状判断眼睛是否处于闭合状态。该过程的示意过程如图3所示。

1.4 系统实现流程图

根据以上的分析,系统通过摄像头采集图像,对每一帧的图像进行分析。其主要解决两个问题:一是人眼的状态判断;二是疲劳的状态判断。当PERCLOS值大于固定的阈值时,系统发出预警提示。整个过程的实现流图如图4所示。

2 系统实现过程

2.1 预处理阶段

在正常的驾驶条件下,由于诸多因素的影响,通过摄像头采集的图像可能包含噪声或者由于分辨率、背景突变等原因对后续的图像运算带来干扰,为了消除这些影响,需要对图像进行预处理:包含了去噪处理和直方图均衡化。Android?OpenCV中对应的接口分别是:Imgproc.medianBlur(Mat src,Mat des,int ksize)以及Imgproc.equalizeHist(Mat src,Mat des)。

2.2 人眼的状态判断

系统的人眼状态判断实现包含了人脸检测过程、人眼定位过程、人眼分离过程(二值化处理和边缘检测)。

2.2.1 人脸检测

传统的检测人脸方法有很多种:基于肤色的分离、基于统计模型、PCA方法,但是这些方法识别的时间较长,并且准确率不高。在本文中,采用的是OpenCV中非常成功的基于Haar?Like特征的Adaboost算法。人脸检测分成两步:首先训练过程产生分类器文件;再利用分类器进行人脸检测过程[9]。训练过程:准备正负样本,正样本是需要检测的目标(正脸),负样本是不含正样本特征的任何目标;利用CreatSample程序准备正样本集;利用Haar?Training程序训练得到分类器特征XML文件。检测过程:利用Android?OpenCV中的分类器构建函数去加载该特征XML文件,利用分类器本身的成员函数[9?10]:detectMultiScale(Mat image,List objects,double scaleFactor,int minNeighbors,int flags,Size minSize)对指定的image进行检测。其函数各参数的意义为:Image,需要进行目标检测的区域;Object,将检测到的目标标记在矩形框中;scaleFactor,代表图像的缩放因子;Minneighbors,指定每个候选矩阵至少包含的邻近元素个数;Flag,标志位,默认为0;Minsize,最小的检测窗口,如果该值设置过小,将会导致图像的计算量较大。

2.2.2 人眼定位

同样的,人脸的检测和定位同样采用该Adaboost算法,加载的分类器文件为自带的haarcascade_mcs_eyepair_big.xml,其检测的成功率达到95%以上。关于人脸和人眼的检测效果图如图5所示。

2.2.3 基于Otsu的灰度二值化

当系统成功标记处人眼部的区域后,需要进行二值化处理,从而实现眼部提取。但是由于图像的灰度值对光线很敏感,固定的阈值势必无法满足要求,本文采用的是基于Otsu算法的二值化处理。Otsu算法,又被称为最大类间法,是一种自适应的图像分割技术。它是根据最小二乘原理推导出来的,根据光线强度的不同,阈值会随之变化,能得到最优的阈值[11]。其基本原理为:将直方图在某一阈值分割成两组,称为“前景”和“背景”,当被分成的两组的方差最大时,该阈值就是最佳分割阈值。方差是灰度均匀分布的一种度量,值越大说明构成图像两部分的差别越大,当部分“前景”错分为“背景”或者“背景”错分为“前景”时,都会导致方差变小,因此最大类间法意味着错分的概率最小。对于图像直方图,不妨假设其灰度级为0~m,像素点个数为N,针对某一个分割阈值t,那么整个图像被分割成两部分,0~t称为“前景”,而t+1~m称为“背景”。“前景”的权重为[Wf],均值设为[Mf],方差为[Df],“背景”的权重为[Wb],均值设为[Mb],方差为[Db]。图像的整体的方差公式如下:

[D=Wf*Df+Wb*Db] (2)

Otsu的最终目的就是要求出D的最大值来,从而得到最优的分割阈值。

2.2.4 基于Robert Cross 的边缘检测

边缘是图像灰度值变化剧烈的位置,因此包含了大量的有用信息,常用的边缘检测包含很多,比如:Robert Cross边缘检测、Canny边缘检测、Prewitt边缘检测、Sobel检测。但是这些方法中惟有Robert Cross计算方便简单、快速,容易在实时系统中实现,本系统中采用的就是该检测方法,根据任意一对互相垂直方向上像素点的差分来计算梯度的原理[12?13],采用对角线方向相邻像素灰度差,如下:

式中:G是计算之后的灰度值;f是原始图像的灰度值。虽然Robert检测速度很快,但是其缺点也是很明显的,对噪声敏感,并且边缘不是很光滑。当成功提取出边缘轮廓之后,根据边缘的最大垂直距离,进行眼睛的状态判断,多次试验结果表明,该系统中当最大的垂直边缘距离小于眼睛标记矩形区域高度的40%的时候,判断是闭合状态。对于眼睛的提取在不同光线下的效果图如图6~图8所示。

2.3 疲劳状态判断

系统采用的是PERCLOS原理进行疲劳的判断,当PERCLOS值大于40%之后将会进行疲劳判定,并且会进行预警提示。针对每一帧图像的人眼边缘信息,可以判断出人眼的闭合状态。本文中对帧状态Ni的设置:当人眼处于闭合状态时,Ni的值为1,睁开状态Ni的值为0。因此PERCLOS的计算公式可以转换为:

[PERCLOS=i=0NNiN] (4)

对连续的N=30帧进行检测,当PERCLOS的值大于40%的时候表明驾驶员处于疲劳状态,进行预警提示。

3 系统实验

在实验室的环境下,测试平台为三星GT?9100G,邀请了同组的成员进行疲劳模拟,然后利用该系统进行疲劳检测。一共进行了5组实验,其中检测出4组,未被检测的那一组,原因在于其眼睛较小,张开和闭合的状态不是很明显,导致系统无法进行确切的识别。另外,还邀请2组同学带着眼镜进行测试,发现系统能有效地标记出人眼,但是由于眼镜的部分边框也被标记在了边缘提取区域内,造成了边缘的最大垂直距离较大,不能有效地判断人眼状态,对PERCLOS值的计算造成了影响。图9和图10是其中一个同学的实验效果图。

4 结 语

本文实现的基于Android平台的人眼疲劳检测终端,在实验室的环境下表现良好,从实验结果可以看出:系统能快速地定位到人脸和人眼,采用的是摄像头进行图像采集,能有效地避免和监测者的接触,提高了监测系统的适用性,适合驾驶条件下的疲劳检测。Otsu二值化方法和Robert Cross边缘检测相结合的人眼分割技术能有效地使系统不受光线强弱的变化,快速提取出人眼的形状和边缘分布,提高了PERCLOS值的计算精度。系统目前也同样存在一些限制:实时性不是很好,目前仅能做到7 f/s的处理水平,因为嵌入式平台本身的限制和开发环境本身的原因,以及各类算法优化程度不够造成图像的处理速度不够;不能有效地排除眼镜边框造成的边缘信息提取,需要进一步地提高眼睛的定位精度。这些都是后续要对系统进行改进的方向。

参考文献

[1] 刘洪榛.基于机器视觉的疲劳驾驶检测算法研究[D].广州:华南理工大学,2012.

[2] 赵团.基于机器视觉的驾驶员疲劳检测技术的研究与实现[D].辽宁:东北大学,2010.

[3] 焦波波.基于眼睛状态的驾驶人疲劳检测技术的研究[D].长沙:中南大学,2012.

[4] 倪小鹏.基于视觉的驾驶员疲劳状态检测方法研究[D].上海:华东理工大学,2012.

[5] 吴康华.基PERCLOS的驾驶疲劳检测系统设计[D].杭州:浙江大学,2008.

[6] 夏芹,宋义伟,朱学峰.基于PERCLOS的驾驶疲劳监控方法进展[J].自动化技术与应用,2008,27(6):43?46.

[7] 郭永彩,李文涛,.基于PERCLOS的驾驶员疲劳检测算法[J].计算机系统应用,2009,18(8):54?57.

[8] 刘江伟.基于人眼检测的驾驶员疲劳状态识别技术[D].哈尔滨:哈尔滨工业大学,2008.

[9] 刘瑞祯.OpenCV教程?基础版[M].北京:北京航天航空大学出版社,2007.

[10] 王宏彬,李灯熬,赵菊敏,等.利用OpenCV实现在Android系统下的人脸检测[J].软件工程与技术,2011,32(12):4?7.

[11] 曹亮.基于Otsu理论的图像分割算法研究[D].武汉:武汉理工大学,2008.

友情链接