首页 > 文章中心 > 模式识别

模式识别

模式识别

模式识别范文第1篇

英文名称:Pattem Recognition and Aitificial Intelligence

主管单位:中国科学技术协会

主办单位:中国自动化学会;国家智能计算机研究开发中心;中国科学院合肥智能机械研究所

出版周期:双月刊

出版地址:安徽省合肥市

种:中文

本:16开

国际刊号:1003-6059

国内刊号:34-1089/TP

邮发代号:26-69

发行范围:国内外统一发行

创刊时间:1989

期刊收录:

CBST 科学技术文献速报(日)(2009)

EI 工程索引(美)(2009)

中国科学引文数据库(CSCD―2008)

核心期刊:

期刊荣誉:

联系方式

模式识别范文第2篇

关键词:模式识别;本科教学;教学实践;教学改革

随着电子信息技术的迅速发展和信息处理自动化需求的不断扩大,模式识别方法和技术在信息处理领域中的重要性越来越受到重视。在吸引了众多研究者投身到模式识别研究领域的同时,模式识别的教学也从研究生教学逐渐延伸到了本科教学。模式识别作为计算机、电子信息技术等专业的专业基础课程,已经在越来越多的高等院校开设。本科模式识别课程主要讨论以统计学为基础的模式识别理论和方法,内容包括:贝叶斯决策理论以及参数估计方法、以误差函数最小化为原则的线性和非线性判别、近邻规则、特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法、非度量方法、独立于算法的机器学习等内容[1]。由于模式识别研究领域的广泛性,模式识别本科教学的内容和侧重点的安排目前尚处于探索阶段。模式识别领域的发展日新月异,这就要求教师在授业解惑的同时能够与时俱进地介绍该领域的发展前沿,从而培养学生主动探索知识的兴趣。

本文将结合本科模式识别教学的实践,分析该课程在内容设置方面面临的问题并给出相应的解决问题的建议;结合模式识别课程的特点,提出了以应用实例为先导的教学方法,以提高学生的学习兴趣;针对不同类型的学生,提出了如何培养学生实践能力和科研兴趣的方法。

1模式识别教学内容的层次划分和讲授方法

模式识别是一门理论与实践紧密结合的学科,其理论基础涉及高等数学、线性代数、数理统计、矩阵论、随机过程、工程优化方法、小样本统计学习理论、模糊数学等学科[2]。然而除了高等数学、线性代数和数理统计,其他课程都是研究生阶段才会开设的数学基础课。这就使得本科的模式识别教学面临着尴尬的局面:既不能花过多的时间讲数学基础知识,又要把以这些数学知识为基础的内容讲清楚。面对这一难题,我们在教学实践中总结出了一套办法,具体做法是将教学内容划分为基础型、前沿型两类;并采用弱化公式推导,强调数学表达式物理含义的方法进行讲授。

基础型教学指的是已经发展完善的模式识别原理和方法。基础型内容包括:贝叶斯决策理论、概率密度函数估计、线性判别、近邻规则、独立于算法的机器学习等内容。贝叶斯决策理论和概率密度函数估计是以数理统计为基础的[3],这一部分也是模式识别的重点内容。线性判别是以高等数学和线性代数为基础,同时涉及工程优化方法课程的部分内容。在这部分内容中,公式推导占据了相当大的篇幅,而且推导过程是学生可以理解和掌握的。对于基础型的内容,可以采取理论推导和实际例子相结合的讲授方式。在公式推导的过程中,尤其要强调公式的物理含义,同时给出几个有趣的例子,在增强记忆加深理解的同时提高学生的学习兴趣。

前沿型教学指的是正在发展中的模式识别原理和方法。前沿型内容包括:特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法等内容。这部分内容或者是数学基础超出了本科生的能力范围,或者处于发展前沿,很多内容正处于探讨阶段。对于前沿型的内容,可以忽略公式推导过程,直接讲授推导的结论以及结论的物理含义,同样结合实际例子加深学生的理解。对于发展中的模式识别方法可以适当介绍该领域的发展前沿,在开拓视野的同时激发学生的科研兴趣,引导部分学生从事感兴趣的科学领域的研究。

2实例先导的教学方法

模式识别方法是为了解决信息处理中面临的识别问题而提出的。在讲授方法之前,首先要明确将要介绍的模式识别方法的应用背景和使用范围,而不是像我们通常做的那样,先介绍方法的理论基础和流程,最后再给出一个例子,或者通过课后练习和作业的形式让学生掌握课程介绍的理论和方法的应用。针对本科模式识别课程的特点,我们在教学实践中摸索出了一套以实例为先导的教学方法,并与上机实验和课程设计相结合,大大提高了学生的学习兴趣和动手能力,取得了良好的教学效果。

实例先导的教学方法是在介绍每一章或者相关的几章内容之前首先用一个实际的例子引出要学习的内容,在相关内容的学习结束之后给出解决实例问题的模式识别方法。例如:在讲授贝叶斯决策理论之前,给出根据长度和光泽度等数值特征识别鲑鱼和鲈鱼的例子[4];在讲授决策树之前,给出根据颜色,形状、尺寸等非度量特征识别水果的例子等等。通过学习,找到了解决这类问题的一般方法,同时学生也通过实例记住并理解了该方法的适用范围。又例如在讲授特征的选择与提取这一章时,先不讲特征空间的映射和变换,而是从几个实例出发,说明并不是特征越多越好,而是要选择合适的特征向量;特征的组合变换可以使复杂的分类问题转化为简单的问题等。从而让学生更好地理解特征选择和提取的目的和重要性。

在接触到实际的模式识别问题时,会引发学生的思考。在授课过程中,教师可以针对具体问题组织学生进行讨论,看是否能够利用已学过的模式识别方法解决该问题。若可以解决,则引导学生分析用已学方法解决该问题时存在的不足,从而引出下面将要介绍的新方法。这样,在介绍新方法的同时,学生会很自然地将新方法与旧的方法进行比较,分析各种方法的优劣,有利于学生对教学内容的深入理解和掌握。这种方法在讲授解决同一类模式识别问题的不同方法时是适用的。如在讲授贝叶斯决策时,可以通过对比的方式介绍几种决策规则的特点,又如在讲授线性判别方法中各种形式的感知器算法时,也可以对比学习各种算法的优劣。若该模式识别问题不能用已学的方法解决,则引导学生分析该模式识别问题的特点,思考为何必须引入新的模式识别方法来解决该问题,学生是否能够提出自己的解决方案。在分析和思考之后,教师再将解决该问题的思路引入到下面将要介绍的新方法上。这种方法在讲授解决不同类型的模式识别问题时是适用的。如在讲授非度量模式识别方法时,面对非度量语义属性的模式识别问题是前面介绍的方法无法解决的,要引入非度量模式识别方法加以解决。

因此我们建议在教材的编写上可以尝试采用实例先导的方法。首先在引言部分给出一个实际例子,然后在介绍方法的部分结合理论分析给出解决实例问题的方法。这种方法有利于提高学生的学习兴趣,增强记忆,加深理解。

3实践能力和科研兴趣的培养

模式识别是一门理论和实践紧密结合的科学,该学科的发展日新月异,在计算机和信息处理领域的地位越来越重要。因此,在模式识别课程的教学过程中要注重学生实践能力和科研兴趣的培养。在教学实践中,我们采用了上机实验和科学报告相结合的教学方式。

掌握各种模式识别方法的原理和流程是本科模式识别教学的第一个阶段。在此基础上,我们要求学生在计算机上实现模式识别方法并用于解决实际的模式识别问题。在上机实现的过程中,学生不仅需要掌握模式识别问题在计算机中的表示方法和识别结果的展示形式,尤其重要的是学生需要对模式识别方法的每一个细节都要深入理解和掌握才能将算法实现。在上机教学中,我们采用了Matlab编程环境实现课程中介绍的模式识别方法。Matlab的编程语言简单高效,而且提供了功能强大的图形展示功能[5]。例如在贝叶斯决策和线性分类器的上机实验中,学生可以利用画图函数用不同的颜色和符合标记不同类别的样本,可以轻松地画出决策面,这种可视化的分类结果展示形式不仅提高了学生的学习兴趣,而且加深了学生对模式识别方法及其特点的理解。

在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇具独到的见解。

在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇独到的见解。

4结语

本科模式识别教学由于学生的数学基础有限而面临着两难的境地。既要把原理和方法讲清楚,又不能过多的涉及复杂的数学推导,这给教学带来很大困难。在教学实践中,我们把教学内容划分为基础型、前沿型两类,并提出了弱化公式推导,强调公式的物理含义,以及结合实例增强记忆的教学方法。为了提高学生的学习兴趣,加深理解,我们提出了实例先导的教学方法。用实际例子引导学生思考,加深学生对模式识别方法应用背景和适用范围的理解。模式识别是实践性很强的科学,并且该学科的发展十分迅速。在教学实践中,我们十分重视学生动手能力和科研兴趣的培养。通过上机作业和科学报告的形式引导学生积极动手,积极思考。

参考文献:

[1] 边肇祺,张学工. 模式识别[M]. 2版. 北京:清华大学出版社. ,2002:9-303.

[2] 顾波. 模式识别本科教学方法浅谈[J]. 中国科教创新导刊.,2010(4):68.

[3] Andrew R. Webb. 统计模式识别[M]. 2版. 王萍,等,译. 北京:电子工业出版社,2004:1-10.

[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分类[M]. 2版. 李宏东,姚天翔,等,译. 北京:机械工业出版社. ,2003.

[5] 杨淑莹. 模式识别与智能计算:Matlab技术实现[M]. 北京:电子工业出版社,2008:1-300.

Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming

QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2

(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)

模式识别范文第3篇

关键:面孔识别 注视模式 文化差异 异族面孔 面部表情

分类号:B842.1

面孔对于人类的生存具有重要意义。在社会交往中,面孔传递着十分丰富的信息。有时仅仅很快速地观察面孔,人们就能获得对方的性别、表情、种族、身份、年龄、吸引力和注意力的指向等多种信息。作为一种独特的社会性刺激,面孔是视觉认知中最重要的刺激之一,而面孔识别也一直是视觉认知领域的研究热点。自从达尔文在《人和动物的情绪表达》一书中首次提出了人们拥有的熟练的面孔识别技能到底是先天还是后天的问题,大量的相关研究开始探讨面孔识别问题。眼动技术能够在较自然的状态下记录个体外显注意,可以揭示多种不同的加工任务潜在的认知过程。近年来眼动追踪技术也逐渐在面孔识别领域的研究中发挥越来越重要的作用。本文将对最近十多年面孔识别领域进行的眼动模式相关研究进行梳理,并对面孔识别的眼动研究前景进行展望。

尽管大量研究表明面孔加工具有整体性加工的特点(Farah,Wilson,Drain,&Tanaka,1998;Kan-wisher,Tong&Nakayama 1998;Tsao&Living-stone,2008)。但是仅仅看一眼并不能完成对面孔的识别。研究发现。人们最少需要两个注视点才可以有效的完成对面孔的识别(Hsiao&CottreU,2008),而实际的面孔识别中人们会有远多于两个的注视点和眼跳次数:也有研究者发现限制被试眼动会严重影响面孔识别的成绩(Henderson,Williams,&Falk。2005)。上述研究证据都说明,眼动在面孔识别中是必要的,并且眼动对于识别面孑L具有重要的功能。Hannula等人(Hannula’Baym,Warren,&Cohen,2012)的研究从另一个角度证实了面孔加工中眼动的功能性,他们考察了被试在观看学过的旧面孔和变形处理后的新面孔时的眼动模式,结果发现被试对于学习过的旧面孔和被误选的新面孔的注视时间存在显著差异。正是由于眼动在面孔识别中具有独特而重要的功能,许多学者围绕面孔识别的眼动模式从不同角度展开了研究,并试图揭示面孔识别眼动模式背后的规律和意义。

1、不同文化群体面孔识别的眼动模式

已有大量研究发现,面孔识别中大部分注视点都落在面孔的眼睛、鼻子、嘴巴区域(Yarbus,1967;Mertens,siegmund,&Grusser,1993)。并且过去的研究者普遍认为面孔识别具有跨文化一致性。随着跨文化研究在心理学领域的兴起,研究者们也开始质疑面孔识别的文化普遍性。

Blais等人(B1ais,Jack,Scheepers,Fiset,&Caldara,2008)提出主要以西方人面孔为实验对象的研究可能掩盖了面孔识别中存在的文化差异,他们开启了面孔识别眼动模式的文化差异相关研究的先河。Blais等人考察了西方人(高加索人)和东方人(亚洲人)在学习、识别和对面孔分类时的眼动情况,结果发现东方人和西方人在面孔识别时的注视模式存在显著差异。西方被试在观看面孔时表现出一致的三角形注视模式,注视点主要集中在眼睛和嘴巴区域:而东方人观看面孔时更多地注视面部中央区域。即鼻子周围区域。注视模式的这一差异被发现之后,引发了面孔识别眼动模式的研究热潮,东西方人在面孔识别中表现出的注视模式差异也已得到诸多后续研究的验证。Rodger等人(Rodger,Kelly,Blais,&Caldara,2010)考察了高加索人和东亚人在观看倒立面孔时的眼动情况,结果发现即使是对倒立面孔的识别,东西方人也表现出注视模式的差异——西方人采用倒三角形的偏向嘴巴的注视路径,而东方人的注视焦点都指向面孔中心部分到眼睛区域。

尽管东西方人在面孔识别时注视模式不同,但他们识别面孔的准确率没有差异,因此有研究者开始关注眼动模式文化差异的原因。Caldara等人(Caldara,Zhou,&Miellet,2010)采用了限制视角的聚光灯(spotlight)技术考察了东西方被试在面孔识别过程中采用不同的注视模式所获取的信息是否一致。结果发现,在2°和5°视角这两种条件下,东西方被试对面孔识别的注视模式没有显著差异,注视点都集中在眼睛和嘴巴区域。而当视角达到80时,也就是在注视鼻子区域并可以同时通过边缘视觉获得眼睛和嘴巴信息的情况下。亚洲人又重新表现出集中于鼻子区域的注视策略。Miellet等人(2010)的另一项研究采用了掩蔽中央凹视觉(blindspot)的技术,同样考察了东西方被试面孔识别的注视模式,结果发现东方被试受到中央凹视觉掩蔽的影响较小。而西方被试则转而采用典型的东方人的眼动注视模式来识别面孔。这一研究结果证实东方被试的注视模式确实更加有效地利用了边缘视觉的信息。由此可以发现,尽管社会经验和文化因素影响人们抽取面部信息的策略,但是这些外部因素并不影响在面孔识别时信息的使用。为了进一步探讨面孔识别眼动模式文化差异的原因,Kelly,Miellet和Caldara(2010)分析了对人面、羊的面孔和人造物体(greeble)这三类同质性视觉刺激的学习和再认过程中的眼动特点。他们主要检验了假设:①面孔识别模式差异是来自于东西方文化中与人接触时对眼睛的接触及回避的社会解释不同:②东方人所采用的整体性加工策略可能是受到面孔加工的整体性所影响的。他们发现东西方观察者对于人面的再认成绩都好于另外的两类刺激,并且东西方被试的这种注视模式差异并不仅表现在对人面的识别上,也表现在对羊面孔和人造物体上。这就否定了东西方被试识别模式的差异是由于文化中对于目光接触和回避的意义的解释不同这一假设,面孔注视模式的文化差异是由更根本的影响因素导致的,此影响机制同时对面孔及其同质性参照物的识别发挥作用。为了更进一步探讨面孔识别模式差异的形成机制,Kelly等人(2011)对中、英两国的7-12岁的儿童完成新旧面孔识别任务时的眼动情况进行了追踪,结果发现两组儿童都表现出了和他们各自文化中的成人相同的注视模式。可见文化因素可能在儿童早期就开始影响眼动模式。要了解注视模式差异究竟是从什么年龄开始表现出来的,还需要针对更小年龄的儿童去探讨。Kelly等人(Kelly et al.,2011)的另一项研究考察了在面孔识别中文化和遗传因素分别起多大作用,结果他们发现大部分英国出生的华裔成年被试表现出了典型的东方人注视模式,只有约25%的被试表现出了典型的西方模式。

Miellet,Vizioli,He,Zhou和Caldara(2013)的研究更深入地探讨了东西方人在面孔识别眼动模式上的差异。他们采用了扩展的聚光灯(Expand,ing Spotlight)技术发现东方被试确实更多从鼻子区域采集信息,西方被试更多从眼睛区域采集信息,而且东西方被试采集信息的差异不仅表现在数量上也表现在质量上,西方被试更多抽取面孔的局部的高频空间信息,而东方被试则更多抽取面孔整体的低频空间信息。这一研究再次证明了对面孔的识别和加工并不是只有一种独特的方法,不同文化背景下的人们会采用灵活的策略而达到同样好的识别效果。

Kelly等人(2010)和Caldara等人(2011)的研究得到了基本一致的结论——单纯用文化环境因素来解释东西方被试的眼动模式差异是不够的,除了文化环境之外,还有更根本的作用机制(比如遗传因素)在影响面孔识别过程。也有研究者选择了东西方文化交汇的特殊地点。考察了在面孔识别中遗传与环境的复杂交互作用。Tan等人(Tan,Stephen,Whitehead,&Sheppard,2012)考察了马来西亚的华裔大学生识别东亚人、白人和非洲人面孔时的眼动情况,发现这些被试对于这三类面孔的注视都采用了混合策略,即他们对所有面孔的注视模式都是注视眼睛和鼻子多于嘴巴。马来西亚的华裔被试采用的整合策略使得他们在识别东西方面孔时都具有优势,这也表明不同文化群体的注视模式差异是多样化的。今后的研究需要进一步探讨环境因素和个体经验是如何共同影响视觉加工机制的。

2、不同种族面孔识别的眼动模式

尽管人们都是面孔识别的专家,但是大多数人对本族面孔的识别与再认显著好于异族面孔。对本族面孔加工的偏向,被称为异族效应(other-Faceeffect)。异族效应稳定地表现在面孔加工的多个方面——对异族面孔的记忆效果更差(Meissner&Brigham,2001)、对异族面孔的区分能力更差(Byatt&Rhodes,2004)、对异族面孔的变化更难觉察(Humphreys,Hodsoll,&Camobell,2005)以及对异族面孔的年龄和性别的判断准确度更差(Dehon&Bredart,2001;OToole,Peterson,&Deffenbacher,1996)。目前,对于异族效应的理论解释主要有下面几种不同的观点:①异族面孔加工较差是由于个体接触异族面孔的经验相对缺乏(Goldstone,2003),经验的缺乏又导致了异族面孔的表征与储存在心理空间中的密集程度较大(Bv-att&Rhodes,2004);②由于群体内偏向,人们对本族面孔的编码更加准确并且集中于加工他们的个体化特征(sporer,2001);③人们对本族面孔加工的整体性要好于异族面孔(Michel,Rossion,Han,Chung,&Caldara,2006)。

Liu等人(2011)研究了4至9个月的中国婴儿对交替呈现的亚洲面孔和高加索面孔的眼动注视模式,结果发现4到9个月的中国婴儿对本族和异族面孔的总体注视时间没有差异,而且都是表现出对上半部分面孔的注视时间多于下半部分,对于右半部分面孔的注视时间多于左半部分。但是随着年龄的增长,中国婴儿对高加索人面孔鼻子区域的注视时间会显著下降,而对本族面孔的鼻子区域的注视时间则没有显著变化。整体看,4至9个月的中国婴儿对本族和异族面孔的注视模式差异集中体现在鼻子区域。Wheeler等人(2011)考察了6到10个月的高加索白人婴儿对动态呈现的本族面孔和异族面孔(非洲面孔)的眼动注视模式。结果发现,虽然婴儿注视本族面孔与异族面孔的总体时间没有显著差异,但是随着婴儿年龄的增长,婴儿对本族面孔的眼睛区域的注视时间变长,对本族面孔嘴巴区域的注视时间变少。

比较Wheeler等人(2011)研究中发现的西方白人儿童对本族和异族面孔的注视模式的差异以及Liu等人(2011)发现的中国婴儿所表现出的对本族和异族面孔的注视模式的差异,可以发现这种东西方儿童的注视模式的差异与前文所述的东西方人普遍的注视模式的差异是一致的,即东方人集中于注视鼻子区域,而西方人主要注视眼睛和嘴巴区域的。由此可见,东西方人之间的注视模式的差异在6-10个月的婴儿身上已经有所体现,而且随着年龄的增大,婴儿对于本族和异族面孔的差异逐渐突出。据此可以推测面孔识别的眼动模式东西方差异的原因中既有先天的因素,也有后天教育的影响。

Wu,Laeng和Magnussen(2012)采用眼动追踪技术考察了高加索被试对东西方面孔进行记忆时是否存在不同的眼动模式。结果发现,高加索被试表现出了典型的异族效应,他们对本族和异族面孔识别时的眼动编码方式和瞳孔直径都有差异。对本族面孔进行加工时,扫描活动更活跃,有更多短的注视点和更高的眼跳频率。上述这些眼动指标都表明在注视本族面孔时,人们更多地在不同的面部特征之间进行转换,即试图更多地进行构形信息加工,而相应的对异族面孔的整体性加工则表现的较少。他们的研究也发现被试在观看异族面孔时比观看本族面孔时的瞳孔直径要大,这表明在加工异族面孔时可能有更大的认知负荷。

Fu,Hu,Wang,Quinn和Lee(2012)考察中国成人被试记忆并再认异族(高加索白人)和本族面孔时的眼动模式的异同。他们发现无论是在记忆还是再认阶段,中国成人对本族面孔的鼻子和嘴巴区域注视更多,却更多地注视异族面孔的眼睛区域。Fu等人(2012)的研究结论与Blais等人(2008)的研究结论并不完全一致,后者并没有发现中国成年被试对本族和异族(高加索)面孔的注视模式的差异,这两项研究结论不一致的一个重要原因是他们选取的被试样本对异族面孔的接触经验存在显著差异。王乾东。胡超和傅根跃(2013)发现中国的幼儿和成人一样,在面孔识别的眼动模式上都表现出了异族效应:中国幼儿对本族面孔更多注视鼻子和嘴巴区域,而对异族面孔更多注视眼睛区域;并且相对于成人,幼儿在加工面孔时更倾向于注视面孔的眼睛部分,进行局部加工。他们提出这种对本族面孔和异族面孔的注视策略的差异可以部分地用专家一新手理论去解释:对本族面孔更多的视觉经验将人们塑造成本族面孔加工的专家,从而对本族面孔更多地采取以鼻子为中心的整体化视觉加工策略,而对异族面孔则更多采用分析型的局部加工策略。

尽管上述相关眼动研究较多地支持了本族面孔加工的整体性要好于异族面孔,但是现有研究还不足以否定关于异族效应的其它假设。在今后的研究中需要直接操纵接触异族面孔的经验多少等变量,采用眼动与电生理技术结合等方法,来明确地比较几种不同理论假设的合理性。

3、不同熟悉度面孔识别的眼动模式

每个正常成年人都是面孔识别的专家,都可以记住成百上千张不同的熟悉面孔。即使在明度、表情、年龄等方面变化较大的情况下,人们也可以准确地识别出熟悉的面孔。但是人们对陌生面孔的识别能力却十分差。当需要对陌生人进行判断时,无论是要求记忆面孔,还是要把人物和照片进行对应的任务都会表现较差。人们只需要250ms就能辨识出一张熟悉的面孔(Jacques&Rossion,2006)。Bruce和Young(1986)在他们早期的面孔识别模型中指出熟悉面孔和陌生面孔的加工是通过独立的路径实现的,他们各自依赖不同的功能性编码。有研究者(Burton&Jenkins,2011;段海军,蔺素琴,2011)指出人们对于熟悉面孔进行识别时除了进行视觉编码之外,还会提取相关的语义信息、声音信息和情感信息等,而对陌生面孔则更多依赖视觉编码。熟悉度对于面孔加工影响的研究由来已久,其中眼动研究在揭示人们加工熟悉和陌生面孔的差异时扮演了重要的角色。

熟悉度对面孔识别的眼动模式影响的典型表现是:在识别熟悉面孔时人们对内部特征(眼睛、鼻子和嘴)比对外部特征(脸型、头发)的关注更多,而人们对不熟悉面孔的识别中更多依赖外部特征(Young,Hay,McWeeny,Flude,&Ellis,1985)。有大量的研究发现注视熟悉面孔和陌生面孔时,对内部特征注视比率的差异显著。

Van Belle,Ramon,Lefevre和Rossion(2010)的研究考察了识别熟悉和陌生面孔的眼动模式的差异,结果发现尽管被试对熟悉和陌生面孔的注视点个数没有显著差异,但是注视点分布的差异在注视的早期——几乎是在第一个注视点之后就表现出来了,人们对熟悉面孔的内部特征比陌生面孔的注视时间更长、加工更多。Heisz等人(Heisz&Ryan,2011)考察了被试对明星和陌生人的面孔进行学习和判断时的眼动模式。结果发现,无论是老年被试还是年轻被试都表现出相对于陌生人的面孔,对名人面孔的内部特征注视更多的特点。Heisz等人(Heisz&Shore,2008)考察了当新学习的面孔逐渐变得熟悉(连续学习四天)之后被试眼动注视模式的变化。结果发现,无论熟悉面孔还是陌生面孔,眼睛比其它面部区域获得的注视更多,注视时间也更长。随着熟悉性的增加,观察者对眼睛的注视越来越多,对鼻子、嘴巴、前额、颈部、下巴的注视逐渐减少。樊倩和隋雪(2011)也发现被试在完成面孔的熟悉性判断任务中,对熟悉面孔的识别倾向于只注视眼睛,而在识别陌生面孔时则首先在双眼间平移而后向嘴巴运动。Hilliar(2011)的研究招募了在澳大利亚成长的澳大利亚人、在澳大利亚成长的亚洲人和在亚洲成长的亚洲人三组被试。结果发现无论对于本族面孔还是异族面孔,这三组被试都是对面孔的内部特征比外部特征的注视次数更多,注视时间也更长。

总体看来,现有研究关于熟悉性对面孔识别眼动模式影响的结论并不一致,存在分歧的原因可能有两方面:一是不同的研究中采用的熟悉和非熟悉面孔的标准并不统一,有的进行了熟悉度等级的预先评定,有的则是简单地进行明星非明星的分类:二是不同的研究采用的面孔加工任务也不尽一致。Stacey等人(Stacey,Walker,&Underwood,2005)采用眼动追踪技术考察了在三种任务下被试对熟悉和不熟悉面孔的信息提取特点。结果发现只有成对面孔匹配任务中,被试对熟悉面孔比非熟悉面孔的内部特征注视显著更多;在熟悉性判断任务和面孔记忆任务中,被试对于熟悉和不熟悉面孔的大部分的注视点都落在了面孔的内部区域。由此可见,对熟悉面孔的内部特征关注更多的现象并不是任何情况下都存在的,可能是任务相关的。此外,也有研究者发现对陌生人的面孔识别更依赖外部特征这一现象并非是跨文化普遍性的。Megreya等人(Megreya,Memon,&Havard,2011)考察了埃及人和美国人在观看录像辨认虚拟凶手任务中表现出的“头巾效应”(Headscarf Effect,即被观察者带头巾时人们的面孔识别变差)。结果发现虽然美国人在辨识埃及和美国凶手面孔时都表现出了“头巾效应”,但是埃及人无论对哪个种族凶手的辨认都表现出相反的现象,即对戴头巾时的虚拟凶手辨认效果更好。由此可见个体的文化背景可能会强烈地影响其面孔加工特点,面孔识别具有文化适应性。

目前的研究并非都支持内部特征对于熟悉面孔的识别更重要的结论,那么面孔的熟悉性在注视模式上的表现究竟是什么样的呢?今后的研究需要对熟悉和陌生面孔的注视模式的差异做出更细致的区分,比如更多分析注视点个数、凝视时间、眼跳的幅度、注视轨迹等具体眼动指标上的细节差异,从而更准确和更清晰地了解面孔熟悉性对眼动模式影响。

4、不同情绪面孔识别的眼动模式

在面孔识别的研究中,面部表情的识别是一个重要的方面。虽然目前在这一领域进行的眼动研究相对较少,但也有一些有趣的发现。

李强等人(2005)考察了大学生被试观看不同情绪图片时的眼动模式。结果发现人们观看不同情绪面孔图片的眼动特征存在差异——观看正、负性图片时比观看中性图片时的瞳孔直径更大,注视点个数要多。隋雪和任延涛(2007)发现中国大学生被试在加工正性、中性和负性情绪的西方人面孔时。表现出的眼动轨迹基本一致——呈现出从右侧眉心到鼻尖再到左眼的逆序“V”字型:并且在掩蔽条件下。眼睛部位的掩蔽相对于嘴部和鼻子的掩蔽对情绪面孔识别的影响更大。

有研究者(Khail,Konik Dinet,Meyer,&Bouakaz,2011)通过眼动追踪技术对不同面部表情识别的关键特征进行了分析。结果发现,对于高兴和惊讶表情的识别,嘴巴是关键部位:对于悲伤和害怕的识别,眼睛和嘴部都是重要的:但是对于生气和厌恶的识别。则体现出了嘴、鼻子、眼睛的复杂交互作用。另一些研究者(Laurent,Poecker,Noiret,&Claudon,2011)考察了不同的情绪背景下人们观看情绪面孔的眼动特点。结果发现,一般情况下人们对情绪兴趣区(在此研究中界定为眼睛和嘴巴区域)内的总注视时间要长于情绪兴趣区外部的区域。但是,在正性和中性情绪背景下观看负性情绪面孔时,总注视时间没有表现出在情绪兴趣区内部和外部的差异:而且在正性情绪背景下。人们对负性面孔的情绪兴趣区内的总注视时间比中性背景下的显著减少。上述研究表明。在积极情绪状态下,人们倾向于改变视觉搜索的策略。从而避免发现情绪兴趣区内的负性信息。

Guo(2012)考察了被试对不同强烈程度的6种基本情绪的分类和识别时的注视模式,结果发现人们在观察不同类型的表情时,对各个情绪兴趣区(在此研究中界定为眼睛、鼻子、嘴巴)上的注视比率是不同的,但是人们对不同类型和强度情绪的识别所遵循的眼动模式基本一致,都是采用整体策略,即扫描全部的情绪兴趣区,注视最多的是眼睛,其次是鼻子和嘴巴区域。

另外,近期的研究还发现东西方人表现出的面孔识别的眼动模式差异也影响到了东西方人对情绪面孔的分类和识别。Yuki,Maddux和Masuda(2007)发现在做表情判断时,日本被试更重视眼睛部位传递的信息,而美国被试则更多受到嘴巴区域的情绪信息的影响。Jack,Blais,Scheepers,Schyns和Caldara(2009)指出东方人对眼睛注视相对较少,导致了他们对害怕和厌恶的分类和识别存在缺陷。表情识别的文化差异是近期研究的一个新热点,在今后的研究中我们不仅可以关注对基本情绪识别的眼动模式,也可以更多的关注其它复杂的社会情绪的识别模式,以及人们对动态表达着的情绪信息实时解读的眼动模式。

5、研究展望

尽管目前人们使用眼动仪对面孔识别眼动模式的多个影响因素进行了研究,也取得了一些成果,然而由于面孔的特殊性和面孔识别系统的复杂性,许多问题还有待进一步的分析和探讨。结合目前研究中存在的问题,笔者认为,未来关于面孔识别的眼动模式研究可以在如下两个方面进行扩展。

5.1 面孔识别眼动模式东西方差异的原因分析与

功能分析

眼动注视在面孔识别中具有重要的功能,而已有的诸多研究证实了面孔识别模式的非普遍性,打破了人们原以为面孔识别是由普遍的生物学因素决定的观念。而后续研究发现东西方人在面孔注视模式上的差异不仅仅是经验引起的,遗传因素很可能也起一定的作用(Kelly et al.,2010;Kelly et al.,2011;Tan et al.,2012)。

今后关于注视模式的研究需要更进一步地考察面孔识别模式的东西方差异的机制,具体探讨如下几个问题:(1)面孔识别的眼动模式出现差异的原因是什么?(2)遗传因素和文化环境因素分别在注视模式差异中起到什么样的作用?要更好地分离遗传和文化环境因素,开展双生子研究是有效的手段。(3)面孔识别的眼动模式差异是否带来功能性的差异?已有研究表明,尽管东西方人获取面部信息的方式不同,但是真正有效利用的信息是一样的(Caldara et al.,2010)。如前所述,既然眼动信息在面孔识别中是具有功能的,那么东西方人不同的注视模式背后是否还蕴藏功能性的差异呢?(4)如果存在功能性差异,这些差异又是什么呢?注视模式背后的功能性差异的内涵也是值得进一步研究探讨的问题。

5.2 动态面孔中社会性信息识别的眼动研究

模式识别范文第4篇

【关键词】独立通风笼盒;故障;模式识别;误差逆传播网络;遗传算法

IVC(Individually Ventilate Cages),又称为独立通风笼盒,是目前国际上普遍使用的实验动物饲养系统[1,2]。在我国,IVC被引入国内之前,通常采用独立屏障系统来饲养实验动物。但是,由于实验动物饲养要求的特殊性,其对饲养环境的高要求使得传统的独立屏障系统在实际使用过程中,需要饲养人员人为地做大量工作来保证其符合基本要求,不但耗费人力物力,效果也并不是太好。

国内的技术人员结合国内实际情况,对引进的产品进行了二次开发,改良了一部分的性能,使其适用于国内使用环境。开发的方向主要集中在两方面:

(1)故障报警模块的开发。特别是利用日益发展的3G网络实现远程报警和控制。

(2)针对通风系统的故障问题自动识别模块的开发。识别方法主要包括故障树、人工神经网络等。

本文主要介绍针对通风系统的故障问题的自动识别。

1.故障模式识别模型

IVC是一个密封的系统,虽然有较为完善的过滤系统,但空气中的微尘,动物自身携带的粉尘和国内主要使用的垫料、食物中的粉尘微粒等仍然容易引起通风系统的堵塞。一旦通风系统不能正常工作发生故障,密封笼盒内的气流速度、内外压差、噪音、相对湿度、温度、氨气浓度等参数指标就会发生改变,达不到实验动物饲养环境的要求,对医学实验结果的正确性也有影响。

IVC系统中,由于包含生物生理活动这样一个不确定因数,常规的故障树等故障诊断方法难以实现对其故障类型的准确判断。而神经网络作为一种自适应的模式识别技术,不需要预先给出有关模式的经验知识和判别函数,而是通过自身的学习机制自动形成所要求的决策区域。并且环境发生改变的时候,通过学习而得到的映射关系还可以自适应地进行调整。神经网络的这些特性,决定了它适合用于系统模型比较复杂,环境多变的场合。因此,对IVC的故障模式识别采用基于人工神经网络的识别方法更合适。

1.1 标准BP网络

误差逆传播网络(Error Back-Propagation network.,简称BP网络)是人工神经网络中,理论最成熟,运用最广泛的网络模型之一。

基于梯度下降的标准BP算法,最突出的优点是寻优具有精确性,且具有自学习能力,但同时存在易陷入局部极小、初始值对网络结果影响大和引起振荡效应等缺点。虽然近年来提出不少改进方法,一定程度上提高了BP网络在实际应用上的可行度与准确度,但是仍然无法解决BP网络所固有的易陷入局部的问题。

1.2 基于遗传算法的改进BP网络

遗传算法(Genetic Algorithm,简称GA)是一种基于自然选择和群体遗传机理的搜索算法[3]。它模拟生物在自然环境中的遗传和进化过程,形成的一种自适应全局优化概率搜索算法,不存在局部收敛问题[4,5]。由于遗传算法的寻优过程是随机的,带有一定的盲目性和概率性,所以遗传算法具有难以得到精确解的缺点。

可见,BP算法和遗传算法各有利弊,并且优缺点呈互补性,可以用遗传算法对BP模型进行改进,利用遗传算法的全局搜索能力,优化解空间,再发挥BP算法的局部搜索能力强的优势,找出最优解。本文提出应用基于遗传算法的改进BP算法来实现对IVC故障诊断,以满足IVC故障模式识别对实效和精度的高要求。

2.基于遗传算法的改进BP模型的IVC故障模式识别

2.1 模型的初步确定

网络的输出是IVC故障的四个类型,包括进风过滤网膜轻微堵塞、出风过滤网膜轻微堵塞、进风过滤网膜严重堵塞、出风过滤网膜严重堵塞4种。网络的输入是发生故障时被影响的参数,考虑到样本的相关性和冗余性,本系统选择氨气浓度、气流速度、内外压差、相对湿度四个量作为网络的输入。因此,对应的网络输入神经元个数为4个,输出神经元也为4个,隐含层神经元个数通过调试最终确定为7个。

2.2 模型参数的确定

选择适合的编码方式是遗传算法的关键。将参数编码成对应的子串,再将各子串首尾相联,构成染色体,每条染色体代表解空间的一个解。不同的编码方式对遗传算法的求解精度和收敛速度有一定的影响。本系统根据权重、阀值的特点,采用二进制编码方式。BP模型为4-7-4结构,包括56个权重,11个阀值,共67个参数,每个参数用8位二表示,联起来形成一条染色体,长度为536。

目标函数唯一的条件是:针对输入可计算出能加以比较的非负结果。因此,系统的目标函数采用网络误差平方和函数,表达式为:

3.仿真结果与分析

将真实状态下,IVC系统故障发生时记录下的数据作为初始样本集,将这些样本做归一化处理,并进行冗余分析,剔除冗余项,保证样本空间无重叠。将处理好的样本的70%作为训练样本集,剩下的30%作为测试样本集,分别对网络进行训练和测试。训练结果见图1。

可以看出,基于标准BP网络的训练,需要经过66步才能收敛于目标函数0.00001,而基于遗传算法的改进BP网络的训练仅需要18步,大大缩减了训练的时间。

测试结果见表1。可明显看出:

(1)改进后的BP网络,收敛率达到95.7%,一定程度上克服了标准BP网络易出现振荡效应的缺点;

(2)改进后的BP网络,正确识别率可以达到92.4%,相比标准BP网络70.2%的正确识别率,识别的准确性有了很大的提高,减少了陷入局部极小的可能性,基本上可以达到实际应用所要求的误差范围要求;

(3)改进后的BP网络,识别时间缩短,能更好地满足本系统对实效性的要求。

可见,基于遗传算法的改进BP网络,能更好地对IVC进行故障模式的识别,并且能达到实际应用中对实效和精度的要求,可以解决目前制约IVC在国内广泛应用的问题。

参考文献

[1]Krohn TC.Method developments and assessments of animal welfare in IVC-systems[M].Printed by DSR Grafik,2002,5.

[2]柯贤福,陈文文等.四种独立通风笼具(IVC)的检测[J].中国比较医学杂志,2009,19(9):78-82.

[3]王德明,王莉等.基于遗传BP神经网络的短期风速预测模型[J].浙江大学学报(工学版),2012,46(5):437-842.

[4]Li Weiqing,Wang Chengbiao,etal.An edge detection method based on optimized BP neuralnetwork[J].International Symposium on Information Science and Engineering,2008(2):40-44.

模式识别范文第5篇

1.问题的提出

题1.某生产饮料的企业准备投入适当的广告费,对产品进行促销.在一年内,预计年销量Q(万件)与广告费x(万元)之间的函数关系为Q=(x≥0).已知生产此产品的年固定投入为3万元,每生产1万件此产品仍需要再投入32万元,若每件售价为“年平均每件成本的150%”与“年平均每件所占广告费的50%”之和.

(1)试将年利润W万元表示为年广告费x万元的函数;

(2)当年广告费投入多少万元时,企业年利润最大,最大年利润为多少?

从学生认知层面来说,解高中数学应用题难在如何将现实问题转化为学过的数学知识,即把现实问题“数学化”.这就说明高中数学应用题教学的核心在于如何引导学生“数学”地思考实际问题并把现实问题转化为纯数学问题的过程.

2.问题的思考

针对出现的这一问题,笔者认为应用题取材于生活,是一个简化了的实际问题,是“学数学,做数学,用数学”的有效载体,是现实问题与纯数学问题的必然联系和区别中的辩证统一关系,更重要的是应该使学生掌握解决高中数学应用题的有关方法,也就是要有一定的思考方向.本文试图用模式法教学法进行探究.

笔者同时也认为数学应用题的教学应分为两步教学:一是建模的教学;二是解模的教学.而《江苏省普通高中数学课程标准教学要求》明确提出:发展数学应用意识和创新意识,力求对现实世界中蕴涵的一些数学模式进行一定的思考和作出有效判断.

3.问题的解决

3.1审题

在学生读题过程中,教师要引导学生找出条件是什么,问题是什么,把题中的重点词、句用线段画出,明确条件与问题有什么关系,并尽可能寻找出条件(已知)与问题(未知)的内在关系,将题目给定的信息经过分析、综合后,让学生尝试自己复述,学生在不经意中把现实问题“数学化”.在审题过程中,由于认知能力的差异,学生的感悟会有所不同,会存在一些疑点、难点,可以通过讨论让学生自己探究到问题的缘由.通过学生自己的阅读、理解、自主体验,实现“数学语言”的提炼,从而顺利实现了实际问题“数学化”.

3.2模式化建模

通过“审题”学生大致可以知道:用已学过的哪些数学知识可以解决问题,解题有了基本明确的方向.这一过程也是培养学生“数学”地思考问题的最关键环节,这一过程我们不妨叫做“模式化建模”.其中高中常见的数学模型:函数模型、不等模型、数列模型、立体几何模型、三角模型、解析几何模型的应用题等.各类数学题型就是一个个数学模式,由于高考应用题都不是原始的实际问题,命题者对原始的材料,通过精心设计、加工、创作,就可将应用题化归为某个数学题型.学生识别出了题中的模式,就可将应用题化归为某个数学题型,也就找到了相应的解题途径.教师要帮助学生总结各类典型应用题的基本模式,构建相应的数学模型及识别模式的思维方法,保证学生在解高考应用题时能进行准确的模式识别.

3.3解模

建模后,实际问题被转化学生比较熟悉的纯数学问题.到这个阶段,学生开始对“问题解决”有了初步的方法和策略,以下的教学就可以由学生自己完成,让学生发挥主体作用,增强学生解数学应用题的自信心.

4.案例分析

4.1模式化教学课堂简录

以题1(函数型模型识别类)为例

教师:如何读懂题目?

学生:理清题目中量的关系。

教师:怎么理?

学生想不出来,期待老师……

教师:好,现在解决问题1,教大家一个处理信息的常见方法――列表。

教师继续讲:销售问题涉及几个量?

学生:价格、销售量、成本、利润。

教师:列表,关键怎样列?

几个学生列表后,上黑板,比较,大家一致认为下面一种表格比较好.

学生完善表格内容:

当x≥7时,w′0,w是的单调增函数;

当x=7时,w取得最小值.此时w=42.

教师展示:简解及评分标准(略).

通过一段时间模式识别法教学后,笔者发现其对帮助学生克服畏惧心理,增强学习数学的自信心,培养学生孜孜以求的探索精神,培养学生的应用意识和应用能力,有一定的帮助,这也是大众化数学的真正目的.正如著名数学家华罗庚所说:“宇宙之大,粒子之微,火箭之速,化工之巧,地球之变,生物之谜,日用之繁,无处不用数学.”

参考文献:

相关期刊更多

模式识别与人工智能

北大期刊 审核时间1-3个月

中国科学技术协会;中国自动化学会

金刚石与磨料磨具工程

北大期刊 审核时间1-3个月

郑州磨料磨具磨削研究所有限公司

模型世界

省级期刊 审核时间1个月内

北京市体育局