前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉技术应用范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

中图分类号:TP391 文献标识码:A 文章编号:1007-3973(2012)002-075-03
1 前言
自1825年世界第一条铁路在英国出现以来,铁路已经成为人们不可或缺的交通工具,越来越多的人在使用铁路出行,由于近年来铁路事故频频发生,促使了计算机视觉技术在铁路检测上的广泛使用并大力发展。
传统的铁路检测一直是靠人工和静态检测,这种检测缺乏实时性和准确性,并且效率低下,根本无法满足铁路的发展。这就要求研究一种新的检测方法来适应环境的发展,人们就试图将计算机视觉技术应用于铁路检测上,并取得了很好的效果。将计算机视觉技术应用在铁路检测上显著提高了铁路检测的实时性、准确性,有效的减轻了人工检测中工作条件恶劣,工作量大等缺点。它能在列车行驶的过程中就能对铁路和列车状况进行检测,并及时的做出预警,防止安全事故的发生。目前有关铁路检测主要集中在铁路信号检测、轨道检测、接触网检测、电力机车检测及站台环境监测等五个方面。
2 计算机视觉技术
计算机视觉,也称机器视觉。它是利用一个代替人眼的图像传感器获取物体的图像,将图像转换成数字图像,并利用计算机模拟人的判别准则去理解和识别图像,达到分析图像和作出结论的目的。
计算机视觉是多学科的交叉和结合,涉及到数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域。计算机视觉已有多年的发展历程。随着计算机、控制理论、模式识别、人工智能和生物技术的发展,计算机视觉在机器人、工业检测、物体识别的应用越来越广,研究方向也从二维到三维,从串行到并行,从直接依赖于输入信号的低层处理到依赖于特征、结构、关系和知识的高层处理。
一般的计算机视觉系统是有CCD(电荷耦合器件)摄像机、装备有图像采集板的计算机、光照系统以及专用图像处理软件等组成。CCD摄像机将所要研究的对象和背景以图像的形式记录下来,这其实是一个光电传感器,将光学信号转成电信号,图像采集板把采集的电信号转为数字信号,即数字化,一般情况下在摄取图像时都需要一个照明系统提供光照,然后再用专用的图像处理软件对图像进行处理,输出分析结果。
3 计算机视觉技术在铁路信号中的应用
铁路信号灯和现在的交通公路上的红绿灯是一个功能,但铁路和公路不同,铁路有限定的道路,列车必须在限定的股道上行驶,所以一旦与其他车辆相遇的话根本没有办法避让,如果发生车祸将会对国家和人民的生命和财产造成严重的损失,因此列车必须严格按照信号灯的指示行驶。
铁路信号灯识别主要是利用了信号灯在不同情况下会发出特定色彩光的特点。文献[1]在HSV空间中对S分量图像边缘检测和膨胀等,结合各种信号灯色调H分量的取值范围得到信号灯区域,然后多次腐蚀直到消除孤立点得到信号灯的边缘,最后填充信号灯区域,从而实现了信号灯的识别。在文献[2]也与此类似。文献[3]将彩色图像由RGB模式转化为HSI模式,用彩色特征聚类分析法来对图像进行分割,文中提出了基于颜色和形状相结合的复杂环境中目标检测与识别方法,用Hough变化来提取目标边界,从而提取出特定目标,而后得到指示灯区域所有像素的H,S统计值确定信号灯的颜色。在文献[4]提出一种基于改进的Hough变化的吊车信号灯识别算法。Roberto将摄取的图片转换到HIS颜色空间,用基于形状特征和模板匹配的方法探测到相关的铁路标志而放弃无关的基础设施。
为了部分消除因为光照条件、背景和拍摄角度对目标识别的影响,文献[5]提出使用一种利用sift特征的方法,它首先建立已知样本模型的特征集,然后将视频流每帧灰度图像的sift特征与之比较,从而实现对目标的检测或跟踪。实验表明该方法不仅能避免目标的错误识别,而且也明显优于基于边缘检测的算法,在识别准确率上达到了90%。
4 计算机视觉技术在轨道检测中的应用
随着世界铁路运营速度的不断提高,列车在行驶时对轨道的撞击、摩擦加剧,这就会造成轨道的变形、零件松动、磨损乃至缺失等,这些都会对列车的安全性造成严重影响,极有可能会造成铁路安全事故的发生。因此轨道设备具备良好的状态是铁路运输安全的重要保证。
随着电子技术和检测技术的发展,轨道检测技术也经历了翻天覆地的变化,其中也有不少研究机构将计算机视觉技术应用于轨道检测上,且取得了若干有效的检测方法。
轨道表面缺陷对列车行驶的质量和铁路系统的安全性会造成严重的影响,文献[7]提出了一种轨道表面缺陷检测的实时视觉检测系统。利用跟踪提取算法分割出轨道的灰度图像,然后用局部归一化法增强轨道图像的对比度,最后用基于投影轮廓的缺陷定位法检测缺陷。该算法对噪声有较强的鲁棒性和计算速度快,在一定程度上克服了光照不均和轨道表面反射性质不同对图像的影响,但对局部归一化过程中参数的选择有待进一步研究,以使该系统有更强的鲁棒性。该系统在216km/h速度下能进行实时检测,但随着检测速度的提高检测的准确度会明显下降且缺乏实时性。
文献[8]利用一排结构光视觉传感器,将钢轨轮廓的大圆周和小圆周的中心作为检查点。首先结构光视觉传感器拍摄铁轨侧面并且将其标记 在参考坐标帧中,最后通过比较测量的钢轨轮廓与参考轮廓的比较计算出铁轨磨损程度。该方法简单快速精确且不需要特殊的图像处理设备,在列车较高速度时仍然能达到良好效果。
5 计算机视觉技术在接触网检测中的应用
接触网是沿铁路线上空架设的向电力机车供电的特殊形式的输电线路。其由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。它是轨道交通的主要组成部分,主要为机车提供动力,接触网的连接件由于受外界因素的影响容易产生过热现象,严重时会导致供电中断,引发列车停运事故。
我国的计算机视觉技术的接触网检测系统是基于德国相关技术而建立起来的,目前基于计算机视觉技术的接触网磨耗检测主要有两种方案:(1)基于镜面反射,激光照射接触线,线性CCD照相机捕获反射图像;(2)基于漫反射原理和CMOS(互补金属氧化物半导体)照相机。由于长期的频繁摩擦,接触网与受电弓接触部分很少被空气氧化,所以用光进行照射时该部分光反射率明显高于其他部分,因此这也为计算机视觉技术用于接触网检测提供了可能。
基于机器视觉的接触网检测系统主要是建立在图像识别和图像处理等视觉技术基础之上的,检测的内容涵盖接触网的所有基本几何参数。随着铁路的发展,原有的检测系统已经暴露出了一些问题,已无法满足需求,所以研究人员在系统硬件设备不变的情况下提出了许多改进的算法,如文献[9]针对现行的接触网定位器倾斜度检测方法效率低下、精确度不高的缺点,提出了一种基于计算机视觉的接触网定位器倾斜度自动测量装置,应用图像分割、剔除干扰线、图像细化等算法,对采集的图像进行处理,然后利用改进的霍夫(Hough)变换检测细化后的图像,对相邻的特征像素点进行聚类并感知编组,最后用随机Hough变换使感知编组后的每条线段更接近直线,进而计算装置中定位器的倾斜度,实验证明该算法精度高、速度快。
6 计算机视觉技术在电力机车检测中的应用
在列车的行进过程中,机车车轮与钢轨接触面不断发生摩擦,也就是轮缘与踏面的摩擦。从而会造成踏面的擦伤或剥离,而剥离会严重影响列车运行的安全性和平稳性以及轨道设施的使用寿命,因此需要对轮缘进行定期的检测和维修。
传统的检测方法需要人工逐项检测,存在费时费力、工作量大、工作环境差、效率低等缺点,所以人们就提出了一种基于计算机视觉技术的检测技术,该技术是一种非接触式检测方法,它能检测出所有关于火车轮缘轮廓的几何参数,从而计算出火车轮缘的磨损情况。这种检测方法检测速度快、准确率高且大大减轻了劳动强度,在实验中取得了满意的效果,并且在实际检测中也得到了广泛的应用。
文献[10]中研发设计了一种利用CCD成像测量技术、图像处理理论和计算机控制等相关技术,提出了一种非接触式的在线测量系统。采用二元多项式方法对由于硬件装置引起的误差的图像进行几何校正,用统计均值法对图像进行分割,从而求出车轮踏面的各项参数,通过在实验室对标准物进行测试实验而得到的测量数据结果进行分析而得出。此系统能够完成对火车轮对几何参数的测量,并且可得到相对准确的测量结果。
为了解决检测轮缘高度和宽度存在精度难以保证及稳定性不高的问题,文献[11]提出了一种基于三角法测量的在线监测系统,该系统由CCD高速摄像机和结构光发射器完成数据的采集,然后利用三角测量原理导出测量模型和计算模型,根据轮缘高度和宽度的定义完成对高度和宽度的测量,最终对轮缘磨损程度进行量化,实验表明该算法测量精度高,结果稳定可靠。
7 计算机视觉技术在站台环境监测中的应用
近年来铁路交通事业发展迅速,铁路客流量也不断增大,如中国每年的春运期间都有上亿人次通过火车返乡,各种危害乘客安全的事故也时有发生,因此世界各国特别是中国站台监控就显得越来越重要,目前的站台监控主要是依靠安装在各个角落的闭路电视或专业技术人员,这不仅需要专业技术知识还需要大量的人力物力。随着计算机、图像处理等技术的快速发展,对站台的自动监控也逐渐成为发展趋势。
近年来人们做了许多关于站台人群检测的研究,这些研究大都使用铁路站台中的闭路电视(CCTV)系统,在现代的CCTV系统中基本上使用的是数字化图像,在人群监测过程中大量使用了数字图像处理技术,如边缘检测、细化、像素计算等,通过图像的处理可以轻易的得到想要的结果。
文献[12]仍采用原有的CCTV监控系统拍摄的灰度图像作为处理对象,利用基于视觉的经过最小二乘法和全局搜索的混合算法训练的工业的额神经网络来估算站台的拥挤程度,该系统在实际的运行中获得了较高的精确度,虽然不能计算人数但却能实时的预测人群的密度。
文献[13]所设计的系统就较为复杂,它利用多台摄像头对站台进行检测。首先判断站台上列车的四种状态,如:没有列车、有列车、列车正在出站、列车正在入站等,然后对物体或行人检测及跟踪,最后对所检测的结果综合分析,做出合理的预警或警告。
8 计算机视觉技术在铁路检测上的发展趋势
随着计算机视觉技术的铁路检测中的应用越来越广泛和深入,并且随着计算机视觉技术等关键技术的不断发展,计算机视觉技术在铁路检测上应用发挥更大的作用,它就目前而言在铁路检测的应用上仍然存在技术难题需要研究:
关键词:视觉原理;计算机视觉艺术;数字媒体;应用
利用计算机所具有的视觉艺术,大众仅仅利用需要实施身体动作来直接性的操作以及控制,根本就不需要学习就能够启动以及进行一定的操作,这样更加方便老年人以及儿童的实际操作。在数字媒体当中,应该对计算机视觉艺术进行充分利用,更加方便人们的实际操作,同时还能够保证其更好的感受艺术方面所具有的魅力,让群众在足够放松的时刻能够对创作者的实际思想以及意图进行充分的了解以及掌握,对艺术价值进行充分发挥,进而来有效提升艺术人文的实际价值。
1对计算机视觉原理进行分析
通常来讲,计算机视觉还称为机械视觉,属于是机械来对人类视觉进行一定的模仿的光学识别系统,利用光学系统、感应器、光源等来实现物体定位、动作的追踪以及视线的判断等相关的功能。一般情况下,工程技术所运用的基本都是计算机视觉,当有着一定的环境以及模式时,计算机视觉在进行持续性的工作时,能够有效保证持续工作有着非常高的正确性以及准确性,还能够对人工不可以完成的任务进行很好的完成。当计算机视觉在进行实际的工作过程中,最为基本的条件是先对映像进行处理,之后输入模拟讯号,对数字影像进行一定的处理以及分析。实际的工作流程是:影像在摄入之后,应该对其进行一定的强化,除去噪声,之后对图像特征进行一定的压缩以及获取。在对数据库样本进行一定的对比之后,对程序进行有效的分析以及判断,做出有效的指令。
2对数字媒体当中计算机视觉艺术的实际应用进行分析
2.1艺术与计算机进行一定的融合时,应该对动画、声音以及图像等因素进行有效结合,在对艺术语言表现形式进行丰富的同时,应该提高作品的感染力
在有些结合视觉艺术以及数字媒体时,应该保证在对画面进行观看时,应该有效的欣赏画面,还可以有效的感受到声色等。利用高度仿真的听觉、触觉以及视觉,保证大众在进行玩游戏时,可以对虚拟世界进行真实的感受,还能够利用动作以及肢体语言等来和计算机实现有效的交流。保证大众不是对电影单独的进行欣赏,还应该更好的参与到其中,体会艺术的表演。
2.2在数字媒体当中运用计算机视觉艺术能够对艺术的实际表达形式进行有效的丰富
随着交互技术的逐渐成熟以及发展,让该技术得到了有效的拓展以及广泛的运用。运用交互技术,应该让人们不受到被动的欣赏,应该积极的参与到视觉艺术当中,保证大众的积极参与以及做出判断,同能够利用各种选择来呈现出过程以及解决,对观众的兴趣进行充分的调动,进而来有效提高大众的参与积极性。
2.3在电子游戏当中,运用计算机视觉艺术,应该在相对比较大型的电子游戏当中进行计算机视觉技术的运用
在实际的游戏过程当中,大部分的玩家基本上不再是仅仅运用键盘以及鼠标来实施游戏,大部分都是利用身体行动来移动。通常情况下,机器利用摄像机部来对玩家的具体身体动作进行一定的捕捉,玩家能够与机器相连接的手枪进行有效的操作,射中屏幕当中的对象。同时,手机上的相对比较小型的电子游戏,仅仅需要手指来滑动屏幕,就能够实现实物的运动以及跳跃等,进而来躲避障碍。除此之外,仅仅需要稍微的倾斜一些收集,就能够实现人物两侧的奔跑,同时还能够保证声光效果,实现互动,具有非常大的震撼力,会在很大程度上促进大众参与的积极性。
2.4分析数字媒体中计算机视觉技术的应用,保证数字媒体技术有效表现艺术
同时在实用艺术以及纯艺术当中,也会运用到数字媒体,该技术能够让相对比较单纯的个人视觉实现有效的创造,同时还能够把艺术箱社会性视觉产品进行转化,并得到一定的经济效益。同时,大众能够通过剪切以及拷贝等相关的方式来有效获取视觉技术,之后有效的转化艺术资源,有效奠定了创作视觉艺术的基础。现阶段,大众对于个性化以及独特性有着逐渐提高的需求,在对相对比较独特的视觉技术进行追求时,在一定程度上提高了评价视觉作品的标准。在数字媒体当中运用计算机视觉技术,会在很大程度上提高大众对美的享受,保证大众能够充分感受到舒适以及愉快的感觉,同时还能够得到审美方面的评价,在该过程当中,不能够参杂任何的因素,应该让计算机视觉因素仅仅对视觉美感以及视觉形式进行充分的追求,可以有效体现艺术的本质。同时,数字媒体有着美方面的品格,有效结合计算机视觉艺术,保证数字媒体艺术的美以及真。这个实际的运用过程能够有效提升审美方面的机制,更好的领悟视觉艺术当中所存在的美。
3结语
综上所述,在数字媒体当中,计算机视觉技术的运用,应该有效结合图像、动画、声音以及文本等多个因素,在对语言表现的具体形式进行一定的丰富时,应该让作品具有更大的感染力。除此之外,还应该保证视觉技术有何足够的光声效果,利用一定的互动,会具有非常大的震撼能力,积极促进大众的参与程度。还可以在很大程度上满足大众对于美方面的追求,进而对其所具有的艺术价值进行充分发挥,有效提升艺术所具有的人文价值。
参考文献
[1]刘晓,王会霞.计算机视觉艺术在数字媒体领域的应用研究[J].互联网天地,2015,07:21-24.
[2]丛婧.浅谈计算机视觉艺术在数字媒体的应用[J].电子制作,2013,18:75.
【论文摘要】随着Internet的普及,尤其是宽带网的盛行,计算机病毒也在向网络化方向发展,这种病毒就是所谓的蠕虫病毒。本文利用数据挖掘技术,研究了如何在新的蠕虫病毒大规模爆发之前就将其检测到,并采取相应的措施。
一、网络病毒的特征分析
网络病毒(蠕虫病毒)自身就是一个可执行的二进制代码程序文件。它的传播途径、方式与传统的病毒不同,它具有主动性传播的特点。它主动扫描网络上主机操作系统和一些网络服务的漏洞(大多是利用操作系统的缓冲区溢出漏洞),利用这些漏洞侵入这些主机,将自身的副本植入其中,从而完成传播过程。被感染后的主机又会用同样的手法感染网络上其它的主机,如此反复下去,这样很快就会传遍整个网络,尤其是一个新的操作系统漏洞还没引起计算机用户足够重视的时候。蠕虫病毒感染主机后往往大量占用主机资源(如CPU资源、内存资源等),使机器运行速度越来越慢,或向网络上发送巨量的垃圾IP数据包,严重阻塞网络带宽,甚至造成整个网络瘫痪。更恶毒的还会盗取用户的敏感资料,如帐号和密码等。而且现在的蠕虫病毒有从以破坏为主要目的向以盗取资料为主要目的转换的趋势,因此危害更大。
通过分析蠕虫病毒的传播过程可知,蠕虫病毒要感染网络上的其它主机,首先必须对网络上的主机进行扫描。它的这一举动就暴露了目标,就为检测蠕虫病毒提供了途径,也使蠕虫病毒预防系统的实现成为可能。通过抓包分析,发现蠕虫病毒的扫描过程并不像黑客入侵前的扫描那样详细,它只是随机地生成目标主机的IP地址(通常优先生成本网段或相邻网段的IP地址),然后用攻击模块(通常是用缓冲区溢出程序)直接攻击目标IP地址的主机,而不管该主机是否存在。这个攻击过程首先要向目标主机的特定端口发起TCP连接请求。例如,冲击波蠕虫病毒会在几秒内两次向目标主机的135端口发起连接请求,而震荡波会在几秒内两次向目标主机的445端口发起连接请求。因此,通过捕获数据包,利用数据挖掘技术分析它们的特征,找出异常的数据,从而达到预防的目的。
二、基于数据挖掘的病毒预防系统
基于数据挖掘的蠕虫病毒预防系统主要由数据源模块、预处理模块、数据挖掘模块、规则库模块、决策模块、预防模块等组成。
(一)工作原理
1.数据源是由一个抓包程序将所有来自于网络的、发向本机的数据包截获下来,交给预处理模块处理。
2.数据预处理模块将截获的数据包进行分析,处理成连接请求记录的格式。因为蠕虫病毒传染网络上的主机时,会主动地向主机发起连接,这也是预防系统建立的理论依据。连接记录由时间、源IP地址、源端口、目的IP地址、目的端口组成。这些众多的连接请求记录组成了事件的集合。
3.规则库用于存储已知的蠕虫病毒的连接特征和新近数据挖掘形成的规则集。规则集是蠕虫病毒行为模式的反映,用于指导训练数据的收集和作为特征选择的依据。
4.数据挖掘模块利用数据挖掘算法分析由连接请求记录组成的事件库,分析结果交给决策模块处理。
5.决策模块将数据挖掘的结果与规则库中的已知规则进行模式匹配,若与规则库中的规则匹配,则由预防模块发出发现已知蠕虫病毒的警报;若不匹配,则由预防模块发出发现新蠕虫病毒的警报,同时将新规则加入到规则库中。
(二)基于数据挖掘的病毒预防系统
1.分类:把一个数据集映射成定义好的几个类。这类算法的输出结果就是分类器,常用决策树或规则集的形式来表示。
2.关联分析:决定数据库记录中各数据项之间的关系。利用审计数据中系统属性间的相关性作为构建正常使用模式的基础。
3.序列分析:获取序列模式模型。这类算法可以发现审计事件中频繁发生的时间序列。这些频繁事件模式为构建预防系统模型时选择统计特征提供了指导准则。其算法描述为:已知事件数据库D,其中每次交易T与时间戳关联,交易按照区间〔t1,t2〕顺序从时间戳t1开始到t2结束。对于D中项目集X,如果某区间包含X,而其真子区间不包含X时,称此区间为X的最小出现区间。X的支持度定义为包括X的最小出现区间数目占D中记录数目比例。其规则表示为X,Y->Z,[confidence,support,window],式中X,Y,Z为D中项目集,规则支持度为support(X∪Y∪Z),置信度为support(X∪Y∪Z)/support(X∪Y),每个出现的宽度必须小于窗口值。
3.系统中的数据挖掘模块
首先利用分类算法对连接请求事件库中的数据进行分类,本系统中分别按源IP地址与目的端口对事件进行分类。然后对这两类数据进行关联分析与序列分析,在对相同源IP地址的数据分析中可以发现该台主机是否感染已知的蠕虫病毒或异常的举动(可能是未知的蠕虫病毒所为);对同目的端口的数据分析中可以发现当前网络上蠕虫病毒疫情的严重程度。
【参考文献】
[1]杨玉锋,夏晓峰.上网用户安全防范[J].韶关学院学报:自然科学版
关键词:双目视觉;匹配算法;计算机视觉;立体匹配;相位一致性
1.计算机视觉系统分析研究
1.1计算机视觉技术及双目立体视觉
计算机视觉是通过计算机技术实现对视觉信息处理的整个过程,是一门新的学科。视觉是人们认知事物的重要途径,视觉是人们对视觉信息获取、处理和存储的过程。随着计算机技术的发展,信号处理技术的应用,人们通过照相机来把实际的事物拍摄下来转变为数字信息,并通过计算机信号处理技术队获取的视觉信号进行处理。计算机视觉技术对图像的处理分为获取图像、特征抽象选取、事物识别及分类和对三维信息的理解。获取图像主要是通过摄像机和红外线等技术对周围视觉事物进行获取,并通过计算得到和真实事物相应的二维图像,二维图像主要是数字图像。计算机视觉系统的最基本的功能是数字图像的获取。可以看出计算机视觉研究最基本内容是三维场景距离信息的获取。在计算机被动测量距离方法中,有一种重要的距离感知技术叫作双目立体视觉。双目立体视觉技术是其他计算机视觉技术无法取代的一种技术,对双目立体视觉技术的研究在计算机视觉技术和工程应用方面都是非常重要的。
1.2计算机视觉理论框架
第一个视觉系统理论框架的提出是以信息处理为基础,综合了图像处理和神经生理学等研究内容而建立的。这个视觉系统理论框架是计算机视觉系统的基本框架,与计算机视觉技术有着密切的关系。视觉系统的研究是以信息处理为基础的,从理论层次、算法层次和硬件层次3个层次进行研究。计算机理论层次主要是表达系统各个部分计算的目的和方法,对视觉系统的输入和输出进行规定,输入作为二维图像,输出是以二维图像为基础建立起来的三维物体,视觉系统的目的就是对三维物体进行分析和识别,通过计算对二维物置和形状进行重新建立。算法层次对计算机规定的目标进行计算,算法和计算机表达有关,不同的表达可以通过不同的算法进行实现,在计算机理论的层次上,算法和表达比计算机理论的层次要低。硬件层次是通过硬件来实现算法的一种表达方法。计算机理论层次在计算机信息处理中时最高的层次,取决于计算机的本质是解决计算机的自身问题,不是取决于计算问题的计算机硬件。要更好地对计算机系统和框架进行理解最好的方法就是要区分3个不同的层次,计算机理论的含义和主要解决的问题是计算机的目的,表达算法含义和主要解决的问题是实现计算理论的方法和输入输出的表达,硬件的实现的含义和主要解决的问题是如何在物理上对表达和算法进行实现。计算机视觉处理的可以分为3个阶段,对视觉信息的处理过程从最初的二维图像的原始数据,到三维环境的表达。第一阶段基元图的构成,基元图是用来表示二维图像中的重要信息,主要是图像中亮度变化位置及其几何分布和组织结构,图像中每点的亮度值包括零交叉、斑点、端点和不连续点、边缘等。第二阶段2.5维图描述,在以观测者为中心的坐标中,表示可见表面的方向、深度值和不连续的轮廓,基元是局部表面朝向离观测者的距离深度上的不连续点表面朝向的不连续点。第三阶段三维模型表示,在以物体为中心的坐标系中,有由体积单元和面积单元构成的模块化多层次表示,描述形状及其空间组织形式,分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积单元或面积形状基元都附着在轴线上。视觉理论框架图如图1所示。
2.基于计算机的视觉立体匹配算法研究
视觉立体匹配算法是基于人类视觉系统的一种计算机算法。立体匹配算法作为计算机立体视觉问题研究的重点,快速地实现图像对应点的匹配来获得视差图是当今研究的热点问题。立体视觉匹配算法根据基元匹配的不同可以分为相位匹配、区域匹配和特征匹配3种,其中区域匹配算法可以减少计算负担,区域匹配算法实时性高,应用前景广阔。计算机立体视觉通过对人的双眼进行模仿,在双眼的立体感知中获得信息,从摄像机拍摄的图像中获取物体的三维深度信息,这就是深度图的获取,把深度图经过处理得到三维空间信息数据,二维图像到三维空间实现转换。深度的获取在双目立体成像视觉系统中分为两步,首先在双目立体图像与图像之间建立点对点的对象关系,双目立体视觉算法研究的重点问题是解决对应点之间的匹配问题。其次以对应点之间的视差为依据对深度值进行计算。双目成像是获取同一场景中两幅不同的图像,两个单目成像模型构成一个双目成像模型。双目成像示意图如图2所示。系统的基线B是两个镜头中心的连接线,空间点w(z,y,z)作为世界坐标的值由(x1,y1)与(x2,y2)进行确定,如果摄像机的坐标位置和空间点w世界坐标的位置重合,图像平面和世界坐标轴xY的平面就是平行的。如果两个摄像机在坐标系统中的原点不同但是它们的光轴平行,那么双目成像计算人们可以看图3所示,图3表示的是两个摄像头连线在平台xY的示意。
立体视觉的成像过程是成像的逆过程,具有一定的不确定性。大量的数据信息在从三维影像向二维图像进行投影的过程会出现丢失的现象,所以视觉系统要通过自然的约束条件才能保证获取正确的解。这些约束条件在减少匹配的计算量方面可以提供有利的帮助。针对基于区域匹配快速算法,还可以应用基于视差梯度的匹配算法,这种匹配算法应用较大的搜索范围在边缘的特征点上进行搜索,采用视差梯度在非边缘区减少搜索范围。应用计算机视觉立体匹配算法可以减少成像匹配时间,大大提高了工作效率。计算机立体匹配算法征点的提取是算法的关键问题,今后的研究方向重点是对有效特征点提取方法的研究。
(1)课程内容方面:工程应用价值较小的内容居多;具备工程应用价值的方法,如基于结构光的3D信息获取,在课程内容中却极少出现。
(2)课程定位方面:现有课程体系中未能体现最新研究成果,而掌握世界最新工程应用成果是卓越工程师的基本要求之一。
(3)教学形式方面:传统计算机视觉课程侧重基本原理,尽管范例教学被引入到课堂教学中,在一定程度上帮助学生理解,但卓越工程师培养目标是培养学生解决实际工程问题的能力。针对卓越工程师培养目标,以及目前计算机视觉课程中存在的问题,本文提出工程应用导向型的课程内容、面向最新成果的课程定位、理论实例化与工程实践化的教学形式,以培养具有扎实理论基础及工程实践能力的卓越工程师。
1工程应用导向型的课程内容传统计算机视觉课程围绕Marr理论框架展开教学,其中部分原理仅在理想状态或若干假设下成立,不能直接运用到工程实践中。近年来已具备工程应用基础的原理及方法,在传统课程内容中较少出现,如已在工业测量、视频监控、游戏娱乐等领域中应用的主动式三维数据获取方法等。我们对工程应用价值高的课程内容,增加课时,充分讲解其原理及算法,并进行工程实例分析;对工程应用价值较低内容,压缩课时,以介绍方法原理为主。例如,在教授3D信息获取部分时,课时主要投入到工程应用价值较大的内容,如立体视觉、运动恢复结构、基于结构光的3D信息获取等;而对于基于阴影的景物恢复等缺乏应用基础的内容主要介绍其基本原理,并引导学生进行其工程应用的可行性分析,培养学生缜密的思维习惯,训练学生辩证的分析能力。
2面向最新成果的课程定位计算机视觉近十年来发展迅速,新方法和新理论层出不穷,在现有课程体系中未能得以体现。跟进世界最新成果是卓越工程师的基本要求之一,因此计算机视觉课程定位应当面向国际最新成果。为实现这一目标,我们主要从以下两方面入手。
(1)选用涵盖最新成果的教材。我们在教学中加入国际最新科研成果及应用范例,在教材选取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作为参考教材。该书是RichardSzeliski教授在多年MIT执教经验及微软多年计算机视觉领域工作经验基础上所著,涵盖计算机视觉领域的主要科研成果及应用范例,参考文献最新引用至2010年。这是目前最新的计算机视觉著作之一,条理清晰,深入浅出,特点在于对计算机视觉的基本原理介绍非常详尽,算法应用紧跟国际前沿。
(2)强化学生调研及自学能力。“授之以鱼”,不如“授之以渔”。在教授学生的同时,更重要的是培养学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。为强化学生的知识结构,培养学生跟踪国际前沿的能力,我们在教学中加入10%的课外学时,指导每位学生完成最近三年本领域的国际最新文献调研及工程应用新技术调研,并撰写相关调研论文。同时,设置2学时课内学时,让每位学生介绍调研成果,并进行课堂讨论。在调研基础上,选择相关算法进行了实验证明,进一步强化学习成果。实践证明,由于学生能够根据自己的兴趣,选择本领域感兴趣的课题进行深入调研,极大地调动了学生的积极性,强化了学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。
3工程实践化的教学形式我们在教学中提出工程实践化的教学形式,即以人类视觉功能为背景,由相应工程实例引出相关理论,并最终将理论运用到工程实例中的算法和方法传授给学生。