前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉研究领域范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词:图像处理 计算机视觉 立体视觉
在实际工程实践中,由于受现场条件和测试技术本身的限制,结构动位移的测试往往存在一定的困难和挑战,这也使动位移并未成为结构动力性能评估中一个常见的评估指标。结构动位移响应是直接反映结构在动力荷载作用下安全性和整体性的重要参考指标。随着工程结构或构件建造得越来越柔和复杂结构模型试验研究的发展,如大跨度桥梁、高层建筑、索结构等的现场测试以及结构振动台试验、风洞试验等,结构动位移的测试显得尤为重要。
计算机视觉是研究计算机模拟生物外显或宏观视觉功能的科学与技术,是一个发展十分迅速的研究领域,其研究手段涉及甚广,如图像处理、机器视觉、医学图像分析、模式识别、计算机图形学、人工智能等。当计算机通过视觉传感器(比如相机或摄像机等)试图分析三维空间的物体时通常只能给出二维图像,通过计算机分析和处理图像信息,可以重构实物的三维几何信息,包括其形状、位置、姿态、运动等。因此,通过计算机视觉技术实现结构动位移的测量是可行的。上世纪八十年代中期以来,随着计算机软、硬件技术的不断发展,在土木工程领域,国内外很多学者尝试将计算机视觉技术用于结构的几何测试,包括结构的位移(静、动位移)、裂缝、表观外形等。Aw和Koo采用数码照相机来进行预设目标的坐标测量,经过基于计算机视觉理论的光束法优化后,其测试精度为2.24mm。Nieder?st和Maas利用数码摄像机来测试混凝土梁在脱水收缩过程中的变形情况,其在相机视场为80cm时测试精度可达0.03mm。相类似地将计算机视觉技术用于结构特性的测量例子还有很多,比如混凝土管片变形检测,梁破坏试验中的变形测量,远距离桥梁变形测量,轨道梁破损状况的检测等。相比于结构静态几何特性的测试,结构动态特性的测试应用相对不多。Olaszek利用摄像机来摄录桥梁的振动情况,并以计算机视觉技术进行结构动位移重构分析,得出的动位移测试精度为1mm左右。Yoshida等采用立体视觉技术来测试一块薄板的三维振动特性。
一、单相机标定
二、基于立体视觉的两相机立体标定
三、图像点跟踪
图像点跟踪是基于立体视觉的结构位移测试手段中的重要环节。在图像(或视频)分析过程中,点跟踪的精度会直接影响位移测试的最终结果。在实际测试中,本文采用两个黑方格组成的目标模板粘贴在所测结构的表面,方格尺寸均为30×30mm,两方格的交叉角点作为图像分析的跟踪点。
四、三维点重构
关键词:数字图像处理;测距;聚焦;频域
中图分类号:TP391.41 文献标识码:A 文章编号:2095-1302(2012)09-0016-03
Images ranging method based on frequency domain analysis
ZHU Xue-yi
(School of Microelectronics and Solid-State Electronics, University of Electronic Science and Technology, Chengdu 610054, China)
Abstract: Using digital image processing theories and methods, the digital image pre-processing mode, the target graphic detection and the ranging model construction are studied and analyzed. Combined with a ranging scheme of single camera, a focusing ranging technique based on frequency domain analysis is given to process images captured by the monocular camera and calculate the distance from target detection image to the camera based on frequency domain image signals. The technique saves lots of complex hardware and reduces the demands of digital image processing, which has the advantages of high ranging precision and fast processing speed.
Keywords: digital image processing; ranging; focusing; frequency domain
0 引 言
视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80%的信息是由视觉获取的。计算机视觉就是人类利用计算机实现人的视觉功能,从而对客观世界三维场景进行感知、识别和理解。计算机视觉是一个相当新而且发展迅速的研究领域。
在对生物视觉系统的研究中,人们早就注意到,几乎所有具有视觉功能的生物都有两只眼睛。用两只眼睛同时观察物体,会有深度或远近的感觉,我们称之为视差。因此,在计算机视觉系统中,也常用两台或多台摄像机从两个或多个视点去观察同一场景,从而获得在不同视角下的一组图像,然后通过同一场景点在不同图像中的视差,推断出场景中目标物体的空间几何形状和位置,这种方法称为立体视觉。它是计算机视觉的一个重要分支,也是计算机视觉的核心研究内容之一。
视频和图像是对物质世界客观事物的形象而生动的描述,是最直接且具体的信息表达形式之一,是人类最重要的信息载体。随着科技的日益发展,人们需要一种更加先进快捷的工作方式,另外,人们对工作环境和工作条件也提出了更新、更高的要求,视频测距系统便在这种背景下应运而生。
视觉测距技术的发展对于距离测量有重要的意义。在基于数字图像处理技术的视觉测距系统中,使用单个CCD(Charge Couple Device)摄像机的系统称为单目摄像系统,而同时使用两台摄像机对同一景物进行摄像,并运用计算机分析两幅图像来确定物体的三维状况的系统称为双目摄像系统。双目摄像系统测量精度高,但计算速度较慢,成本较高。而单目摄像系统方法则比较简洁、快速,因此,本文对采用单目摄像系统检测目标物的测距方法进行研究。
1 测距技术在国内外的研究现状
目前,国内外对视觉测距技术的研究仍在不断的进行之中,还并没有形成国际统一的标准模式,各种数字图像处理技术和算法之间孰优孰劣仍在不断的探讨和比较中。当前,国内外的研究机构主要研究的测距技术包括超声波测距技术、微波雷达测距技术、激光雷达测距技术和视觉测距技术。
1.1 激光雷达测距
激光雷达测距具有测量时间短、量程长、精度高等特点,但激光雷达在恶劣天气环境下或逆光状态下的测距准确性降低,另外,其造价、耗能、对人眼安全等因素也对其进一步应用有一定影响。
1.2 超声波测距
超声波是指振动频率在20 kHz以上的机械波,具有声波传输的基本物理特性。超声波测距是根据超声波反射时间来计算与前方车辆之间的距离。超声波测距原理比较简单,成本低,但超声波的传输速度受天气影响较大,不同天气条件下的传输速度不同。
李飞飞在新泽西读高中期间,家中难以支付她的教育费用,她只能勤工俭学,自己想办法挣钱读书。在初到美国的前两年里,李飞飞利用课余时间,做过街头清洁工、餐馆收银员,还做过照看宠物狗的服务员。
不仅生活艰苦,她的英语成绩也不好,美国的学生比较势利,同学不想和她来往。初到美国的几年里,她基本上没有朋友。幸运的是,她读高中时遇到几位特别善良的老师,在老师们的关怀和鼓励下,她逐渐祛除了自卑心理,增添了奋斗的勇气。
临近高中毕业时,李飞飞申请了很多大学,也收到不少录取通知书。只有普林斯顿大学给予李飞飞近乎全额的奖学金,这也让李飞飞的生活开始发生改变。
父母依然在困境中挣扎。李飞飞在进入普林斯顿大学读书时,就决定在课余时间自己去打工挣钱,为父母在帕西帕尼开设一个干洗店,让他们每个月有稳定收入,摆脱窘境。开店的钱最终还是不够,她只得向高中数学老师借钱。
在老师热情支持下,干洗店终于开业。李飞飞从此在学校和店铺之间奔波,周一到周五在学校攻读物理学,辅修工程物理专业,周末就回到帕西帕尼,在干洗店里帮忙。尽管干活用去很多时间,不过李飞飞的成绩还是相当优秀。大学毕业时,她以最高荣誉取得普林斯顿大学物理学学士学位。
李飞飞大学毕业时,金融证券市场无比火爆,对来自华尔街的征召,她居然不接受邀请,认为自己应该去,研究藏医。在父母耐心劝说下,她才改变想法,打算继续深造。
随后,李飞飞进入加州理工大学攻读电子工程的硕士、博士学位,开始研究人工智能和计算神经科学。在李飞飞读研期间,她的母亲患癌症,还有中风症状,家庭生活再次陷入困境。这种境遇会压垮很多人,李飞飞竟然没有垂头丧气,她积极寻找办法度过难关、完成学业,取得了博士学位。
李飞飞博士一毕业,高盛就投来橄榄枝,愿意给予她高薪工作;麦肯锡等公司也希望她前去工作。这是很大的诱惑,能极大改变家庭的生活状况。可是,她并拒绝了,“我几次拒绝高薪工作,父亲都没有轻易反对。非常感激他们对我追寻梦想的支持。”
“我的研究兴趣,集中在视觉研究领域,主要是计算机视觉和视觉心理学。我将利用大数据训练计算机学习视觉认知、记忆、推理和与环境互动。”用两年时间,李飞飞通过网络众包技术,建立起含有1500万张照片、涵盖22000种物品的全球最大图像识别数据库ImageNet。李飞飞希望研究界能从中受益。
无论数量还是质量,ImageNet都是规模空前的数据库。所陈列的物品,是根据日常英语单词进行分类组织的。光是猫,就有62000多只,长相各异,姿势多样,涵盖了各种家猫和野猫。李飞飞将数据库免费提供给全球的研究团体,很快被研究者广泛运用。
博士毕业四年后,李飞飞来到斯坦福大学计算机科学系任教。在上课的时候,她娓娓而谈,学生们都全神贯注地聆听。仅用三年时间,李飞飞就晋升为终身教授,并成为斯坦福大学人工智能实验室及斯坦福大W视觉实验室的主任。
从1955年起,美国斯隆基金会每年颁发斯隆研究奖,专门奖励科学领域最杰出的年轻教授。获奖者来自美国和加拿大54所高等院校,涵盖七大科学领域。2011年3月1日,斯隆基金会授予李飞飞“计算机科学奖”,表彰她在这一领域的重要贡献。
2015年9月4日,斯坦福大学宣布,丰田汽车公司投资2500万美元,在校园内设立人工智能研究中心,利用人工智能教计算机与现实世界互动,发展出突破性的技术,普遍运用于日常生活之中。首先展开的研究项目,是教机械人安全地自动驾驶无人车。
李飞飞担任斯坦福大学人工智能研究中心主管,由她领军研发无人车技术。李飞飞觉得无人车自动驾驶,是计算机学习人脑的极佳研究,基本目标是让计算机学习人脑做决定的方法。研究中心迅速制作出多个计算机系统,推进自动驾驶的技术。
2016年11月,李飞飞加盟谷歌云担任首席人工智能和机器学习科学家。同时,她仍担任斯坦福大学副教授,负责斯坦福人工智能实验室和斯坦福视觉实验室。
关键词:微创业;移动web;云计算;物联网;机器视觉
中图分类号:G646 文献标志码:A 文章编号:1674-9324(2014)33-0281-02
一、引言
十八届三中全会中指出,要深化教育领域综合改革、营造创业环境、健全促进就业创业体制机制,高校毕业生是创业的生力军,要加大力度培养大学生的创业素质和能力。IT微企未来的创新点在云计算、大数据、移动互联网三大领域,通过利用微平台或者网络平台进行新项目开发的创业活动的微创业被认为是改变当前大学生就业难状况的一个有益的探索和尝试。微创业参与者一般都是初次创业者,经验不足,需要更多的指导与帮助。大学生微创业素质发现与培养系统,是从提高服务、降低成本,集合优势资源,从大学创业的实际需求出发,将互联网技术、移动web技术、机器视觉技术、云数据存储技术等多种技术有机融合成的综合性微创业素质培养指导体系,对大学生的创业与创新能力提高有推动性的作用,对于高校大学生微创业教育的开展具有重要意义。
二、国内外研究现状
国内最早的微创业的概念是2011年两会期间陈天桥、历以宁的提案,紧随其后的是2011年发起的一项“中国互联网微创业计划”,提出了所有项目与互联网、移动互联网等先进技术和营销手段相结合以实现成效最大化的“微创业”原则。很多企业和高校、政府部门都开始关注对初次创业者的支持,并陆续推出了不同形式的微创业计划。2011年2月份中国电信北京分公司面向高校推出“天翼微创业计划”,2011年3月份著名杂志“创业邦”在其官方网站启动了2011中国“微创业计划”大赛等等。微创业的概念已经慢慢形成,不过相关研究还很少,具体应用模式还有待更新。2008年北京华普亿方软件科技有限公司开发创业实训计算机模拟仿真平台研究,学生可利用仿真平台进行创业实训;2008年上海推出国内首个创业能力测评系统,对大学生创业素质进行测评;第十二届挑战杯项目“基于创业素质培养的创业课程开发研究”从课程开发角度进行研究。更多的创业素质培养集中在概念性和理论性的层面,基于移动web的大学生微创业素质发现与培养尚无应用。
三、系统总统架构
建立一个基于移动web的大学生微创业发现与培养系统,归集大量创业素材(文字与视频等),通过大数据环境下的云计算处理实现对互联网上创业信息、用户信息的数据的搜索、分类、整理并将信息存储到云数据库中。针对创业测评系统中仅仅靠问答这一单一的方式并不能完全反映学生的综合创业素质这一问题,采用创业素质测评系统中创业能力测试问题和计算机视觉软件系统相结合的方式,在测试过程中加入面部表情判断,综合测试学生的性格特征、职业倾向、创业能力等。通过微创业系统为相关学生提供3D创业课堂、创业指导、创业实施、创业俱乐部等(这些服务以两种形式完成,其一建立以互联网技术为核心的Android移动客户端,为用户提供创业素质测评系统、创业指导、创业论坛等信息服务,其二是建立通用的Web客户端,为用户提供3D创业课堂、创业实施等相关服务),具有良好的使用价值。
系统所有的数据存储在云端,云数据包括系统创业素质测评数据、个人信息数据、创业案例数据、课件素材、视频等资料,系统架构图如图1所示:
四、系统功能结构图
系统包括素质发现和素质培养,其中素质发现主要由创业案例库、计算机视觉系统、创业素质测评系统和个性化的电子创业档案组成。素质培养包括创业学堂、创业论坛、创业动态等模块,并延伸到理论课的教学管理和信息管理功能,系统功能图如图2所示:
创业学堂中包括编写创业计划书、3D模拟创业课堂、创业实施(公司成立、创业实践、创业俱乐部)等。3D模拟创业课堂中运用计算机虚拟仿真技术、仿真市场博弈技术、3D建模技术等仿真模拟市场、市场调查和市场行业的竞争,逼真再现企业场景,并利用成熟的经济学模型来计算模拟市场的变化,如市场需求反应模型、价格模型、广告促销市场反应模型、离散时间博弈模型等。学生通过系统模拟还原企业的创立过程,完成创业计划书、办理工商税务登记注册、建立企业进行运营管理等。创业俱乐部主要通过Flas、视频、图片、文本的形式呈现各类创业理论知识、经典创业讲座以及成功企业家的成长经历。创业动态主要通过文本和图片形式呈现相关创业热点新闻、最新创业政策、学生创业活动、开展的创业大赛以及介绍相关的大学生创业基地等信息。
五、系统关键技术
1.云数据处理。对海量的数据存储、读取后进行大量的分析、提高数据的更新速率以及进一步提高随机读速率等问题,是数据管理技术必须解决的问题。
2.计算机视觉的面部表情分析推理。智能人脸表情识别系统嵌入在创业测评系统中,浏览网站的人自动开启云相机,在素质测评过程中记录表情及其肢体语言。人脸表情识别系统中第一步对人脸进行检测定位,第二步通过摄像机获取人脸图像并进行表情特征提取,在提取特种数据的过程中,进行特征降维、分解等处理,第三步将捕捉到的表情进行分类,输出结果。
六、结语
本研究从提高服务、降低成本,集合优势资源从大学生创业实际需求出发,有效利用大数据处理的云计算技术、机器视觉技术、虚拟现实技术、网络技术以及移动互联网技术,构建基于移动web的大学生创业素质发现与培养系统,以期为高校推动大学生创业提供参考,对学生创业和学校教学改革起到推动作用。大学生微创业素质发现与培养系统目前尚处于探索阶段,本研究融合多种最新技术于一体,是在创业领域的创新性实践。机器视觉技术应用于大学生创业素质尚无前例。计算机虚拟仿真技术运用企业博弈、3D建模技术逼真再现企业场景尚未在移动互联网中应用。
参考文献:
[1]Gerald E.Hills.An empirical study of an evolving field[J].Journal of Business Venturing,2009,(2):30-31.
[2]Einar A.Rasmussen.Roger S?rheim.Action-based entrepreneur-
ship education[J].2013,(3):56-57.
[3]程君青,章春军.基于网络的大学生创业服务平台构建[J].教育教学论坛,2012,(4):78-79.
[4]褚本立.中国移动互联网创业企业的机遇与挑战[J].商品与质量,2011,(3):67-68.
[5]陈艳,雷育胜.大学生创业素质调查与思考[J].高教探索,2012,(4):123-124.
[6]祝敏丹,左利华.大学生创业能力培养与测评系统构建[J].黑河学刊,2011,(1):43-45.
[7]张淑梅,宋维堂.高职软件技术专业创业型人才培养课程体系的构建[J].职教论坛,2011,(27).
1.科学计算可视化技术研究背景
科学计算可视化作为一个研究领域开始于1987年,它首先是为了高效地处理科学数据和解释科学数据而提出并形成的。它将大量枯燥的数据以图形图像这种直观的方式显示出来,使观察者可以准确地发现隐藏在大量数据背后的规律,从而帮助人们更好地理解和分析这些数据。
VISC的研究包括两方面:一是VISC工具的研究.即如何把科学数据、数值图像转化成可视图形与可理解信息的算法和工具;二是VISC应用研究,即把可视化工具应用于科学和工程的各个学科的方式和方法。它涉及计算机图形学、图像处理、计算机视觉、计算机辅助设计及图形用户界面等多个研究领域。科学计算可视化技术的意义重大,它大大加快了数据的处理速度,使每日每时都在产生的庞大数据得到有效的利用;实现人与人、人与机器之间的图像通讯,增强了人们观察事物规律的能力;使科学家在得到计算结果的同时,知道在计算过程中发生了什么现象,并可以改变参数,观察其影响,对计算过程实现引导和控制。
2.科学计算可视化技术在现代教育方法中的应用
信息时代,学习是一种社会活动,个人不能脱离社会环境孤立地学习,抽象、多维信息的处理能力显得日益重要,如果把科学计算可视化与教育有机地结合,教育与社会需求之间的差距将得以缩小,因为科学计算可视化本身是对客观对象的模拟,所构建的学习环境与实际生活情境相关。科学计算可视化的沉浸性和交互性为学习者提供了可以直接交互的三维立体空间,并将学习者置于主动学习的中心地位,有利于学习者知识的建构。
2.1虚拟现实技术制造“真实”感受
虚拟现实可以彻底打破时间的限制,对学生学习过程中所提出的各种假设模型进行虚拟,通过虚拟系统便可直观地观察到这一假设所产生的结果或效果。例如,利用虚拟实验系统,学生可以进行温室效应、电路设计、建筑设计等方面的探索学习,从而研究出二氧化碳对全球气候的影响规律,或设计出新的电路、新的建筑物。虚拟现实的沉浸性和交互性,使得设备与环境塑造更接近于真实,有利于学生的技能训练,如军事作战技能、外科手术技能、汽车驾驶技能、果树栽培技能、电器维修技能等。
美国巴尔的摩Johns Hopkins大学的化学工程系教授卡尔威在计算机网络上建立了一个虚拟实验室,模拟各种实验,让工程系的学生通过计算机网络来做实验,尝试解决工程上遇到的各种问题。例如,通过一个虚拟的钻油实验,学生可以知道某个位置的油井的深度,从而估计油层的形状及所需费用。
2.2计算机动画展现“实物”效果
计算机动画在教育方面有着广阔的应用前景。有些基本概念、原理和方法需要给学生以感性上的认识,在实际教学中有可能无法用实物来演示。这时借助计算机动画把各种表面现象和实际内容进行直观演示和形象教学,大到宇宙形成,小到基因结构,无论是化学反应还是物理定律,使用计算机动画都可以淋漓尽致地表示出来。
另外计算机动画在网络游戏、文化娱乐等方面也有着广阔的应用前景。基于PC的三维游戏正在不断增加,其制作也离不开三维动画技术。开展三维数据场可视化技术研究,探索提高体绘制质量、速度的理论和关键技术,对于完善可视化理论、拓展体绘制的应用领域等都具有重要的理论和实践意义。
3.科学计算可视化技术对于现代教育方法的价值及意义
从教育的发展过程看,任何一种新技术、新媒体的出现,都会引起教育上的革命。例如,纸和印刷术的出现,广播和电视技术的发展,计算机和网络技术的发展,都曾引起了教育在质的飞跃。毫无疑问,科学计算可视化与教育相结合,也一定会在教育领域中产生质和量的飞跃。因此,探讨科学计算可视化与教育相结合的理论依据,无论是对教育的发展,还是对科学计算可视化技术自身的发展都是必要的,也是现实可行的。利用计算机动画技术,可将科学计算过程以及计算结果转换为几何图形或图像信息并在屏幕上显示出来,以便于观察分析和交互处理。计算机动画已成为发现和理解科学计算过程中各种现象的有力工具,即“科学计算可视化”。
实现科学计算的可视化具有多方面的重要意义。它可以大大加快数据的处理速度,使庞大数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到在传统的科学计算中发生的现象,成为发现和理解科学计算过程中各种现象的有力工具;同时,还可以实现对计算过程的引导和控制,通过交互手段改变计算所依据的条件,并观察其影响。总之,科学计算的可视化将极大地提高科学计算的速度和质量,实现科学计算工具和环境的进一步现代化,从而使科学研究工作的面貌发生根本性的变化。