首页 > 文章中心 > 图像理解理论与方法

图像理解理论与方法

图像理解理论与方法

图像理解理论与方法范文第1篇

关键词:理论教学;数字图像处理;团队建设

作者简介:史彩娟(1977-),女,河北唐山人,河北联合大学信息工程学院,讲师;谷学静(1972-),女,河北唐山人,河北联合大学电气工程学院,副教授。(河北?唐山?063009)

基金项目:本文系河北联合大学教育教学改革基金项目的研究成果。

中图分类号:G642.0?????文献标识码:A?????文章编号:1007-0079(2012)22-0070-01

“数字图像处理”是高等学校信息类专业的重要专业课程。该课程主要介绍数字图像处理的主要内容与方法,论述数字图像处理中的基本概念、理论和算法,教学内容主要包括数字图像基础、正交变换、图像压缩编码、图像增强、图像复原、图像重建、图像分割等理论和方法。

随着电子技术及计算机技术的飞速发展,图像处理的理论和技术不断地丰富和完善,新的理论和技术层出不穷,并逐步应用于实践。图像处理技术已经渗透到计算机、通信、交通运输、医学、物理化学、生物学、军事、经济各个领域,与人们的生活也紧密相关。

一、“数字图像处理”课程的特点

“数字图像处理”课程内容宽泛,难度大,每个章节都可以作为一个研究方向;与其他课程联系紧密,如电子技术、电视技术、通信技术、计算机技术、数学物理等;与实际联系紧密,如数字电视,视频会议等。

因此“数字图像处理”课程起点高、难度大,理论性和实践性都很强。在传统理论教学过程中经常会出现如下情况:一方面学生面对繁杂的数学推导感到困难,或是不能很好地将其他课程所学知识融入到该课程的学习之中;另一方面与图像处理技术的最新发展经常脱节,不能很好地掌握图像处理技术的最新前沿知识和最新动态。为此从教学内容、教学方法、考核方法以及师资等方面对“数字图像处理”课程的理论教学进行了改革和尝试,经过3年的教学实践取得了显著的效果。

二、不断整合完善教学内容

教材的选取是完善教学内容的首要任务。尽量选取权威的、新近出版的教材作为该课程的主讲教材,同时又不拘泥于一本教材,根据课程的系统性和实用性,向学生推荐一些新颖的相关书籍、专题性的文档以及国外原版教材作为辅教材,从而增强学生对相关知识的理解。另外还可以根据讲解内容的需要,充分利用网络资源,查找相应内容以补充教材中的不足。

教学内容以基本理论、基本算法和基本技术为主线,以图像处理的前沿知识、最新发展为补充,同时注意与其他课程的相辅相成。基本内容主要包括图像处理的基础知识、图像处理中多种正交变换、图像压缩编码、图像增强、图像复原、图像重建和图像分割等基础知识。将这些内容的基本理论、基本概念、基本方法传授给学生。由于数字图像处理技术发展非常迅速,所以在授课内容上还要紧跟学科发展的脚步,及时地将新技术介绍给学生。如教材中的正交变换主要是介绍傅里叶变换、离散余弦变换、沃尔什变换和哈达玛变换,但作为正交变换中比较新颖的小波变换也会介绍给学生。这样学生既可以掌握最经典的图像处理技术,同时也能很好地把握学科的前沿新知识。另外教学内容上也非常注意与其他课程的相辅相成,尽量避免内容的重复讲解。如教材中的图像压缩编码中的熵编码详细地介绍了哈夫曼编码和香农编码内容,而在学生的前期课程信息论中对这些内容已经做了详细的讲解,所以当讲解熵编码时就简单复习一下,而将讲解的重点放在预测编码和变换编码上。这样既让学生了解了课程之间的关联,又避免了教学内容无必要的重复。

三、采用多种教学方法和手段

由于“数字图像处理”课程具有内容宽泛、难度大、与其他学科联系紧密、理论性和实践性都很强的特点,所有在讲授的过程中注意采用多种教学方法和手段,从而达到最佳的教学效果。

1.传统与现代教学手段相结合

板书作为传统的授课方式,有其独特的不可替代性。采用板书进行公式推导,可以增强学生对演算推论过程的理解和记忆。根据“图像处理技术”课程的特点,图像处理讲授的理论知识是要应用在图像上,需要通过观察图像的变化来理解图像处理的基本技术。而多媒体教学手段具有丰富的表现力,使所学对象具有生动性、形象性、直观性特点,使抽象的概念具体化。两者相互结合从而达到很好的教学效果。此外,教学中引入形象生动的图像处理实例演示。将MATLAB,VisualC++等软件适时地应用到“数字图像处理”课程的教学中,通过这些直观形象的实例演示,将图像处理前后的效果进行对比,从而使学生对图像处理技术有了感性的认识,加深了理解。传统与现代教学手段结合,相辅相成,大大促进了教学质量的提高。

2.多种教学方法协同互补

图像理解理论与方法范文第2篇

关键词:艺术;视觉文化;图像;图;影像碎片;艺术学理论

中图分类号:j0 文献标识码:a

2012年6月在南京举办了“图像与表演国际学术研讨会”。与会者就图像与表演之间的关系各自做了主题发言和探讨。这是一个基于艺术学理论的实践研究主题的学术会议,目的在于探讨不同艺术门类之间的关系,以及探讨不同门类艺术的共同规律,并以此寻求艺术的本质与艺术原理。当代各种媒体视屏的传播功能,使人们感到图与图像在传播中的“读图时代”是不可抗拒的。但是如何理解“读图时代”中“图”的概念和含义,是图还是图像,如何区别,一些学者试图把戏剧戏曲和影视中截取的“图”作为“图像”,并以此探讨“图像与表演”的课题。但问题也就随着学者们的探讨出现了。图与图像,我们究竟作何理解。它们仅是概念不同而内涵一样吗?显然,由于一些学者把图与图像混用,或看成没有区别的视觉文化,因而探讨结果依然是表演艺术范畴之内的问,题,并没有涉及到图像——造型艺术的问题。表演艺术与造型艺术之间的关系和规律没有得到有效的解决。因此,“图像与表演”或者说造型艺术(美术学),与表演艺术(戏剧戏曲影视学)的关系,需要依赖艺、术学理论的原理来思考图与图像的概念与内涵等问题,并以此解决好这两种艺术门类之间的学理关系。

一、图与图像

“读图时代”似乎成为我们这个时代的一个显著特征。实际上,“图”与“图像”是两个完全不同的概念,其内涵也不同。所谓读图时代的“图”并非都是图像,故此人们才感受到读图时代越来越简单与平面化。读图时代的“图”多是一种后文化时代的产物,其特征是简单、浮躁、肤浅、无深度、游戏性,最大限度的碎片化。“碎片化”是“图”的总体特征,我们也可以将“图”称为“图片”,但不可称为“图像”。图像,具有独立性、完整性、自足性和系统性的特征,它不是偶然的符号集合。图像的“孕育性”具有图像学和叙事学的意义,可阐释,可叙事,包含了某种意义(象征、隐喻等),是“图”与“像”的整合,具有独立意义的传播功能。中国传统文化中的治学方法是“左图右史”。即“置图于左,置书于右;索像于图,索理于书。”(郑樵《通志略·图谱略》)“图”指的是图形,“像”指的是图形中深藏的含义。《说文解字》云:“像,似也”。段玉裁注:“然韩非之前或只有象字,无像字。韩非以后小篆即作像。许断不以象释似,复以象释像矣。系辞日,爻也者,效此者也。象也者,像此者也。又日,象也者,像也。……盖象为古文,圣人以像释之。虽他本像亦作象。然郑康成、王辅嗣本非不可信也。凡形像、图像、想像字皆当从人,而学者多作象,象行而像废矣。”段注提到了“图像”,意在解释“像”的出处与来历,像与爻辞功能大体一致,故圣人以像释之。《易·系辞上》云:“仰以观于天文,俯以察于地理,是故知幽明之故。”《易·系辞下》又云:“仰则观象于天,俯则观法于地”。“观天文”实为观天象(像),与“索图于像”,说明了二者合二为一的“图像”,自有深妙的玄机。《易·系辞上》所指的“河出图,洛出书,圣人则之”的“图”,当为“图像”理解,很有玄机可阐释。当今“图像”与西说融合,基本上属于美术学(造型艺术)意义的范畴,有独立的自足的编码符号系统。即显示了母题、主题、意象、形象、结构以及相关联的系统,这与西方图像志与图像学有关分析和阐释的对象——图像的理论有关。因此,图像一系列的编码符号(图像逻辑)隐藏有深刻的含意,具有阐释学和叙事学的意义。不仅如此,作者(艺术家)赋予给图像的精神与情感是丰富的和完整的。当然,一些折射了历史、文化、民族、社会等价值的具有可阐释性、叙事性的摄影作品,也因此可作为图像来分析和

阐释。

图不具有上述所说的图像的编码符号与意义。图是时间过程中一瞬间截取的片段,是非独立性、非自足性和非系统性的时间碎片,不孕育整个时间过程,其精神和情感也是散碎的。因而,图不具有图像学的意义,也无叙述性。如一些出现在影视、戏剧戏曲或舞蹈表演中一个画面的截取图——剧照,不具有图像学的意义。也就是说,无法从图像志的辨析到图像学的阐释,没有叙事的性质。如同连环画中每一页都是图,不完整,没有独立性,不可阐释。概言之,图的碎片特性,缺乏图像逻辑的系统。正因为如此,连环画的图才配以文字,并且由众多的图构成一本可阐释的、可解读的具有完整性的连环画。连环画的每一页仅仅是孤立的图,而不是图像。影视、戏剧戏曲和舞蹈等中截取出来的图——剧照,仅仅是图而已,而不是图像。今日流行的动漫(学科上归属影视戏剧戏曲学)、网络上流传的照片,等等,皆为图,非图像。正是应为这些“图”充满了我们的视觉世界,我们才惊呼读“图”时代的来临。但仅仅是“图”的到来,而非真的“图像”的到来。因为我们的视觉文化大都是图,所以我们感到今天的“读图时代”越来越简单,越来越觉着肤浅。而真正的图像却受到图的冲击,使我们难以辨认,或根本没有认识到图像本身到底是什么。于是有的学者认为图像与表演无法辨分:图像就是表演,表演就是图像。这种认识是值得商榷的,主要问题在于把图与图像混同了。

图像包含了最基本的单位或元素——母题、主题、意象、结构以及与之相关联的符号等。人们通过对母题的分析与辨认,最后进行图像学对主题的阐释与研究,这是对图像的基本研究路径和研究手段。这就涉及到图像的符号以及编码问题。19世纪西方产生的图像学理论主要是对古希腊和中世纪宗教艺术的图像进行研究的一种方法,并由此使艺术史研究进入到人文主义的学科中。法国艺术学家埃米尔·所著的《图像学:12世纪到18世纪的宗教艺术》便可使我们了解图像学研究的对象,并由此也了解西方“图像”一词所指的含义了。图像学成为艺术史学家对图像隐藏的某种文化、思想、宗教或历史最完美的解释。阐释和研究的这些图像本身有这样几种特征:其母题或主题隐含或象征了某种意义,显现了它的历史性、社会性、政治性、宗教性和叙事性的特征。西方最早被认可为图像的不是别的,正是那些被今天称为宗教的和古典的“艺术”。它们是由“艺术家”依据某种意图而创作的。某个艺术(图像)体现了某个“艺术家”思考和表达的意图,或者表现了他者(教会或赞助者)的意图。“在12和13世纪意大利和法国艺术中我们可以找到许许多多类似的例子,即,艺术家直接和精心地从古典的母题中借用了母题,却把异教的题材改变成基督教题材。”母题、主题、意象等,都是经过艺术家或赞助者的意图来编译符号构成了图像不可缺少的元素并由此产生了意义,从这个层面上说,图像还具有符号学的意义。结构是图像隐含的内容之一,是符号系统的编码程序。如何构图画面,如何取舍母题或意象,并从各种构成关系中产生某种特定的主题,这就是创作者所要思考的结构要素。西方中世纪的宗教图像,是创作者与赞助人(教会组织)共同完成的艺术(图像)形态。当代学者研究与阐释它们,提出了图像学的研究方法,同时还提出了一个肖像学(圣像学)的概念,“肖像学是艺术史中研究与艺术形式相对的艺术题材或含义的一个分支。”正是因为这些中世纪的艺术(图像)具有象征意义、为现代人难以知晓的隐喻,以及它们隐藏的事件和某种可叙事的关联情节,才被研究者称为图像。在西方,图像显然包含了中世纪的宗教绘画与雕刻,通过运用图像学方法研究,揭示这些图像在中世纪宗教文化系统中的现象和宗教文化的形成与变迁,以及图像所暗示出来的宗教思想与其它观念。图像学研究不仅仅是针对宗教艺术图像的研究,也包含对古希腊艺术(图像)的研究,其实际目的还是因为中世纪宗教艺术中,借用了古典艺术的母题,但因某种主题的需要而使母题发生了变异。图像学正是要阐释这种变异而叙事新主题的含义。因此,图像学研究和阐释的是,西方各个时期图像所显示的文化形成和变迁,以及这些图像隐藏的文化、社会、宗教、思想与政治的意义。西方现代图像学转向对所有图像领域的研究与阐释,因为图像中最要的是它包含了思想与观念,显示了图像中某种历史与观念。

不难理解,图像就是我们今天说的造

艺术,是空间艺术的概念,非时间艺术的概念,是艺术家的独立创作的作品(图像)。艺术家在创作作品(图像)时,都有自己的思路、观念和企图,这就是我们说的一整套艺术构思和技术,也可以说是“编码系统”,故此自成独立的系统。一些摄影作品,由于摄影师有意识地选取某些重大的事件进行抓拍,使其作品本身具有了叙事性因素,随着时间的推移成为将来历史中的某个重要事件,再经过一些艺术化形式的处理,如构图剪裁、光线等暗房技术的处理,使摄影作品成为可阐释和可叙述的图像。还有一些摄影作品,经过摄影者后期制作处理,即后期编码,使其成为图像。当代一些广告摄影作品,之所以也可以称为图像,是因为这些广告被摄影师按照商家和市场(客户)的消费观念的需求,以及时代文化时尚包括审美属性等,即我们通常说的“设计意图”,进行了“观念”的处理,做了后期编码制作,使其突出商业与市场价值的效应并体现了设计师的设计理念,体现了“我消费,故我在”的当代消费文化时代的观念,具有独立的意义。当然广告这类图像比起我们前面描述的图像来讲,因为广告图像注重的是商业价值和商业效应,它缺少叙事学的意义,即使阐释也是单向的,隐含的人文思想较少。总之,广告设计经过“编码系统”的处理,较多的是体现了某个阶段的时尚设计观念或创意理念,自身也构成了独立的、可解读的和阐释的价值体系。

质言之,图像应该具有这样几个术语来指向它的全部意义:形式、形象、母题、主题、意象与象征(寓言)。

图或图片,无上述我们说的这些基本元素。之所以说“读图时代”是肤浅的、无深度的,甚至是游戏性的,就在于“读图时代”的图没有独立性,没有编码的符号系统,缺乏隐含的历史性独特含义,没有叙事的结构。这就是造成我们今天焦虑读“图”时代肤浅的根本原因。尤其是今日的各种媒体在传播过程中的视觉文化现象,基本上是贴“图”视觉现象。因此,才被认为当今是“读图时代”。也有西方后现代文化理论家认为媒体与语言发生的词与物的关系,使当代的视觉文化现象具有“图像转向”的意义。但是,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论,也不是更新的图像‘在场’的形而上学,它反倒是对图像的一种后语言学、后符号学的重新发现,将其看作是视觉、机器、制度、语言、身体和比喻之间复杂的互动。它认识到观看(看、凝视、观察实践、监督以及视觉)可能是与各种阅读形式(破译、解码、阐释等)同样深刻的一个问题,视觉经验或‘视觉读写’不能完全用文本的模式来解释。”这里我们看到了,即使西方后现代文化理论阐释图像并使图像转向成为后现代文化阐释,图像依然脱离不了上述的“术语”。不是任何“图”都是可以作为“图像”来认识的。

二、表演艺术中的碎片影像

表演是时空艺术,它包含了造型元素,又必须需要时间完成叙事。它包括了早期传统的舞蹈、戏剧戏曲和后来工业社会的电影电视。这些是不同历史阶段的表演艺术形式和现象,虽有差异,但其艺术的本质和规律是不变的。时间艺术是需要在一段时间内展现其叙事的结果,它不暗示某种未完结的内容或含义。因此,“时间”就是表演艺术的主要叙事方式。然而作为空间艺术的那些图像,它们的叙事是在阐释者的阐释中完成的,故此阐释(破译、解码等)是空间艺术的主要叙事方式。表演艺术的“时空”也是它的存在的方式;作为造型艺术的图像的“空间”是它存在的方式。艺术分类学依据艺术的存在方式分类,把艺术分为时间艺术与空间艺术,表演一类的同时具有时间与空间性质,故为时空艺术。也正应为如此,表演某些性质又复杂一些。在一般人的心理上,读图看似比较简捷和容易,一眼望去尽收眼底。现代人们的生活方式越来越紧张,时间越来越“少”,人们沟通的方式依赖电脑等多媒体视屏技术,视觉文化便在各种媒体上呈现。“读图时代”正是这种社会生活现状中产生的。“读图时代”的中的“图”的概念是混杂的,事实上是包含了“图”与“图像”。但是,表演艺术中截取下来的图(剧照或还不如剧照的图),以及动漫作品中截取下来的图,只能是图,或称为影像碎片,不能作为图像。这种影像碎片的图,貌似成为了空间艺术,其实不然。原因就在于它不可阐释,不可叙事。它阐释的符号是乱码,叙事的主要方式——时间没有了。也不是空间的艺术,因为它是

从时间艺术中抽离出来的瞬间碎片的影像,没有经过编码系统的过程,不具有自足性的独立特征。

在南京举行的“图像与表演”主题的国际学术会议,主办方是中国艺术学理论(原艺术学)学科的发源地、全国唯一的“艺术学理论”重点学科的东南大学艺术学院,也是全国首家艺术学理论的博士点授予权单位和全国首家艺术学理论博士后流动站单位。其举办“图像与表演”会议的宗旨与目的不言而喻,就在于探讨造型艺术(图像)与表演艺术(影视戏剧戏曲)之间的某些关系。这是一个基于艺术学理论实践层面研究课题的国际学术会议。一些研究者把注意力放在了表演艺术中的图与表演本身的研究视野中。他们几乎都把图与图像混淆了,以至于有的学者认为,当今的图像与表演无法分清。造成这种误读的根本原因,就是没有打通最关键的三个门类艺术——美术学、音乐学与舞蹈学,缺乏研究和架构艺术学理论的学术能力,错把“图”当作“图像”了。因而,所研究的图像与表演之间的学理问题,实际上依然是表演艺术自身的问题。即用戏剧戏曲影视中截取下来的图片,探讨戏剧戏曲和电影自身的问题,与造型艺术的图像没有关联。甚至一些与会者,还把一些采用社会学方法收集的一手资料图片,作为图像来理解。这些一手资料的图片对于帮助和了解研究者考察某个民族的传统文化习俗,具有资料性的考证意义和价值。但仅是图片资料,非图像资料。

艺术学理论学科的重要创始人张道一先生,很早就对从事艺术学理论研究者提出了要求,他指出研究者必须将美术、音乐与舞蹈这三门打通,这是从事艺术学理论研究者所必须具备的基本要求和学术能力。张道一先生在“艺术三要素”中,始终反复强调了研究者要打通艺术的“三大块”:美术、音乐与舞蹈,掌握它们、了解它们共同规律和基本原理。不仅如此,张道一先生还强调要抓住艺术的“三要素”:思维、载体、技巧,才能抓住艺术的真谛,“可以说思维、载体、技巧是创作艺术的三条腿,三足鼎立不但站得稳而且走得远。”张道一先生的“艺术三要素”分别从艺术创作与艺术理论两个方面探讨了艺术“三大块”与“三要素”的关系问题。目的就是阐明艺术学理论研究的基本原理和基本理论必须建立在打通美术、音乐与舞蹈三门学科基础上,建立在艺术实践中对艺术的思维、载体和技术的掌握的基础上。一个从没有从事过造型艺术创作的艺术学理论研究者,对图与图像的理解自然难度很大。他无法理解“图像”为什么是独立的系统,为什么“图”就不是独立的系统。艺术离不开思维,这是最基本的。造型艺术的图像首先是需要艺术家的思维,他要在作品中表达自己的思想、观点、看法和态度,使作品具有某种意义。载体是艺术呈现的物质形式,没有物质这个载体,艺术永远不能够实现物质化,艺术品无法产生,艺术家的思想、观念、看法和态度等,都只能装在他的头脑中,表达不出来。选择什么物质作为承载艺术的载体,是艺术的本体问题,物质关系到艺术的语言、表达和技术等艺术的本体问题。但是,有了思维和载体,不等于就有了艺术作品。艺术家如何表现他的思想和观念等,还必须依赖于艺术的技巧。如果一个造型艺术家(画家、雕塑家),没有掌握一定的艺术技巧,再好的思想或想法也是无法表现出来的,或者创作不出来好的艺术品。艺术技巧的好坏不但影响到艺术家思想观念的表达,也影响到艺术作品的品质和艺术价值。这三者是相互叠加与印证作品(图像)的自足系统的,使艺术作品(图像)产生了独立的、完整的图像学与叙事学的意义,具有文化与艺术的价值和意义。  表演艺术中截取某个瞬间的图,仅仅是整个时空艺术中的一个“碎片影像”。对这样的碎片影像作完整的描述,只能将无数碎片影像叠加起来还原到时间的方式逻辑系统中才能做到。这样做实际上依然还原为表演艺术的形态,或者就是连环画的形态。把电影转换为“连环画”的这种形态,是上世纪70年代我国很流行的一种阅读方式,用碎片影像组成一组一组的画面,图片的下面配上一段文字说明,这就是“电影连环画”。我把这种阅读形式称为看“静态电影”。这就说明了“图”不是“图像”。我们不能把影视戏剧戏曲中截取的影像——图,这些乱码碎片,当作图像并试图进行阐释。企图对碎片影像这样的图作图像学的阐释和叙事学的文本诠释,其结果都是无法进行的。即便试图对这些影像图进行阐释与诠释,阐释或诠释者也是依据已知的表演

艺术的过程与结果作某种诠释性的“复制”工作。即使像米歇尔这样的后现代文化理论者,在其《图像理论》中也说,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论”。图的不可阐释性和不可叙事性,使其图本身不具有深刻性,不具有孕育事件前后的延续性,图的乱码和碎片性决定它自身的肤浅,无深度、戏谑性以及无风格等特征。也许正是因为图的这些特征,恰恰碰巧对应了后现代主义的文化理论,人们才开始意识到“读图时代”的“图”之浅薄。

图像理解理论与方法范文第3篇

MATLAB的全称是mathandlaboratory,翻译成中文就是矩阵实验室。它将矩阵的计算、数值分析、可视化科学编程以及非线性电子电路动态系统建模仿真等大量科学研究上实用的功能集成起来,大量的函数库、丰富的编程及仿真模型几乎覆盖了工程数学化处理的所有领域,因此成为了工科研究生必须掌握的科研利器。由于MATLAB的计算基础是矩阵,因此矩阵论中所有的理论和计算都成为了该软件的运行基础,为选用MATLAB进行矩阵论课程的教学研究和改革提供了牢固的理论和实践基础。目前,MATLAB已应用于许多课程的教学中,比如将MATLAB软件的滤波器设计工具引入数字信号处理课堂教学过程中[5],用MATLAB仿真软件来辅助“激光原理及应用”课程的教学[6]等。本文根据矩阵论课程的理论和实践特性,结合问题教学法,以MATLAB实现各种数学问题的教学,并理论结合实践,提高了研究生对矩阵论理论方法的理解和应用能力,有利于工科研究生科研数学素养的提高以及创新能力的培养。

2教学改革和研究

矩阵论课程的教学改革可以从理论和实践两部分出发,其中理论教学部分针对课本上的定理和公式,而实践教学则偏向工程方面矩阵论的应用。采用MATLAB进行辅助教学,可以从这两部分分别入手,3.1和3.2节分别用实例来阐述。

2.1理论教学矩阵论的课程体系中,理论和公式推导占了绝大部分的篇幅,因此理论教学仍旧是本课程的教学主体。但是,对于工科学生而言,理论公式的应用才是最重要的,于是,对于公式的理解和运用则成为教学重点,教师则可以适当放宽学生对于理论公式推导的掌握。MATLAB中,矩阵论所有的理论公式都被集成成为函数库,因此,结合MATLAB加深学生对于理论公式的理解,也不失为理论教学改革的一种方法。本节针对矩阵论中各章节的典型问题,在MATLAB中进行理论分析和解决,验证基于MATLAB的理论教学对于本课程的意义。第一章的线性空间和线性变换中,所有的运算不外乎加法和数乘,在MATLAB中,矩阵的加法和数乘一目了然,如图1所示。第二章求解Jodan矩阵,首先要从矩阵的特征值和特征多项式开始,继而求解Jodan标准型和Jodan链。在掌握了复杂的运算过程后,MATLAB可以用一个函数来验证和描述,从而达到直观和引发学生的学习兴趣的作用,如图2所示。贯穿矩阵论,有一项计算是无处不在的,那就是线性方程组的求解。在MATLAB中,同样是一个函数就能完美直观地呈现求解的过程和结果,如图3所示。正因为MATLAB能简洁直观的解决矩阵论中诸多复杂的理论和公式计算以及方程的求解,因此可以打消许多同学由于复杂计算引起的恐惧感,并能激发学生对矩阵论问题求解的信心和兴趣。

2.2实践教学从教材来看,矩阵论课程并没有包含实践教学内容。但是,矩阵论是一门数学类课程,数学问题来源于科学实践,而科学实践的发展又依赖于数学的发展。因此,在矩阵论课程学习中,实践教学对于工科研究生来说是不可或缺的。矩阵可以用来表示化学元素,从而化学上的平衡问题可以通过矩阵论解决;信息的编码与解码,可以用矩阵和逆矩阵的方法来进行,从而矩阵论可以解决信息论与编码中的编解码和纠错问题;矩阵可以用来表示图像,矩阵的大小决定了图像的分辨率,从而图像的各种处理方法均可以用矩阵论来处理,利用图像压缩可以归结为矩阵的分解等。对于图像处理,MATLAB中有图像处理的大量函数库和体系。已有学者将MATLAB仿真应用于数字图像处理课程教学中[7]。本文利用矩阵论中的矩阵运算和方程求解方法的函数库,结合MATLAB处理工具,解决图像复原中矩阵方程求解的问题,从而验证基于MAT-LAB的实践教学对于矩阵论课程的教学研究改革具有重要的作用。

在成像探测等工程应用当中,图像的质量对于探测的精度产生重要的影响。因此,图像处理在探测等工程项目中起了举足轻重的作用。目前简单的图像处理包括去噪、增强等,复杂的有图像复原和超分辨率重建。图像复原在目标探测中应用的较为广泛,因为成像过程对于图像的形成可以用退化来描述,而图像复原是专门针对图像退化的。图像由于像素的存在,因此可以用矩阵来进行描述。在MATLAB中,图像正是以矩阵的形式来存储和运算的,矩阵的每一个元素值代表图像中某一像素点的灰度值或色彩信息,图像的处理进而可以用矩阵的运算来完成。图像复原的方程求解在MATLAB中可以运用矩阵的函数库来实现,如图4所示。用该方法处理的原始图像和处理后的图像如图5所示。从图4和图5可以看出,矩阵论通过MATLAB在工程上可以得到广泛的应用,且范围不局限于图像处理。任意事物都可以用二进制数据来描述,因此都能以矩阵的形式存在,而事物之间的联系正是矩阵的运算。因此MATLAB在科学研究中是一种较为重要的工具,无论是程序设计还是仿真,甚至可视化编程都能实现。而作为MATLAB的基本元素,矩阵的理论则能解决许多实际问题。研究生或多或少都会参与导师的各种项目,因此将MATLAB结合矩阵论解决实际项目中的问题,能激发学生的学习兴趣,并引导他们深刻认识问题的本质。

3结语

图像理解理论与方法范文第4篇

关键词:DSP技术;数字图像处理;实验教学;最佳阈值

作者简介:施帮利(1969-),男,四川泸州人,重庆理工大学电子信息与自动化学院,实验师。(重庆 400054)韩武红(1971-),男,重庆人,重庆市巴蜀中学教务处主任,中教高级。(重庆 400013)

基金项目:本文系重庆市高等教育教学改革研究重点项目(项目编号:122003)的研究成果。

中图分类号:G642.423 文献标识码:A 文章编号:1007-0079(2013)10-0171-03

“DSP技术”是指利用通用或专用DSP处理器完成数字信号处理的方法与技术。[1]“DSP技术”课程中数字图像处理部分内容主要讲述利用DSP系统对图像进行加工分析的方法和原理。[2]“数字图像基本处理实验”包括图像的反色和二值化处理,是数字图像处理的最基本算法,是图像进一步处理的很多算法的基础。[3]“数字图像基本处理实验”是“DSP技术”课程中比较典型的一个实验,它体现了DSP技术应用中的一些共有的方法和原理,对DSP技术的其他应用案例具有很好的示范作用。

一、实验教学特点

1.教学对象

本节实验面向电子信息工程专业大三学生,大三上半学期学生已学完“信号与系统”、“微机原理”和“数字信号处理”等相关课程,已具有C语言和汇编语言基础,但程序设计基础比较薄弱。

2.教学目的

(1)了解BMP图像文件的基本处理程序。

(2)理解图像处理的基本原理。

(3)掌握用C语言实现图像二值化处理算法的方法。

(4)掌握CCS开发环境中分析数据的基本方法。

二、课前的预习准备

数字图像处理的理论性和实践性都很强,一方面学生对图像处理已有比较直观的了解,且具有比较浓厚的兴趣;另一方面学生对图像相关理论如图像格式等知识比较欠缺,对其算法也感觉比较抽象。

课前,教师可预先将图像反色处理的所有代码提供给学生,要求学生结合BMP图像格式,了解从图像文件中获取图像点阵数据的具体实现。考虑到学生的实际情况,在程序设计时对内存分配、文件操作、图像数据提取等较低层部分不做强制要求,学生只需针对算法的具体实现,将图像反色部分的代码修改为图像二值化处理的代码即可。

为了提高学生的兴趣和积极性,让学生自己准备几张需要处理的图片,比如自己的大头贴或喜欢的明星照片等。图片预先处理为适当的格式:120×120像素、8位色深的BMP格式。为便于比较,可以使用画面相近,但整体亮度适中、偏暗和偏亮的三张图片。

三、教学内容分析

1.数字图像基础知识

常见的BMP格式数字图像的每个像素通常用8bit表示,因此图像有256个灰度级,其范围为0~255,其中0对应黑色,255对应白色。它由图像文件头和图像数据阵列两部分组成。图像数据阵列记录了图像的每个像素值。图像数据的存储是从图像的左下角开始逐行扫描图像,即从左到右、从下而上将图像的像素值一一记录下来,从而形成了图像数据阵列。[4]

2.图像反色处理

设输入图像为f(x, y),反色后的图像为g(x, y),那么图像反色的方法为:

g(x, y) =255-f(x, y)(1)

3.图像二值化处理

实验中一般采用全局阈值。设输入图像为f(x, y),二值化后的图像为e(x, y),设定一个阈值T,那么图像二值化的方法为:

(2)

4.“最佳阈值”算法

目前采用最广的是“最大类间方差算法”,也叫“OSTU算法”。算法的描述为:[5]

(1)计算输入图像灰度级的归一直方图,用h(i)表示。

(2)计算灰度均值μT:

(3)

(3)计算直方图的零阶累积矩w(k)和一阶累积矩μ(k):

(4)

(5)

(4)计算类间方差:

(6)

(5)求δ(k)(k=0,1,…,255)的最大值δB(k),其对应的k值即为最佳阈值T。

四、实验教学设计

由于图像反色处理部分内容较为简单,可作为演示部分让学生观看。学生在观看教师演示时,建立对图像处理的直观认识,并熟悉CCS环境中调试、运行程序和查看实验数据的方法与步骤。

1.算法实现方法[6-8]

(1)算法的优化设计。

1)计算h(i)时,可先声明一个int型数组gray_nu[256],用于计算每种灰度的像素点数,然后用语句“h[i]=(float) gray_nu[i]/total_pixel;”算出h(i),其中“total_pixel”为图片总像素点数。

在计算gray_nu[i]时,学生常常会设计为对每一级灰度值i遍历一次图片,将灰度值为i的像素点数累加起来。这样需要遍历256次图片,程序运行需要很长的时间。改进的算法是:在遍历图片每个像素时,将像素的灰度值f(i,j)作为数组gray_nu[]的下标,用语句“gray_nu[f(i,j)]++;”即可将各个灰度值的像素点数累加到数组gray_nu[]中。其中,“f(i,j)”通过宏定义语句“#define f(i,j) ip[(long)(i)*lx+j]”声明,指向图像坐标为i,j的像素点灰度值的存储地址。改进后的算法只需遍历一次图片,大大节约了运行时间。

2)公式(4)和(5)需要两重循环,可将其修改为式(7)和(8)的形式,这样只需要一重循环即可实现。

(7)

(8)

(2)算法实现时应注意的问题。在公式(6)中,可能出现分母为“0”的情况。用min_h和max_h分别表示图像最小和最大的灰度值,很多时候,min_h并不等于“0”,则对于0≤k

虽然CCS2.2编译器对浮点数“0/0”的处理结果仍然是“0”,这样对最终结果不会有影响,但从设计的严谨性来说,还是应该将k的范围分成0≤k

2.实验数据分析

(1)CCS环境中查看数据的方式。在CCS环境下,可以通过“View”菜单查看内存、寄存器等的值,了解程序运行状况。数据的显示方式可以在“Watch Window”中以数值的方式列出,也可以使用“Graph”菜单以多种图形的方式呈现。引用时可以使用内存绝对地址,也可以使用变量符号。用C语言编写程序时,要查看的数据必须声明为全局变量。

(2)图像二值化处理的数据分析。对于电子信息工程专业工科学生来说,图像二值化处理采用的“OSTU算法”比较抽象,理解起来比较困难。借助于CCS环境中“Graph”菜单中的工具,以图形方式显示这些实验中的数据,可以帮助学生理解这些抽象的数据和数学公式的物理意义。

图1 在CCS中用图形窗口显示的实验数据

1)图1是在CCS中用图形窗口显示的实验数据。其中“in”窗口显示的是原始图像,“out”窗口显示的是二值化处理后的图像;算法中的关键数据h(i)、w(k)、μ(k)、δ(k)等均以图形方式显示。T、μT等单值可在“Watch Window”中查看。

2)图1中“h”窗口是图像灰度值的归一直方图,它显示了图像灰度值的分布情况。这种分布通常有三种情况:双峰结构、单峰结构和多峰结构。

h(i)呈双峰结构,通常表明图像前景和背景层次分明,图像二值化处理很容易分割出前景和背景,得到人物清晰的轮廓特征,[9]如图1中的情况。

h(i)呈单峰结构,表明图像前景和背景层次不清,有很多混叠。

h(i)呈多峰结构,表明图像色彩层次比较复杂。

后两种情况,用全局性的阈值算法进行图像二值化处理效果一般都不太好,很难展示出人物清晰的轮廓特征,如图2中的情况。

图2 h(i)呈多峰结构,图像二值化处理的效果

3)图像的累积矩是图像的一个统计特性。图1中“w(k)”窗口显示的是h(i)的零阶累积矩w(k),它的值从h(0)值单调递增到1;“μ(k)”窗口显示的是h(i)的一阶累积矩μ(k),它的值从0单调递增到灰度均值μT。μ(k)比w(k)阶次更高,所以增加得更快。

4)图1中“δ(k)”窗口显示的是类间方差δ(k),它一般呈单峰状,其峰顶对应的横坐标即是最佳阈值T。h(i)呈双峰结构时,T值一般位于h(i)的双峰之间的波谷,如图1中游标所处位置。

(3)不同算法图像二值化处理的效果比较。图像二值化处理的关键是计算阈值T,不同算法的差异体现在计算T值的方法不同。工程实际中使用的图像二值化处理算法有很多种,且各有各的优势和不足。在实验教学中,不必过多地纠缠于这些理论的研究,而是采取了另外两种比较简单且较直观的算法与“最佳阈值”算法进行比较,即采取三种算法:固定阈值T=128;用灰度均值作为阈值T=μT;用“最佳阈值”算法计算阈值T。这样处理的好处:一是算法由简单到复杂,在学生逐渐理解了“阈值”、“二值化”等概念的基础上,引出“最佳阈值”算法更易于学生理解和接受;二是通过直观地比较三种算法的处理结果,学生更容易深刻地理解“最佳阈值”算法的优势。

表1中的数据是使用上述三种算法对同一组图像进行二值化处理的结果。对比表1中的输出图像可以看到,无论哪种情况的原始图像,采用“最佳阈值法”对图像进行二值化处理结果都更好。

五、结束语

“DSP技术”是一门面向工程应用的课程,同时也是一门理论知识涉及面较广的课程,理论知识是“DSP技术”应用的基础,而工程实现则是其最终目标。如何将理论知识与工程实现技术紧密结合起来,是“DSP技术”实验教学的核心问题。“数字图像基本处理实验”为“DSP技术”实验提供了一个范例,在实验教学过程中,着重分析讨论了算法实现的过程,训练并培养了学生在DSP技术应用中的一些基本方法和技巧;对实验数据的图形化分析反过来又加深了学生对基本理论知识的理解。通过实验可以让学生真正理解基础理论、掌握工程实现的基本技能,只有这样才能在未来的实际工作中发挥出最大的潜力。[10]

参考文献:

[1]管庆,胡全.“DSP技术”课程及其实验[J].电气电子教学学报,2004,26(1):70-72.

[2]范迪,孙农亮,曹茂永.我校《数字图像处理》课程的实验设计[J].中国科教创新导刊,2009,(2):166-167.

[3]Sankur B,Sezgin M.A survey over image thresholding techniques and quantitative perfor mance evaluation[J].Journal of Electronic Imaging,2004,13(1):146-165.

[4]BMP[EB/OL].[2012-8-12].http:///wiki/BMP.

[5]Ostu N. A Threshold Selection Method from Oay Level Histograms.[J].IEEE Transactions System Man and Cybemetics,1997,9(1):62-66.

[6]董立菊,于戈.一种有效的图像二值化方法[J].东北大学学报(自然科学版),2004,25(12):1149-1152.

[7]梁金明,魏正曦.Ostu算法的改进研究[J].四川理工学院学报(自然科学版),2010,23(5):543-545.

[8]王勇智.数字图像的二值化处理技术探究[J].湖南理工学院学报(自然科学版),2005,18(1):31-33.

图像理解理论与方法范文第5篇

关键字:图像融合;小波变换;融合质量评价

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2009)35-10075-02

Image Fusion Based on Wavelet Transform Method

WANG Chen,QI De-ning,CHU Bin-bin,PANG Lu-lu

(Artillery Academy of PLA Information Engineering Teaching and Research,Hefei 230031,China)

Abstract: This paper introduces the basic principles of image fusion, the structure models and applications, the brief image of the Mallat wavelet decomposition and reconstruction algorithms. The Matlab7.0 environment, the use of Daubechies wavelet (dB4) filter treatment of fusion images of the three orthogonal wavelet decomposition, using edge-preserving low-frequency coefficients, high-frequency coefficients of the largest energy, based on the rules of regional integration, and integration of image quality evaluation.

Key words: image fusion; wavelet transform; integration of quality assessment

20世纪90年代以来,随着图像传感器技术的迅猛发展,多传感器图像融合技术引起了人们越来越多的关注。特别是近年来,数字图像处理技术、数据融合技术及小波变换等理论的发展,使图像融合技术研究更加成为众多研究者的研究热点。图像融合在遥感、自动目标识别、计算机视觉、机器人智能、网络安全、工业检测、等领域都起着重要的作用,尤其在军事指挥领域,以多传感器图像融合为核心内容的战场感知技术已成为现代战争中最具影响力的军事高科技技术[1-2]。

图像融合就是根据某一算法,将来自不同传感器(或同一传感器在不同时间或不同观测角度)对同一目标或场景观测得到的多幅图像进行处理,从而得到一幅新的、达到某种要求的、对目标或场景的描述更加准确、更加全面、更加可靠的图像。数字图像融合充分利用了多个被融合图像包含的互补信息,大大增加了融合图像包含的信息量,同时也将多幅被融合图像中的冗余信息去除掉,提高了系统的可靠性,从而高效利用由多传感器获取的图像信息。数字图像融合系统结构模型如图1所示。该模型将图像融合评价的信息加入到融合规则的选取和参数的选择过程中,可以更充分地利用信息源提供的信息[1-3]。

1 图像的小波分解与重构[1,4]

对二维图像信号进行小波分解与重构,即在空间L2(R2)对信号进行二维可分离正交多分辨率分析,Mallat算法的实现使得小波在图像处理领域的应用成为可能。图像Mallat算法一层小波分解即对图像矩阵先进行行小波变换,再进行列小波变换得到图像的四个频带――低频近似部分子图LL,高频细节部分水平方向子图HL、垂直方向子图LH和对角线方向子图HH,如图2所示,下一层分解仅在LL子图上进行。

设{Vj}j∈Z 是L2(R)的一个多分辨率分析,?准为尺度函数,?鬃为小波函数,{hk}k∈Z 为对应尺度函数的低通滤波器系数,{gk}k∈Z 为对应小波函数的高通滤波器系数,图像小波分解的Mallat算法如下:

图像小波重构的Mallat算法如下:

2 基于小波变换的图像融合

2.1 融合规则的确定[1,5]

图像融合过程中,融合规则的选择对于最终的融合图像的质量是至关重要,设计图像融合的融合规则的理论基础是小波变换后低频子带表征的是图像近似部分,而高频子带表征的是图像的细节信息。高频子带的系数在零值左右波动,绝对值越大的系数表示该处灰度变化越剧烈,即包含图像的重要信息,如图像的边缘、线条以及区域的边界。另外,同一场景经过不同的传感器得到的图像,其低频近似部分的系数值差别不大,而高频细节部分却存在显著差异。因此,本文采用小波域低频系数采用边缘保持,高频系数采用基于区域能量最大的规则。

2.2 图像融合步骤[3,6]

对二维图像进行N层小波分解,最终有(3N+1)个不同频带,其中包含3N个高频带和一个低频带。基于小波多尺度分解图像融合方案如图3所示,图像融合的基本步骤为:

1)将待融合图像进行小波塔式分解;

2)按融合规则对各频带层分别进行融合,得到融合后各高频带和低频带小波系数;

3)将融合后各高频带和低频带小波系数进行图像重构,得到融合后的图像。

2.3 图像融合实验

待融合图像如图4(a)(b)所示,在Matlab7.0环境下,采用Daubechies小波(dB4)滤波器组对待融合图像进行了3级正交小波分解,对两个分解后的图像以小波域低频系数取平均、高频系数模值取大的融合规则进行融合,经过小波逆变换,重建图像,实验结果如图4(d)所示。图4(c)为对应像素灰度值取大的空域直接融合结果,从视觉感受而言,小波域融合能够取得较好的效果。

2.4 融合图像质量评价

融合后图像效果的质量评价研究,对于在实际应用中选择适当的融合算法,以及对现有融合算法的改进和研究新的融合算法都具有十分重要的意义[2,4],一般有主观评价和客观评价两类。主观评价是由专家进行诸如好、较好、一般、不好等定性的等级评分,主观因素造成评价标准的不同一,具有很大局限性;从信息理论与图像处理的角度出发,依据评定方法所需条件的不同,图像融合效果的客观质量评价分为基于标准参考图像的质量评价和无参考质量评价[2,3]。通常情况下,不存在标准参考图像,因此无参考质量评价更具有实际意义,本文在无标准参考图像的情况下,根据图像自身统计特性对其进行评价,选取以下四个常用评价指标(设融合图像用F表示,L表示图像F的总灰度级数,行数M、列数为N)。本文实验选取各图像的客观评价指标见表1。

1)灰度均值:指图像中所有像素灰度值的算术平均,对人眼反映为平均亮度,其定义为:

2)标准差(Standard Error):反映灰度相对于灰度均值的离散情况,即图像反差的大小,标准差越大,则图像灰度级分布越分散,包含更多的信息。其定义为:

3)图像信息熵(Entropy):反映其包含的信息量的多少,熵值越大,信息量越多,定义为:

其中,p(i)表示灰度值为i的像素数目与图像总像素数之比。

4)清晰度,又称为平均梯度,反映图像细节反差程度和纹理变化特征,一般来说,平均梯度值越大,表明图像越清晰。定义如下:

其中,ΔFx ΔFy分别为融合图像F在X与Y方向上的差分。

3 结束语

根据图像多分辨率分析理论,在小波域采用低频系数取平均、高频系数模值取大的融合规则进行融合实验,相对于空域直接融合,取得了较好的效果,但基于区域特性的融合规则大大增加了运算量。近年来,多尺度几何分析开始应用于图像处理领域[7],该理论的发展将为图像融合技术提供新的思路和解决方案。

参考文献:

[1] 敬忠良,肖刚,李振华.图像融合―理论与应用[M].北京:高等教育出版社,2007:10.

[2] Shi Wenzhong, Zhu ChangQing, Tian Yan.Wavelet-based Image Fusion and Quality Assessment[J].International Journal of Applied Earth Observation and Geoinformation,2005(6):241-251.

[3] 李伟.像素级图像融合方法及应用研究[D].华南理工大学博士论文,2006.

[4] 孙延奎著,小波分析及其应用[M].北京:机械工业出版社,2005.

[5] 胥妍.基于小波变换技术的图像融合方法的研究与应用[D].山东师范大学硕士论文,2008.