首页 > 文章中心 > 地理空间数据可视化概念

地理空间数据可视化概念

地理空间数据可视化概念

地理空间数据可视化概念范文第1篇

论文关键词:空间隐喻,“上-下”,“UP-DOWN”,抽象概念

 

一、引言

隐喻是一种十分普遍的现象。认知语言学界普遍认为,在所有隐喻中,空间隐喻对人类的概念形成具有特殊的重要意义,因为人们倾向于通过空间隐喻来表达和理解多数非空间的抽象概念。[1](p45)空间隐喻实际上是物质世界中空间概念的一种延伸,Lakoff&Turner(1989)认为,空间隐喻是一种意向图示隐喻(image schema metaphor),人们把源域中具体的空间关系投射到表示抽象事物的目标域上,就形成了空间隐喻,这使我们能运用空间思维来思考和理解非空间概念。[2](p99-100)汉语的“上-下”空间隐喻系统与英语的“UP-DOWN”空间隐喻系统在很大程度上可以形成对应或对等。[3](p105)然而随着目标域的不断扩展,汉语的“上-下”空间隐喻与英语的“UP-DOWN”空间隐喻之间的差异度越来越大,总体说来是异大于同。蓝纯在“从认知角度看汉语的空间隐喻”一文中指出,汉语的“上下”概念可用来构建状态、数量、社会等级及时间四个抽象概念。[4](p10)除了这四个抽象概念外,本文将补充讨论投射到范围的抽象概念,并将之与对应的英文进行比较,找出异同,并探讨其原因。

二、空间关系以及空间隐喻

(一)空间概念喻指时间

1. 时间概念表达

Gluckberg,Keysar&McGlone(1992)认为:“人类语言的一个普遍特性,甚至说抽象概念,人类思维的一个普遍特性,是系统地使用空间概念和词汇来喻指时间概念。”[5](p89)但在众多的空间关系中,不同的语言群会选用不同的空间关系来喻指时间。在汉语中,“上-下”关系是最常用来表示时间概念的。“上”用来指“早,过去的”和“即将到来的”时间;“下”则指“迟,接近未来的”时间。如:上午/下午,上世纪/下世纪,上一代/下一代,上学期/下学期,春上, 眼下等等。与之对应的英文分别是:in the morning / afternoon, the previous/next century,the previous/next generation,last / this term, on springdays, at present。从以上英汉的对照不难看出,汉语中“上-下” 喻指的时间概念,在英文中并没有对应“UP-DOWN” 喻指的时间概念,而是使用了“in,on,at,previous,last”,根据具体情形而定。

英语中用“UP-DOWN”表示时间与汉语的“上-下”时间隐喻也有相似之处。英语中的“UP”与汉语中的“上”一样,可以表达双向的时间意义中国知网论文数据库。“UP”既可以表达过去的时间点,也可以表达将要延续到的某一点或某一段时间。如:

(1)His family traces up to the colonial peIiod.

(2)Up to now, they’ve had very little to say.

(3)Thanksgiving is coming up on us.

(4) He remained faithful up to the last moment of his life.

英语中,“DOWN”表示“(自上而下)延续到……时间点(过去的,现在的和未来)。如:

(5)Down to the beginning of this year,John lived in London.

(6)This custom has been carried down from the 16thcentury.

(7)The old vase made in Han Dynasty has passed down to him.

2. 理据基础

从以上空间概念喻指时间的例子中可以看出,汉英之间有共同点,“上”和“UP”一样都可以表示双向的时间。此相似点体现了语言的共性,英汉两个民族有着相似的身体经验,空间--时间关系有两套隐喻系统,即“时间在动”和“自我在动” [5](p91),所以人们看待时间的视点是不固定的。

然而汉语中用“上-下”来表达时间是十分普遍的,而英语中跟“UP-DOWN”有关的时间隐喻相对要少得多,多数的时间表达不是通过“UP-DOWN”来实现的。这种差异更多地反映了英汉民族文化价值取向不同所导致的时间观差异。Boroditsky,Scott,Chun,L.等人比较分析发现:虽然汉语和英语都用“表水平的词语”来谈论时间抽象概念,但是汉语更多地用“表垂直的词语”来谈论时间,这是由于汉语民族文化历史中社会等级制度对时间隐喻的影响。[6](p142)

(二) 空间概念喻指范围

1. 范围概念的表达

汉语中“上-下”是较为确切的具体的空间概念,而处所、范围则可能是具体的,也可能是模糊的抽象概念。“上-下”方位词用在名词后可以表示主体与客体之间的两种关系,即接触性关系与非接触性关系,其中接触性关系还可以细分为附着性关系和包容性关系,而非接触性关系也可以理解为离析性关系。

(1) 接触行关系

1)附着性关系

主体客体关系

杯子桌子桌子上有一个杯子。

图画墙墙上挂着一幅图画。

大地脚大地在我们脚下。

主客体间关系对应的英语为:

There is a cup on the table.

A picture is on the wall.

The earth is beneath our feet.

2) 包容性关系

主体客体关系

鸟树树上有很多鸟。(树冠里有很多鸟。)

石油大地这片地下蕴藏着丰富的石油。(这片地里

蕴藏着丰富的石油。)

主客体间关系对应的英语为:

There are many birds in the tree.

There is rich oil under the ground.

(2) 非接触性关系

主体客体关系

百岁老人村村上住着两位百岁老人。

困难工作刚开始他工作上遇到了很多困难。

主客体间关系对应的英语为:

There are two old men aged over one hundred years old living in thevillage.

At first he encountered a lot of difficulitieds in the work.

2. 理据基础

从以上例子可以看出,汉语中方位词“上-下”可以表达表达内部,外部,广延及接触和不接触的等丰富的空间含义,这是汉语方所概念中的一个典型,说明汉语方位词语具有较大的概括性和模糊性。[7](p10)而英语是一种比较精确理性的语言,当表达接触性关系时,英语中用“on”来表达,当表达非接触性关系时,英语中用“in,at,on,above,over”来表达精确的空间关系。英语“UP-DOWN”只表示垂直关系,因此不能喻指处所、范围,而汉语“上-下”不仅表示垂直关系,也可表示平面关系,所以能喻指处所、范围。[8](p117)

(三)空间概念喻指数量

1. 数量概念表达

汉语中数量的多少,除了用数字表示外,还常常用“上-下”的空间概念来表示。如以下例句所示:

(8)房价涨上去了。

(9)此套电视剧播出后,其收视率迅速上升。

(10)今天的股市行情有所下滑。

(11)生产稳步上升,成本稳步下降。

英文中空间概念喻指数量与中文是相似的,也是体现为数量较多为“UP”,数量较少为“DOWN”。如:

(12)Adjusted sales were UPrelatively steep 2.5% from those of the month before.

(13)The yield of corn is down compared with last year.

2. 理据基础

汉语和英语空间概念喻指数量表达的相似性事实上是有理据的。根据相似的身体经验,数量的多少与现实中的上下位置有直接的关系,正如Lakoff(1980)所说,日常生活中的隐喻都来自于类似的经验。[9]如一堆东西,当往上面添加物品,数量增多,高度就会增加,数量减少抽象概念,高度也会跟着降低。又如,往杯子里倒水,水的高度就会上升,而把杯子中的水倒出,高度则下降。

(四)空间概念喻指地位、等级、品质

1. 地位、等级、品质的概念表达

汉语中,社会、等级制度、质量被看成抽象的空间概念,用“上-下”来表示社会地位、等级或者品质的高低。处于该抽象空间的越上方,地位越高,权势越大,品质越好;反之,处于该抽象空间的越下方,地位越低,权势越小,品质越差中国知网论文数据库。例如:高高在上、上级、上司、上宾、上调、上流社会;部下、下级、下人、手下人、下士、下放;上乘、上签、上品;下三烂、下品、下策。

英语中也用“UP-DOWN”来表达社会地位、等级的高低。地位高的为“UP”,地位低的为“DOWN”,例如:

(14)He has come down in the world.。

(15)Life is full of ups anddowns.

(16)Be nice to people on your wayup because you’ll meet them on your way down.

对于质量的优劣,英语也常用“HIGH-LOW”来表达,如:high quality,low quality,high marks,low marks。

2. 理据基础

从以上例子可以分析得出,英语和汉语在空间概念喻指地位、等级方面有重叠之处,都是利用空间位置的高低来隐喻社会地位、等级的高低以及质量的好坏。有这样的相似之处,是因为英汉两种文化中有着相同的经验基础:地位高的人处在较高的位置上,而地位较低的人则处于较低的位置上。正如上帝、皇帝都是“高高在上”的,而平民则要弯腰甚至下跪,显示自己地位低下,对其表示尊重与敬畏。[7](p11)

(五) 空间概念喻指状态

1. 状态概念的表达

汉语习惯用“上-下”空间概念来喻指状态,例如:

(1) 处于工作状态为“上”,不在工作状态为“下”

开车上班、专心上课、走马上任、持证上岗;提早下班、下课休息、下岗待业、

(2) 公开状态为“上”,非公开状态为“下”

股票上市、上电视、上报纸;私下调解、下意识里想

(3) 情绪状态高涨为“上”, 情绪状态低落为“下”

喜上眉梢、乐上心头、七上八下(不安)

(4) 主动状态为“上”

上进、上前、上心、上劲

英语中也有类似表达,“心情愉悦,健康,有控制力,积极良好”为“UP”,“情绪低落抽象概念,生病,失去控制,状态不好”为“DOWN”。例如:

(17)He was up for a time and then,without warning, despondent again.

(18)I have been down ever since Iheard the news.

(19)He is low man on the totempole.

(20)chin up, keep up one’s heels, wakeup.

(21) down in the dumps, gun down, down-at-heel.

2 理据基础

从以上分析可以看出,汉语用“上-下”与英语用“UP-DOWN” 喻指状态,有着许多相似之处。这是因为日常生活中,“健康的人以站姿和坐姿完成日常生活的绝大部分内容,只有重病者被迫躺倒在床;人死后均倒下”。 [4](p11)人们的情感(如快乐或悲伤)和感知肌动经验(如直立、弯曲的姿势)有关。当心情愉快时,往往精力充沛,昂首挺胸;悲伤失望时往往双肩下垂,低头弯腰。[8](p115)

三、结语

本文分析了空间概念喻指时间、范围、数量、等级地位、状态五个方面的英汉表达及其理据基础,发现英汉两种语言在隐喻表达结构和概念意义上既有相似之处,又有差异,且异大于同。根据莱考夫和约翰逊(Lakoff&Johnson)的观点,空间隐喻来源于直接的身体体验。[9](p14)英汉两民族有着共同的身体经验,对于时间、范围、数量、等级地位、状态这些重要的抽象概念在隐喻表达上有重叠之处也是合情合理的。但是,从以上分析中,我们不难看出,英语和汉语的隐喻表达更多的是不同之处。英汉两个民族有着迥异的文化认知模式和思维方式,并且随着社会的不断发展,目标域不断扩大,这些在很大程度上影响了语言中隐喻的表达使用。

[参考文献]

[1]钟曲丽.《红楼梦》中的空间隐喻[J]. 湖南科技学院学报,2008,(2):45.

[2]Lakoff,G.&M.Turner. More than cool reason—a field guide to poeticmetaphor[M].Chicago:UniVersity Of Chicago Press,1989.

[3]肖家燕.优先概念化与隐喻的翻译研究--《红楼梦》“上-下”空间隐喻的英译策略及差额翻译[J]. 四川外语学院学报,2008,(4):105.

[4]蓝纯.从认知角度看汉语的空间隐喻[J].外语教学与研究,1999,(4):10.

[5]周榕.隐喻认知基础的心理现实性——时间的空间隐喻表征的实验证据[J].外语教学与研究,2001,(2):89-91.

[6]肖家燕.《红楼梦》概念隐喻的英译研究[D].浙江大学博士学位论文.2007.

[7]吴静,王瑞东.空间隐喻的英汉对比研究[J] .山东外语教学,2001,(3):10.

[8]史厚敏,何芸,陆彦.英汉“上下”空间隐喻的认知对比研究[J] .湛江师范学院学报,2007,(4):117.

[9]Lakoff,G.&M.Johnson.Metaphors we Live By[M].Chicago:UniVersity Of Chicago Press,1980.

地理空间数据可视化概念范文第2篇

维克多?迈尔?舍恩伯格和肯尼恩?库克耶在《大数据时代》一书中前瞻性地指出大数据带来的信息风暴正在变革全人类的生活、工作和思维,大数据不是随机样本,而是全体数据,在数据的混杂性中需求相关关系。[1]

目前,学界和业界还未就大数据的规范化定义形成统一的标准,大多从大数据的特点出发进行描述性概括,即3V特征:Volume(数据的超大规模性)、Variety(数据的多样性)和Velocity(数据创建和传输的高速性);之后IDC在《大数据分析:首席信息官的未来架构、技能和路线图》白皮书中指出:“大数据被设计用于从海量的多样数据中获取价值”[2] ,IBM在《系统管理中用户行为数据建模的若干问题》给出大数据另外一个特征Veracity(真实性)。[3]

维克多?迈尔?舍恩伯格认为大数据在教育领域的应用,将有力地重构教学的三个主要特征:个性(individualization)、反馈(feedback)和概率预测(probabilistic predictions)。决定教育未来的,是那些更好地利用大数据来适应学习的组织。[4]

一、历史学科的可视化教学

随着计算机网络通信技术的高速发展,信息的来源也日益多元化、碎片化、海量化,这远远超出了人脑分析并应用这些数据的能力。科学可视化概念于1987年提出。科学可视化就是为了便于研究数据的动态变化,将符号化的数据转化为直观的图形图像,把研究者从复杂的多维数据中解脱出来。可视化的本质是用图形与图像来揭示数据,是处理大量数据最有效的手段。教育心理学规律显示,受教育者平时生活中接收的信息较大部分来自于视觉,因而图形图像有助于他们理解信息的属性和信息之间的关系。

鉴于可视化技术的优越性,上世纪80年代,可视化作为现代化教学方法应运而生。借助计算机的图形图像多媒体技术,把各种教学元素信息转换成恰当的图形图像,并通过多媒体设备呈现出来。可视化教学不但可以传达课本信息,还可以传递教师的态度和观点,随着可视化技术的不断完善和发展,特别是伴随着虚拟现实技术的迅速发展,可视化必将成为一种有力的教学工具。确如亚里士多德所言“告诉我,我会忘记;给我看,我会记住;参与其中,我会理解”。

历史学科是极具自身特点的基础学科,一方面其学习研究对象之间具有多元的线性关系,且历史环境、历史事件、历史人物等都具有不可复制性,只能根据历史遗存进行发散性想象和逻辑性推断,受教者的感受性差,难以理解,从而增加了教学难度。另一方面历史学科不仅仅是书本上的浅显性知识的集合,还包含更多的隐性逻辑线索,而这些隐性的逻辑线索才是揭示历史发展规律的根本所在,同时也是学习和研究历史的着力点。如果认为历史学科就是死记硬背的学科,那么历史学科就没有存在的必要了,更加不必提及大学历史教学了。可视化教学将为历史教学带来新的助力,特别是在大数据日益活跃的当下。一方面,可视化教学借助计算机图形图像多媒体技术将课本上的历史事物图形化、图像化、具体化、动态化,从而给学生以直观感受,便于其理解和消化所学内容,弱化了学生对客观历史知识的时空距离感。另一方面,可视化技术可以把晦涩难懂不易理解的历史概念、错综复杂难以全面掌握的历史事件直观生动地演示出来,并借此发掘出历史对象之间的隐性逻辑线索,分析归纳其历史发展规律。因此大学历史学科在大数据背景下的可视化教学将是“视觉文化研究对拓宽教育技术发展有着深层次的意义”[5]一次深刻的阐释。

二、大学历史教学现状

根据本科历史教学目标的要求,大学阶段的历史教学应着重关注基础历史知识的普及和学生历史思维的培养。但从现实来看,大学的历史教学往往侧重于对学生的知识性教导, 而忽略了按照历史发展脉络对其进行情景式启发。大学历史教学往往沦为教师的“一言堂”,“阅读”PPT课件,或者照本宣科,学生被动地接收老师的知识灌输。课堂上学术研究问题很少提及,遇有争议问题,教师很少全面介绍不同观点,或是不做详细阐述和分析。师生之间的互动也仅仅停留在课堂问答的层面。最终导致教学氛围沉闷,教学模式僵化,学生的学习主动性和探究性也逐渐日益消减。

从全人类视域关注历史,犹如个人关切其记忆。作为整个人类学科体系信息基础,历史学是人类文明的自我反思,从而为自身的处境找到历史根源,并因而形成文化传统,为新的挑战提供解决路径。历史教学内容都是过往真实发生过和存在过的社会变迁和思想交融。理想化的历史教学应该是以学生为主体,促使其理解并掌握历史史实,积极主动地学会思考历史现象。

三、可视化教学的实施方式

大数据背景下,可视化教学的实施必须借助计算机多媒体技术作为底层支撑,利用文字描述法、结构示意法、图形比较法、表格说明法、图像再现法、视频播放法展示教学内容。[6]

(一)具象化的图示、表格及文字说明

具象化的图示、表格及文字?f明是可视化教学的重要实施方式,可以直观清晰地呈现严密的逻辑线索或内容。

1.概念图

概念图是一种常见的图示法,其中节点表示某种知识概念,节点之间的连线表示概念间的相互关系,是一种表征知识和结构知识的一种工具,可以显示不同概念之间的联系,最终形成所有基本概念有机联系起来的网络图。在教学实践中,借助概念图教师可以从全局视角通盘把握所授知识体系,既可以保证概念的完整性,又可以梳理概念间的逻辑性,从而从更高的层次感悟历史。同时,概念图可以活跃学生的思维,在不同时空维度下体会历史,从而不再拘泥于静态的书本知识。

2.思维导图

思维导图是能够有效传达发散性思维的图形工具,围绕中心主题以辐射线形连接所有的代表字词、想法、任务或其他关联项目等。思维导图强调图文并茂,借助相互隶属及相关的层级图来展现各级知识主题之间的相互关系,通过主题关键词与图像、颜色等直观视觉元素的匹配来完成记忆链接的建立。在教学实践中,教师借助思维导图,可以发现学生个体之间历史思维方式的差异性,从而有针对性地进行个体启发和指导,激发学生求知兴趣。

3.概念地图

概念地图是一种知识及其结构的图形化表达,也是思维过程或思维结果的图形化展示,由节点、链接(连接各节点的连线)和表达节点之间关联的文字标注所构成,节点由几何图形或图案表示。概念地图是一种简单而有效的知识学习工具,可以有效地提升学生的学习效率。概念地图应用于历史教学过程,其所呈现的历史概念及相互关系,表现了构建者对相关历史知识的理解力与掌控力。

(二)直观化的图形与图像

随着信息技术的进步,人们的生活日益色彩化、图像化,视觉文化应运而生,借助可见的形象以表达、理解和解释事物及有关知识。[7]当前,图形图像已在历史教学领域得到广泛的应用,其直观的视觉冲击为可视化历史教学提供了必要的形象的史料准备。

1.承载历史信息的图片图画

历史图片是历史事实的物质载体,为历史学家阐释历史进程提供有力证据,同时也是历史可视化教学的工具。借助图片图画,一方面可以通过直观的视觉刺激,激发学生求知兴趣,另一方面可以通过图片信息的深层次挖掘,有效提高学生分析与解决历史问题的能力。

2.记录历史信息的音频视频

随着互联网技术的迅速发展,特别是大数据技术的日益普及,关于历史的视频音频资料大量涌现,这些都可作为历史可视化教学的信息来源。在收集、挖掘和整理上述历史视频音频时,需去伪存真,遵循适度原则,以历史课堂为核心,服务于知识趣味性的开发,引导教学与育人。

3.构建历史情境教学

历史学科的特性决定了学生无法身临其境地去目睹体验历史发生的情境和过程。因此,如何创设真实的历史情境,激发学生的历史情感,是当前历史教学亟待解决的议题。大数据背景下,虚拟历史情境成为可能,为历史可视化教学提供了必要条件。

虚拟历史情境是指根据历史学科教学的需要,以基本史实为线索框架,虚构出具有一定情绪色彩的、以形象为主体的生动具体的教学场景。在历史教学过程中借助计算机技术,模拟历史人物、历史事件,创设可视化场景,构建历史教学的虚拟情境,从而把历史人物、历史事件融入一定的历史空间内,拉近现实与历史的距离,从新的视角对历史进行解读。

四、教学效果和意义

1.创新教学手段,激发学生的兴趣

在传统的本科历史教学中,主流的教学工具便是黑板和粉笔,教学方式则以口授为主。在整个教学活动中,授课教师处于绝对主动地位,学生处于被动接受地位。师生之间的知识流动性差,往往处于单向传播状态。尽管借助一些信息手段努力地培养学生的学习兴趣,但由于技术条件的限制以及应用方法的固化,效果并不尽如人意。然而借助大数据技术,就可以有效地利用多元化的历史信息,丰富教学手段,从而极大地提升学生的学习兴趣。

2.促进了教学方法的改进

大数据背景下,借助计算机多媒体手段可以融合大量的相关信息,传统的板书逐渐被取代,新的教学方法不断涌现,教学过程中有较多时间被空余出来。在这种情况下,为教师教学地位的转化提供了可能,即教师从绝对的讲授转化为协同的指导,在单向传播知识的同?r,教师可以有较多时间来完成知识的回流,引导学生思考问题,协助学生分析问题,最终理解问题。由此可见,借助于大数据为代表的信息技术,教学方法的多样化促使教学过程中师生地位的转变,授课教师成为课堂活动的主导,而学生则成为课堂的绝对主体。

地理空间数据可视化概念范文第3篇

关键词:大数据;中文标记;图像视频;综合检索

中图分类号:TP311. 文献标识码:A 文章编号:2095-1302(2013)11-0061-03

0 引 言

随着传统数据中心向多媒体数据中心的发展,数据中心服务模式已经发生了翻天覆地的变化。大数据时代的核心特性有两个要点:一是一切都被记录,二是一切都被数字化。随着大数据时代的来临,它带来两个重大变化:一是数据量爆炸性增长,据统计,最近两年来国内各类机房产生的数据量大于2010年以前人类文明所产生的数据量的总和;二是数据来源极其丰富,特别是诸如图像、视频等非结构化数据所占比例逐年增长。从存储方面看,传统数据中心存储内容包括资源信息、业务信息、统计信息、指挥信息等,主要以结构化的数据表的形式存在,现在数据中心存储文本、数字、图像、视频、声音等多种数据形式。这些变化对数据中心检索技术要求越来越高,主要体现在:一是检索载体多样化。现代数据中心需要综合利用磁盘、磁带等综合性数据库。二是检索手段综合化。检索目标由单一的文本检索向文本、图片、视频、声音、地理信息多种目标发展。三是检索时机全域化。新数据文件增加不应中断向用户的服务,保障24 h全天候检索的可用性。因此,为了更好地利用海量图像、视频等非结构化数据,提高图像视频数据的检索效率,同时提高图像视频数据的可用性,有必要对图像视频检索方法进行深入研究。

1 图像视频检索在大数据时代的意义

多媒体信息包括文本、图像、音频、视频等信息。使用关键词检索,只能查询到媒体文件对应的文件名等特征,而无法对媒体文件内容进行查询,所以对于多媒体信息的查询应该不同于简单的文本信息的查询。随着越来越多的视频多媒体形成了海量文档,急需研究新一代的信息检索技术。

现代数据中心的发展具体来说,涉及数字化技术、超大规模数据库技术、网络技术、多媒体信息处理技术、信息压缩与传送技术、分布式处理技术、安全保密技术、可靠性技术、数据仓库与联机分析处理技术、信息抽取技术、数据挖掘技术、基于内容的检索技术、自然语言理解技术等。在众多技术门类中,对视频图像的检索显得尤为重要。本文主要研究基于内容匹配的数据中心图片视频资源的综合信息检索技术,为铁路、水路、公路、航空、交通保障等领域的数据中心建设以及综合性基础性中心多媒体检索技术的发展提供理论参考。

2 国内外的研究现状及动态

国外基于关键镜头关键帧的视频检索技术已经发展了很多年,随着视频数据急剧增加,图像视频检索已经成为一个新的研究热点。从第一届DIAL’04(The first International Workshop on Document Image Analysis for Libraries)开始,图像视频检索就一直被当做专题来研究,近年来,数字图像视频检索受到了极大的关注,DIAL、ICDAR等每次研讨会议均对其进行专题讨论。但是,由于国外图片视频中标记大多采用英文形式,而我国数据中心中图片视频标记是中文的,中英文在笔画排列、字词句构成、组织方式等方面差异太大,他们的视觉特征明显不同,现有的很多方法无法直接被我们直接采用。为了研究我国海量中文图像数据的管理、检索、利用,因此必须研究具有我国自主知识产权的基于中文标记的数字中心图像视频资源综合检索方法。

2.1 基于OCR的文档图像检索

在海量的视频图像数据中,其中一部分可进行正确的OCR识别,进行上下文标记,完全可用传统信息检索技术检索。对于各语系而言,其检索技术是相通的,只是OCR技术不同而已,但受到OCR技术的限制和视频图像本身质量的影响。在许多情况下,OCR识别结果并不尽人意,识别正确率对检索结果影响很大。目前,主要有两种容忍OCR识别错误的方法:一是对查询词进行扩充,估算OCR转换错误,并对OCR误差词进行检索;二是采用单词距离匹配的策略,主要是通过在矢量空间中进行词与词的匹配,计算出查询词与OCR识别目标的距离来排序。采取这两种检索误差容忍技术后,检索正确率明显提高,但统计显示,当OCR识别正确率低于75%时,视频图像检索质量将很难达到用户满意。

2.2 基于图像特征的图像视频检索

视频资料中,大量的关键帧、镜头是不能进行OCR识别的,主要有以下几个方面原因:其一是技术限制。由于OCR技术本身的局限,对于非规则字体、复杂背景、图像质量差、字符严重形变/扭曲、字符分割不完整等情况,OCR无能为力。即使能部分识别正确,但需要大量的人工校正,效率很低。其二是功能限制。对于签字或者印章等需要用于确定性的具有法律效力的文件,不适合采用OCR进行识别。例如,史料文献、名人手迹、重要的人工标记与墨迹、书法书画等也只能以文档图像的格式呈现。

基于图像特征的检索技术已经被越来越多的专家学者所研究。基于图像特征的检索过程与CBIR(Content Based Image Retrieval)过程相似,但技术迥异。CBIR常用的颜纹理等基本特征不再有效,必须根据文档图像本身特点,抽取相应图像视频特征及规律进行检索,目前研究主要集中于基于内容相似性和基于关键词检索。基于文档凸显内容相似性的建设主要是抽取基于文档全局特征与基于帧图像的局部特征来进行。全局特征主要有字符纹理统计、直方图统计、字符投影分布、字符行统计等,而局部特征主要是字符图像块的区域宽度、位置与面积等。还可将帧页面分为多层网格,抽取每个网格特征,进行基于网格的相似性比较。为了克服网络尺寸最优选择的一些问题,Cesarini、Mairinai等利用基于MXY树进行检索,在图像区域分割时建立MXY,综合全局特征与MXY树结构特征形成特征矢量进行相似性比较。

2.3 基于标记的图像视频检索

在基于空域语义上下文的概念标注优化中,Jiang等人基于概念之间的相关性学习得到一个语义图模型,在对某个镜头进行标注时,首先得到各个概念对于这个镜头的预测结果,然后利用这个图模型对预测结果进行平滑优化,并且在这个过程中考虑数据跨域的问题,即训练语义图模型的数据和对之进行优化的数据来自于不同的域,取得了较好的结果。Smith等人提出了一种Discriminative Model Fusion (DMF)方法,该方法将不同概念检测子对镜头的输出概率形成一个向量,然后以这个向量为镜头特征进训练,并预测概念标注结果。Jiang等人对这个方法进行了修改,加入了用户提供的标注信息。这些方法的问题在于,它们受限于语义词典的大小,只在词典中的概念数目较少的时候证明比较有效。

3 基于中文标记的数据中心视频图像资源综合检索方法

3.1 主要技术原理

在大数据时代,针对数据中心中文视频图像的特征,本文研究提出一种基于中文标记的数据中心视频图像资源综合检索方法,主要技术原理框图如图1所示。

图1 基于图像视频检索的数据中心存储体系结构和服务架构

3.2 主要方法

好的存储结构是检索的前提和关键,也是检索的方法之一。本文所采用的检索方法采用一种复杂应用环境下数据中心体系结构和服务架构。

首先,采用特征描述的视频图像检索方式。特征提取是图像处理中的一个初级运算,也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分,那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。有时,假如特征提取需要许多的计算时间,而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样,它们的计算复杂性和可重复性也非常不同。

其次,数据中心图像视频文档特征提取和索引建模技术是高效检索的关键。如前所述,视频内容本身包含丰富的视觉上下文信息,这些上下文信息是自然存在的,而不是相互独立的,一般可分为两类,即空域视觉上下文信息和时域视觉上下文信息。空域视觉上下文是指视觉帧内部的视觉信息之间存在的相关性。本项目针对空域视觉上下文信息和时域视觉上下文信息进行建模,为图像视频的快速检索提供基础。

4 基于中文标记的图像视频综合检索特点

基于中文标记的图像视频综合检索方法主要有以下特点。

首先是提出了特征描述方法。对于一个给定的视频镜头,在三维网格上进行采样,对于采样得到的点进行聚类,形成视觉词典,把每个采样点映射到特征空间离它最近的那个视觉词。这样,一个视频镜头就可以看作是一个由视觉词组成的立方体结构。然后,根据视觉词在立方体结构中的相对位置,把它们看做一个视觉词的序列,并用一个扩展的马尔科夫链对之进行建模。这样,视觉词在时空域中的关系可以用该模型中的状态转移矩阵进行描述,并和原始的Bag-of-words特征结合,作为视频内容的特征描述,可以有效提高其区分不同内容视频的能力。我们把该特征应用到两个不同的问题中,即视频概念标注和动作识别。

其次,提出一种两阶段的视频概念标注优化方法。思路大致如下:一方面,分别利用星型结构和链式结构的Conditional Random Filed(CRF,条件随机场)对视频中的空域语义上下文和时域语义上下文进行建模,并借用其训练预测方法完成优化过程。和现有方法相比,本文方法能够更为准确地对概念之间的相互关系进行描述。利用训练集中人工标注的语义信息,体现人类对于视频内容和语义概念的理解,该方法能够有效提高概念标注的结果。由于训练数据的局限性和问题本身的复杂性,基于语义上下文的优化方法不可能完美地对概念之间的关系进行建模,因此,本项目提出一种基于半监督学习的调整方法,作为基于语义上下文优化方法的有效补充:认为得分较高的镜头被进行了正确的标注,通过在视频镜头之间建立图结构,利用视觉上的相似性,采用半监督学习的方法用概念标注中置信度较高的优化结果对其余结果进行调整,能够进一步提高视频概念标注的准确率。

最后,提出一种基于颜色聚类和多帧融合的视频文字识别方法。主要思路大致如下:首先,在视频文字检测中,统一考虑了文字区域图像的两个明显特征—— 一致颜色和密集边缘,采用近邻传播聚类算法,基于图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到多个边缘子图中,使得在各个子图中检测文字区域更加准确。其次,在视频文字增强中,根据文字笔画强度图,过滤掉模糊文字区域,并综合平均融合和最小值融合,对在不同视频帧中检测到的,包含相同内容的文字区域图像进行融合,能够得到背景更为简单,笔画更为清晰的文字区域图像。再次,在视频文字提取中,一方面,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够得到比现有的方法更好的二值化结果;另一方面,基于图像中文字与背景的颜色差异,利用颜色聚类进行噪声去除,能够更为有效地提高文字识别率。实验证明本文提出的基于中文标记的图像视频检索方法能够较好地完成视频图像检索。

5 结 语

大数据时代数据中心检索载体多样化、检索手段综合化、检索时机全域化,各类数据中心不仅存储容量急剧增加,而且视频、图像等多媒体数据比重逐年增加,因此提高检索效率,增加数据的可用性成为多媒体数据中心的重要任务。多媒体数据检索方式多样,检索原理复杂,目前还处于起步阶段,伴随我国经济社会的快速发展,大数据时代即将来临,各行各业数据的不断融合,图像视频检索必将大显身手。

参 考 文 献

[1] BERG A C, BERG T L, MALIK J. Shape matching and object recognition using low distortion correspondences [C]// Proceedings of 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE. 2005, 1: 26-33.

[2] GRAUMAN K, DARRELL T. Pyramid match kernels: discriminative classification with sets of image features [C]// Proceedings of 2005 Tenth IEEE International Conference on Computer Vision. Beijing, China: IEEE, 2005, 2: 1458-1465.

[3] WALLRAVEN C, CAPUTO B, GRAF A. Recognition with local features: the kernel recipe [C]// Proceedings of 2003 Ninth IEEE International Conference on Computer Vision. Nice, France: IEEE, 2003, 1: 156-264.

地理空间数据可视化概念范文第4篇

关键词:GIS 空间数据挖掘 可视化

中图分类号:P2 文献标识码:A 文章编号:1672-3791(2013)02(b)-0015-02

1 空间数据挖掘的概念

空间数据包括了空间属性数据和非空间属性数据,空间属性描述了空间拓扑关系和方位、距离等关系,空间属性数据按照空间索引结构存储和查找。空间数据挖掘(Spatial Data Mining,SDM)指的是从空间数据库中抽取隐含的知识、空间关系或非显式地存储在空间数据库中的其它模式等[1]。从空间数据中提取信息,提取的信息包含了复杂的空间关系,因此空间数据挖掘与其他数据挖掘方法上有其独有的特点。空间数据挖掘需要综合数据挖掘与空间数据库技术。空间数据挖掘可用于对空间数据的理解,空间关系和空间与非空间数据间关系的发现,空间知识库的构造,空间数据库的重组和空间查询的优化。

空间数据是地理信息系统的重要数据,可以是地表在地理信息系统中的二维投影,也可以是多维的立体数据。由于雷达、卫星、传感器等技术的飞速发展,空间数据的数量、大小和复杂性都在快速地增加,出现GB,TB甚至于PB级的海量数据,获取实质性有用的数据,就需要空间数据挖掘技术。所以空间数据挖掘就是处理空间数据的技术方法,是挖掘出隐藏在空间数据库中的非显性知识、空间关系等。GIS从本质说是一个空间数据管理系统,将空间数据挖掘技术应用于GIS,是将GIS中的数据转化成知识的有效方法。

1989年8月,在美国底特律市召开的第一届国际联合人工智能学术会议上,首次出现了从数据库中发现知识(knowledge discovery in database,KDD)的概念。1994年,在加拿大渥太华举行的GIS国际学术会议上,李德仁院士首次提出了从GIS数据库中发现知识(knowledge discovery from GIS,KDG)的概念,并系统分析了空间知识发现的特点和方法,认为它能够把GIS有限的数据变成无限的知识,使GIS成为智能化的信息系统。1995年,在加拿大召开的第一届知识发现和数据挖掘国际学术会上。又出现了数据挖掘(data mining,DM),后又相继出现了数据发掘、数据开采、数据采掘、知识提取、信息发现等。同时,李德仁院士也把KDD进一步发展为空间数据挖掘和知识发现,系统地研究或提出了可用的理论、技术和方法,并取得了很多创新性成果,奠定了空间数据挖掘和知识发现在地球空间信息学中的学科地位和基础[2]。

2 空间数据挖掘的流程

空间数据挖掘是空间数据库中知识发现过程的一个基本步骤。数据挖掘步骤是通过将有趣的模式提供给用户,或作为新的知识存放在知识库中这种与用户或知识库交互的方式来进行的知识发现过程的其中最重要的一步,因为它可发现隐藏的不为人知的模式。它由以下步骤组成。

(1)数据清理:通过填写空缺的值。平滑噪声数据,识别、删除孤立点,并“清理”不一致数据。

(2)数据集成:对多种数据源进行集成。

(3)数据选择:从数据库中检索与任务相关的数据。

(4)数据变换:通过汇总或聚集等操作将数据变换成适合数据挖掘的形式。

(5)数据挖掘:使用智能的方法来提取数据模式。先对数据挖掘的目标和知识类型进行确定,然后根据所需要的知识类型选择合适的挖掘算法,最后从数据库中按照选定的挖掘算法获得所需的知识。

(6)模式评估:通过某种兴趣度量来评估真正有趣的知识模式。

(7)知识表示:通过知识可视化表示技术向用户展示挖掘的知识通过对以上过程不断地循环操作,可以对所挖掘出来的知识进行不断求精和深化。

而面向GIS的空间数据挖掘的过程大致可分为:确定挖掘内容、数据获取、数据预处理、挖掘方法选择、过程处理、挖掘知识应用。具体流程如(图1)所示。

首先用户提出问题,系统接受用户的要求,将其转化为GIS数据库模块的输入参数。挖掘向导接受用户的命令,触发空间数据挖掘核心模块。用户则根据需要选择挖掘技术,对预处理后的数据进行挖掘。挖掘后的知识再通过提取反馈给用户。

3 空间数据挖掘在GIS中的应用

空间数据挖掘技术与地理信息系统(GIS)的结合具有非常广泛的应用空间。数据挖掘与GIS集成具有三种模式:其一为松散耦合式,也称外部空间数据挖掘模式,这种模式基本上将GIS当作一个空间数据库看待,在GIS环境外部借助其它软件或计算机语言进行空间数据挖掘,与GIS之间采用数据通讯的方式联系。其二为嵌入式,又称内部空间数据挖掘模式,即在GIS中将空间数据挖掘技术融合到空间分析功能中去。第三为混合型空间模型法,是前两种方法的结合,即尽可能利用GIS提供的功能,最大限度的减少用户自行开发的工作量和难度,又可以保持外部空间数据挖掘模式的灵活性。

利用空间数据挖掘技术可以从空间数据库中发现如下几种主要类型的知识:普遍的几何知识、空间分布规律、空间关联规律、空间聚类规则、空间特征规则、空间区分规则、空间演变规则、面向对象的。目前,这些知识已比较成熟地应用于军事、土地、电力、电信、石油和天然气、城市规划、交通运输、环境监测和保护,110和120快速反应系统等资源管理和城市管理领域。在市场分析、企业客户关系管理、银行保险、人口统计、房地产开发、个人位置服务等领域也正得到广泛关注与应用,实际上,它正在深入到人们工作和生活的各个方面。

4 基于GIS空间数据挖掘结果的可视化

空间数据挖掘是面向更具可视化要求的地理空间数据的知识发现过程。可视化能提供同用户对空间目标的心理认知过程相适应的信息表现和分析环境,可以考虑将空间数据挖掘过程置于可视化的环境之下。可视化与空间数据挖掘的结合促使数据挖掘经历了一个数据可视化—— 挖掘算法的应用—— 挖掘结构的验证和可视化表达—— 挖掘算法的进一步改进和完善的循环往复的提高过程,可视化在其中扮演着重要的角色。

而基于GIS空间数据挖掘的可视化主要表现为与GIS相关的各类地图及其各类符号和要素。GIS平台中常用的可视化方法主要包括以下几点。

(1)基本查询技术:包括地图缩放、平移、视点选取等基本的空间查询与选择技术。

(2)色彩:利用人们对色彩的视觉敏感程度很高的特点,是用色彩来反映数据的变化趋势(如地貌中的分层设色)、突出反映某些分布规律或者数据的本身特征(不饱和数据表示不确定性)等。在交互可视化中应该给予用户充分的自由来选取各种色彩模式用于描述数据,用户可以任意调整色相、亮度和饱和度等,系统环境也应该提供一些缺省或者是某些比较有效的色彩模式供用户选择。

(3)统计图技术:统计图是最常用的可视化技术,用于显示数据集的统计和信息,统计图包括散点图、箱图、平行坐标图、柱状图、星形图、轮廓图。这些统计图在交互可视化环境中一般同地图和其他数据视图相连,成为数据整体可视化的一部分,还可以使用聚焦、高亮、色彩来加强其可视化和交互能力。

(4)专题图可视化技术:可以通过系统内置的地图制图知识在地图上自动表达数据信息,这样可以减轻用户这方面的负担以及避免由于地图知识的缺乏而造成的不适当表达,以便用户投入主要精力来进行数据探索分析。专题图可视化技术协助用户交互式地探索空间数据,通过一些通用的、与领域无关的法则的形式。自动地选择相应的一些表达式来说明诸如属性数据类型、取值范围和属性字段之间的关系。专题图可视化还可用于交互式的可视化数据分析,并提供多种制图表达方法和工具以便用户更易于表达隐含信息。

(5)其他交互技术:一些特殊的交互方法,如虚拟现实、触摸交互、声音交互等。

5 基于GIS空间数据挖掘存在问题

基于GIS的数据挖掘主要是空间数据和属性数据一体化的挖掘模式,与按传统的通过查询方式获得的知识相比,它是一种更深层次的数据处理分析。目前在这一领域的研究取得了一些成功,但未来的发展中,还有很多理论和方法有待进一步研究。

(1)改进挖掘的算法和效率:基于GIS数据挖掘这一块,因为有它自身领域的知识,既增大了挖掘算法的搜索空间,也增加了盲目搜索的可能性。因此要结合GIS数据和领域本身的特点改进算法,提高算法的效率以及设计出更好的相关挖掘算法。

(2)综合式挖掘模式:在面向GIS挖掘其隐含知识规则方面,采用某种单一的方法往往挖掘出的知识甚微,因此需要通过几种挖掘技术并行的综合挖掘模式挖掘,才能从大量的GIS数据中挖掘出更多更有用的知识。(3)G1S软件、空间数据库与数据挖掘技术的集成:当前的GIS软件和空间数据库还不能有效地支持数据挖掘,而是通过先提取相关数据,再利用挖掘技术对数据进行挖掘,这种方式可以说增大了挖掘的工作量,降低了挖掘的效率。所以未来的研究还会向实现三者的集成应用方面发展。

6 结语

空间数据挖掘技术对GIS数据进行更高层次的分析,能从空间数据库中抽取隐藏的、为人们感兴趣的空间模式和特征、空间和非空间数据之间的概要关系以及其它概要数据特征。将可视化技术作为一件GIS数据挖掘工具,可以利用可视化技术丰富的图形表达能力与高度的交互机制,充分调动用户的主观能动性,融入用户的知识与经验,真正实现探索性数据分析。目前,有关这方面的研究才刚刚起步,对它的研究重点应放在构建空间数据挖掘的系统的理论框架上。如何将GIS与空间数据挖掘有效集成还有待进一步深入研究。

参考文献

地理空间数据可视化概念范文第5篇

论文摘要:为了实现对地下管线的数字化与可视化管理 ,结合虚拟现实技术对地下管网进行研究。系统根据分层概念和管网数据的特点 ,设计城市地下管网的概念模型,着重介绍栅格矢量一体化数据结构的形式,利用空间数据库将地下管网的相关信息存储在 计算 机上并做相应处理,最终运用 gis和 lod模型的建立实现管网系统的可视化和实时漫游 功能。

城市地下各类管网是一个城市重要的基础设施,担负着信息传输、能源输送等工作,也是城市赖以生存和 发展 的物质基础。但由于多方面的原因,我国现有地下各类专业管网的资料残缺不全,且有关资料精度不高或与现状不符,在建设施工中时常发生挖断或挖坏地下管网,造成停气、停水、停暖、通信中断、污水 四溢等严重事故。另一方面,我国现有地下专业管网的资料都以图纸、图表等形式记录保存,采用人工方式管理,效率低下。为了解决这个问题 ,必须使用新的技术手段对地下管网进行管理。

城市地下管网虚拟现实系统属于处理地下管网专题数据的一种信息系统,是以地下管网空间信息和属性信息为核心,利用计算机地理信息系统技术、计算机图形学技术、数据库管理技术和信息可视化技术对城市地下管网进行综合管理,为施工部门和管理部门提供地下管网准确的走向和埋深等有关信息,通过进行各种分析,为领导部门进行管网规划、管网改造等提供辅助决策功能。地下管线虚拟现实系统一是可以实现传统手工处理方式向 现代 化信息管理转型,以保证数据的实时更新、有效管理,避免重复收集数据信息;二是可为市政建设提供规划、设计、决策服务;三是可为应对突发事件提供支撑。

1 管网数据模型与数据结构

空间数据模型是关于现实世界中空间实体及其相互问联系的概念,它为描述空间数据的组织和设计空间数据库模式提供基本方法。管网空间数据模型是空间数据模型的一种,在管网数据的表达和管网空间分析等方面起着极其关键的作用。

1.1 城市地下管网数据特点

城市地下管网是城市基础设施中的生命线,有地下神经之称,包括给水管网、燃气管网、供热管网、排水管网、电力管网、排污管网和电信管网等。每一类管网都由管线段和附属设施组成,呈树状、环状或辐射状,形成一个系统,系统的各组成元件相互影响,共同发挥作用 。

首先,地下管 网数据是一种基本 网络 数据,满足网络的一般特性 ,其基本构成包括弧段和节点。节点包括管网点状实体和三类特征点,即管径变化点、埋深变化点和管网交点,弧段表示相邻节点问的管线段 。其次 ,地下管网数据有区别于一般网络数据的特殊性。地下管网数据包括两种基本类型:树状管网和环状管 网。树状管网大多是重力管网,其弧段都是单向弧段,方向取决于起始节点的高程值,如排水管网就属于这类管网。而燃气、给水等压力管线在设计时为了尽可能减少事故造成的影响,大多采用环状设计,同时大、中城市的燃气、给水等管网都采用多个源头,使得这些管线呈多源环状分布。

1.2 系统概念模型设计

概念模型反映了城市地下管网所包含的各部分数据之间的关系。根据分层概念和管网数据的特点,设计了城市地下管网的概念模型,如图1所示。

在该模型中,首先将城市分成多个城区,每个城区的信息又分成基本框架信息和管网信息两部分。管网信息包含给水管网层、燃气管网层、供热管网层、排水管网层、电力管网层、排污管网层和电信管网层等 7个层。每层包含点状实体和特征点、线状实体两类数据。实体和特征点由节点和指明节点特征的标记组成,点由几何坐标定位;线状实体类由弧段和指明弧段特征的标记组成,弧段由一系列坐标点描述。基本框架信息反映了城市基本面貌,由点状、线状和面状三类实体组成。该模型中所有实体都有区别于其他实体的属性特征。

1.3 地下管网数据存储结构

在空间数据库中,空间数据的表达方法主要有栅格数据结构、矢量数据结构和栅格矢量一体化结构等。

1.3.1 栅格数据结构

栅格模型由规则的正方形或矩形栅格组成,每个栅格代表 1个像元。栅格数据结构实际上就是像元阵列,像元由行列号确定它的位置。点状实体在栅格数据结构中表示为 1个像元;线状实体则由在一定方向上连接成串的相邻像元集合;面状实体表示为聚合在一起的相邻像元集合。栅格数据有数据结构简单、空间数据的叠加和组合方便、各类空间分析易于进行以及模拟方便等优点,但同时存在着图形数据量大、数据精度低、地图输出不精美以及难以建立网络连接关系等缺点。

1.3.2 矢量数据结构

矢量数据结构用点串序列来表示空间实体的边界形状和分布。点状实体在矢量数据结构中表示为坐标;线状实体则由线上的一系列点的坐标表示;面状实体由面的边界弧段序列表示。矢量数据的优点是数据精度高、数据量小、完整的描述拓扑关系、图形美观以及图形数据的恢复、更新、综合容易实现等,但也有数据结构复杂、矢量多边形叠置算法和数学模拟困难的缺点。

1.3.3 栅矢融合与地图配准

作为管网系统的基础底图,考虑能充分利用矢量图画面精美、无级缩放的优势,同时利用栅格图更新速度快、能反映城市最新风貌的特点。解决方法是:将手头现有的矢量地图作为建立管网专题图层(矢量图)的基础,并设法将栅格图与矢量底图进行配准,从而有效结合两者的优点。

管网系统的专题数据建立在矢量 电子 地图基础上,而矢量图的修改相当困难。当城市风貌发生变化时,为反映管网相对于新的参照物的位置,设想利用栅格图与当前管网进行比较;而比较的前提则是首先将栅格图与矢量图进行配准。

栅格图配准时存在 3个问题:比例尺的配准、投影的配准、坐标的配准。考虑到本系统中匹配要求不太严格,经多次实验发现,如果选择的栅格图所包含的实际区域越小.那么矢量和栅格叠加的越精确。由此得到启发,是否可以将整个栅格图分成小块(不妨将分得的每 1块栅格图称为栅格图块)去配准,配准后将其作为 1个图层保存,当所有的栅格图块都配准后,在显示栅格图时,选择所有的栅格图块,那么就得到了一幅完整的、能够和矢量图准确匹配的栅格图。具体步骤如下:

1)在制图软件 中将栅格图平均分割成 m 块(实际上 m 的大小代表 了配准的精度,m 越大,则精度越高),并分别保存 ;

2)对每一栅格图块在 mapx环境中进行匹配控制点至少选择 2o个;

3)在 mapx环境中显示所有的栅格图块,看整幅图与矢量图叠加的效果 。

在分割的栅格 图全部显示时,两两相邻的栅格图块有可能会出现拼接不上的问题,比如 1条河流在拼接后不能衔接上、建筑物在拼接后出现错位现象、延续的道路有可能变为两条道路。可以采取以下两种方法解决栅格图块的拼接问题:

1)增加栅格图块的个数。通过多次实践发现,如果栅格图分割的栅格图块越少,则上述问题会越严重,如果分割的栅格图块越多,拼接不上的程度会有所减少 ;如果对栅格的精度要求不太严格的话,可以忽略不计 。其次 ,如果道路或建筑物改变不多或知道其大体的区域,则可利用其它画图工具,直接分出包含这个 区域的最小的栅格图块,只要配准所有分割的栅格 图块即可。这时精度的问题已经转化为配准的问题 。

2)选择特殊控制点。选择栅格图块的 4个顶点作为其 中一部分控制点及其图块中心的点,则两两相邻的栅格图块之间至少有 2个相同的控制点。在显示栅格 图块时,就会产生一幅完整的栅格图。本课题将 以上两种方法结合使用,以获得更好的效果。

2 地下管网的可视化

管网的可视化就是将存入计算机中的数据通过某种方式变成能看到的图片或者是界面。而空间数据坐标系定义 是可视化地理信息系统(gis)的基础 ,正确定义 gis系统的坐标系非常重要。

2.1 地图坐标系及投影

gis中的坐标系定义 由基准面和地 图投影两组参数确定,而基准面的定义则由特定椭球体及其对应的转换参数确定,因此,欲正确定义 gis系统坐标系,首先必须弄清地球椭球体(ellipsoid)、大地基准面(datum)及地 图投影(projection)三者的基本概念及它们之间的关系。

基准面是利用特定椭球体对特定地区地球表面的逼近,因此,每个国家或地区均有各自的基准面,通常称谓的北京 54坐标系、西安 80坐标系实际上指的是我国的两个大地基准面。wgs 1984基准面采用 wgs84椭球体,它是地心坐标系,即以地心作为椭球体中心,目前 gps测量数据多以 wgs 1984基准。

椭球体与基准面之间的关系是一对多的关系,也就是基准面是在椭球体基础上建立的,但椭球体不能代表基准面,但能定义不同的基准面。 地图投影是将地图从球面转换到平面的数学变换,例如某点北京 54坐标值为 x一4 231 898,y一21 655 933,实际上指的是北京 54基准面下的投影坐标,也就是北京 54基准面下的经纬度坐标在直角平面坐标上的投影结果。

根据空间解析几何, 参考 坐标系点(x,y,z )向世界坐标系坐标(x,y,z)的转换方程为

式中:a、 、y为两坐标系相应坐标轴的夹角;(x。y。z)为参考坐标系原点在世界坐标系中的坐标。

2.2 三维数据的显示及 l0d模型

三维显示通常采用截面图、等距平面、多层平面和立体块状图等多种表现形式,大多数三维显示技术局限于 crt屏幕和绘图纸的二维表现形式,人们可以观察到地理现象的三维形状,但不能将它们作为离散的实体进行分析,如立体不能被测量、拉伸、改变形状或组合。为了提高场景的显示速度,实现实时交互,在实际的三维显示中常常采用降低场景复杂度的方法,从 计算 机硬件绘制的角度考虑,即减少每帧数中绘制的图元对象的数目。其中细节层次模型(l0d)的方法具有普遍性和高效性,在飞行模拟和地形仿真应用中得到了广泛的应用。所谓的l0d模型是指根据不同的显示对同一对象采用不同精度的几何描述,物体的细节程度越高,则数据量越大,描述越精细 ;细节程度越低 ,则数据量越小,描述越粗糙。因此,可以根据不同的显示需求,对需要绘制的对象采用不同的描述精度,从而大大地降低需要绘制的数据量,使实时三维显示成为可能。

在场景的实时动态显示中,当视点距离某一物体很近时,它的图像将在屏幕上占据较多的像素,而当视点距离它很远时,图像只能在屏幕上占据很少的像素。在这种情况下,可以用多种不同的精度表示,并根据视点位置的变化或者物体图像在屏幕上所占据的像素数多少而选择不同精度的模型予以成像,这是非常有效的手段。这种方法通常称为层次细节 (1evel of details,lod)显示和简化技术。

lod模型是对原始几何模型按照一定的算法进行简化后模型的一种总称。简化后的模型在几何数量上比原始的几何模型的数据量减少了很多,降低了对计算机软件和硬件设备的需求,从而提高了数据操纵 的速度,缩短了人机交互操作的时间,因此,在图像的渲染速度上会有很大的提高。lod模型的种类在几何结构上大致分为以下 3种类型:不连续的 lod模型;连续的 lod模型;几何结构自身的 i od模型,如图2所示。

2.3 漫游过程中的实时处理

在三维地下管网系统研究方面,使用地形 lod模型和 r—tree空间索引技术对大量的三维数据进行实时漫游研究,取得一定进展。但是在数据的状态交换、高速的内存交换机制、空问索引技术方面还有待进一步研究和提高。由于地下管网数据量比较大 ,很难实现实时漫游,因此,实时绘制出相应的结果成为一个主要瓶颈。针对地下管网地理信息系统在漫游过程中实现绘制的这一特殊性,实时加速方法主要通过使用改进的平行投影技术、空间跳跃重采样、相邻帧间的连贯性关系三种方法来实现。 通过一组平行投射线而得到的形体投影称平行投影 。平行投影又可根据投射线与投影面垂直与否分为平行正投影和平行斜投影。

使用光线投射技术,在沿视点投射出的光线上进行重采样时,有许多空体素,使用改进的空问跳跃(space--leaping)技术可以跳过这些空体素,以加快绘制速度 。

在漫游过程中,由于相邻的两个视点位置和视线方向变化较小,相邻帧的场景大部分是相同的,只有少部分不同,因此,可以利用相邻帧的这种连贯性关系实现实时处理。

基于相邻帧的连贯性,提出了一种两步实时处理技术 ;将当前帧的处理分成两步:近景和远景的处理。近景的处理利用改进的两阶段光线投射技术,远景的处理利用改进的加速对象投影处理远视点区域,并考虑了相邻帧的连贯性,相邻帧场景变化在一定范围内近视点场景重新计算,其余部分利用上一帧的结果进行处理,然后再重新合成。

使用 opengi 的双缓存技术可以实现部分漫游功能。该技术使用两个前后台和两个缓存绘制画面。在显示前台缓存内容中的一帧画面时,后台缓存正在绘制下一帧画面;当后台缓存绘制完毕,后台缓存内容便显示在屏幕上,而前台此时又在绘制下一帧画面内容,如此循环反复,屏幕上总是显示己经画好的图形,看起来所有的画面都是连续的。

3 结束语

三维可视化技术使传统二维的、静态的地图向三维的、动态的场景表示方向 发展 ,在空间关系型数据库的支持下利用可虚拟现实技术不仅可以对空间对象进行全方位的交互,而且可以对其中的空间对象进行数据挖掘,探索其中隐含的逻辑 规律 ,对未来状况进行预测,并制订出合理、可行的解决方案等。

通过对地下管网一系列问题的研究,主要解决以下几个问题 :

1)针对管线的布置特点和数据特点,设计合理的数据模型和数据结构,建立管线空间数据库,充分表现管线间的空间拓扑关系。

2)在对管线数据进行入库后,对管线数据进行三维显示的可视化研究。

3)使用 opengl的双缓存技术实现地下管线漫游查询功能。

参考 文献

[1]肖絮飞.城市地下管线数字化流程[j].北京测绘 ,2004(1):37—39.

[2]李鸿雁.依托信息技术创建长治市综合地下管线动态管理模式的成功实践[j].城建档案 ,2006(4):26-27.

[3]田湘平.城市地下管线档案动态管理的设想[j].黑龙江科技信息,2008(2):22—23.

[4]卢丹.地下管网地理信息系统通用模型的设计与实现[d].哈尔滨:哈尔滨工程大学,2003.

[5]华建源.地下管网信息系统中的数据存储性能改善技术探讨[j].地矿测绘,2005,21(3):42—44.

[6]张玉洁.地下管网综合管理系统的设计与实现[d].大连:大连理工大学,2003.