首页 > 文章中心 > 编码技术论文

编码技术论文

编码技术论文

编码技术论文范文第1篇

论文关键词:视频编码,压缩技术

 

一、引言

所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。视频压缩发展到现在己有几十年的历史。1948年,Oliver提出了第一个编码理论脉冲编码调制(PulseCodingModulation,简称PCM);同年,Shannon的经典论文“通信的数学原理”首次提出了信息率失真函数的概念;1959年,Shannon进一步确立了码率失真理论;而Berger在1971年所著的《信息率失真理论》一书则对率失真理论做了系统地论述和扩展;以上各项工作奠定了信息编码的理论基础。

二、AVS基本介绍

AVS是基于我国创新技术和部分公开技术的自主标准,技术方案简洁,芯片实现复杂度低,达到了第二代标准的最高水平;而且,AVS通过简洁的一站式许可政策,是开放式制订的国家、国际标准,易于推广;此外,AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案。综上所述,AVS可称第二代信源标准的上选。

图1AVS视频编码器框图

三、AVS主要技术

AVS采用的主要技术包括:8x8整数变换量化技术、帧内预测、半像素与1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等:

1.整数变换量化:AVS为了避开H.264的专利问题,选择了以往标准广泛采用的8×8变换,这样可以在16位处理器上无失配地实现。AVS采用的64级量化,可以完全适应不同的应用和业务对码率和质量的要求。目前AVS所采用的8x8变换与量化方案大大降低了芯片的实现难度。

2.帧内预测:AVS采用的帧内预测技术,是用相邻块的像素预测当前块,同时采用代表空间域纹理方向的多种预测模式。AVS亮度和色度帧内预测都是以8x8块为单位的。亮度块采用5种预测模式,色度块采用4种预测模式,而这4种模式中有3种和亮度块的预测模式相同。在编码质量相当的前提下,AVS采用较少的预测模式,使方案更加简洁、实现的复杂度大为降低。

3.帧间预测运动补偿:帧间运动补偿编码是混合编码技术框架中最重要的部分之一。AVS标准采用了16×16,16×8,8×16和8×84种用于运动补偿的宏块模式,去除了MPEG-4AVC/H.264标准中的8×4,4×8,4×4的块模式,这样可以更好地刻画物体运动,提高运动搜索的准确性。

4.半像素与1/4精度像素插值:AVS通过4抽头滤波器(-1,5,5,-1)得到半像素点,再通过4抽头滤波器(1,7,7,1)和均值滤波器得到1/4像素点,在不降低性能的情况下减少插值所需要的参考像素点,减小了数据存取带宽需求,这在高分辨率视频压缩应用中是非常有意义的。

5.预测模式:AVS的B帧双向预测使用了直接模式、对称模式和跳跃模式。使用对称模式时,码流只需要传送前向运动矢量,后向运动矢量可由前向运动矢量导出,从而节省后向运动矢量的编码开销;对于直接模式,前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量按比例分配导出,因此也可以节省运动矢量的编码开销;跳跃模式的运动矢量导出方法和直接模式的相同,跳跃模式编码块都不编码运动补偿的残差,也不传送运动矢量,即该模式下宏块只需要传输模式信号则可。

6.二维熵编码:AVS熵编码采用自适应变长编码技术。在AVS熵编码过程中,定长码用来编码具有均匀分布的语法元素,指数哥伦布码用以编码可变概率分布的语法元素。采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码字,无需查表;另一方面,它可以根据编码元素的概率分布灵活确定k阶指数哥伦布码编码,如果k选得恰当,编码效率可以逼近信息熵。预测残差的块变换系数后,经扫描形成(level、run)对串,level、run不是独立事件,而存在很强的相关性,在AVS中level、run采用二维联合编码,并根据当前level、run的不同概率分布趋势,自适应改变指数哥伦布码的阶数。

四、总结与展望

目前AVS技术可实现标准清晰度、相当清晰度、低清晰度等不同格式视频的压缩,但针对此类应用的压缩效率还有待不断提高,这应当是AVS视频技术进一步发展的重点所在:着力AVS编解码的实际应用研究,优化AVS运动搜索算法,提高AVS解码速度,从而推动我国数字音视频标准AVS的推广和应用。

参考文献

1 陈亮 AVS先进编码技术研究 华中科技大学 2006

2 申青平 AVS-M关键技术及多平台应用研究 湘潭大学 2007

编码技术论文范文第2篇

近些年来对无线通信技术领域的研究越来越多,这些技术在地空通信中逐渐成为热点。LDPC码是一种线性的分组码,它是基于稀疏校验矩阵的。本论文简要介绍了LDPC码的编码算法和译码算法,以及在地空通信中的应用。

【关键词】 LDPC码 地空通信 编码

1 LDPC码简介

1.1 提出LDPC码的背景

卫星通信技术发展越来越成熟,最近研发的卫星通信技术能够通过空间卫星进行地空通信。LDPC码是其中非常重要的一环,这是因为LDPC码具有强大的纠错能力,具有很低的复杂度等。

LDPC码具有很强的纠错能力,同时还具有低复杂度的快速译码算法和比较好的特性结构,所以在最新的带宽无线多媒体的通信系统中,LDPC码成为了能够传播高质量的通信以及视频信号的关键性技术。同时LDPC码已经广泛被欧洲等国家的卫星使用。

1.2 LDPC码的基本概念

LDPC码的全称为低密度奇偶校验,1960年后Gallager第一次提出这个概念。LDPC码是一种线性的分组码,它是基于稀疏校验矩阵的。LDPC码的编码是一种随机码。由于当时的技术和条件都十分落后,LDPC码并没有广泛应用于实际当中。后来人们发现了Turbo码,但是Turbo码在本质上就是LDPC码。LDPC码的纠错性能十分优异,近些年来越来越受到人们的重视。

LDPC码的译码采用软判决的置信传播迭代译码算法。正是由于这个原因,LDPC码在给定误码率的情况下,信息的传输速率和Shannon限很接近。在某种程度上,LDPC码的纠错性比Turbo码强出了很多很多。我们都知道,译码的复杂度与码长有关,而且是线性的关系。要想实现长编码分组的应用,就必须克服分组码在长码的时候译码的计算量问题。

2 DVB-S2标准的前向纠错系统

LDPC码的编译方法有许多,本论文简要介绍一下介绍LDPC码的DVB-S2标准编译码方法。

第一代DVB标准是1994年提出来的,它采用RS码,QPSK调制和级联卷积码的方式。但是伴随VLSI技术的发展,就出现了更高效率的编码方式。DVB-S2项目组的目标旨在带宽和功率不增加的情况下,增加百分之30的传输量。

DVB-S2标准主要由三个部分组成:BCH(前向纠错系统由外编码)、LDPC(内编码)和比特交织。同时输入流包括BBFRAMES(基本比特帧)和FECFRAMES(外流前向纠错帧)。FEC系统处理完每个BBFRAME(kbch位)之后,都会产生一个FEC-FRAME(nldpc)。系统BCH外码的奇偶校验比特(BCHFEC)被加到BBFRAME,LDPC内码的奇偶校验比特被加到BCHFEC后面。

3 LDPC码的算法

3.1 LDPC码编码算法

传统的规则LDPC码的编码主要可以分为四步,分别如下。其框图如图1所示,编码步骤如下:

(1)明确规则LDPC码的H矩阵的列重和行重。

(2)构造LDPC码的H矩阵。

(3)将校验矩阵H转换成系统形式。

(4)根据线性分组码系统形式的校验矩阵与生成矩阵之间的关系得到相应的生成矩阵G,编码生成的码字为C=uG。

3.2 LDPC码的译码算法

LDPC码有很多种译码方式,常见的译码方式主要有:加权比特翻转译码、比特翻转译码、大数逻辑译码、后验概率译码以及和积算法译码等。本论文简要介绍和积算法。

所谓和积算法,就是一种迭代译码算法,它的传播是基于置信度的。下一次迭代的输入,是上一次译码结束时可靠度量度的计算结果。直到达到了某个特定的条件后,译码的迭代过程才会停止,进而系统会作出硬判决。

4 我国的LDPC码在将来地空通信中的应用

地空通信具有许多特点,比如信号的能量衰减比较严重,信息的传输延时比较大等等。因此必须采取特殊的方法,才能够保证信息传输时的可靠性。地空通信信道对于信道编码是一种理想的信道。

(1)地空通信信道和无记忆的高斯信道很相似,都是Shannon编码理论的信道模型。

(2)地空通信信道可以使用很低的频带利用率的编码和二进制调制方案,因为地空通信信道具有很丰富的带宽。

(3)由于地空通信中传输距离非常远,信号的能量衰减比较多,所以采用的都是低码速率通信。

以前地空通信使用的都是Turbo码。Turbo码具有很多优点,比如误码性能很好,但是仍然存在着误码平台。相对于Turbo码,LDPC码更适合作为地空通信的信道编码,这是因为LDPC码具有很低的译码复杂度、更低的误码平台以及更大的吞吐量。要想设计出更加适合于地空通信的LDPC码,还需要考虑到功耗效率、编码器和译码器的结构以及复杂度等等。作为一种重要的信道编码,LDPC码必将会在地空通信中发挥重要的作用。

5 总结

近些年来对无线通信技术领域的研究越来越多,这些技术在地空通信中逐渐成为热点。LDPC码是一种线性的分组码,它是基于稀疏校验矩阵的。本论文简要介绍了LDPC码的编码算法和译码算法,以及在地空通信中的应用。

参考文献

[1]曾蓉,梁钊.低密度校验LDPC码的构造及编码[J].重庆邮电学院学报(自然科学版),2005,17(3):316-319.

[2]张长帅,宋黎定,刘泳.LDPC码在深空通信中的应用技术研究[J].航天器工程,2007,16(3):90-92.

[3]翟政安,罗伦,时信华.深空通信信道编码技术研究[J].飞行器测控学报,2006,25(2):59-61.

编码技术论文范文第3篇

关键词:多视点视频 差错控制技术 视频编码

中图分类号:TN919.81 文献标识码:A 文章编号:1007-9416(2013)02-0027-02

随着高科技的发展,电子数码技术得到高速发展,多视点视频为人们提供了更加真实和自然的视觉感觉,虽然成本价格高,但还是受到人们的青睐。多视点视频的目的是为了得到更好的时评效果,就需要在不同的视点,从不同的角度对同一场景,利用多个摄像机拍摄,这样得到的影像,就可以得到一组视频信号,这样的视频信号与传统的视频信号不同,它可以更加如实地再现场景,为观者了一个具有立体感和交互功能的视频影像,我们把这种视频称作3D 视频。在三维视频拍摄时,为了避免信息冗余差值。大都采用的是利用时间预测,空间预测和视点间的预测方法来进行防治。但这样并不能解决三维视频编码的差错问题,因为目前异构性网络还具有时变和易错等不利因素,这些因素会影响增加冗余。这些不利因素可以导致编码三维视频流对信道差错的出现。因此,只有利用对三维视频传输进行差错的控制技术,这样才能够保证三维视频编码的准确,对三维视频得效果评价就显得尤为重要。

1 多视点视频编码的现状

MPEG早于2001年专门成立了关于三维视频方面的技术研究部门,他们把研究对准3DAV的典型应用场景和标准化内容。2003年7月就提出了3DAV的需求和应用前景。在2004年受到影视业的使用,开始对多视点视频编码进行标准化的工作。到2005年开始利用MVC的编码方案,验证了MVC标准化的必要性和可行性。MVC的研究最初为了视频标准化,MVC模式是英文缩写符号,表示:模式-视图-控制器”由这三个部分组成。对MVC研究已经成为视频编码的重点。近年来,国内外相关的研究者对MVC技术的理论研究和具体应用举办过多次专题研讨,学者们发表了许多关于MVC的研究论文,在这些论文中包括对MVC的预测结构研究,对MVC的多视点视频的运动和视差补偿技术的发展和应用,对多视点视频编码的视点图像插值和颜色的校正等。我国的许多学者也对三维视频研究领域发表了许多论文,积极地开始了对MVC的研究工作,这些研究工作主要针对三维视频编码方案的设计、对视频效果颜色的校正和对画面感官视差的估计控制等方面。

2 多视点视频编码的结构

三维视频编码与单视点视频相比,其差别是很大的,从多视点视频的数据量来比较,由于三维视频编码需要多台摄像机拍摄,由于三维视频编码的数目呈线性增长。因此巨大的数据量就成为制约三维视频广泛应用的瓶颈,有研究者提出了多视点视频编码的概念。其目的主要对多视点视频进行高效压缩编码,这是提高视频通信领域质量的技术,利用视频编码应用于任意视点视频的同步拍摄,得到清晰的图像。图1就是利用多视点视频拍摄的场景和Exit序列示例。

多视点视频编码体系结构如图2所示,在这个图示中,其核心模块包括多视点视频的编码、存储/传输和解码。由摄像机阵列拍摄的N个视点的视频并行输入到MVC编码器,经编码后生成单个码进行存储或传输,解码端对输入码流进行解码后就可以恢复出多视点视频。

3 多视点视频的差错控制技术

多视点视频的差错控制技术,是为了接收数据完整性和准确的数据,这样才能够保证视频的设计结果。因为实际视屏效果总会存在这样或那样的不足。这里面的原因很多,但其实质还是由于大量的视频数据,在传输过程中可能变得紊乱或丢失。为了不使这些错误的信息丢失,就利用发送端的调制解调器对即将发送的数据执行数学运算,并将运算结果连同数据一起发送出去,接收数据的调制解调器对它接收到的数据执行同样的运算,并将两个结果进行比较。如果数据在传输过程中被破坏,则两个结果就不一致,接收数据的调制解调器就可以使对方重新发送数据。

3.1 基于分层 B 帧结构的差错控制技术

三维视频编码是根据分层B预测结构的特点,2008年Ulrich Fecker提出将三维度视频频率的处理方法是利用选择性外插算法,这种方法是将这种技术应用到多视点视频之中,它的提出适合对多视频的误码处理,利用它可以掩盖四维度频率选择性外插算法出现的问题,因为这种算法,是利用丢失宏块周围正确接收的宏块数据的一种方式,可以迅速把同一视点时域上的前后帧视频序列信息进行恢复,也可以将邻近视点的信息进行恢复,但这种方法操作程序复杂,因为要利用这种算法进行操作,需要构造一个四维正交函数,同时当使用这个算法时,由于它的复杂度较高,在实际应用时不适合实时的解码的应用。也有学者针对多视点视频中的整帧丢失问题,提出帧相似度的概念,利用这个概念,当帧相似度在不同状况时可采取相应措施对其修复,当帧相似度高于某个阀值时,也可以采用空域中参考帧,重新对视频影像丢失帧进行整帧拷贝;当帧的相似度低于某个阀值时,也可采用时域中的整帧拷贝。上述技术可以解决分层B 帧结构的差错。

3.2 基于双目预测结构的误码掩盖技术

三维视频编码的另一种结构,称为双目预测结构,这种机构是立体视频,立体视频编码可以采用传统的块基编码方法,虽然在实际应用时,块基编码来讲算法简单、稳健性高,易于硬件实现,但由于这种方法会出现块效应,如果在低比特率下重建,得到的图像主观视觉效果会很不理想。随着计算机技术的发展,基于对象的编码方法近年来引起研究者的关注,块基编码已成为替代编码方法。该编码方法能减少编码错误,有较好的视觉效果,能对场景进行结构性描述,使视觉效果更好。

在三维视频编码的立体视频中,有左、右两个试点构成,其中左视点使用运动补偿预测消除时间域上的数据冗余,右视点采用运动信息补偿来消除时域和视点间的冗余。有的研究者提出,基于互查误码恢复准则,在时域误码掩盖以及视点间的误码掩盖算法中选择一种最佳的误码掩盖算法对丢失宏块进行恢复,其中视点间的误码掩盖算法是利用了可见评判绘制工具,从左右视点中得到的正确解码的图像数据与深度数据来绘制整个丢失的彩色信息帧。

4 多视点视频联合编码方案(JMVC )

多视点视频联合编码方案,它是由MPEG和VCEG的JVT团队推出的参考编码方案,对MPEG来讲,它是运动图像压缩算法的国际标准,这一方法受到广泛的应用,现在这一方法已被许多的计算机平台支持。它的应用广泛,几乎包括MPEG-1,MPEG-2和MPEG-4的广泛应用。例如,MPEG-1已经被广泛地应用在VCD的制作,绝大多数的VCD的制作,大都采用MPEG-1格式压缩。而MPEG-2大都应用在DVD、HDTV(高清晰电视广播)和一些高要求的视频编辑、处理方面。MPEG-4是一种新的压缩算法,使用这种算法的ASF格式可以把一部120min长的电影压缩到300M左右的视频流,可供在网上观看。

利用CVS软件获取最新版本JMVC软件。输入配置后,点击获得模块列表,从中选择“JMVC”模块。对于JMVC的运行平台,可在 Windows和linux两种平台上运行。在Windows平台的相应工程文件在目录JMVC\H264Extension\build下包含一个 H264AVCVideoEncDec.sln工程,即JMVC的工程文件,用Microsoft Visual 的编译器打开。该目录下包含一个VC6的工程文件H264AVCVideoEncDec.dsw,但该版本未经更新,不建议使用。

5 结语

多视点视频使人们喜欢的真实和自然的视觉感觉,因此提高多视点视频的质量,利用高科技手段发现和解决多视点视频编码的错误,对多视点视频的提高具有重要的历史意义。因此,在多视点视频编码中,利用高效率的压缩编码技术,不仅可以去除大量的信息冗余,而且可以修复由于网络拥塞等丢包后果的修复变得简单易得,显然,差错控制技术的提高发展和应用显得愈发重要。当然,至今,多视点视频编码技术还在发展中,对其易发错误的研究还较少,相信未来对视点视频的发展一定会得到丰厚的回报。

参考文献

[1]杨文成,郁梅,傅松寅,李福翠 等.多视点视频编码中的码率控制技术研究[J].二届亚太地区信息论学术会议论文集.国际会议,211-11-04.

[2]羊飞帆.视点视频编码方案及其差错控制技术的研究[J].科技传播.2012-11-23.

[3]邓智玭,贾克斌,陈锐霖 等.多视点视频编码中的运动和视差估计快速算法[J].北京工业大学学报.2011-05-15.

编码技术论文范文第4篇

关键词:中文信息处理关键技术检索

中图分类号:TP391.1 文献标识码:A 文章编号:1007-9416(2015)07-0000-00

随着人们各项需求不断提升,信息处理技术得到长足发展,产生多种有效信息处理关键技术,这些关键技术改进了基于概率统计的属性选择算法,改进了词语间依存关系的定量识别,提出具有增量学习能力以及信息分类法以及基于子空间的信息聚类算法等,这下关键技术给信息处理带来极大便利。

1 中文信息处理的难点

从全世界范围来看,汉语是一种相对独立的语言,无论语言结构上还是文字上都与其他语言存在天壤之别。汉字是一种综合性文字,集合了匈奴、鲜卑、突厥、契丹、满、蒙古、梵语灯多种文字,由此造就中文以下特点:

(1)中文完全由象形文字演变而来,是当今方块字的主流。

(2)汉字以单个汉字为基本单元,词语之间并不存在明显分隔符,也不存在明显的形态标记。因此中文信息处理中一大难题就是中文分词,即在进行中文信息处理过程中会出现一定错误率,降低了信息处理效果。

(3)中文处理结构较为松散,在对同一句子处理过程中可能得出不同结论。

(4)汉语语法具有较强灵活性,句子本意处了语序关系外还与需靠意合和虚词。

当前大多自然语言处理均通过英文为研究对象发展而来,因此英语在世界范围内更具通用性。中文无论在发音、文字、语法、语义等多个方面均与英文存在较大差异,因此中文信息处理无法将英文信息处理方式照搬过来,甚至在形式上都难以模仿。从计算机模型角度来说,汉语是其中不够发达的语言,因此对中文信息处理带来巨大挑战和压力。

2 中文信息处理需求

随着信息大爆炸时代的到来,信息量呈现数量级增加趋势,各种信息不断丰富,这也信息获取过程更加高效便捷,必须对信息处理方式进行研究,尤其是研究高效准确的信息处理算法。通过科学有效的信息处理办法促使人们在信息海洋中能够及时获取自己需要的信息。

信息处理方式设计多方面内容,主要有信息分类、信息摘要、信息聚类、信息索引、主题标注等等。当前中文信息处理已经开始深入探究并取得一定成效,并出现一些具有代表性关键技术,为中文信息处理提供有效平台。

3中文信息处理基础

中文信息处理主要指通过计算机程序语言对汉语进行存储、转换、加工、分析等,从某种意义上来说中文信息处理主要指一门利用计算机心理学、数学、科学、信息论、声学、控制论、智能化等多种计算机相关功能进行综合处理的边缘学科。

4 中文信息处理若干关键技术

4.1 汉字编码

汉字编码是汉字信息处理中最重要部分之一,也是中文信息处理过程的重要技术,当前中文信息处理中汉字编码是一个难题,从整个信息处理过程来看是薄弱环节,当前国内汉字编码方式不下于四百种,而实际能够运用于计算机的不超过五十中,这些汉字编码均通过键盘输入,主要有小键盘、中键盘、大键盘三种,就编码方式来看主要有拼音码、笔形码、字元码、影响结构的混合编码几种。(如图1)

拼音码在汉字编码研究初期便实现,但由于汉字存在大量多音字现象导致汉字检索重复率较高,给中文信息处理带来较大难度。

笔形码指将汉字通过笔画进行分类,将汉字与对应数码或英文字母,并按照一定组合原则生成汉字代码。如当前常用的五笔码就是笔形码之一。

字元码主要产生于字典查询汉字中的部首而来。当前人们常用键盘由于键盘数量有限,无法将所有字元都一一对应于键盘上,因此字元码采用分组方式,将若干字元分为一组,该组对应与某一按键上,因此便形成人们常说的二十六键、三十六键、六十键、九十键等几种原理相同的编码方案。汉字所包含的字元数各不相同,从一个到七八个不等。因此为节省存储空间提高输入速度需进行汉字字元码码长限制。

音形结合码主要是将汉字读音部分信息与汉字自行部分编码结合在一起,该种方式集合了汉字音码以及形码的有点,同时兼具音码以及形码的缺点。目前仍旧处于探究阶段。

汉字编码问题相当复杂,入门简单,深究却存在较大难度。

4.2 汉字信息的压缩存储技术

当前较为先进的汉字信息的压缩存储技术主要包括高密度点阵字模的压缩存储与再生技术,初除此之外还有汉字信息压缩迭加还原技术。我国中科院某学者研究成功的汉字信息的压缩存储技术E能够成功将汉字压缩至16K。

4.3 中文图书情报检索系统

相比于西方图书情报检索系统,我国在该方面起步较晚,目前虽然已经建立一些实验性图书情报检索系统,但针对中文这一特殊字体而言系统性不足。随着人们需求不断增加,中文信息处理技术处于不断完善中,我国在中文图书情报检索系统实验研究阶段取得一定成绩。目前已经可以进行各项资料联机处理实验,南京某科研所已经使得科技档案管理系统具有四种检索功能,分别为顺序号、档案号、标题、课题。当前图书馆中方图书情报检索系统仍旧存在一定不足,需要进一步完善发展。(如图2)

4.4 中文信息处理的发展动向

中文信息处理技术在过去一段时间获得长足发展,已经能够满足人们对中文信息处理基本需求,从长远角度来看为更进一步促进中文信息发展必须度仍旧存在的问题进行深入分析探讨,并未中文信息处理技术提供发展方向。

由于中文具有一定识别难度,若强行提升中文识别度具有一定难度,也难以推广,因此可以将中文翻译为英文,即中英文自动翻译技术。

未来中文信息处理输入方式必将由手写输入改为更为便捷的语音输入,因此需研究汉语语音识别与合成技术。除此之外还有汉字印刷体自动识别技术等。

5 结语

随着科学技术不断发展,人们在工作、学习过程中需借助中文信息处理技术搜索自己需要的信息,基于人们需求不断增加,必须提升人们搜索资源的效率,提升中文信息处理相关技术,让中文信息处理与时俱进,满足人们实际需求,为社会发展提供助推力。

参考文献

[1]张一鸣. 中文信息处理关键技术[J].科技博览.2012(5):32-35.

[2]罗丽俊.中文信息处理中若干技术的研究与实现[J].计算机应用技术.2011(1):25-26.

编码技术论文范文第5篇

壹、前言

由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。

贰、WAVELET的历史起源

WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。

1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。

三、WAVELET影像压缩简介及基础理论介绍

一、WAVELET的压缩概念

WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。

WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。

WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。

以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。

二、影像压缩过程

原始图形资料色彩模式转换DCT转换量化器编码器编码结束

三、编码的基本要素有三点

(一)一种压缩/还原的转换可表现在影像上的。

(二)其转换的系数是可以量化的。

(三)其量化的系数是可以用函数编码的。

四、现有WAVELET影像压缩工具主要的部份

(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。

(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。

(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。

(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。

(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。

(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。

肆、WAVELET影像压缩未来的发展趋势

一、在其结构上加强完备性。

二、修改程式,使其可以处理不同模式比率的影像。

三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。

四、加强运算的能力,使其可支援更多的影像格式。

五、使用WAVELET转换藉由消除高频率资料增加速率。

六、增加多种的WAVELET。如:离散、零元树等。

七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。

八、增加8X8格的DCT模式,使其能做JPEG的压缩。

九、增加8X8格的DCT模式,使其能重叠。

十、增加trelliscoding。

十一、增加零元树。

现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。

伍、影像压缩研究的方向

1.输入装置如何捕捉真实的影像而将其数位化。

2.如何将数位化的影像资料转换成利於编码的资料型态。

3.如何控制解码影像的品质。

4.如何选择适当的编码法。

5.人的视觉系统对影像的反应机制。

小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。

陆、在印刷输出的应用

WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。

有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。

在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。

图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。

柒、结论

WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。

参考文献:

1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。

2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。

3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。

4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。

5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。

6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。

7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。

附录:

嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送

目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。

阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。

基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。

LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。“有”版权所

LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。

相关期刊更多

中兴通讯技术

统计源期刊 审核时间1-3个月

安徽出版集团有限责任公司

条码与信息系统

部级期刊 审核时间1个月内

国家市场监督管理总局

病毒学报

北大期刊 审核时间1-3个月

中国科学技术协会