首页 > 文章中心 > 关联矩阵法的基本原理

关联矩阵法的基本原理

关联矩阵法的基本原理

关联矩阵法的基本原理范文第1篇

关键词: 数据挖掘;矩阵;关联规则;Apriori算法;频繁项集

中图分类号:TP18

文献标识码:A文章编号:1672-8513(2010)05-0334-03

A New Algorithm Based on Matrix to Mine Frequent Item Sets

YANG Jing, ZHENG Zhongzhi,SONG Jinge,DUAN Peng

(School of Mathematic and Computer Science, Yunnan University of Nationalities, Kunming 650031, China)

Abstract: Apriori algorithm has been considered as a classic algorithm to mine frequent item sets. But its major defect is that the database has to be scanned many times, and there are a large number of candidate item sets in the result. So this algorithm is inefficient. This research proposes a new algorithm based on matrix to mine frequent item sets and it can help overcome such defect.

Key words: data mining; matrix; association rule; Apriori algorithm; frequent item set

关联规则挖掘是数据挖掘的一种[1-2],是描述在一个事件中不同的项之间同时出现的规律的知识模式,具体地针对一个事务数据库来说,关联规则就是通过量化的数据描述某种物品的出现对另一种物品的出现有多大的影响.

挖掘关联规则主要包含以下2个步骤.

步骤1:发现所有的频繁项集,根据定义,这些项集的频率至少应该等于(预先设置的)最小支持度;

步骤2:根据所获得的频繁项集,产生相应的强关联规则.根据定义这些规则必须满足最小信任度阈值.

此外还可利用有趣性度量标准来帮助挖掘有价值的关联规则知识.由于步骤2中的相应操作极为简单,因此挖掘关联规则的整个性能就是由步骤1中的操作处理所决定.因此,基本上所有关于挖掘关联规则的研究都围绕步骤1展开.

传统的挖掘频繁项集的经典算法是Apriori算法.但是随着研究的深入,它的缺点也暴露出来.Apriori算法有2个致命的性能瓶颈.

1)多次扫描事务数据库,需要很大的I/O负载.对每次k循环,候选集Ck中的每个元素都必须通过扫描数据库1次来验证其是否加入频繁项目集Lk.

2)可能产生庞大的候选集.由Lk-1产生k-候选集Ck是指数增长的.如此大的候选集对时间和主存空间都是一种挑战.

1 基于矩阵的频繁项集挖掘算法

随着研究的不断深入,各种挖掘频繁项目集的算法相继被提出,在文献[3]中作者的主要思想是将矩阵和向量内积结合使用,从而产生频繁项目集,进而挖掘出关联规则;在文献[4]中作者主要思想是在矩阵的基础上,分别统计各个商品的频数,然后计算其他商品相对于该商品的信任度,从而挖掘出事务数据库内的关联规则;而在文献[5]中作者利用矩阵对Apriori算法进行改进,从而避免多次扫描原始事务数据库.除此之外,还有许多其他的关于关联规则的方法被提出[6-8],在这就不一一介绍了.

本文提出了一种基于矩阵的频繁项集挖掘算法.与文献[3]中的方法相比,本文提出的方法更加简洁方便,求解过程中只用到矩阵中行之间的加法,实现程序也非常简单.

该算法的主要思想如下:

首先根据所要分析的事务数据定义1个矩阵,矩阵的每一行表示事务数据库中的每一条购买记录的购买情况,矩阵的每一列表示各种事物的被购买情况.矩阵中的元素只用0和1两个数表示,当矩阵中第i行,第j列的元素为0时,元素0表示第i条购物记录所对应的购物者没有购买j列所对应的商品;相反当矩阵中第i行,第j列的元素为1时,元素1表示第i条购物记录所对应的购物者购买了j列所对应的商品.

其次,由题设的最小支持度要求及数据库的大小计算出相应的最小支持计数,设该最小支持计数为n.

最后,根据以下提出的定理完成频繁项目集的挖掘.

定理 设由题设计算出的最小支持计数为n,则某一频繁项集中包含某一组商品的充要条件是由任意选取已知矩阵中的n个行相加而得到的所有一维数组集中必存在1个一维数组使得该组商品对应该一维数组的分量都为n.

证明 充分性的证明:若任选n个行相加得到的所有的一维数组集中存在1个一维数组使得某组商品对应分量都为n,由于矩阵只由0和1构成,则在原矩阵中必存在n个行使得这n个行对应这组商品的分量的值都为1,即这n条记录所对应的购买者都买了这组商品,那么这组商品也就满足了最小支持计数要求,则频繁项集中必包含这组商品.

必要性的证明:若某一频繁项集中包含某一组商品,也就是说这组商品同时被购买的次数大于或等于要求的最小支持计数n,即在原矩阵中存在m(m>n)个行,使得这些行对应该组商品的分量的值都为1,在这m行里选取n个行相加得到1个一维数组,该一维数组所对应这组商品的分量也就都为n.定理证明完毕.

本文算法的具体描述:

输入:事务数据;

输出:该事务数据的频繁项集;

步骤1:用布尔矩阵A表示事务数据库中的数据;

步骤2:根据数据库大小及最小支持度要求计算出相应的最小支持计数n;

步骤3:计算出由任意选取已知矩阵中的n个行相加而得到的所有的一维数组集;

步骤4:扫描由步骤3得到的所有一维数组,并由这些数组得出所有的频繁项集.

2 本文算法的运用

本例题基于某商场的日常销售事务数据库,数据库中有9条数据记录.这9条记录分别是T1=[A B E],T2=[B D],T3=[B C],T4=[A B D],T5=[A C],T6=[B C],T7=[A C],T8=[A B C E],T9=[A B C].上面9条数据中中括号内的大写字母A,B,C,D,E分别表示5种商品,放在同一个中括号内的字母表示被某顾客同时购买的物品.假定最小支持计数为2.要求:求出该数据库的频繁项目集.

这里先把这9条数据转化为一个9×5的矩阵,矩阵的行分别表示9个事务,矩阵的列依次表示A,B,C,D,E这5种商品被购买情况,根据上面介绍的算法思想,该事务数据库中的数据就可以用如下的一个9×5的矩阵表示:

基于上述理论,我们可以把该矩阵中9个行两两相加,这里有36种可能结果,也就是有36个一维数组构成结果,然后对这36个一维数组进行逐个检查以确定符合要求的频繁项集.例如把原矩阵的第1行和第2行相加便得到如下s矩阵的第1行,根据此行便得知[B]为频繁1-项集;把原矩阵的第1行和第3行相加便得到如下s矩阵的第2行,根据此行也可得知[B]为频繁1-项集;把原矩阵的第1行和第4行相加便得到如下s矩阵的第3行,根据此行就可得知[A B]为频繁2-项集,[A],[B]均为频繁1-项集.把原矩阵中9个行两两相加,得到的结果矩阵s如下所示:

由于矩阵s的各列均含有元素为2,所以[A],[B],[C],[D],[E]均为频繁1-项集,而所有行都没有出现4个或4个以上的2,说明该数据库没有频繁4-项集,也没有频繁5-项集.第7行和第36行出现了3个2,说明该数据库有2个频繁3-项集,分别为[A B C]和[A B E].由Apriori性质[1]可知,[A B C]和[A B E]的2-项子集都是频繁2-项集,所以[A B],[B C],[A C],[A E],[B E]均为频繁2-项集,除此之外,扫描矩阵s发现第10行有两个2,即[B D]也为频繁2-项集.

由分析可知,此事务数据库的

频繁1-项集为:[A],[B],[C],[D],[E];

频繁2-项集为:[A B],[B C],[A C],[A E],[B E],[B D];

频繁3-项集为:[A B C],[A B E].

以上便是基于矩阵的频繁项集挖掘算法具体思想及应用.

如果对这个例题用Apriori算法求解,由于结果中存在13个频繁项集,因此至少需要扫描事务数据库13次,并且在求解过程中需要用大量的连接操作去产生候选频繁项集,产生的候选频繁项集会占用大量的内存空间,在产生候选频繁项集后还需多次使用Apriori性质对这些候选频繁项集进行判断.相比而言,运用本文提出的算法求解就会简单得多,只需扫描事务数据库1次,不需产生候选频繁项集,节省了内存空间,也就避免了反复使用Apriori性质对候选频繁项集进行判断.

3 结语

此方法与Apriori算法相比较,其优点是:首先,算法在执行过程中只需扫描事务数据库1次,扫描的过程中将事务数据库的内容转换为布尔矩阵,减少了频繁扫描原始的事务数据库所需消耗的大量时间,因而有效地解决了Apriori算法迭代产生频繁项集的瓶颈问题;其次,该算法不用产生大量的候选频繁项集,节省了大量的内存空间,更无需反复使用Apriori性质对候选频繁项集进行判断.因此,该算法具有较高的效率.与其他的基于矩阵的方法相比,该算法更简洁明了,方便易懂.其缺点是对于海量数据库,当要求的最小支持计数特别大时,算法所需用的循环将很多并且非常复杂,如何克服这个困难将是下一步着重的研究方向.

参考文献:

[1]HAN Jiawei, KAMBER M. 数据挖掘概念与技术[M]. 北京: 机械工业出版社,2006.

[2]佘玉梅, 段鹏. 人工智能及其应用[M].上海:上海交通大学出版社,2007.

[3]方炜炜,杨炳儒,宋威,等.基于布尔矩阵的关联规则算法研究[J].计算机应用研究,2005,25(7):1964-1966.

[4]高正红,邵良杉,沈学利.基于布尔矩阵的关联挖掘算法[J].科技资讯,2007(4):59-60.

[5]李娟,张明义,汪维清.基于矩阵的关联规则增量式更新算法[J].云南民族大学学报:自然科学版,2007,16(2):148-151.

[6]王新, 赵强.不完全数据库中的关联规则挖掘[J].云南民族大学学报:自然科学版,2005,14(3): 252-258.

关联矩阵法的基本原理范文第2篇

关键词: 线性代数 自学考试 线性变换 特征值

线性代数(Linear Algebra)是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题。因而,线性代数被广泛应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛应用于自然科学和社会科学中。

线性代数的主要内容是研究代数学中线性关系的经典理论。由于线性关系是变量之间比较简单的一种关系,而线性问题广泛存在于科学技术的各个领域,并且一些非线性问题在一定条件下,可以转化或近似转化为线性问题,因此线性代数所介绍的思想方法已成为从事科学研究和工程应用工作的必不可少的工具。尤其在计算机高速发展和日益普及的今天,线性代数作为高等学校工科本科各专业的一门重要的基础理论课,其地位和作用更显得重要。

线性代数主要研究了三种对象:矩阵、方程组和向量。这三种对象的理论是密切相关的,大部分问题在这三种理论中都有等价说法。因此,熟练地从一种理论的叙述转移到另一种,是学习线性代数时应养成的重要习惯和形成的重要素质。如果说与实际计算结合最多的是矩阵的观点的话,那么向量的观点则着眼于从整体性和结构性考虑问题,因而可以更深刻、更透彻地揭示线性代数中各种问题的内在联系和本质属性。学习时应做到心中有数,将内容一步步分解为这些简单问题的叠加。学习重点应放在理解和运用和计算上,老师上课时的例题很重要,要方便学生课后理解消化,学生要勤做练习加深理解,做题时应分清各类题型,举一反三。笔者从事线性代数的教学和自考辅导工作多年,对如何学好这门课有自己的认识。

一、注重对基本概念的理解与把握,正确熟练运用基本方法及基本运算。

线性代数的概念很多,重要的有:代数余子式,伴随矩阵,逆矩阵,初等变换与初等矩阵,正交变换与正交矩阵,秩(矩阵、向量组、二次型),等价(矩阵、向量组),线性组合与线性表出,线性相关与线性无关,极大线性无关组,基础解系与通解,解的结构与解空间,特征值与特征向量,相似与相似对角化,二次型的标准形与规范形,正定,合同变换与合同矩阵。

我们不仅要准确把握住概念的内涵,而且要注意相关概念之间的区别与联系。线性代数中运算法则多,应整理清楚不要混淆,基本运算与基本方法要过关,重要的有:行列式(数字型、字母型)的计算,求逆矩阵,求矩阵的秩,求方阵的幂,求向量组的秩与极大线性无关组,线性相关的判定或求参数,求基础解系,求非齐次线性方程组的通解,求特征值与特征向量(定义法,特征多项式基础解系法),判断与求相似对角矩阵,用正交变换化实对称矩阵为对角矩阵(亦即用正交变换化二次型为标准形)。

二、注重知识点的衔接与转换,知识要成网,努力提高综合分析能力。

线性代数从内容上看纵横交错,前后联系紧密,环环相扣,相互渗透,因此解题方法灵活多变,学习时应当常问自己做得对不对,再问做得好不好。只有不断地归纳总结,努力搞清内在联系,使所学知识融会贯通,接口与切入点多了,熟悉了,思路自然就开阔了。例如:设A是m×n矩阵,B是n×s矩阵,且AB=0,那么用分块矩阵可知B的列向量都是齐次方程组Ax=0的解,再根据基础解系的理论和矩阵的秩与向量组秩的关系,可以有r(B)≤n-r(A),即r(A)+r(B)≤n,进而可求矩阵A或B中的一些参数。上述例题说明,线性代数各知识点之间有着千丝万缕的联系,代数题的综合性与灵活性较大,同学们整理时要注重串联、衔接与转换。

三、注重逻辑性与叙述表述。

线性代数对于抽象性与逻辑性有较高的要求,通过证明题可以了解考生对数学主要原理、定理的理解与掌握程度,考查考生的抽象思维能力、逻辑推理能力。复习整理时,应当搞清公式、定理成立的条件,不能张冠李戴,同时还要注意语言的叙述表达应准确、简明。

自学考试的特点是难度不大,考点广泛,要求基础扎实,面面俱到。每年的考卷内容变化不是太大,基础题重复出现的机会较大。在学习过程中,把概念搞清楚、内容理顺后,对往年的真题进行大量的强化练习,相信一定会取得好成绩。

参考文献:

关联矩阵法的基本原理范文第3篇

关键词 边缘特征向量 穷举法 灰色关联分析 文字行特征 人工干预

中图分类号:TP391 文献标识码:A

0引言

破碎文件的复原工作在司法物证复原,历史文献的修复和军事情报的获取等领域都具有重要的意义,传统的人工修复虽然准确率高,但是效率很低,特别是在纸片的数量较多,破碎程度较大的情况下,光靠人工复原可能很难再短时间内完成拼接工作,这样就会影响物证复原,文献修复和情报获取的进度。是否可以在计算机的帮助下,试着对碎纸片进行拼接,从而加快人工复原的速度,提高复原的效率。平面碎片匹配复原技术的研究有着重要的理论和现实意义,己成为模式识别、计算机视觉等领域的重要研究课题。本文采用计算机编程和人工干预的方法实现对横纵切割碎纸片的拼接。

1纵向切割碎纸片的拼接复原模型

1.1模型流程图

1.2获取数据

将碎片的文件导入到MATLAB,由软件读取出每张图片文件的像素信息,并且这些信息可以由MATLAB转换为一个数字矩阵。

程序语句:

Imread(‘图片路径\*.bmp’)

通过MATLAB处理得到的数字矩阵可以得到每个矩阵的边缘特征向量,之后可以利用得到的边缘特征向量进行两两比较。

1.3数据预处理和模型的建立

由MATLAB得到数字矩阵之后,选取数字矩阵的左右边缘向量L,R,向量里的数字“0”代表图片中黑色的点,“255”代表图片中白色的点,介于“0”和“255”之间的数字代表图片中灰色的点。可以比较任意一张图片的右边和其余每张图片的左边,如果两张图片是相邻的图片,那么左边图片的右边缘所表示的向量R和右边图片的左边缘所表示的向量L应该是相关联的,同样的,如果两张图片不是相邻的,那么右边缘和左边缘应该是不能匹配的,也就是说是不关联的,这样就可以筛选出两张相邻的图片。在此模型中,在进行拼接之前进行人工干预,通过观察碎片的边缘留白的距离,字体边缘的整齐程度以及图片上内容,可以确定出哪张图片为完整图片中的最左边的纵切碎片。

在确定了最左边的纵切碎片之后,通过MATLAB读取该碎片的像素数字矩阵的右边缘特征向量R0,并和剩下的图片的左边缘特征向量进行比较,选出能够匹配的那张图片(设为R1),接着再比较1图片的右边缘向量R1和剩下图片的左边缘向量,再次选出能够匹配的那张图片,以此类推,可以将所有图片都匹配出来,即完成了拼接的工作。

2横纵切割单面碎纸片的拼接复原模型

通过对数据矩阵的观察可以看出,如果两个片段是属于同一行的,那么它们的图案中从最上方开始往下检测,第一次出现全部都是白色像素值255的数字矩阵中的行数应该是相同的。

上图是两张碎片图片,从他们的部分数字矩阵可以看出他们出现第一个一行全部都是白色像素点的行的行数h是相同的,都是在“上”字和“风”字的最下沿。说明这两张图片有很大的可能是在同一行的,剩下的图片可以采用同样的方法进行分类。

每张图片转换成数字矩阵之后,如果其中某一行的数字全部都是255,那么说明原图片中这一行全部都是白色,即说明这一行没有汉字或字母。每张图片转换成数字矩阵之后,矩阵的每行有72个数字,我们定义为,当一行全部都是255时,即=18360,然后计算代表每张图片的数字矩阵中第一次出现总和为18360的行数h,其中如果有行数h相同的,那么基本上可以确定它们是属于一行的。

那么此时就可以得到N个类,每个类当中都有M个片段,而这M个片段都是在一行的,这M个片段可以看成是把一个横行作为整体的图片纵切后得到碎片,这就回归到了纵向的问题,可以利用纵向中的模型将每一类中的M个片段复原成一个横行的整体。复原完成后的N个完整的横行,将这N个完整的横行旋转90度得到新的N个完整的纵行,又可以看成这N个片段是由一个整体纵切得到的,再次回归到纵向切割问题,利用纵向切割的模型可以将最后的N个片段复原,得到原本完整的图片。

3横纵切割双面碎纸片的拼接复原模型

由于一般正反两面切割问题中的碎纸片数量庞发,也信息量较复杂。首先,无法确定在这些碎片中哪些是属于正面的,哪些是属于反面的,这样就不能直接用横纵切割问题所才用的先分类的方法了,因为如果直接对行进行分类的话,很有可能将正反两面的一行分到了一起,这样仍然无法将属于同一行的碎片分类出来,所以只能先从整体出发,用人工干预找出一些明显属于最边缘的碎片。当找到了一定数量的最边缘碎片的时候就能利用灰色关联分析法对与最边缘碎片相关联的碎片进行筛选了。

3.1利用灰色关联分析法对最边缘附近的碎片进行筛选

灰色关联分析法可对样本数据量较小的系统进行综合分析,且计算量很小。但这种方法中的某些参数如指标权重和分辨系数需要人为指定。必要时,可将上述几种综合评价与决策方法结合起来使用。比如,可先用层次分析法确定指标权重,然后再用灰色关联分析法,可取得精度较高的结果。

根据灰色关联分析,可以在剩下的碎片中找出跟边缘碎片关联度最大的碎片,剩下的碎片都可以用这样的方法进行拼接。可以利用灰色关联分析法找出一些行或者列的片段,这样在之后的拼接中就可以运用横纵切割问题中的模型了。

3.2拼接实验

经过灰色关联分析的处理之后已经得到了一些行或者列的片段,这样其实就将正反两面切割问题转化为了横纵切割问题中的问题,在找到行(或列)的片段之后,就将这些行(或列)的片段作为一个大类,将每个大类进行旋转,得到纵列(若得到的是列就不用旋转了),得到纵列后就转化为纵向切割问题了,那么利用程序一就可以将纵列复原拼接了。

这样就可以正确复原正反两面中的一面,那么另一面也就正确的复原了。

4总结

采用MATLAB读取图片像素信息的方法,可以很好的保持图片原有的信息,同时能够准确的将图片的信息以矩阵的形式反映给读者,有较强的实用性。另外,用矩阵的形式来表达也有利于采用边缘边缘特征向量比较的方法。

在考虑横纵切割问题的时候充分利用纵向切割问题所建立的模型,通过将原本横纵切割的碎纸片先进行横行的拼接,使其转换成N个大类,再将得到的横向的片段旋转90度得到转换成纵向的片段,利用纵向切割的模型来解决。节约了重新编写对应横纵切割问题的程序的时间,同时也充分的利用了两个问题之间的连贯性,以纵向切割为基础,利用已经得到的结论来解决更加困难的问题。

参考文献

[1] 马艳, 张治辉(著).种边缘检测算子的比较.工矿自动化出版社,2004.1:54~P55.

关联矩阵法的基本原理范文第4篇

近几年,国内发表了大量有关产业或企业集群理论的综述[4,5];一些研究将产业集群定位为一种区域发展理论,因为产业集群强调区域分工的重要性,也突出了发挥区域内各种资源整合能力的作用,尤其是技术进步与创新的作用[6~8];也有一些案例研究,如计算机相关产业集群的研究[6,9~11],河南虞城县钢卷尺企业集群的研究[12],这些案例研究将产业集群定义为一个产业内企业在一定区域内的集聚,对区域产业之间的功能联系重视不够。区域产业集群辨识方法研究还处在探讨阶段,主要以定性研究为主。在实际操作中,辨别产业集群最常用的方法是“产业认知法(Industry Perception Method)”[13],第一步是计算区域内各产业的区位商,并根据其大小对产业进行排序。然后基于研究者的产业知识及其对区域产业结构的了解将产业初步归类为集群。最后通过对产业内主要公司进行访谈确认产业间的联系,从而认定对集群判断的正确性。IPM过分依赖专家的经验和知识,容易被区域内占主导地位的企业所误导,这种主观判断的产业集群给区域间的比较带来困难,因此在产业集群的辨别上非常有必要引入科学的定量方法。

产业间功能联系构成产业集群的必要条件,许多辨别集群的定量方法都源于投入产出表,如图谱分析法和多因素聚类分析等。Campbell[14] 和Slater[15] 利用图谱方法分析区域产业之间的关联并将联系程度超过一定门槛的每对产业用箭头连接,在此基础上辨别区域产业集群。多因素聚类分析是比较成熟的方法,但在产业集群辩识研究中用得不多,主要原因是这种方法将不同产业归纳到不同的集群,这与现实不吻合,因为许多产业可能属于多个集群。一些研究采用主成分分析法来辨识产业集群[16~20]。主成分分析可以将显著关联的变量聚集到一个因子上,减少信息的重叠。投入产出表中产业间价值流信息存在显著的重复,根据投入产出表可构建反映某个产业的中间投入或中间销售的行业结构,因此可采用主成分分析将具有相似经济技术联系的产业组合成因子,每个因子反映产业间价值流的行业结构,提取出来的因子成为构造产业集群的基础,每个产业集群中存在若干个联系强度各异的产业链。

1 产业集群辨识方法——主成分分析及其发展

产业间功能联系是产业集群的必要条件,一个区域的投入产出表反映产业之间的技术与市场联系,因此可依据区域投入产出表来辨识区域产业集群。区域投入产出关系表述为如下两个等式:基于产出的关系式:

附图

基于投入的关系式:

附图

式中,X[,i]为产业i的总产出额,X[,j]为产业j的总投入额;x[,ij]为产业i到产业j的销售额,亦x[,ij]为产业j从产业i购买的投入额;y[,ik]为最终部门k对产业i的最终需求额,E[,i]为产业i的区域外销售额;V[,j]为产业j的增加值,M[,j]为产业j从区域外进口额。

首先,基于投入产出表构造反映产业间功能联系的矩阵。1997年北京市投入产出表中总共有124个部门,这里仅其中的74个制造业部门。产业的总中间投入和中间销售以p和s表示,产业i和j间的功能联系可表示为如下2个系数:

附图

式中,,a[,ij]表示产业j从i购买的中间投入占产业j的总中间投入的比重,a[,ij]系数较大说明产业j强烈依赖产业i提供中间投入;b[,ij]表示产业i向产业j的中间销售额占产业i的总中间销售额的比重,b[,ij]系数较大表明产业j是产业i主要市场。a[,ij]构成一个74×74的中间投入矩阵A,b[,ij]构成一个74×74的中间销售矩阵B[,B],将矩阵B[,B]转置成矩阵B。矩阵A中每一列表示一个产业的中间投入行业结构,矩阵B中每一列代表一个产业的中间销售行业结构。矩阵A和B反应北京市制造业之间的功能联系。为了能够运用主成分分析的方法辨识基于产业联系的集群,需要构造反映产业功能联系的相关矩阵。根据矩阵A和B,可计算四个相关系数来全面衡量产业m和n的投入产出结构的相似性:R(a[,m],a[,n])衡量两产业中间投入行业结构的相似程度;R(b[,m],b[,n])测量两个产业的中间销售行业结构的相似程度;R(a[,m],b[,n])表示产业m中间投入的行业结构与产业n中间销售行业结构的相似程度;R(b[,m],a[,n])衡量产业m中间销售的行业结构与产业n的中间投入的行业结构的相似程度。对74个产业中每一对产业计算上述四个相关系数,然后取其数值最大者构成一个新的74×74对称矩阵C,这个矩阵类似于主成分分析中的原变量的相关矩阵,矩阵中每一个相关系数反映产业之间的经济技术联系的行业结构相似性。C[,mn]表示如下:

C[,mn]=C[,nm]=max[R(a[,m],a[,n]),R(b[,m],b[,n]),R(a[,m],b[,n]),R(b[,m],a[,n])]

(4)

然后将矩阵C分解以求得其特征向量和特征值,并采用主成分分析方法提取因子。主成分分析中的因子反映各产业间价值流的行业结构。由于各个特征值都不相同,且特征值λ[,i]可以按严格大小顺序排列,因此根据矩阵C的标准正交化特征向量P可将其分解为:C=PΛP',其中,

关联矩阵法的基本原理范文第5篇

关键词:正交频分复用; 独立信道预编码; 发送迫零预编码; 联合迫零和独立信道预编码

中图分类号:TN929.5-34文献标识码:A

文章编号:1004-373X(2011)01-0004-03

A Combined Zero-forcing and Channel Independent Precoding OFDM System

LI Zhen-ke, ZHANG Xiao-ying, WEI Ji-bo

(School of Electronic Science and Engineering, National University of Defense Technology, Changsha 410073, China)

Abstract: A combined zero-forcing and channel independent precoding OFDM system is introduced. The proposed system utilized a combined zero-forcing and Hadamard matrix precoding at the transmitter, simplified the receiver and increased the diversity gain of the system. The simulation results show that the proposed precoder improved the BER performance of OFDM system.

Keywords: OFDM; channel independent precoding; TXZF; combined zero-forcing and channel independent precoding

0 引 言

正交频分复用(OFDM)[1-2]是一种高效的多载波传输技术,它将数据符号调制到不同的相互重叠的正交子载波上进行低速传输,较长的符号周期和加入保护间隔(循环前缀)可以消除符号间干扰,并且可以将多径信道转化为平衰落信道,这样,在接收端只需要单步均衡就可以恢复发送信号。由于正交频分复用技术(OFDM)具有信道频谱利用率高、抗频率选择性衰落能力强和接收端结构简单等优点,已成为近年来的通信领域最受青睐的技术之一。目前,OFDM技术已被多个国际标准,如数字视频广播[3](DVB)、宽带无线城域网[4](IEEE 802.16e)、3G长期演进[5](3G LTE)等所采用,OFDM已成为未来通信领域中最关键的技术之一。

预编码技术是在发送端预先补偿信道损失,简化接收端提高系统性能的一种信号处理的方法,目前有发送端已知全部信道信息或部分信道信息及独立信道的预编码技术。

基于酉矩阵的独立信道的预编码原理是发送信号通过酉矩阵的调制使其发送信息重新分配,提高系统的分集增益,从而提高系统性能的一种预编码的方法,哈达玛矩阵就是其中的一种可以利用的酉矩阵。

文献[6]指出,通过独立信道的线性预编码可以达到OFDM系统的最大分集增益。文献[7-8]指出,通过基于酉矩阵(如FFT矩阵或哈达玛矩阵)的无冗余独立信道的预编码可以在较高信噪比的条件下提高OFDM系统的误码率性能,但这种方法的预编码矩阵要受到子载波数目的制约。文献[9]提出了一种OFDM独立信道的预编码的方案,该方案是在发送端对数据进行分组,然后对每个分组进行基于哈达玛矩阵的预编码处理,该方案的预编码矩阵不受子载波数目大小的影响,提高了预编码的灵活性,且提高了OFDM系统的误码率性能。但该方案要求在接收端进行基于门限的自适应均衡,需要根据信道信息和信噪比的数值计算出门限值,增加了系统处理的复杂度。

在TDD系统中,根据信道的互易性,可以直接将上行链路中基站估计的信道冲击响应值作为下行链路发送端的信道信息,在FDD系统中,在发送端和接收端加上一个反馈信道,发送端通过反馈信道同样可以得到信道信息,从而发送端数据可以利用得到的信道信息进行预编码达到提高系统性能简化接收端的目的。

发送端迫零预编码[10]是一种在发送端利用信道信息对数据进行类似迫零均衡的处理,通过这样的处理可以达到简化接收端,提高系统性能的目的。本文结合发送迫零预编码和独立信道的哈达玛矩阵酉预编码提出一种联合发送端迫零和独立信道预编码OFDM系统,利用发送迫零预编码和独立信道预编码对OFDM系统进行联合处理。该处理方法简化了接收端,减小了系统的复杂度。理论分析和仿真结果都表明,该处理方法能够提高OFDM系统的误码率性能。

1 系统模型

1.1 系统框图

本文提出的联合迫零与独立信道预编码OFDM系统框图如图1所示。

图1 联合迫零和独立信道预编码OFDM系统

串行的调制数据被分割成许多大小为N的数据块,用N×N维的哈达玛矩阵左乘每个数据块,进行哈达玛矩阵预编码,其目的是提高系统的分集增益。然后数据进入交织模块,进行时频二维交织,其目的是使同一预编码块的符号保持信道独立性。交织后的数据sе匦路指畛傻瘸さ娜舾勺椴⑿械氖据流,其数据流的组数和OFDM的子载波的数目相同,然后对并行的数据流进行迫零预编码,迫零预编码的作用是简化接收端,并且减小由于接收端均衡对噪声的放大。迫零预编码后的数据进行OFDM调制,进入信道,在接收端只需进行OFDM解调,解交织,哈达玛矩阵解调,而不需进行频域均衡的处理。

1.2 哈达玛矩阵预编码的设计

哈达玛矩阵是一个由元素+1,-1组成的方阵,它的任两行相互正交。一个二阶的归一化的哈达玛矩阵表示为:

H2=12111-1

高阶的归一化的哈达玛矩阵可由低阶的哈达玛矩阵递归来产生:

H2n=12HnHnHnHn

本文的预编码所使用的哈达玛矩阵是指归一化的哈达玛矩阵。在接收端只需用发送端哈达玛矩阵的转置矩阵左乘每个数据块就可实现解哈达玛矩阵预编码。

1.3 时频二维交织的设计

16个8子载波的OFDM符号的时频二维交织示意图如图2所示,其他情况下时频二维交织和图2类似。

图2 16个8子载波的OFDM符号的时频二维交织示意图

1.4 发送迫零预编码的设计

在一个通信系统中,如果在发送端采用迫零准则构造调制矩阵M,即为发送迫零预编码(TXZF)[10]。TXZF是在迫零准则的约束下,采用均方误差MSE最小化的预处理方法。设信道矩阵为H,接收端解调矩阵为D,г诜⑺投私行类似收端迫零均衡的处理,则可以得到发送迫零预编码的预编码调制矩阵为:

MZF=(DH)H[DH(DH)H]-1

(1)

为尽量简化接收端,接收端可以用单位矩阵进行解调,即D=I,г蚩梢缘玫降髦凭卣:

MZF=(H)H(H(H)H)-1

(2)

基于信道信息的预编码OFDM系统的一般模型如图3所示。

图3 基于信道信息的预编码OFDM系统的一般模型

假设有N个数据符号dn,n=1,2,…,N,Ц檬据符号取自于有限集:

V={v1,v2,…,vm}

(3)

如果选用QPSK调制方式,就有:

V={1+j,-1+j,1-j,-1-j}

(4)

数据的矢量形式可以表示为:

d=(d1,d2,…,dN)T

(5)

图3中M为预编码矩阵,通过预编码调制矩阵后,将信号d调制为发送的信号s,Ъ从:

s=Md

(6)

OFDM系统中由于循环前缀的作用,把一个FIR信道h=[h(0),h(1),…,h(l)]转变为一个卷积矩阵信道H,且有:

[H]i,j=h((i-j)mod N)

(7)

用FП硎FFT变换(傅里叶变换)矩阵,且:

[F]n,k=1Nexp-j2πnkN

(8)

那么发送端的IFFT变换可以表示为FH,Р环料群雎栽肷的影响,那么对发送信号来说,其等效信道即为:

H′=FHFH

(9)

若不考虑频偏和多频勒频移带来的ICI,则H′是对角阵,其对角线上的元素为信道h=[h(0),h(1),…,h(l)]的NУ愀道镆侗浠弧=邮斩送ü等效信道可以得到:

e=H′s+n′=FHFHs+n′=FHFHMd+n′

(10)

式中:n′为噪声nУ母道镆侗浠唬即有:

n′=Fn

(11)

为了简化接收端,可以用单位矩阵对接收数据e进行解调,即有D=I,в谑墙獾骱蟮氖据信号为:

=De=D(H′s+n′)=H′Md+n′

(12)

根据式(2),可以得到OFDM系统的发送迫零预编码调制矩阵为:

MZF-OFDM=(H′)H(H′(H′)H)-1 =

(FHFH)H(FHFH(FHFH)H)-1

(13)

2 仿真分析比较

以下对一般的OFDM系统,文献[8]中基于门限的自适应均衡的哈达玛独立信道预编码OFDM系统和本文中提出的联合发送端迫零与哈达玛矩阵独立信道预编码OFDM系统在不同的仿真环境下进行了仿真分析比较。

图4的仿真环境为COST207 RA信道,多谱勒频移为89 Hz,子载波个数为128个,循环前缀为32个采样点, QPSK调制,哈达玛矩阵的维数为256×256,带宽为4 MHz。由于多谱勒频移远小于子载波间隔,为了处理的方便,可以不考虑多谱勒引起的ICI的影响。

图5的仿真环境为SUI-3信道,子载波个数为128个,循环前缀为32个采样点, QPSK调制,哈达玛矩阵的维数为1 024×1 024,带宽为4 MHz。

在图4和图5中,OFDM表示一般的OFDM系统, ZSY-OFDM表示文献[8]中的基于门限的自适应均衡的哈达玛矩阵预编码的OFDM系统,ZFP-OFDM表示本文所提出的基于发送端已知信道信息的联合迫零和哈达玛矩阵独立信道预编码OFDM系统。假定OFDM系统,ZSY-OFDM系统是在接收端进行完美的信道估计, ZFP-OFDM在发送端已知完全的信道信息,虽然在实际情况下,这是不可能实现的,但是它们却提供了所能达到的最佳性能的上限。

由图4和图5可以看出,本文所提出的联合迫零和哈达玛矩阵独立信道预编码OFDM系统的性能,明显好于传统的OFDM系统和文献[8]中基于门限自适应均衡的哈达玛矩阵独立信道预编码OFDM系统,且简化了接收端。

图4 COST207 RA信道下三种OFDM系统的

误码率性能比较

图5 SUI-3信道下三种OFDM系统误码率性能比较

3 结 语

本文把基于信道信息的发送端迫零的预编码和独立信道的预编码用于OFDM系统,提出了一种联合迫零预编码和独立信道预编码的OFDM系统,并对这种OFDM系统进行了理论分析和仿真验证。结果表明,这种处理方法不仅简化了接收端,而且提高了系统的误码率性能。

参 考 文 献

[1]LI Y, STUBER G. Orthogonal frequency division multiplexing for wireless communications [M]. New York: Springer Press, 2006.

[2]罗涛,佟学俭.OFDM移动通信技术原理与应用

[3]Anon. ETS 300 744-1999, Digital video broadcasting (DVB): framing structure, channel coding and modulation for digital terrestrial television[S]. [S.l.]:[s.n.], 1999.

[4]Anon. 802.16e, Draft 12: local and metropolitan area networks-part 16, air interface for fix broadband wireless access systems [S]. [S.l.]: [s.n.], 2005.

[5]郑侃,赵慧,王文博.3G长期演进技术与系统设计

[6]WANG Zheng-dao, GIANNAKIS G B. Linearly precoded or coded OFDM against wireless channel fades [C]// Wireless Communications.[S.l.]: IEEE, 2001: 267-270.

[7]LIN Yuan-pei, PHOONG S F. BER minimized OFDM systems with channel independent precoders[J]. IEEE Trans. on Signal Process., 2003, 51: 2369-2380.

[8]DLUGASZEWSKI Zbigniew, WESOLOWSKI Krzysztof. WHT/OFDM-an improved OFDM transmission method for selective fading channels [C]// Communications and Vehi-cular Technology.[S.l.]: SCVT, 2000: 144-149.

[9]ORTI′N Jorge, GARCI′A Paloma, GUTIE′RREZ Fernando, et al. Channel independent precoder for OFDM-based systems over fading channels [J]. IEEE Transactions on Broadcasting, 2009, 55(4): 818-825.

[10]谢显中,雷维嘉.移动通信中的空时信号处理[M].北京:电子工业出版社,2008.

作者简介: 李贞柯 男,1982年出生,河南泌阳人,硕士。主要研究方向为OFDM中预编码技术。

张晓瀛 女,1980年出生,湖南益阳人,讲师。主要研究方向为宽带无线通信中的均衡与信道估计。