首页 > 文章中心 > 正文

主成分分析法多元统计论文

主成分分析法多元统计论文

一、主成分分析法

主成分分析法,又称主分量分析法是指相关的经济变量间通常存在着起主导作用的决定性因素,通过对原始变量的相关矩阵内部结构进行分析,找出几个不相关的综合指标来线性表示原来的变量,主成分之间既互不相关,又尽可能多的包含了原指标集合。这种方法首先由Hotelling提出,其主要思想是降维。Stone(1947)对美国1929-1938年间的17项国民经济统计指标进行主成分分析,发现完全可以用三个经济指标来概括原来的17项指标,大大简化了数据分析。M.Scott(1961)对英国157个城镇的发展水平进行主成分分析,发现原57个测度指标完全可以由5个综合变量替代,既解决了原指标间的信息重叠问题,又简化了原指标体系的指标结构,主成分分析由此推广。邱东(1990)系统阐述了主成分分析法的定义、基本思想、基本步骤和特点,认为主成分分析法可以消除评价指标间的相关影响,并且伴随数学变换过程生成信息量权数和系统效应权数,保证了客观性。同时也指出了主城分析法在计算综合评价值未充分考虑指标的重要程度等不足,主要适用于被评价对象较多的综合评价。随后,众多学者对此提出了改进:孟生旺(1992)针对原始数据的标准化处理和主成分个数的选择问题,认为标准化不如均值化的无量纲处理方法,提出了非标准化主成分分析法。陈述云等(1995)通过对原始数据作对数—中心化转换,用原始变量的非线性组合表示主成分,同时重点分析样本协方差矩阵而非相关系数矩阵,提出了非线性主成分法。朱泰英等(2004)提出了加权主成分分析法,认为可以将主成分分析法的客观分析和层次分析法的主观分析有机结合。王璐等(2006)在对主成分分析法的权数、降维等问题的研究上,提出了首先要按主成分分析法对指标体系进行分类,得到各方面的评价值后再进行主成分分析,最终得到综合评价值的二重主成分分析法。段力誌等(2009)在传统主成分分析法基础上,首先对原始指标值进行预处理,再借助软件,将原始数据转化为少数几个主成分的线性组合,并进行加权变换,得到改进的主成分综合值。白雪梅等(1995)则分析了“均值化”、“标准化”、“极差正规化”三种方法的选择条件是保证方差损失最小。陈衍泰等(2004)认为主成分分析法具有全面性、可比性和客观合理性等优点,比较适合对评价对象进行分类,但需要大量数据,函数意义不够明显,不能反映客观发展水平。苏为华(2012)提出经典的R型主成分本质是单项指标标准化结果的加权算术平均值,比当量平均法复杂。赵利等(2013)通过主成分分析法对宏观经济中影响城镇劳动就业因素分析时,提出主成分为宏观经济和技术进步,通过VAR模型对主成分进行分析,得出宏观成分中对城镇劳动就业影响最大的是消费、产业结构和城市化水平,而技术进步成分中影响最大的是技术进步的结论。黄利文(2013)针对主成分分析中存在的未考虑负向因子的影响,以及采用线性加权法时确定权重方法不统一,评价结果非唯一等缺陷,提出了逼近理想点的主成分分析法,更好地反映了原始数据信息,并较为客观地给出了综合评价结果。林海明等(2013)认为主成分分析因缺乏应用条件的考虑而导致评价结果不具合理性甚至错误,通过分析因子分析法因子载荷阵的简单结构、加权算术平均数的合理性,得出主成分分析的应用条件是:指标是正向、标准化的;主成分载荷阵达到更好的简单结构时,主成分正向,且主成分与变量显著相关。

二、因子分析

法因子分析法是指从被评对象的观察变量的相关度出发,利用降维的思想,把繁杂的变量尽可能归纳为几个综合因子进行分析的的一种多变量统计分析方法。其基本思想是:将观察变量按相关度的高低或联系的紧密程度进行分类,类别内部变量相关性高,联系紧密,而类别之间的变量则相关度较低,联系稀疏,每一类变量则代表一个公共因子。具体步骤为:

三、逼近理想解的排序法

TOPSIS法是指预先确定评价问题的理想点和负理想点,分别测量指标向量与两者的距离,将距离作为评价值进行排序。由H.wang.C.L和Yoon,K.S.于1981年提出,其基本思想是:在所有备选方案中,设定一个各项指标都达到各方案最优的“正理想解”,再设定一个“负理想解”,通过比较各方案的正、负理想解来判断方案的优劣,判断标准是:离正理想解越近,离负理想解越远则方案最优。其优点在于对评价对象的描述比较精确,可以处理多决策者、多指标、动态的对象;不足是评价较刚性,无法涉及有模糊因素的对象。主要使用于优化系统的评价与决策,应用领域较为广泛。王应明(1998)通过矢量投影将决策方案投影到理想方案上,提出根据投影值大小进行排序。卢方元(2003)针对传统的TOPSIS法存在的正负理想解难以确定,权重易主观化,部分方案无法比较等问题提出了改进的TOPSIS法。余雁(2004)在理想点的基础上,提出了双基点法,建立了靠近理想解和远离负理想解两个基准的改善了的TOPSIS法。于新峰等(2004)通过引入时间因素,将基于区间值的多指标决策问题的研究从静态领域拓展到动态领域,补充了固定性和区间性指标的标准化公式,定义了时间权重取区间值的时序条件下多指标决策的正理想方案和负理想方案,解决了指标取值、指标权重和时间权重可以全部为区间值模糊数的多指标决策问题。付巧峰(2008)针对传统TOPSIS法的缺点,提出了改进的TOPSIS法,简化了正负理想方案的计算,采用目标规划优化模型和高等数学的方法计算各评价指标的权重,弱化了主观因素,使其更具合理性和实用性。王敬敏等(2010)针对传统TOPSIS法决策矩阵求解复杂的缺点对其进行了改进,简化了正负理想解的计算,并将熵权法应用到评价中,能够客观确定评价指标的权重,同时证明熵权法和改进TOPSIS法在竞争力评价中提高了实用性与可信度。王一任等(2013)认为TOPSIS法存在逆序问题,其评价值只能反映各评价对象内部的相对接近度,并不能反映与理想的最优方案的接近程度,且评价值区分各评价对象优劣的范围也有限,提出了一种新的改良TOPSIS法,使之不仅具有强保序性,而且比传统TOPSIS法灵敏。大数据的发展,导致评价对象的数据不断扩大,数据形式不断改变,研究对象呈现多样化特征,如何准确地选择评价方法并有针对性地开展个性化研究和评价,评价结果的一致性能否保证,值得长期探讨。

作者:黄小艳单位:湖北工业大学商贸学院

文档上传者