首页 > 文章中心 > 正文

诚信政府采购信用研究论文

诚信政府采购信用研究论文

摘要:支持向量机(SVM)是在结构风险最小化的一种新的机器学习技术,在解决小样本、非线性及高维空间问题中具有独特的优势,适用于政府采购中对供应商进行信用分析。但供应商信用属性数据构成了高维空间的稀疏分布,不利于SVM的准确建模。

由于主成分分析技术具有良好的去噪音特性,能够对信用属性数据进行有效地挖掘。因此,若将两者进行有机地结合,就能有效改善SVM输入样本的特性,从而提高SVM分类的准确率。政府采购不同于一般的采购行为,它具有政策性强、规模大、资金多等特点。政府采购项目,尤其是国家重点建设项目,如北京奥体项目、南水北调工程、三峡工程等,更是集政治性、经济性、社会性于一身,对国家的社会效益、政治效益和经济效益都会产生广泛而深远的影响。因此,在政府采购中为避免国家的财税流失、保证政府投资效益,提高政府采购效率,必须规范政府采购市场,促进供应商在市场竞争中遵守国家法律、法规,规范经营,并将对供应商的管理提高到信用管理的高度。

在市场经济环境下,良好的履约能力对政府采购项目按时、保质、保量地完成是十分必要的,而供应商履约能力是与其信用水平密不可分的。因此,在对供应商进行规范化管理过程中,政府部门应对供应商的信用进行公正、客观地分析。这具有很强的理论与现实意义,引发了国内外学者广泛的研究和探讨[1-3]。常用的信用分析方法包括层次分析法、模式识别理论和神经网络等。由于信用分析具有多属性和非线性等特征,这些方法在应用中都很难取得满意的效果。笔者尝试将数据挖掘技术与机器学习方法相结合,建立基于主成分分析———支持向量机技术的供应商信用分析模型。通过主成分分析技术进行数据挖掘,改善了信用属性数据的特性,提高了支持向量机的建模效率。

一、模型的总体设计

供应商信用分析效果的好坏,主要取决于信用分析中所选用的属性数据的特性以及所采用的方法解决非线性复杂问题的能力。当前,商业信用分析主要是通过基于财务指标的信用特征而进行的商业信用等级划分。由于财务属性数据种类繁多,且数据之间往往存在紧密的相关性。这无疑加大了信用分析建模的难度。因此,有必要在进行信用分析之前,对信用属性数据进行数据挖掘。在众多的数据挖掘技术中,主成分分析方法既能够有效去除属性数据间的相关性,又可以降低数据维数。因此,它被选作供应商信用属性数据特征挖掘的工具,以构造新的更有效的信用属性数据。数据挖掘后,接着面临的问题是如何有效地构建供应商的信用分析模型。

由于在政府采购多采用“短名单”,这就造成了供应商的信用分析具有典型的小样本、多属性及非线性等特征。传统的信用分析方法很难进行有效地分析。神经网络技术虽然能够进行良好的经验学习[2],但由于其基于经验风险最小,易出现过拟合问题,从而降低了模型的泛化能力。20世纪90年代兴起的支持向量机(SupportVec-torMachines,SVM)是基于结构风险最小化原理的统计学习方法,适用于小样本分类问题。在解决高维、非线性问题时,本论文由整理提供SVM通过非线性映射把非线性分类化为线性问题来处理。从而,显示出其显著的优越性[4-5]。因此,SVM技术是进行供应商信用分析建模的有效工具。笔者将PCA技术与SVM技术相结合构建政府采购中供应商的信用分析模型,

二、信用属性数据的特征挖掘主成分分析方法

目前主要有两种:标准主成分分析方法和基于核的主成分分析方法。

(一)标准主成分分析标准的主成分分析是一种有效的数据特征挖掘方法[6]。它基于数据二阶统计矩,对由一系列观测数据向量组成的向量组进行分析,通过选择样本点分布方差大的坐标轴进行投影来降低维数而使信息量损失最少。记供应商的信用观测属性矢量为:sX=(sx1,sx2,…,sxn)T∈Rn(1)sX的自协方差阵为:RsX=E﹄sXsXT﹃(2)式中RsX是一非负定实对称矩阵。由矩阵对角化理论知,对RsX而言,存在正交变换矩阵U,使UTRsXU=Λ0,Λ0为对角阵。U的列向量Ui(i=1,2,…,n)是RsX的单位特征向量,且相互正交。当detRsX≠0,作变换:X=UΛ0-12sX(3)则有:RsX=E﹄sXsXT﹃=I(4)式中,I为单位阵。经过上面的处理过程,获得了供应商信用的新属性矢量为X=(x1,x2,…,xn*)T∈Rn*。X是白化后向量,其各分量间不存在二阶相关性。由于n*(二)基于核的主成分分析方法[7]基于核的主成分分析方法(KernelPrincipleCom-ponentAnalysis,KPCA)是一种非线性特征挖掘方法,其基本思想是利用核函数,通过非线性映射将输入数据映射到一个高维的特征空间中,然后在特征空间中利用标准主成分分析法来挖掘主成分作为特征向量。设为一非线性映射,:Rn→F。通过求解KA=DAΛ,获得特征值,其中Λ为特征值λ1、λ2、…、λn对角阵,A=[α1α2…αn],N为输入样本的个数。然后,对A进行标准化,使λi‖αi‖2=1。于是,可求得:ν=MAΛ(5)式中,ν=(ν1ν2…vn),M=[(x1)(x2)…(xn)]。对于任意的测试样本,设它在特征空间的映射为(x),KPCA通过下式进行特征挖掘:F=νt(x)=AtB(6)式中,B=((x1)•(x)(x2)•(x)…(xn)•(x))t。实践证明,PCA与KPCA都能够获得良好的特征挖掘效果[6][7]。虽然与PCA相比,KPCA挖掘后的道德标准均方误差更小,但是KPCA需要大量的主成分,要耗费大量的时间进行计算,这对于供应商信用管理信息系统的建立和维护是不利的。由于PCA完全能够满足精度要求,在本文中被采用进行信用属性数据的特征挖掘。然后,将挖掘出的新的属性样本数据用于支持向量机的信用分析建模。

三、信用分析模型的建立

在政府采购项目中能够得到供应商各种类型的信用数据十分有限,这些数据构成了信用分析输入空间的稀疏分布。此时,若利用神经网络进行信用分析建模,由于神经网络是以经验风险最小化进行优化,易引起过拟合问题,从而影响模型的泛化能力,并且易陷入局部极小点。与其相比,支持向量机分类的基本思想是通过建立一个超平面作为一个决策平面。它不但能将分类中的两类样本正确分开,而且还使分类间隔最大。在分类过程中将优化问题转化为一个凸二次规划问题,由标准的拉格朗日乘子算法解得具有较高精度的全局最优解[4][5][7]。给定训练集{xi,yi},xi=(xi1,xi2,…,xis),xi∈Rn*,i=1,…,n,n为训练集样本个数,s为新属性个数。yi∈{1,-1}或yi∈{1,2,…,k}。当yi∈{1,-1}时为二分类问题。

题对于给定训练样本集的线性划分问题就是求最优超平面〈w,φ(xi)〉-b=0。具体而言,当训练燕本集在特征空间线性可分时,分类间隔等于2/‖w‖,求最大间隔等价于12‖w‖2的最小值,即求解:minw,b12‖w‖2s.t.yi(〈w,φ(xi)〉-b)1(7)上式是一个凸二次规划问题,并且具有极小点。采用Lagrange优化方法将上述最优化分类问题转化为其对偶问题[8]:max∑li=1αi-12∑li,jαiαjyiyj(xi•xj)s.t.∑yiαi=0,αi0,i=1,2,…,n(8)式中αi为Lagrange乘子,则求得相应的xi就是支持向量机,得到的最优分类函数为:f(x)=sgn[(w•x)+b]=sng∑mi=1αiyi(x•xi)+b(9)若训练集是线性不可分的,需要引入非负变量ξi,使分类间隔与分类错误达到某种折中,凸二次规划问题变为:minw,b12‖w‖2+C∑li=1ξis.t.yi(〈w,φ(xi)〉-b)1-ξi,ξi0(10)式中ξi看作训练样本关于超平面的偏差,C>0为自定义的惩罚系数,用来控制样本偏差。超级秘书网

(二)非线性问题SVM解决非线性问题的基本思想是基于Mercer定理,通过选用适合的核函数,将样本空间映射到一个高维的特征空间,在此特征空间中求解线性问题。此时,目标函数变为[4][8]:y(x)=sgn∑mi=1a*iyik(x,xi)+b*(11)其中,k(•,•)为核函数。其对偶问题为:max∑ni=1αi-12∑ni,jαiαjyiyjk(xi,xj)s.t.∑yiαi=0,αi0,i=1,2,…,n(12)常用的核函数k(•,•)为:(1)多项式核函数,k(x,xi)=((x•xi)+1)p;(2)高斯径向基函数,kx^)=exp-‖x-xi‖2σ2;(3)多层感知机核函数,k(x,xi)=tanh[v(x•xi)+c]。

(三)模型评估根据信用分析的特点,本文定义信用分析模型的评估指标如下:L=1N(N-∑ki=1ci)×100%(13)式中:N表示样本的总数量,ci表示第i分类被错分的样本数量。在两分类问题中,k=2,可以定义两类分类错误:第一类错误为将信用“好”的供应商误判为“差”;第二类错误为信用“差”的供应商误判为“好”。

四、实证分析选取参加政府采购活动的32位供应商进行信用分析

其中,有9位供应商经营状况欠佳,其余的供应商经营状况正常。利用Matlab实现计算与模拟。由于在样本中存在两类样本数据,因而对供应商进行两模式的信用分类。选取的属性数据类型如下:流动比率(C1)、速动比率(C2)、负债/权益比率(C3)、存货周转率(C4)、总资产报酬率(C5)、资产负债率(C6)、长期负债比率(C7)、销售利润率(C8)、首先,利用PCA进行数据挖掘,特征值见表1。生成了三个主成分,贡献率累计为99•06%,能够完全满足信用分析的要求。

五、结语

笔者在应用支持向量机进行供应商信用分析过程中,引入PCA进行属性数据特征挖掘,提高了支持向量机的推广能力和建模效率,为今后政府采购中供应商的信用分析提供一种可借鉴的方法。实例和分的结果表明所建信用分析模型的质量比较高,验证了其有效性。