首页 > 文章中心 > 文献综述的基本特征

文献综述的基本特征

文献综述的基本特征

文献综述的基本特征范文第1篇

作者简介:黄浙京(1984-),男,浙江黄岩人,硕士研究生,主要研究方向:通信与信息系统、计算机网络安全、人工智能; 汪斌强(1963-),男,安徽潜山人,教授,博士生导师,主要研究方向:宽带信息网络、高速路由器; 张建辉(1977-),男,河南叶县人,讲师,博士,主要研究方向:网络路由; 贺磊(1974-),男,河南郑州人,讲师,博士,主要研究方向:计算机网络安全。

文章编号:1001-9081(2011)07-1776-05doi:10.3724/SP.J.1087.2011.01776

(国家数字交换系统工程技术研究中心,郑州 450002)

()

摘 要:在案例推理(CBR)案例检索匹配中,不同案例通常由不同的特征构成。而传统的CBR引擎模型大多采用固定权值模式,导致系统在匹配精度方面的性能很低。为了解决这一问题,提出一种CBR变权值引擎模型,在其特征权值计算模块引入人机互动机制,基于群决策法计算主观权值,提出依据专家个体和群体决策差异的主观权值调整方法;基于相似粗糙集法计算客观权值。最后设计了一种综合权值调整算法,通过计算主观权值和客观权值间的距离,判断两者的偏离程度,从而推导出权值调整系数,得到最终的权值调整结果。通过网络攻击案例进行的算例分析和仿真实验验证了上述方法的正确性和优越性。

关键词:案例推理;特征权值;群决策方法;相似粗糙集;综合权值

中图分类号:TP181文献标志码:A

Case-based reasoning engine model with

variable feature weights and its calculation method

HUANG Zhe-jing,WANG Bin-qiang,ZHANG Jian-hui,HE Lei

(National Digital Switch System Engineering and Technological Research and Development Center,Zhengzhou Henan 450002,China)

Abstract: In the Case-Based Reasoning (CBR) case retrieving and matching, different cases are usually composed by different features. But most of the traditional CBR engines adopt fixed feature weights mode, which makes matching rate of whole system very low. To solve this problem, this paper proposed a CBR engine model with variable feature weights and brought interactive mode into feature weights calculating module. It calculated subjective weight based on group decision-making theory and proposed an adjustment method which used differences between a single expert and his group. It used similarity rough set theory to calculate objective weight in order to make results calculating more objective and accurate. At last, it designed composite weights adjustment algorithm which calculated the distance between the subjective weight and objective weight, considered the deviation degree of those two weights, then deduced weights adjustment coefficient, and get the final weight adjustment results. The calculation example and simulation analysis of network attack cases validate the effectiveness of the proposed method and prove this method has much better performance in different performance indexes.

Key words: Case-Based Reasoning (CBR); feature weight; group decision-making method; similarity rough set; synthetical weight

0 引言

在基于案例推理(Case-Based Reasoning,CBR)中,最重要的环节是案例的检索,即根据目标案例在案例库中寻找相似的案例进行匹配,找到与目标案例最为相似的案例。这一过程中最关键的技术是案例间的相似性度量。现有的大多数CBR模型,例如Aamodt-Plaza[2]和Leake[3],都采用k-最近邻算法(k-Nearest Neighbor,k-NN)来计算案例间的相似度。该算法在与目标案例计算加权距离时所使用的案例特征权值都是相同的,这就为解决实际问题带来一定的误差。因为在求解实际问题时,各特征的权值直接影响着案例匹配的质量,例如在入侵检测系统中,不同攻击的案例通常由不同的特征构成,即使是相同的特征,在不同案例中的重要程度即权值也有差异。因此必须对上述问题进行两个方面的研究:1)提出一种CBR变权值引擎模型,去除k-NN算法中权值不变的设定,使各特征权值在相似度函数计算中设置为不同的值;2)设计出适合于上述模型的权值计算方法,以符合实际问题的求解,提高系统解决问题的精度。

在CBR引擎模型方面,文献[4]给出了一种经典的CBR引擎模型,但是在案例特征权值的存储和传递中依旧采用固定的特征权值工作结构,不能有效反映案例的实际特征。在特征权值计算方面,文献[5]采用主观赋权法,充分考虑了领域专家的意见,利用改进的层次分析法(Analytic Hierarchy Process,AHP),动态分析和综合各个专家的意见,构造案例特征相互重要程度的判断矩阵,最后确定各特征的权值,但是这种方法容易受到专家个人偏好影响,数据缺乏客观性。文献[6-8]采用客观赋权法,数据具有很强的客观性。其中,文献[6]采用粗糙集理论首先对连续的特征进行离散化,在得到的离散化定性特征表中进一步进行特征权值的约简与计算,但是数据离散化有可能造成特征信息丢失。文献[7]采用相似粗糙集的方法,将传统粗糙集理论中的不可分辨关系推广为相似关系,得到各特征间的相似差别矩阵,然后对该矩阵进行属性约简和权值计算以确定特征权值,从而避免了数据离散化造成的特征信息丢失。文献[8]认为在CBR案例比较中,时间因素对历史案例可采纳度有显著的影响,因此在利用粗糙集理论进行权值计算后,引入了基于时序的案例特征权值调整算法,对案例权值进行调整,但其在引入时序调整因子时没有给出一个严格的标准。上述这三种方法都完全依赖机器计算的模型,缺乏相应的灵活性,数据反映的值相对于网络现实情况有一定的滞后性,有时不能反映用户的意愿。

在CBR系统设计时,一方面要确保特征权值计算的客观性,另一方面又不能完全依赖机器的自学习。因此本文提出一种CBR变权值引擎模型,在其权值计算模块将特征权值分为主观权值和客观权值,基于群决策法计算主观权值,并提出依据专家个体和群体决策差异的调整方法;基于相似粗糙集法计算客观权值,使计算值更加客观、精确。最后,在二者的基础上设计了一种综合权值调整算法得到最终权值计算结果。

1 CBR变权值引擎模型

1.1 具有变权值计算功能的CBR引擎

CBR引擎是CBR系统的核心模块,它负责CBR系统案例搜索、案例比较、相似度计算、特征描述、特征权值计算等功能。可以说引擎性能的好坏直接影响了整个CBR系统案例推理的质量以及对实际问题求解的能力。

本文对传统的CBR引擎做了一定的改进,去掉k-NN算法中权值不变的假设,引入变权值概念。在具体实现时又将该模块分为主观权值计算模块和客观权值计算模块,以期计算结果更加符合实际,并能够对权值进行灵活地调整。改进后的模型如图1所示,其中黑色箭头表示调用关系;白色箭头表示创建关系。

图1 变权值CBR引擎结构

图1中,特征权值计算模块分为主观权值计算模块和客观权值计算模块。两个模块分别根据各自的算法计算出相应的主观和客观权值,然后送入综合权值计算模块的WeightCalculate对象中进行权值综合计算,得出最终的结果。

1.2 特征权值计算模块工作流程

CBR系统是一个具有一定推理能力和领域知识的专家系统,但专家系统学习新知识的能力和效率都要比人类专家低得多;另外,专家系统运行时和人类专家(用户)不仅是一种简单地使用与被使用的关系,而应是一种合作的关系。因此,本文在特征权值计算模块采用人机互动机制,从而使特征权值计算更加精确,并且发现和解决问题的效率得到。该模块具体工作流程如图2所示。

图2 特征权值计算模块工作流程

由图2可知,本模块在运行时有多个环节可将决定权交给用户,例如在某案例无历史特征权值时,若用户对该问题比较了解,可手动进行权值输入,无需进入专家系统计算模块以避免多次调用机器学习算法而给系统增加负荷。同时,如果用户在系统运行过程中需要调整权值,则可随时进入权值调整模块进行案例特征权值的调整。另外,客观权值是基于一系列历史数据得出的,可以在系统日常维护阶段就计算好存储在数据库中,而不必每次进行计算。若用户觉得其需要调整,则可以令其重新计算以更新其值。

2 特征权值计算方法

根据第1章提出的变权值引擎模型,本节给出适用于其中的特征权值计算方法。

2.1 主观权值计算

特征权值的主观计算可以看做一个多属性决策问题[9],即通过专家解决具有多个属性(特征)的有限方案的排序和优选问题,所以可引入群决策理论。另外,专家决策的最终目的是各位专家的意见与群体的意见趋于一致,而以往的主观权值计算方法都忽略了专家个体与群体在决策结果上的差异。因此本文对此提出一定的修改,即通过计算专家个体决策结果与群体决策结果的偏离程度来对主观权值进行调整,使专家决策趋于一致,同时使计算结果合理。

设多属性群决策中专家群体为E{e1,e2,…,es},专家ek的权重为λk,0≤λk≤1,1≤k≤s,λk由Delphi法确定,其值受专家的知识结构、学术水平、工作经验以及对问题的熟悉程度等方面的约束。设待评估的案例集为U{X1,X2,…,Xm},各案例的特征属性集为Ci{ci1,ci2,…cin},则cij表示第i个案例的第j个特征,其中1≤i≤m,1≤j≤n。

向s个专家进行的调查问卷为Q,其问卷形式为

(1)

其中:Qk表示E{e1,e2,…es}中第k个专家的调查问卷,qij表示第i个案例的第j个特征的得分,0≤qij≤10。

根据式(1)的问卷形式,得到第k个专家确定的第i个案例的第j个特征的得分为akij。由几何平均法综合上述s个专家的意见,得到s个专家确定的第i个案例的第j个特征的得分的平均值为

aij(∏sk1akij)1/s(2)

由此可得由s个专家确定的特征重要性的矩阵:

A(aij)m×n(3)

则第i个案例的第j个特征的初始主观特征权值为

ωij′; i1,2,…,m, j1,2,…n(4)

由式(4)可得各方案初始主观特征权值的向量为Wi′(ωi1′,ωi2′,…,ωin′)T,1≤i≤m。

专家群对于第i个案例的第j个特征的得分值为:

bij∑sk1akijλk(5)

定义1 专家ek对于第i个案例的第j个特征的个体打分结果与群体打分结果的偏差为:

θkijakij-bij(6)

式(6)表明专家个体和专家群体对同一个问题的认知度,其理想状态应是个体和群体打分结果趋于一致,即θkij的值为0。

定义2 专家ek对于第i个案例所有特征的个体打分结果与群体打分结果的偏差和为

pki∑nj1(θkij)2 (7)

由式(6)、(7)可得专家对于第i个案例的第j个特征个体打分结果与群体打分结果的偏差权值为:

μij∑sk1(θkij)2/∑sk1pki(8)

其中:μij表示专家对于某一案例的某特征认识的争议程度,μij越大说明专家们对于该特征分值的争议越大,相应的初始主观特征权值的调整幅度越大;反之,该特征初始主观特征权值调整的幅度越小或者不调整。

调整后的主观权值为:

ωijωij′-μij; i1,2,…,m, j1,2,…,n(9)

式(9)表明,对于值较大的μij,其对应的ωij′争议越大,公信度较低,应较大幅度地降低其权值比重,以待进一步调整;同理,对于值较小的μij,其对应的ωij′争议较小,公信力较高,其权值比重降低幅度也应越小或者不变。由式(9)可得各方案各特征的主观权值的向量为Wi(ωi1,ωi2,…,ωin)T(1≤i≤m)。

2.2 客观权值计算

本文在计算客观权值时采用相似粗糙集理论,以避免传统粗糙集方法[10]因数据的离散化处理而导致信息丢失现象,从而使计算结果具有很强的客观性。本文在此仅给出算法流程,具体步骤请参见文献[11]。

客观权值计算法流程如下所示:

输入:属性决策表,包含案例各特征属性的实际数值;

输出:案例集属性的特征权值。

第1步 计算相似度差别矩阵;

第2步 对相似差别矩阵进行属性约简;

第3步 求属性约简后的相似差别矩阵;

第4步 基于上述属性约简后的相似差别矩阵,求出其独立属性;

第5步 计算案例特征权值,并得到各方案客观特征权值的向量B(β1,β2,…,βm)T。

第2步中的特征属性约简算法可参见文献[12]。由上述算法步骤可以看出,虽然粗糙集理论计算的特征权值具有很强的客观性,但是其计算结果为某一问题案例集共有属性的特征权值,即不同案例间所有属性的权值结果相同。这不能适应不同案例具有各自特征权值的需求,因此还需结合主观权值来加以综合计算。

2.3 综合权值计算

当主观权值与客观权值分别由各自模块计算出后,送入图2所示的综合权值计算模块进行权值的综合计算与调整。以客观权值为依据,以主观权值为调整对象,通过计算二者间的距离,从而得到调整系数,最终得到综合权值。这样不仅充分利用了数据的客观性,而且使决策过程中人的作用得以凸显,有利于得到更加精确的结果。

定义3 设案例集U{X1,X2,…,Xm},各方案共有的属性集为Ci{ci1,ci2,…cin},cij表示第i个案例的第j个特征(1≤i≤m,1≤j≤n)。主观计算法的结果为Wi(ωi1,ωi2,…,ωin)T,客观计算法的结果为B(β1,β2,…,βm)T,则二者间的相似性度量为Si(si1,si2,…,sin)T,且有

sijβj/ωij, ωij>βi

ωij/βj, ωij≤βi (10)

以客观权值为参考,sij1表示主观和客观权值计算结果无差异;若ωij>βi表示主观计算与客观计算正相似;若ωij≤βi,表示主观和客观计算结果负相似。

定义4 设各特征权值的理想解为F*(f*1, f*2,…, f*n)T,且其相似度量为S*(s*1,s*2,…,s*n)T;设负理想解为F0(f 01, f 02,…, f 0n)T,且其相似度量为S0(s01,s02,…,s0n)T,则主和客观权值计算结果之间的相似差异与理想解的距离为

d*i(11)

同理可得其与负理想解的距离为

d0i(12)

由于本文假设以客观计算结果为参考,则可以设理想解F*B,则由式(9)得F*的相似度量为S*(1,1,…,1)T,由补集关系知负理想解F0的相似度量为S0(0,0,…,0)T,从而式(10)、(11)转化为

d*i(13)

同理可得其与负理想解的距离为

d0i(14)

将主观计算结果与理想解f*i的相似度记为τi,则其相对于负理想解的相似度为1-τi,则综合权值距离为:

D(τi)(τid*i)2 + [(1-τi)d0i]2

τ2i∑nj0(sij-1)2 + (1-τi)2∑nj0s2ij(15)

令0,得到τi,也即主观和客观权值调整系数为

τi11+(16)

综合上述过程,调整系数τi是以客观权值为标准计算得出的,但由于客观权值是根据历史数据计算得到,虽然精确但具有滞后性;而主观权值虽然客观性较弱,却是由专家综合个人经验和现实情况得出的,更为贴近当前的真实情况。因此应以主观权值作为调整对象,以调整系数τi对其进行线性加权计算。从而得到调整后的权值为

ω*ijωijτi(17)

由式(17)可得各方案各特征的综合权值的向量为W*i(ω*i1,ω*i2,…,ω*in)T,1≤i≤m。

3 算例分析和仿真实验

3.1 算例分析

本文以KDD CUP 99中的数据集为例,结合Snort所给的规则集,并通过第2章介绍的算法进行算例分析。表1列出了几种常见的网络攻击和相应的属性特征,将每种攻击都看做一个案例,则能明显地看出相同的属性对于不同攻击的重要性不同,其中ICMP PING Attack1 与 ICMP PING Attack 2为攻击特征不相同的ICMP PING攻击。有的属性(例如内存消耗)对DoS Attack来说具有很大的标识作用,而对于其他攻击则可忽略不计。同时此表对于粗糙集算法来说亦可看成是属性决策表。

表2给出了根据2.1节介绍的方法计算的初始主观权值的结果,其中由5位专家进行决策,其权重分别为0.346,0.168,0.213,0.161,0.112。

表1 常见网络攻击案例集

表2 主观权值计算结果

根据2.2节介绍的相似粗糙集方法计算出的结果为:

B(0.2035,0,0.1861,0.2608,0.2083,0.4719,0.5376,0.3086,0.5651)T

其征c1按照其在流量中出现的统计平均值计算。

由上述结果可以看出,经过主观和客观计算的特征c2的权值都为0,说明该特征在案例比较时可以不予考虑。这也符合表1给出的实际数据,在表1中该类特征在不同案例之间的数据都相等,说明其不能起到区分不同类事物的作用,因此该类特征称为可约简特征。

以特征c1的主观和客观计算结果为例,进行综合权值的

计算。由式(9)可以得到c1的相似性度量S1为:

S1(0.7022,0.7731,0.6703,0.6919,0.6408,

0.7996)T

由式(12),(13) 可得特征c1的相似性度量与理想解、负理想解的距离为d*10.7171,d021.7510,则根据式(15)得特征c1的调整系数τ10.8564。按照同样的方法可以得到其他特征的调整系数为:

τi(0.8564,0,0.9995,0.9677,0.9903,0.9932,

0.9991,0.8534,0.9613)T

最后,由式(16)得出调整后的权值见表3。

表3 综合计算后的权值结果

3.2 仿真实验

本文采用jCOLIBRI软件构造了一个基于CBR技术的网络入侵检测仿真平台。案例库采用XML的组织形式,而案例库中的案例是由Snort规则集转化而来。

案例匹配精度rc是衡量CBR系统的一个重要技术指标。它反映了CBR根据目标案例在案例库中寻找相似案例的能力,其计算公式如下:

rc(17)

其中:cnum表示案例库中案例的总数;ccorrect表示正确匹配案例的个数,0≤rc≤1。如图3显示了采用KDD CUP 99作为测试数据集,并用4组不同权值计算方法的精确度比较曲线。分别为:采用固定权值引擎模型(Fixed Feature Weight,FFW),单独采用主观权值计算法(Subjective Variable Weight,SVW),单独采用客观权值计算法(Objective Variable Weight,OVW),采用本文提出的综合权值计算法(Subjective/Objective Variable Weight,S/OVW)。

图3 不同权值计算方法的匹配精确度比较

由图3可以明显看出,采用变权值的三种方法的匹配精确度均比固定权值的高;单独采用主观权值计算法的精确度忽高忽低,显示出了主观计算方法的权值随专家认识的不同而有一定的波动,从而使案例匹配精度不是很稳定;单独采用客观权值计算法的精度很稳定,但总体精度仍不是很高;而采用综合变权值计算方法的精度明前高于前三种方法,且其随着案例个数的增加而提高,显示了该算法的优越性和强大的学习能力。

图4显示了4种方法在精确度、专业度、灵敏度三个指标上的柱状图,其中cnum100。精确度为如前所述的匹配精确度;专业度表示CBR系统解决问题的效果是否达到专家系统应具备的标准;灵敏度用来衡量系统对于未知问题(例如未知网络攻击)是否具有较强的发现能力。

图4 不同权值计算方法的三种指标的比较

由图4可以看出,FFW方法在综合性能方面远逊于采用变权值的三种算法。而变权值的三种方法中,S/OVW的专业性最好,OVW次之,表明S/OVW解决问题的效果最符合预期效果,而SVW虽然是各位领域专家评估的结果,但是各位专家对同一问题的认识有所偏差,因此造成了其最终结果并不如OVW依据客观数据给出的结果。就灵敏度来说,SVW的灵敏度最高,S/OVW次之,说明了主观计算在解决未知问题方面具有很高的效率,而单纯的机器学习算法OVW在这方面要略逊一筹,这也符合了客观实际,即人的认识总是超前于机器。

图3、图4是不同权值计算模型的CBR系统匹配精度的纵向比较,而图5则显示了不同的人工智能(Artificial Intelligence,AI)方法在匹配精度方面的横向比较。其中J48为一种决策树算法;RIDOR是一种基于规则的分类算法;CBR-VFW是基于本文提出的变权值CBR引擎模型。对于前两种AI方法,匹配精度理解为对于同一待解决问题,其在自己的规则库中搜索匹配的精度。综合图3和图5可以看出采用固定权值的CBR模型在精度方面甚至不如J48和RIDOR;而单独采用主观或者客观变权值方法的CBR模型性能略好于上述两种AI算法;而采用本文提出的权值计算方法的CBR模型性能则优于J48和RIDOR,说明其充分发挥了CBR的性能优势。

图5 不同人工智能方法的匹配精确度比较

4 结语

本文针对传统CBR引擎的缺点,一方面提出适用于CBR的变权值引擎模型并在特征权值模块引入人机互动机制,使CBR系统适应了不同案例不同特征的需要,更好地刻画和反映实际问题,使案例推理的结果更加精细。另一方面研究了适用于该引擎模型的特征权值计算方法,基于群决策理论,利用专家个体和群体决策结果的差异计算并调整主观权值,使主观权值结果更具合理性;基于相似粗糙集法计算客观权值,避免了数据在离散化时导致的信息丢失,使计算结果更加精确;最后通过对上述二者的综合计算与调整得出最后的特征权值。算例分析和仿真实验表明上述方法兼具了主观计算方法的灵活性和客观计算方法的准确性,并且通过不同技术指标证明了该方法的优越性。本文下一步的工作将会集中于CBR变权值引擎模型的可扩展性研究以及基于时间和空间等不同尺度的特征权值调整方法等方面。

文献综述的基本特征范文第2篇

关键词: 主成分分析;排序;资源约束;定权

中图分类号:F224 文献标识码:A 文章编号:1671-7597(2011)1210091-01

0 引言

企业在生产实际中,会从战略角度考虑选择在一定时间内为企业带来最大收益的生产任务组合。在面对多个生产任务时,企业往往要对生产任务进行优先级排序。只有明确了不同生产任务对于企业的重要程度,才可以科学地配置资源进行后续的工作。生产任务优先级的评定需要综合考虑多方面的因素,包含主观和客观因素,客观因素可以用一定数值表示,主观因素也可以凭借经验转化为客观数值指标。但是,往往不能从这些数值直接判断生产任务的优先级。因此,需要一种较为科学的方法来进行推断。

生产任务优先级的评定方法有交货期惩罚函数方法[1][2][3]、模糊综合评价方法[4],交货期惩罚函数模型中许多参数需要人工进行赋值,具有一定的主观性。模糊综合评价方法需要较大的样本才能很好的做出评价,而生产任务的数量往往较小,不具备大样本的条件,较为牵强。本文采用基于主成分的分析方法,从生产任务的多个实际指标,综合评定生产任务的优先级排序,客观合理的解决资源冲突等相关问题,为企业带来最大化的利益。

1 主成分分析原理

PCA定权是利用主成分析方法在提取主成分时,通过求取各个分量在主成分中的比重,进而计算得到了权。在这里转换为,通过PCA变换,可以找到企业的经营与各项指标之间的关系,从而得到权重。

第一步:求 的特征值和特征向量。

根据特征方程 (I为单位矩阵),求得个非负实根,即特征值,其中 ;它们对应的特征向量是

第二步:求主成 分。

当求得特征值和特征向量后,就可以得到以 为系数向量的主成分:Y1=X 、Y2=X 、…、Ym=X 。由于 ,所以Y1、Y2、…、Ym分别代表着第一主成分、第二主成分、…、第m主成分。

第k个主成分Yk的方差贡献率计算公式如下:

贡献率达到85%,认为这m个主成分完全可以代表所有的主成分,能够表达的全部信息量。

2 基于主成分分析的定权原理

在第2节中,介绍了主成分分析的基本原理,从中提取主成分:

式中D1、D2…、Dn是n个指标。

由于 有些为正的数值,有些为负的数值;因此采用各自的平方作为各个指标的权,为了使得权的和等于1,进行适当的处理,记为: 。

3 应用实例

下面的表1是4个生产任务的投资指标,根据这些指标排定生产任务投资的优先顺序。本实例将应用本文前面所陈述的方法进行计算。由于涉及较多的矩阵计算,因此在MATLAB平台上进行计算非常方便,具体过程结果如下。

表1 生产任务的评价指标

1)将上述的指标构造成指标矩阵Y。

2)求Y矩阵的特征值和特征向量,分别用P和U两个矩阵表示,计算结果如下。

3)根据矩阵P计算贡献率和累计贡献率,见表2。从表2中可以知道第一特征值的贡献率达到了93.9%;到第二特征值时,累积贡献率达到了99.9%。因为,可以从前两个主成分入手,计算其综合主成分。

表2 贡献率和累积贡献率

4)计算综合主成分。

综合主成分用 表示,第一、二主成分为 的表达式如下。

通过公式5,可以看出综合主成分 等于P1、P2、P3、P4的加权之和,而权的大小决定了生产任务的重要性程度,其生产任务优先级排序结果是:1-2-4-3。公式5的实际意义代表了,生产任务的综合效益情况,根据指标计算出各个生产任务在综合效益中的比重情况,因此,从公式5确定任务的权,并作为生产任务优先级排序依据是合理的,可靠的。

4 结语

通过分析主成分分析的原理,以生产任务的多个数据指标建立了主成分分析模型,通过计算综合效益确定生产任务的权重,以权重作为生产任务优先级的排序依据。方法科学合理,结果可靠,表明了以主成分变换为基础的任务优先排序具有现实意义,能够知道企业生产中的排序问题。

参考文献:

[1]宋丽红,软件组织多项目协同管理研究[M].天津:天津大学,2006.

[2]谭云涛、郭波、郑敏,企业多项目管理中的优先排序问题研究[J].管理工程学报,2005,19:152-155.

文献综述的基本特征范文第3篇

关键词:前列地尔注射液;肝炎,病毒性;Meta分析

前列地尔(前列腺素E1)是一种高效生物活性物质,不仅有明显扩张血管作用,还具有抑制血小板聚集、降低血液黏度和红细胞聚集性、改善微循环、防止动脉粥样硬化脂质斑形成和改善神经损伤等作用[1]。研究发现,前列地尔具有保护肝细胞的作用,它能稳定溶酶体和细胞膜,增加肝脏血流量,抑制有害细胞因子的释放,还能抑制活性氧产生,对于过强的免疫损伤机制具有抑制调节作用[2]。研究表明,在综合治疗的基础上加用前列地尔对慢性重症肝炎具有明显降酶、退黄、改善凝血机制,预防发生肝肾综合征等作用,可防止病情进一步恶化[2]。我国肝炎患者数量众多,发生率高,严重影响人民健康,病毒性肝炎是我国重点防治疾病之一。笔者在本研究旨在通过系统评价的方法评价前列地尔注射液治疗病毒性肝炎的有效性和安全性,以期为临床合理用药提供依据和参考。

1资料与方法

1.1选择标准1.1.1纳入标准①研究设计:随机对照试验(RCT)。②研究对象:确诊的病毒性肝炎患者,临床试验纳入的患者年龄、性别不限。③干预措施:在给予综合基础治疗的同时,试验组给予前列地尔注射液,对照组仅给予综合基础治疗,包括常规护肝、退黄及血液制品等,各研究的综合基础治疗有所不同。④评价指标:采用下列一项或多项的疗效和安全性判定指标均被纳入:总有效率(治愈+显效+有效)、并发症发生率(包括肝肾综合征发生率、肝性脑病发生率及出血发生率)、不良反应发生率。1.1.2排除标准①单纯描述性研究,无对照的临床试验。②除综合基础治疗外,加用其他治疗病毒性肝炎药物而影响治疗因果关系判断的。③与其他药物联合用药治疗病毒性肝炎的文献。④采用其他疗效评价指标。⑤存在其他无法比较的混杂因素。1.2文献检索计算机检索Medline(1966—2015),Embase(1989—2015),Cochrane图书馆临床对照试验资料库(2015年第3期),CBMdisc(1978—2015),中国知网(CNKI)(1979—2015),万方数据库(1990—2015)及维普数据库(VIP)(1989—2015)。进行数据库检索时,针对各类数据库的特点,采取相应的检索策略和检索式,英文检索词主要有alprostadilinjection,LipoPGE1,viralhepatitis等;中文检索词主要有前列地尔注射液,脂微球前列腺素E1,病毒性肝炎等,纳入文献语种为英文和中文。1.3文献评价与资料提取1.3.1资料提取由2名评价员独立根据预定的纳入、排除标准筛选文献,并通过讨论解决分歧。提取资料项目包括方法学、随机分配的病例数、人口学特征、干预和对照措施的种类、剂量、测量指标的变化、不良反应发生情况等。1.3.2质量评价纳入研究的方法学质量使用Jadad改良法制定的量表进行评价。具体方法如下:随机序列的产生恰当为2分,不清楚为1分,不恰当为0分;分配隐藏恰当为2分,不清楚为1分,不恰当为0分;盲法恰当为2分,不清楚为1分,不恰当为0分;撤出与退出,描述为1分,未描述为0分,记分为1~7分,1~3分为低质量研究,4~7分为高质量研究。由2名评价员独立检索并提取资料,意见不一致时通过讨论解决。1.4数据分析采用Cochrane协作网制定的RevMan5.1软件进行Meta分析。计数资料用相对危险度(relativerisk,RR),以95%可信区间(confidenceinterval,CI)表示。当检验无异质性(P>0.1,I2<50%)时,采用固定效应模型进行数据合并分析。如果研究间存在异质性(P≤0.1,I2≥50%)时,则采用随机效应模型进行数据合并分析。若异质性过大导致不能合并则采用描述性分析。对表述不清或无法分析的数据不采用。发表偏倚用失安全系数(Nfs)估算[3]。Nfs是对发表性偏倚的量化估算。若发表性偏倚对Meta分析影响较大,则只需要新增几个无统计学意义的研究,就能使合并效应量检验结果无统计学意义,而发表性偏倚影响较小时,则需要新增很多个研究,才能改变检验结果。所以,评价发表性偏倚的作用大小,也就是相当于回答需多少阴性研究结果可以使结论逆转,即所谓“失安全系数”。其计算公式为Nfs=K[(Z2-1.6452)]/1.6452(P=0.05),失效安全数越大,说明发表性偏倚的影响越小。

2结果

2.1纳入研究的特点和质量评价根据纳入和排除标准最终纳入14个RCT[4-17],包括1232例患者,其中试验组641例,对照组591例,全部为中文文献。所有纳入研究的治疗组和对照组均采用病毒性肝炎的综合基础治疗。纳入研究的基本特征见表1。14项研究中2项[4,17]随机化方法采用随机数字表法,其余均未描述随机分组的具体方法、是否进行分配隐藏。1项研究[4]描述退出情况。除1项研究[10]采用单盲法(未交待具体方法)外,其余研究均未提及是否采用盲法。Jadad改良量表评分均为1~3分,为低质量文献。

2.2Meta分析结果2.2.1总有效率14项研究[4-17]均报道治疗的总有效率,对上述14个研究进行合并分析,结果显示,采用随机效应模型(异质性检验:P<0.0001),合并效应量RR=1.59[95%CI(1.45,1.74)],P<0.00001,具有显著的统计学意义,表明前列地尔注射液+综合基础治疗组的治疗效果优于综合基础治疗组。计算得Nfs=519,即519个阴性的研究结果才可使本结论逆转,这一数值远大于本研究纳入的独立试验数,说明发表偏倚的影响可能很小。见图1。14项研究中5项研究[6-7,11,15,17]剂量为10μg,qd,进行亚组分析,对上述5个研究进行合并分析,结果显示,采用随机效应模型(异质性检验:P=0.09),合并效应量RR=1.30,95%CI(1.10,1.52),P=0.002,具有显著的统计学意义;6项研究[4-5,8-10,16]剂量为20μg,qd,对上述6个研究进行合并分析,结果显示,采用固定效应模型(异质性检验:P=0.78),合并效应量RR=1.57,95%CI(1.34,1.85),P<0.00001,差异有统计学意义。表明前列地尔注射液(10,20μg)+综合基础治疗组的治疗效果均优于综合基础治疗组,且剂量20μg疗效优于10μg。

2.2.2并发症发生率2项研究[4,7]报道并发症的发生,对上述2个研究进行合并分析,肝肾综合征发生率的比较,结果显示,采用固定效应模型(异质性检验:P=0.73),合并效应量RR=0.49,95%CI(0.31,0.77),P=0.002,差异有统计学意义,表明前列地尔注射液+综合基础治疗组肝肾综合征发生率少于综合基础治疗组,计算得Nfs=6,说明可能会有发表偏倚的影响;肝性脑病发生率的比较,结果显示,采用固定效应模型(异质性检验:P=0.76),合并效应量RR=0.76,95%CI(0.45,1.28),P=0.30,差异无统计学意义,表明前列地尔注射液+综合基础治疗组和综合基础治疗组肝性脑病的发生率无差别,计算得Nfs<0,说明发表偏倚的影响很大;出血发生率的比较,结果显示,采用固定效应模型(异质性检验:P=0.62),合并效应量RR=0.93,95%CI(0.56,1.52),P=0.76,无统计学意义,表明前列地尔注射液+综合基础治疗组和综合基础治疗组出血的发生率无差别,计算得Nfs<0,说明发表偏倚的影响很大。

2.2.3不良反应发生情况9项研究[4,6-8,10,12-14,16]报道了不良反应情况,见表2。3讨论重型病毒性肝炎是以肝细胞广泛坏死为基本病理改变,病情重,发展快,并发症多,病死率高。目前常规药物治疗主要有促肝细胞生长素、甘草酸二铵等护肝药物及退黄药物。但治疗效果不理想,预后很差,国内统计,病死率50%~70%[18]。前列地尔注射液是以脂质微球为药物载体的PGE1静脉注射液,由于脂质微球的包裹,使前列腺素不易失活,而且它利用脂质微球特殊的亲和力发挥靶向作用,使PGE1能聚集于病变部位,从而大大减少PGE1的用量,明显减少其对血管的刺激和炎症反应。其说明书适应证有用于慢性肝炎的辅助治疗。本研究的Meta分析结果显示,对病毒性肝炎患者加用前列地尔注射液治疗组的治疗效果优于综合基础治疗组,两组比较差异有统计学意义。同时,LipoPGE1在临床应用中,可通过直接扩张肾血管增加肾血流量改善肾功能,并通过扩张血管抑制血小板聚集、抑制血栓素A2的合成,改善前列环素与血栓素的比值,从而减少肝肾综合征的发生率,与本次Meta分析的结果一致,但对于肝性脑病和出血的发生前列地尔注射液+综合基础治疗组和综合基础治疗组差异无统计学意义。文献表明[1],前列地尔的不良反应多数与该药的扩张血管作用有关,造成头痛、面红和注射部位红肿等。前列地尔的抑制消化腺分泌作用,可引起食欲减退和口干等不良反应。这些不良反应于每次静脉滴注结束后消退,最迟给药结束后4h完全消失。本次检索未发现前列地尔注射液临床应用相关的严重不良反应。由于本系统评价所用资料均为已发表的文献,缺乏灰色文献,部分结果计算的Nfs数值较小,提示可能存在发表偏倚,可能与阴性结果的研究不易发表、纳入研究的方法学质量较低有关。因此,对上述Meta分析结果应持谨慎态度,若想得出具有说服力的最终结论,还需开展设计合理的多中心、随机双盲对照试验以及更多的药物经济学研究。

参考文献:

[1]王丽.前列地尔的临床应用[J].天津药学,2006,18(2):52-54.

[2]李勇,唐捷.前列地尔的药理研究进展[J].西南军医,2006,8(6):79-81.

[3]ROSENTHALR.Thefile-drawerproblemandtoleranceofnullresult[J].PsycholBull,1979,86(45):638-641.

[4]马明,胡宁娜,燕兰英.前列地尔注射液治疗重症肝炎50例疗效分析[J].中日友好医院学报,1999,13(5):297-298.

[5]顾慧华,田力,薛来英.前列地尔注射液治疗慢性重型肝炎60例疗效观察[J].中国医师杂志,2002,4(12):1397-1398.

[6]王建玲.前列地尔注射液(凯时)治疗慢性重症肝炎25例临床观察[J].现代中西医结合杂志,2002,11(5):397-398.

[7]谌辉.前列地尔治疗重型病毒性肝炎42例[J].医药导报,2003,22(4):236-238.

[8]陆建中.凯时治疗慢性重型肝炎52例临床观察[J].徐州医学院学报,2003,23(4):340-341.

[9]谭晓慧,蒋道荣,徐芳芹,等.前列地尔对重度慢性乙型肝炎疗效观察[J].中国交通医学杂志,2004,18(3):263-264.

[10]观晓辉.甘草酸二铵注射液联合凯时治疗病毒性肝炎重度淤胆的临床观察[J].实用医学杂志,2005,21(13):1457-1458.

[11]冼永超,杨景毅,黄成军,等.前列地尔治疗重型肝炎40例临床观察[J].华夏医学,2006,19(1):51-52.

[12]张德和,彭春仙,吴志宇.前列地尔治疗病毒性肝炎高胆红素血症的疗效观察[J].临床肝胆病杂志,2006,22(4):290-291.

[13]陈彬,林志刚,邱赏赐.前列地尔脂微球载体治疗重度黄疸型肝炎68例疗效观察[J].福建医药杂志,2008,30(1):134-135.

[14]杨景毅,倪辉,冼永超,等.前列地尔治疗慢性重型肝炎65例临床疗效观察[J].中国现代药物应用,2009,3(16):101-103.

[15]吴志宇.前列地尔对急性黄疸型戊型肝炎患者肝功能的影响[J].海峡药学,2011,23(10):106-107.

[16]颜炳柱,陈立艳,康岚,等.前列地尔联合腺苷蛋氨酸治疗病毒性肝炎高胆红素血症疗效观察[J].胃肠病学和肝病学杂志,2011,20(9):839-841.

[17]张海燕,范晖.前列地尔联合复方甘草酸苷治疗重度慢性乙型肝炎合并淤胆的疗效及对血清生化指标的影响[J].中国医学前沿杂志:电子版,2014,6(5):136-138.

文献综述的基本特征范文第4篇

[关键词]产业格局 指标体系 主因子分析法

一、主因子分析法

1.原理及优点

运用主因子法,首先对原始数据进行标准化处理,计算变量之间的相关系数,形成相关系数矩阵,接着计算特征值和特征向量,据此计算贡献率和累积贡献率,一般取累积贡献率达85%以上的特征值为对应的主因子,然后计算主因子载荷量,最后根据特征向量和主因子载荷量计算各变量的主因子得分。在分析实际问题时,可只取前K个以累积贡献率达85%以上的特征值为对应的主因子来代表原变量的变差信息,以减少工作量,这是主因子分析法的优点之一。此外,由于主因子分析在对原指标变量进行变换后形成了彼此相互独立的主因子,而且实践证明指标间相关程度越高,主因子分析效果越好,因而可以消除评价指标之间的相关影响是这种方法的另一个主要优点。

2.计算步骤

(1)原始指标数据的标准化。在综合评价方法中,原始数据的标准化或无量纲化的方法有很多,本文采用Z-scorce法。设有n个样本,p项指标,可得原始数据矩阵X=(Xij)nxp,i=1,2…n,n表示n个样本, j=1,2…p,p表示p个指标,xij表示第i个样本的第j项指标值,令

Zij=(Xij-)/Sj

式中:i=1,2,...p

(2)求指标数据的相关矩阵。R=(rjk)pxp,其中,rjk是指标j与指标k的相关系数。

(3)求相关矩阵R的特征根和特征向量,确定主因子。由特征根方程|λIp-R|=0可求得的p个特征根λg(g=1,2,…,p),它是主因子的方差,它的大小描述了各个主因子在描述被评价对象上所起的作用的大小,对其从大到小进行排列:λ1≥λ2≥…≥λp≥0。由特征根方程可知,每一个特征根对应一个特征向量Lg(g=1,2,…,p),将标准化后的指标变量转换为主因子:

Fg=Ig1Z1+Ig2Z2+…+IgpZpg g=1,2,…p

F1称为第一主因子,F2称为第二主因子,依次类推,Fp称为第p主因子。

(4)求方差贡献率,确定主因子个数。主因子分析法就是选取尽量少的K个主因子(k

(5)对K个主因子进行综合评价。先求每一个主因子的线性加权值,即第3个步骤中的Fg(g=1,2,...k),再以方差贡献率为权重,对这K个主因子进行加权求和,即得最终评价值V:

二、指标体系建立、数据的收集与整理及综合评价过程

根据西方主导产业理论以及区域主导产业选择的原则,本文将定量基准分为五类十个指标,分别为经济效益包括全员劳动生产率、产业增加值率、产值利税率,经济规模包括产值规模、资产规模,市场需求包括需求收入弹性,技术进步包括技术进步率、技术贡献率,产业关联包括感应度系数和影响力系数。根据主导产业选择的评价指标体,各项指标分别从《阜新统计年鉴》和《中国投入产出表》中选取相关数据计算求值。列入我们考虑范围内的产业个数为16个。

根据主成分分析的分析原理及步骤,运用SPSS统计分析软件包中的因子分析法, 并采用主因子分析法提取公因子,计算出相关系数矩阵、因子载荷矩阵等,最终求得综合评价值,并据此进行排序。各个产业排名依次是农产品深加工业、煤炭业、农业、冶金业、电力工业、交通运输业、建材业、电子工业、化学工业、餐饮业、建筑业、房地产业、旅游业、金融保险业、社会服务业及医药业。

三、确定“主导+支柱”产业格局的确立

通过定量分析确定阜新市经济发展的未来应该是以农产品深加工业为主导产业,农业为基础产业,煤炭业、冶金业、电力工业、交通运输业、建材业、电子工业为支柱产业的产业群,此产业群承担了阜新市经济发展相当大的份额,发挥着举足轻重的作用 ,是带动阜新市经济发展的中流砥柱。

参考文献:

[1]胡永宏贺思辉:综合评价方法[M].北京:科学出版社,2000

[2]于秀林任雪松:多元统计分析[M].北京:中国统计出版社,1999

[3]张广玉:基于PERT的预测方法研究[J].郑州航空工业管理学院学报(管理科学版),2004,22(3):111-112

[4]李艳双等:主成分分析法在多指标综合评价方法中的应用[J].河北工业大学学报,1999,(1):28-31

文献综述的基本特征范文第5篇

其中,各个分量的w为权重,ri,gi,bi分别为各个分量的第i(i=0,1,2,3)个dct系数。 3  利用纹理特征进行检索 3.1  提取纹理特征     在国际标准mpeg-7中建议了一种纹理特征描述符——边缘直方图[1]。边缘直方图是基于图像边缘的统计特征,能较好地反映目标的边缘和纹理特征,而且运算速度较高[4]。因此在本文中选取边缘直方图来提取图像的纹理特征。下面介绍一下提取的具体步骤:     (1)将bmp图像转换成灰度图。每个象素的灰度值可以根据rgb颜色分量按下列公式计算得到: 。     (2)将整幅图像分成4×4块。     (3)分别对16块1/16子图像进行sobel边缘算子运算,得到边缘图像。     (4)统计子图像中的边缘直方图,该直方图包括4个直方条。(横轴为0,1,2,3四个边缘方向,纵轴为该方向上的象素数占子图像总的象素数的比率)     (5)将16个子图像的直方条综合起来,得到包括64个直方条的整幅图像的边缘直方图。     下面介绍用sobel算子[5]提取图像边缘的具体算法:     首先介绍一下sobel算子中用到的4个核模板:

   

 (1)将图像中的象素点的灰度值分别与以上四个方向的核模板相乘。     (2)比较四个乘积数值,取最大的那个数值,作为该象素点的新的灰度值。     (3)取适当的阈值t,若新的灰度值≥t,则认为该象素点为边缘点。     通过以上算法提取出图像的边缘。 3.2  相似度计算     仍然采用欧式距离公式作为相似度的计算公式,如下: