首页 > 文章中心 > 计算机视觉研究

计算机视觉研究

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉研究范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

计算机视觉研究

计算机视觉研究范文第1篇

关键词:壁纸;计算机视觉;灰度共生矩阵;纹理

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2012) 11-0000-01

一、壁纸样本特征参数的获取

纹理是一种普遍存在的视觉现象,如木材表面、草坪、皮肤、织物、水波等都有各自的纹理特征,而纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的重要特征。壁纸大都仿制木材表面、皮肤、织物等物体,具有典型的纹理特征。因此,本文采用经典的灰度共生矩阵法对壁纸进行纹理特征参数的获取。

数学定义:灰度共生矩阵是从图像灰度为i的像元位置为(x,y)出发,统计与其距离为d,灰度为j的像元(x+Dx, y+Dy)同时出现的频度P(i, j, d,θ),数学表达为[1]:

P(i, j, d,θ)={[ (x, y), (x+Dx, y+ Dy) | f(x, y)= i;f(x+ Dx, y+ Dy)= j]} (1)

其中,θ为共生矩阵的生成方向,通常取0°、45°、90°、135°四个方向。Haralick等人由灰度共生矩阵提取了14个纹理特征参数,分别为角二阶矩、对比度、相关、熵、方差、均值和、方差和、逆差矩、差的方差、和熵、差熵、聚类阴影、显著聚类、最大概率,依次标为W1~ W14,表1列出了部分样本的纹理特征参数。

二、实验样本

实验样本选用了壁纸样本手册中的8类样本进行实验测试,每类样本包含100张初始样本图像,样本库共包含800张图像(100×8),如图2所示。为了便于进行识别实验,将样本分成3部分,依次为:标准样本集(70×8)、测试样本集(30×8)。

三、实验分析

为了能真实地反映所获取特征的识别能力,应选择相对简单的分类器,从而避免分类器差异对识别率的影响,因此,本研究选择最近邻分类器对壁纸样本进行识别。

观察表2可见,对壁纸测试样本集的总体分类识别率为87.50%,获得了较高的分类识别率。其中,对第5类板材样本的识别率最低为750%,对第3类的识别率最高为100.0%,这也能够反映出样本自身的复杂程度和灰度共生矩阵特征参数对各类样本的描述能力。

四、结论:

本文使用最近邻分类器对壁纸测试样本集合进行分类,总体识别率为87.50%,表明灰度共生矩阵特征参数能够有效描述壁纸的纹理特征,同时也表明采用计算机对板材进行分类识别取代人工识别是基本可行的。

参考文献:

[1]庄军,李弼程.一种基于灰度共生矩阵的文本图像识别方法[J].计算机工程,2006,32(3):214-216

[2]王克奇,王辉,白雪冰.基于模拟退火算法和最近邻分类器识别率的特征选择方法[J].自动化技术与应用,2007,26(1):27-29

[3]杨彩霞.基于Gabor变换与最近邻分类器的字符识别方法[J].西安文理学院学报(自然科学版),2010,13(4):83-85

计算机视觉研究范文第2篇

以下为报告详细内容:

2017年计算机视觉技术在更多的领域有所落地应用,自动驾驶领域、高考、政务等领域更多的场景开始应用计算机视觉技术。艾媒咨询分析师认为,计算机视觉行业技术是核心基础,随着技术成熟度提高,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多新的应用领域,提高商业落地应用。

2017年人脸识别技术在智能手机终端应用开始普及。9月苹果新品会上,iPhone X宣布引入Face ID高精度人脸识别技术,引来人们高度关注。而除了iPhone X,华为、小米、OPPO、vivo等手机厂商都推出了带人脸识别功能的智能手机。艾媒咨询分析师认为,计算机视觉领域内人脸识别功能可应用场景广泛,商业化落地能力强,除了计算机视觉创业企业,互联网巨头和硬件巨头企业也纷纷关注布局人脸识别领域。但目前人脸识别技术仍然存在一定缺陷,艾媒大数据舆情管控系统数据显示,“手机人脸识别”热词言值数据为48.5,整体舆情偏负向。现阶段人脸识别技术在智能手机终端上的应用仍处于起步发展阶段,技术和安全性仍有待提高,未来随着各计算机视觉企业加强技术研发,人脸识别技术有望进一步改善,成为智能手机标配。

iiMedia Research(艾媒咨询)数据显示,2017年中国计算机视觉市场规模为68亿元,预计2020年市场规模达到780亿元,年均复合增长率达125.5%。艾媒咨询分析师认为,人们安全和效率需求不断提升,计算机视觉技术在各行业应用能有效满足人们需求,市场发展空间巨大。国家政策对人工智能行业的支持也为计算机视觉的发展提供了有利的环境。随着计算机视觉技术日渐成熟,企业商业化落地能力不断提高,未来计算机视觉市场规模将迎来突破性发展。

iiMedia Research(艾媒咨询)数据显示,商汤科技以24.3%的企业知名度排名各计算机视觉企业首位,旷视科技与云从科技则分别以23.1%以及21.7%的知名度分列二三位。艾媒咨询分析师认为,商汤科技计算机视觉技术及算法能力在行业内较为出色,同时在安防、金融、商业、手机端等多个领域均有商业落地应用,在企业认知和品牌推广方面具有优势。

iiMedia Research(艾媒咨询)显示,61.7%的受访网民通过手机APP应用接触计算机视觉应用,另外有50.9%的受访网民接触途径为通过智能手机终端。艾媒咨询分析师认为,计算机视觉企业主要服务B端用户及政府机构,相比于其他途径,移动端更适合应用计算机视觉技术的产品推广。计算机视觉技术日趋成熟,在移动终端和APP上均有落地应用,也进一步为计算机视觉企业在大众中奠定基础。未来企业可通过线上渠道开发挖掘C端用户市场。

iiMedia Research(艾媒咨询)显示,半数受访网民认为智能手机及APP加入人脸识别技术功能方便了二者的使用,另有48.8%的受访网民认为人脸识别技术在手机及APP上的应用是未来技术发展的趋势。艾媒咨询分析师认为,人脸识别技术在手机及APP端的应用满足人们智能化和便捷化的需求,随着越来越多的手机及APP产品加入人脸识别功能,未来其普及和认可程度将得到进一步提高。

iiMedia Research(艾媒咨询)显示,41.8%的受访网民表示未来愿意使用人脸识别技术进行手机及APP解锁,同时有41.4%的受访网民虽持观望态度,但愿意尝试。此外,47.4%的受访网民认为人脸识别将取代其他手机及APP解锁技术成为未来主流。艾媒咨询分析师认为,近期智能手机纷纷应用人脸识别技术解锁推动该功能技术的普及,便捷性的优势使该功能技术前景受看好。但目前人脸识别解锁技术的准确性仍然受到质疑,随着未来技术进一步成熟,该技术有望成为智能手机设备标配。

iiMedia Research(艾媒咨询)显示,33.9%的受访网民曾使用过人证比对功能进行业务办理。在使用过该功能的人群中,54.6%认为其方便了业务办理,提供了效率,且有47.3%该部分人群认为其识别准确程度高。艾媒咨询分析师认为,政府、银行等机构业务办理效率以往常遭诟病,人证识别技术的应用提高了办事效率,在提高人们满意度的同时,加强了计算机视觉技术的认可度。未来计算机视觉技术在政府、银行等机构的落地应用将进一步扩展,但其中涉及到个人信息保护等问题需要企业及相关机构合力解决。

iiMedia Research(艾媒咨询)显示,34.1%的受访网民认为公安办案为最有必要应用人脸识别技术的安防情景。而关于网民对人脸识别技术在安防监控领域应用看法调查中,56.1%的受访网民认为其能有力保护人们人身财产安全。艾媒咨询分析师认为,计算机视觉技术,尤其是人脸识别技术在安防领域应用意义重大,在刑侦破案、身份认证、公共安全保护等情景具有重要应用价值。未来安防领域将成为计算机视觉技术重点应用领域,而安防的重要性也对相关企业技术实力有严格的要求,未来安防领域市场或由少数技术实力较强的企业占据。

商汤科技是专注计算机视觉与深度学习原创技术的人工智能创业企业,拥有强大的技术能力和人才资源储备支撑发展。商汤科技在计算机视觉领域综合实力较强,获资本方青睐,B轮融资4.1亿美元,同时与国内外知名企业展开合作。艾媒咨询分析师认为,商汤科技在商业营收上同样处于行业领先水平,但其本质专注于技术发展,强大的技术基础能较好支撑商汤科技在上层应用场景的扩展。商汤科技在技术驱动商业应用的同时,积累商业应用经验,提高企业知名度,拓展应用至更多领域。

艾媒咨询分析师认为,商业化落地能力欠缺是目前计算机视觉行业大部分企业的痛点,商汤科技在商业落地应用方面处于行业领先位置。这一方面源于商汤科技技术能力往专业化发展,以专业技术和研发基础实现场景差异化应用。另一方面,纯计算机视觉技术或算法由于其专业性,需求方在使用时需要具备专业能力,而商汤科技技术产品往标准化方向打造,打包成行业解决方案,能适应更多企业使用需求,也有利于商汤科技技术进一步落地应用。未来坚持技术为基础,继续提高商业落地能力,商汤科技有望继续保持良好发展态势。

旷视科技成立于2011年,2017年10月完成巨额C轮融资,专注于人脸识别、图像识别和深度学习技术自主研发和商业化落地,深耕于金融安全、城市安防、商业物联、工业机器人等领域,同时打造人工智能开放云平台。艾媒咨询分析师认为,旷视科技利用云平台为开发者提供技术支撑,有利于计算机视觉技术进一步结合产品运营,同时可以收集海量图片数据,通过进行深度学习,旷视科技图像识别技术又能进一步得到提升,有利于其强化自身核心技术能力。

艾媒咨询分析师认为,人脸识别技术对于金融行业业务办理及风控等流程具有重要应用价值,旷视科技在人脸识别技术上的优势也助其有效开展金融领域的服务应用。未来随着旷视科技利用云开放平台相关图片数据进行深度学习强化人脸识别技术,以及在金融领域积累的渠道资源,其有望在金融领域继续强化技术服务,成为该领域市场有力的竞争者。

艾媒咨询分析师认为,自动驾驶为人工智能和汽车行业未来发展方向,计算机视觉技术在自动驾驶汽车实现路况感知、高精度定位等方面发挥重要作用,自动驾驶为计算机视觉技术未来重要应用领域。图森未来的计算机视觉技术和算法在自动驾驶领域实现专业化发展,未来有望在此细分领域成长为领先企业。

2017-2018中国计算机视觉行业发展趋势

需求驱使计算机视觉行业发展潜力巨大应用场景拓展渗透各行业

艾媒咨询分析师认为,人们对生活安全以及生产效率追求两大需求的提升,决定计算机视觉行业具有巨大发展空间。而计算机视觉技术场景应用具有广泛性,有望发展成为下一个智能时代的标配。目前计算机视觉技术主要应用在B端领域,短期内行业发展趋势也是集中于B端领域。未来随着技术成熟,计算机视觉有望拓展更多新的应用场景,实现场景落地,渗透至各行各业,形成AI+,开拓更多C端业务。此外,计算机视觉技术可以跟其他技术,如AR、VR、无人驾驶等结合发展,创造新的应用领域。

技术应用由点及面行业解决方案及软硬件结合成商业产品出路

对于计算机视觉技术使用者来说,由于技术的学习应用需要花费较多时间和精力,硬件产品及行业解决方案往往更受青睐。未来计算机视觉企业需要将软硬件结合,如打造嵌入式芯片等。此外,计算机视觉企业应将技术应用由点及面,将技术应用发展成针对各行业的解决方案。未来市场将出现更多基于计算机视觉技术应用的行业解决方案和软硬一体化产品,只有打造方便用户使用的商业产品,才能有效适应其需求,帮助计算机视觉企业迅速占领行业市场,在市场竞争中取得领先优势。

计算机视觉行业发展对企业综合实力要求高

艾媒咨询分析师认为,计算机视觉行业巨大的发展前景决定其具有高成长性特点,未来将涌现更多人工智能领域优秀企业。但行业发展同时伴随高风险性,行业竞争需要比拼企业技术算法能力、资金能力、以及人才资源,同时考验企业能否实现技术迅速落地,对企业综合实力要求高,综合实力不具备优势的企业在行业内将难以生存。

计算机视觉研究范文第3篇

关键词:摄像机标定 视觉 单目 双目 计算机应用 测量

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2014)02-0053-03

Abstract:Between the actual shape of the object and it’s camera image formed a certain function,for the purpose of obtaining the function parameters,in this paper using Matlab to camera calibration for vision measurement system.The method uses the Matlab toolbox and VC + +6.0 compiler software,designed calibration methods and software programs, conveniently and accurately complete the calibration of single camera and the dual camera,and obtained internal and external parameters of the camera,simplify the calibration procedure,improves the calibration rate,and has good portability,suitable for other vision measurement system.

Key Words:Camera calibration Computer vision Monocular camera Binocular camera Computer application Measurement

在机器视觉应用中,我们选择的摄像机都会有图像畸变。我们看到的物体在摄像机上所成的像与物体实际的形状是有一定的函数关系的。这些函数的参数都是未知或不准确的,我们需要通过实验与计算来得到这些参数,求解这些函数的参数的过程就称为摄像机标定。这一过程精确与否,会直接影响立体视觉系统的测量精度。Matlab是一款专业的数学矩阵处理软件,在现阶段是非常流行,深得人们的信任与喜爱。我们选择Matlab用来标定也是看重了它在数学与图形图像处理方面的超强处理能力。而事实证明,它计算出的结果精确度高、可信度强,正是我们机器视觉项目所需要的。

Matlab提供了很多应用工具箱,其中就有标定工具箱toolbox_ calib供我们使用,其图形交互式的处理方式直观简单、结果快速精确,是标定这一重要步骤非常合适的工具。

1 单个摄像机分别标定

本文采用的是平面棋盘格,棋盘规格为27.5mm。用双目摄像头获得不同位置下的棋盘图片,理论上采集越多的图像,所求出的结果越精确。根据实验所需,一般采集20组左右,并记录标定板的位置信息。

在双目立体视觉系统中,由于其它标定方法的不稳定性和局限性,我们最终决定用Bouguet算法的Matlab标定工具箱分别对左右两个摄像头进行标定,Matlab标定工具箱对单个摄像机标定步骤如下:

首先在F:\Program Files中安装MATLAB R2012a主程序。下载Matlab标定工具箱,把Matlab工具箱的文件夹toolbox_calib复制到安装目录F:\Program Files\MATLAB R2012a\toolbox下,再把我们前面已经拍摄的标定棋盘图复制到F:\Program Files\MATLAB R2012a\toolbox\toolbox_calib下。启动Matlab程序,在Command Window内输入:

>>addpath('F:\Program Files\MATLAB R2012a\ toolbox\toolbox_calib')

>>cd('F:\Program Files\MATLAB R2012a\ toolbox\toolbox_calib')

上述语句的意思是将Matlab工作空间设置在安装文件夹F:\Program Files\MATLAB R2012a\toolbox\toolbox_calib下。为了验证工作空间已经设置成功并且标定的棋盘图能正确识别,继续在Command Window内输入:

>> which right1.jpg

如果窗口内显示:

F:\Program Files\MATLAB R2012a\toolbox\ toolbox_calib\right1.jpg

则证明能在工作目录下找到标定所用图像right1.jpg。

准备工作完毕,运行calilb_gui进行摄像机标定。选择Standard,出现如图1-1所示窗口。

先标定右摄像机,点击Image names,在Matlab命令行窗口会提示你输入图片的basename(基础名称),实验的图片文件名是right1,right2,…,right12,basename就是right。我们输入rignt,按回车,接下来是让你输入图片的格式,实验中保存的是jpg格式,就输入jpg,按回车。Matlab工具箱自动读入实验中棋盘格图片,Matlab完成12幅右摄像头的棋盘图的读入。

回到calilb_gui,选择Extract grid corners,进行这12张棋盘图角点的提取。实验中是找最外面一圈的角点,回到Matlab的Command Window,命令行会出现如下提示:Extraction of the grid corners on the images

Number(s)of image(s)to process([]=all images) =

Window size for corner finder(wintx and winty):

它的意思是输入棋盘角点搜索窗口wintx、winty的长和宽,我们选77大小即可。

角点提取界面会在选择完毕后自动弹出,我们按一定顺序分别提取棋盘的最边上的角点,工具箱会自动找到所有内部对应的角点,如图1-2,点击4个最外边的角点即可。

然后回到Matlab的Command Window,输入棋盘格方格大小。这步定义了空间的尺度,在后面的物体测距、物体大小描述等信息方面起着重要作用。

开始下一幅图的角点提取。完成后回车即可自动读入下一幅图,同理完成12幅图的提取。回到calilb_gui界面,点击Calibration,开始摄像头标定。等待30秒左右,Matlab计算得到了摄像头的本征参数和畸变参数,如下所示:

Focal Length:fc=[984.22621 988.55599] ? [14.18888 14.22740]

Principal point:cc=[356.08748 201.80653] ? [12.12838 10.94669]

Skew:alpha_c=[0.00000] ? [0.00000]=>angle of pixel axes=90.00000 ? 0.00000 degrees

Distortion:kc=[0.04377 0.06571 -0.01079 0.00196 0.00000] ? [0.05325 0.45593 0.00469 0.00398 0.00000]

Pixel error:err=[0.11090 0.10129]

回到calilb_gui面板点击Show Extrinsic查看标定3D效果,如图1-3所示。通过已经记录的实际标定板与摄像机的相对位置,验证标定结果是否符合要求。

验证标定结果无误之后,点击面板上的Save按钮,程序会把标定结果放在F:\Program Files\MATLAB R2012a\%drive_F%文件夹下一个叫Calib_Results.mat的文件中,为了后面立体标定识别的方便性,把这个文件名改为Calib_Results_right.mat,复制到Matlab工作目录下方便后续使用,不复制的话程序会找不到相应文件。

同理对左摄像头进行标定,又生成了新的Calib_Results.mat,将其文件名改为Calib_Results_left.mat并复制到Matlab工作目录下。

2 立体标定

用相同的方法对左右摄像头都进行标定之后,开始立体标定。退出calib_gui面板,回到Matlab的Command Window,在该行有>>的情况下输入stereo_gui按回车键,出现图2-1所示界面,开始立体标定。

点击Load left and right calibration files并在命令行中按两次回车键选择默认的文件名(Calib_Results_left.mat和Calib_Results_right.mat),回到stereo_gui面板点击Run stereo calibration开始立体标定,等待10s左右,左右摄像头的参数都计算出来了,也求出了两个摄像头之间的旋转和平移关系向量(om和T)。

Intrinsic parameters of left camera:

Focal Length:fc_left=[981.10666 982.53816] ? [9.19436 9.02776]

Princi palpoint:cc_left=[276.37936 281.21468] ? [14.55475 8.38110]

Skew:alpha_c_left=[0.00000] ? [0.00000]=>angle of pixel axes=90.00000 ? 0.00000 degrees

Distortion:kc_left=[-0.14594 1.22238 0.00740 -0.01087 0.00000] ? [0.07311 1.03011 0.00193 0.00421 0.00000]

Intrinsic parameters of right camera:

Focal Length:fc_right=[979.65348 984.02580] ? [9.04324 9.18283]

Principal point:cc_right=[361.22778 212.64918] ? [11.95349 9.48257]

Skew:alpha_c_right=[0.00000] ? [0.00000]=>angle of pixel axes=90.00000 ? 0.00000 degrees

Distortion:kc_right=[0.03619 0.08136-0.00818 0.00289 0.00000] ? [0.05344 0.48159 0.00376 0.00391 0.00000]

Extrinsic parameters (position of right camera wrt left camera):

Rotation vector:om=[-0.06188 -0.04645 -0.00279] ? [0.01033 0.01794 0.00067]

Translation vector:T=[-112.45166 0.84707 -2.84633] ? [0.17761 0.19990 2.27834]

回到stereo_gui界面点击Show Extrinsics of stereo rig,弹出双目摄像机标定三维环境状态图,结果如图2-2所示,两个摄像头基本是前向平行并在一条直线上,摄像头之间的距离为112mm,计算得十分准确,标定板和摄像头的相对距离也非常精准,标定板自身放置姿态也基本符合。

3 保存标定结果

由立体标定得到了立体标定参数之后,就可以把参数放入xml文件,xml文件为以后的程序调用作准备。

平移矩阵T得到的结果是基于右摄像头为向量起点的,在后面的cvStereoRectify( )函数得到视差图,再用cvReprojectImageTo3D( )函数得到深度图,其中都是以左摄像头为基准的,所以T向量都要反转才能再使用。

要注意的是Matlab标定结果中的om向量,它代表的意义是右摄像头相对左摄像头的旋转角度。这个向量是旋转矩阵通过Rodrigues变换之后得出的结果,如果要在cvStereoRectify中使用的话,需要将这个向量用cvRodrigues转换成旋转矩阵。

4 结语

借助棋盘格标定板,应用Matlab工具箱及VC++6.0,准确的实现了单目摄像机及双目摄像机的标定工作。并对实验过程环境状态进行3D显示,可以清楚看出计算结果与实际位置十分吻合,本方法简单易行,可以应用与视觉测量系统中单、双摄像机的标定。

参考文献

[1]马颂德,张正友.计算机视觉-计算理论与算法基础[M].北京:科学出版社,1998:52-59.

[2]Tsa i R Y.A versatile camera calibration technique for high accuracy 3D machine vision metro logy using of the-shelf TV cam eras and lenses[J].IEEE Journa l of Robotics and Automation,1987,3(4):323-344.

计算机视觉研究范文第4篇

Abstract: From the perspective of budget performance, this article studies how to improve the effectiveness of university budget and final account linking. It is of great significance for improving the funds use efficiency and education quality of universities, and also has important influence on promoting the sustainable development of higher education.

关键词: 预算绩效;高校预决算;衔接

Key words: budget performance;university budget and final account;linking up

中图分类号:G647 文献标识码:A 文章编号:1006-4311(2014)16-0177-02

1 高校预决算关系

自2010年9月1日起实行《高等学校信息公开办法》以来,高等学校财务信息透明度逐步提高,各高校陆续实现预算公开,决算公开也将成为高校接受社会监督的下一措施。高校主管部门要求各高校强化刚性预算,完善预算管理的考核机制,以预算公开推动校务公开,发挥预算的导向约束作用,促进高校科学定位、特色发展。高校财务管理包括预算、核算、决算等,其中预算管理是龙头。高校预算是国家预算的一个重要组成部分,是在管理中对高校的各项经济活动进行预期并控制的管理行为及其制度安排。它是高校加强内部控制的重要方法,也是为了更好的发挥财政资金使用效益,提高高校组织管理效率,保证高校发展目标实现的重要保障。高校决算综合反映了高校财务状况和资金使用情况,是在学校日常会计核算的基础上完成的,并为高校主管部门和高校领导者提供决策依据,也是高校下一年度编制预算的基本依据。高校预算与决算是高校财务运行的两个关键环节,在每年的8、9月份,高校主管部门要组织各高校编制下一年度部门预算,而每年年末,主管部门还要组织编制本年度决算报表。从预算绩效角度来看,高校的收入支出预决算过程应该是一个包含预算绩效的连续并且完整的体系,高校决算是否真实准确直接影响下一年度高校预算的编制,而高校预算编制的好坏又反过来影响高校预算绩效的评价标准,进一步影响对高校决算的评价,所以说高校预算、高校决算和高校预算绩效评价是一个互相影响、互相促进的循环过程。

2 高校预决算现状

目前高校普遍存在重“预算”、轻“决算”的现状,专家学者对高校财务管理方面的研究,也主要集中在预算方面。另外,高校预算和决算不能有效衔接是目前高校存在的普遍问题。本文基于预算绩效视角,提出高校预决算衔接方面存在的问题,并给出加强高校预决算衔接有效性的建议。

3 高校预决算衔接存在的主要问题

3.1 高校预算与高校决算范围不一致 高校预算是按照会计年度进行编制,一般是指下一年度1月1日至12月31日,事实上,高校采用按学年集中收费的方式,在每年8月底开学时,收取学生一学年的学杂费(包括学费和住宿费),收入包含的时间是当年的8月份至明年的7月份,而高校会计核算采用收付实现制,所以当年直接对预收的第二年上半年的学杂费确认收入,而相应的教学支出是在其实际支付时(下一年度)确认,这样就造成高校预算与决算“两张皮”。高校预算时期是会计年度,而高校决算是对当年会计核算的归纳总结,虽然高校决算报表期间和高校预算期间相同,但是高校决算核算的实质范围和高校预算的范围不一致。这样就最终导致预决算工作相互脱节,当年的决算数无法和上年的预算数相互比较,相互衔接。因此,在此基础上进行预算绩效考核,其考核的结果无法看出预算的执行效果究竟如何,会误导高校相关管理者和利益相关者进行决策。

3.2 高校预算与高校决算统计标准不统一 对于预算绩效考核来说,当年预算支出完成率=年终执行数÷(年初预算数±年中预算调整数)×100%,而年终执行数与年初预算数的统计标准并不统一。年终执行数中除了包含本年度预算列支的支出,还包含了年初余额数,所以按此方法计算的当年预算支出完成率并不能完全反映当年预算支出情况。尤其是财政专项项目支出,由于财政拨款一般在年末等各种原因,支出进度缓慢,而且支出中有大部分都是以往年度累积资金,而不是当年财政专项资金列支的支出,所以预算执行完成率很低,或者虽然很高,但财政专项资金当年实际完成情况并不好,其结余仍然很大。这样就很容易导致预算绩效评价指标计算不准确,从预算绩效考核的角度来看,高校预决算的统计标准只有一致,才能通过各种预算绩效指标的计算,准确反映当年预算完成情况。

3.3 高校预算与高校决算科目设置不匹配 决算报表格式是由财政部统一下发的,它适用于多个行业和部门,具有高度概括性。而高校的各项经济活动具有其自身的特点,其会计核算按照《高等学校会计制度》执行,其科目设置与决算报表差别很大。虽然每年在编制决算报表时,都有决算报表填制说明,但是各高校理解不一样,在对支出科目进行归纳时,只是按照要求保证了对支出功能科目的核对,而对经济分类科目,并没有统一要求,而是“仁者见仁,智者见智”,主观随意性很大。这样就使得各高校编制的决算报表不具有横向可比性,上级财政部门也就无法掌握高校的真实财务状况,从而进一步影响下一年度对高校预算的审核批复。从预算绩效考核的角度,由于高校决算报表与部门预算报表设置科目不一致,使得预算绩效考核的难度增加,有些评价指标只能人为统计调整,以达到预决算的对比,降低了预算绩效考核的准确性。

4 高校预决算有效性衔接的建议

4.1 提高对高校预决算的重视,加强预决算的对比

各高校应该将部门预算与年终决算放在同等重要的位置上对待,加强高校成本管理的意识,注重提高资金的使用效益,逐步实现由重财务核算向重财务管理的转变。高校预决算的编制应当与高校发展目标相结合,全盘考虑学校各方面发展,统筹安排各项资金。同时,加强对高校预决算的对比,通过预算绩效评价指标的计算,提取有用信息,为各相关决策者提供支持和依据。

4.2 统一高校预决算的编报范围和口径 首先应统一部门预算和年终决算的编报范围,可以根据高校自身特点,按学年来编报预决算,这样就可以使预决算工作成为一个相互制约的整体,具有真正的对比性。其次统一高校预决算的编制口径,财政部门应就高校预算和决算科目做出相应说明,并统一考虑高校预决算科目设置,使得各项支出科目归口口径保持一致,具有横向可比性。最后,预算管理要尽量实现全面化、专业化、精细化和科学化。

4.3 加强财政专项资金改革,落实预算绩效管理 虽然今年各高校已经开始实行项目库管理工作,但财政部门未做好相关处室间的沟通和衔接,仍需进一步加强和完善。所以财政部门应进一步加强专项资金改革,在各高校收到“一上”预算编制通知前,完成项目库所有原项目的审核和新项目的申报和评审,真正落实年度专项经费收入和项目。同时,各高校应深入学习贯彻《高校财务制度》和《高校财务管理办法》以及内部控制规范,落实预算绩效管理,细化预算绩效评价指标,并充分应用预算绩效评价结果,将评价结果与专项资金联系起来,建立追踪问责的预算监督管理机制和奖惩机制。

5 小结

从以上分析可以看出,高校预决算的好坏,直接关系着教育经费的使用效益,只有加强高校预决算管理,促使高校预决算有效衔接,才能真正的对高校资金管理实行绩效评价,使得预算绩效评价成为促使高校提高教育质量的有效手段。也只有高校预决算实现有效衔接,高校预算绩效评价才能真正有效,才能做到客观、公正,对各相关部门决策参考才具有价值。所以,我们应在整个财务管理别强调预决算衔接问题,加强高等学校预算控制与管理,这样才有利于国家宏观管理学校,促进教育事业的发展,提高高校资金的统筹规划和使用效益。

参考文献:

[1]杨元贵.高校预算管理存在的问题与对策[J].会计之友,2008.

计算机视觉研究范文第5篇

关键词:遗传算法;Web使用挖掘;关联规则

中图分类号:TP311文献标识码:A文章编号:1009-3044(2007)18-31628-03

Research on Web Usage Mining Based on Genetic Algorithm

GAO Huai-jin,LI Guo-hui

(School of Mathematics and Information Science,Weifang University,Shandong 261061,China)

Abstract:This paper gives a mining model of association rules based on genetic algorithm in order to mining the information of web usage log, and also quantify relevant information character by an example, code using an array of real numbers, structure a fitness function. Finallycan mining user rules that hide in the user registration information. It provide accurate and viable association rules for personalized service systems, forecast and analyse the user's behavior.

Key words: GA(genetic algorithm);web usage mining;association rules

1 引言

Web挖掘的目的就是要从大量的Web网站上的信息中提取对用户有用的信息与知识。为了达到这一目的,可以把Web挖掘看成是搜索问题,将整个Web信息数据库看作一个大搜索空间,而把挖掘算法看成一种搜索策略。显然,当Web信息数据库容量极其巨大时,进行穷举搜索是不可行的,必须采取一种有效的搜索策略。应用遗传算法在Web数据库中进行搜索,对随机产生的一组规则进行进化,直到该Web信息数据库能够被该组规则覆盖,从而挖掘出隐含在Web数据库中的规则,找到用户所需要的信息与知识,为用户提供个性化服务。

2 Web使用挖掘

Web挖掘是数据挖掘在Web上的应用,可以分为Web内容挖掘、Web结构挖掘和Web使用挖掘[1][2]。其中Web使用挖掘的主要目的在于分析用户的行为模式(或称访问习惯),发现用户访问Web页面的模式规律,为智能Web服务提供知识依据,因此需要分析描述Web用户访问行为特征的关联规则。关联规则是描述Web用户行为特征的重要依据,是用户行为特征的知识表示,Web关联规则是通过分析用户访问的Web页面(URL)之间的关联关系得来的,具体应用在Web使用挖掘中有其特殊的表现形式,事实上,Web关联规则(Web Association Rules,下简称WAR)是一种知识的表现形式。与一阶逻辑的产生式大体相同,而WAR是考察用户的客观访问规律所获取的知识,用户对Web站点的访问过程是与URL访问序列、访问时间有关系,如果在挖掘WAR时忽略这种关系,那么挖掘出的关联规则就仅仅是URL之间的一种关联关系,而割裂用户的实际访问规律,因此,将通常意义上的关联规则挖掘与序列模式挖掘相结合,考察关联规则的条件与结论及其内部项的时序关系,挖掘有效的WAR,将为基于Web使用挖掘的个性化服务系统提供准确、可行的关联规则。

3 基于遗传算法的Web使用挖掘模型

Web使用挖掘中的信息除了服务器的日志记录外,还包括服务器日志、浏览器端日志、注册信息、用户会话信息、交易信息、Cookie中的信息、用户查询、鼠标点击流等一切用户与站点之间可能的交互记录。可见Web使用挖掘的数据量是非常巨大的,而且数据类型也相当丰富。通过处理服务器日志文件等这些数据,结合站点的拓扑结构信息,可以发现用户的浏览模式,如用户聚类、关联规则、序列模式等,理解用户的行为,进而实现预测用户的行为,为用户提供个性化服务。从而提出了一种基于遗传算法的关联规则挖掘模型,如图1所示:

图1 基于遗传算法的关联规则挖掘模型

该模型的工作过程如下:

根据用户的问题信息将其通过预处理器被编码成有限长的消息并为每个属性(字段)创建映射表,然后依据属性(字段)由SQL查询器在Web信息数据库中查询生成临时消息表,再依据属性映射表将临时消息表离散化处理之后生成消息表:由遗传算法求出满足条件的种群,最后将种群中适应度较高的个体作为解输出到优化器,然后由优化器对规则进行提取生成关联规则返回给用户。

4 实例分析

根据某网站的用户注册登记信息,由此建立了一个用户信息数据库。用户基本信息表的属性(字段)如表1所示。通过收集这些信息并运用遗传算法方法对其进行分析和关联规则的挖掘,从而实现了遗传算法在Web使用挖掘上的应用。具体求解步骤如下:

表1 用户基本信息表

4.1量化

为了能够对用户信息进行编码,必须先根据用户信息特征进行量化[3]。

定义1 量化(Measurement):就是对数据库中的属性值按照一定的方法分类,并赋给一个正整数表示的方法。

定义2 成熟度(Mature):是量化值的线性函数。量化值越小,成熟度越小,反之,则越大。主要来衡量某个个体对网络的依赖程度。

根据量化定义,先对用户基本信息表中的各个字段进行量化再进行编码。

(1)Province的量化

用户所处的地域是Web中关心的一个重要的参数。其部分省份量化表如表2所示。量化原则是先根据地域分组,同一组的具有相同的量化值。北京、上海等直辖市化为一组,具有最高的量化值5;东部省份城市化为一组,其量化值为4;中部省份城市为一组,其量化值为3;西部省份城市为一组,其量化值为2;偏远省份城市的量化值为1,各组的量化值依次降低。根据成熟度的定义可知中西部省份相对于东部省份以及直辖市而言,其对网络的依赖程度还不是很高。其余字段都遵循同样的量化原则。后面挖掘出的关联规则,其解释可能不止一种。例如:表2中,北京、天津、上海等具有相同的量化值5,在挖掘出的关联规则中只能解释为直辖市而无法指出具体的地方。

表2Province的量化

(2)Action的编码

用户在填写上网活动时,允许同时选择多个,同时查询中要采用关系数据库,因此首先就要满足1NF(第一范式)[4],不能有子表,对用户的选择必须进行处理,否则是无法存储到数据库中的。Action的编码值与成熟度无关,Action的编码值与别的量化值有完全不同的意义,因此,在适应度函数构造中是不包含此项的。所采用的方法是:表3中,举出8项用户上网最有可能进行的活动,然后编号,每项活动,用户选择就赋值为1;否则为0。这样就会得到一个8位的二进制的序列,然后转换成十进制存储。最后提出规则以后,再对其解码即可知道所代表的意义。例如:编码为00110001,十进制数是49。说明该用户平时上网的主要活动是在线游戏、体育和聊天。若用户上网活动的选择项不止8项,则相应调整二进制位数。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

表3 Action的编码表

4.2编码

在遗传算法中如何描述问题的可行解,即把一个问题的可行解从其解空间转换到遗传算法所能处理的搜索空间的转换方法就称为编码。由于遗传算法应用的广泛性,迄今为止人们已经提出了许多种不同的编码方法,总的来说,可以分为三大类:二进制编码方法、符号编码方法、浮点数编码方法[6]。二进制编码方法是遗传算法中最主要的一种编码方法,它的优点是:容易产生和操作、理论上容易处理、几乎任何问题都可以用二进制编码,但是二进制编码也存在一些缺点:首先是表示精度与算法效率之间的矛盾;其次,某些问题中要将属性值先转化为实数值然后再将实数值转化为二进制编码,这样在遗传算法的操作过程中,需要不断地对码串进行译码,增加了算法的计算量,降低了算法的效率。所以本实例中不采用二进制编码,而是直接采用实数数组的方法进行编码。

实数数组中元素的个数与事务数据库中的字段个数相对应,元素值代表了元素的属性值,如表4所示的事务数据库。

表4 事务数据库的字段

用一个长度为N的数组来表示表2所表示的事务数据库的个体编码,A[1]表示字段1,A[2]表示字段2,…,A[R]表示字段R。例如:用数值i(i∈N)表示属性值i,就可以用数组A[R]的元素值来表示相对应的字段的属性值。另外用值0表示此属性与其它的属性无关联。由此,表4所示的数据库的编码结构如图2所示。

图2 编码数组结构

采用实数数组的编码方法,这种编码方法具有精度高、便于空间搜索的优点,实现起来也比较简便。在利用实数数组的方法进行编码过程中,实数数组的元素个数与事务数据库中的字段的个数相对应,实数数组的元素值则代表了字段的属性值。其实进行了这样的编码后交叉、变异等的操作就变成了对数组的操作。

根据以上对各个字段的量化,结合上面所述的实数数组的编码方法,可得到用户基本信息表的量化和编码结果。经过量化和编码后的用户基本信息表如表5所示:

表5 量化和编码后用户基本信息表

4.3 适应度函数的构造

适应度函数是遗传算法与应用问题的唯一接口,是种群中个体优劣的一种量化反映,它的构造直接影响问题求解的效率。为了构造适应度函数,再引入关联规则及支持度、可信度等的概念[5]:

定义3关联规则也称之为关联模式,是形如x?圯y的规则,其中x,y是关于数据库中属性取值的断言:由于某些事务的发生引起另外一些事件的发生。

定义4设T是事务数据,即T={t1,t2,...tn},其中ti(1?燮i?燮m) 是每个事务的数据,这些数据称为数据项。I是T中所有数据项(物品)的集合即I={i1,i2,...in} ,ij是T中的一个数据项。每个事务中含有I的一个子集。关联规则是一种蕴含关系:x?圯y,其中,x∈I,y∈I且x∩y=? 。

定义5支持度(support)表示x?圯y在T事务数据库中出现的普遍程度,称规则x?圯y在事务数据库T中具有大小为s%的支持度。

定义6可信度(confidence)说明x?圯y成立的必然性,称规则x?圯y在事务数据库T中具有大小为c%的可信度。

支持度是对关联规则重要性的衡量。支持度说明了这条规则在所有的事物中有多大的代表性,显然,支持度越大,关联规则越重要。有些关联规则的可信度虽然很高,但是支持度却很低,说明该规则使用的机会很少,因此也并不重要。鉴于关联规则的如此特性,考虑用关联规则的支持度来定义它的适应度函数。可以这样来筛选规则,先用支持度来筛选规则,然后在满足最小支持度的规则中确定它的关联程度和关联性。因此规则的适应度可以简便的作如下定义:

fitness(Ri)=S'/S=P 当S'>Sq 当S'

式中S'为经过遗传操作所形成的一条新规则的支持度,s为用户给定的支持度的阈值。当R'为符合要求的规则时,它的适应度函数值应大于1,否则适应度函数值将小于1,这条规则在下一代遗传中就会被淘汰。

在遗传算法进行搜索时只以适应度函数为依据,利用种群中每个个体的适应度值来进行搜索。一般而言,适应度函数是直接由目标函数变换而成的,有时也要根据问题的要求,对目标函数进行一定的适应度尺度变换(Fittness Scaling)。

在实例中,采用的方法是把实数数组元素值线性相加。根据前面知道,A[i]值越大,说明拥有该属性的个体对网络的依赖程度越大;反之,则越小。所以,适应度函数为:

根据适应度大小将整个群体分成n个子种群,fi(x)表示第i组的适应度函数,每一组的规则数目是M/n(M为初始群体的个数)。fi(1)适应度最小,fi(2) 次之,然后依次增加。

4.5实例运行参数和结论

实例运行中对遗传算法需要设定的初始参数主要有:

(1)个体编码的长度L=8。编码的长度与所用的编码的方法有关。当用二进制编码来表示个体时,编码串长度与L的选取和问题所要求的求解的精度有关;使用浮点数编码来表示个体时,编码串长度L与决策变量的个数N相等。在本文中,编码的长度等于数据库中我们希望相关的字段的个数。

(2)初始群体的大小M=200。群体的大小M表示群体中所含个体的数量。当M取值较小时,可提高遗传算法的运算速度,但却降低了群体的多样性,有可能引起遗传算法的早熟现象;而当M的取值较大时,又会使得遗传算法的运行效率降低。所以要综合这两个方面的因素来考虑。

(3)变异概率Pm=1%。变异决定了物种的多样性。但若变异概率取值过大的话,虽然能够产生出较多的新个体,但又可能破坏掉很多较好的模式,使得遗传算法的性能近似于随机搜索算法的性能,因此,在本文中,选择的变异概率为1%。

(4)终止代数T=10。终止代数是表示遗传算法运行结束条件的一个参数,它表示遗传算法运行到指定的进化代数之后就停止运行,并将当前群体中的最佳个体作为最优解输出。在本文中,我们要求的是满足用户给定阈值的规则,因此最后输出的解不是一个最优解,而是一个符合要求的规则的集合。在本例中的终止代数是:经过两代运算后,没有小于用户给定阈值的规则。

(5)初始群体分的子群数n=3。

根据以上算法,可在表5中发现部分关联规则如下,从而得出用户想要的结论。

①:T(10%support,90%confidence)

说明:T(这只是一种合理的解释),由此可以看出在一些家庭条件较好的女中学生经常长时间上网聊天、玩在线游戏、收发邮件。

②:T(32%support,78%confidence)

说明:T

5 小结

与Web使用挖掘中的其它算法比较,遗传算法具有很好的全局搜索能力,将其用于Web使用挖掘时它能较好的处理数据库中不同属性之间的相互关系。在Web使用挖掘中引入遗传算法,其优势在于不仅有传统方法挖掘的准确性,又有进化计算所具有的智能预见性、适应性,不仅能从现有的数据中准确得出所蕴涵的关联规则,更以预知的方式挖掘出未来将产生的关联规则,并且,应用这些关联规则可以为基于数据挖掘的智能Web系统提供更进一步的知识支持。

参考文献:

[1]张云涛,龚玲.数据挖掘原理与技术[M].北京:电子工业出版社,2004.

[2]宋爱波,董逸生,吴文明.等.Web挖掘研究综述[J].计算机科学,2001,28(11):13-16.

[3]贾兆红,倪志伟,赵鹏.改进型遗传算法及其在数据挖掘中的应用[J].计算机应用,2002,22(9):31-33.

[4]萨师煊,王珊.数据库系统概论(第3版)[M].北京:高等教育出版社,2002.

[5]王小平,曹立明.遗传算法――理论、应用与软件实现[M].西安:西安交通大学出版社,2002.

[6]王文杰.人工智能原理与应用[M].北京:人民邮电出版社,2004.