首页 > 文章中心 > 数据挖掘总结

数据挖掘总结范文精选

数据挖掘总结

数据挖掘总结范文第1篇

关键词:数据仓库;数据挖掘;

1数据仓库

数据仓库的含义:“数据仓库是用于支持企业或组织的决策分析处理的,面向主题的、集成的、不可更新的、且随着时间不断变化的数据集合。”互联网中的数据浩如烟海,如果用户在其中搜寻的话,基本上是大海捞针。而数据仓库便解决了此类问题,它把庞大的数据及信息从互联网中收集起来,并进行适当的处理、加工和分类,把这些凌乱的数据转换成公共的数学模型,这样便能够解决数据与数据之间的冲突、表达不一致等问题,同时还方便用户查询自己所需要的信息,这样便使得数据和信息在决策查询上理便捷。

2数据挖掘

互联网中,实际的应用操作数据往往都是数量很大,不完整且具有模糊性和随机性。而数据挖掘所要做的便是提取这类数据中隐含的、不为人知的,但对人们又有潜在用途的信息和知识。并把提取的知识和信息存放于数据仓库或其他信息库中,所以说,数据挖掘是运用统计学、人工智能、机器学习、数据库技术等方法发现数据的模型和结构、发现有价值的关系或知识的一门交叉学科。另一个角度来讲,数据仓库中的数据,利用挖掘技术的算法,将源数据收集起来,并进行适当的筛选及过滤变成相应信息。数据挖掘基于的数据库类型有:关系、面向对象、事务、演绎、时间和时间序列、多媒体、空间、遗产、文本、Web型以及新兴的数据仓库等。对于数据库的描述,通常是指面向对象的数据库在面向对象的程序为规范的程序设计标准。其描述对象可以是一定时期的人口、流量等数据。而关于一个对象的代码在一个单元中的封装,对象可以与其他对象或数据库系统通信。空间数据库涉及空间的信息,如地理、医疗和卫星图像数据库等,通过数据挖掘可以发现,描述各个地区的人口或者可以根据现有的关于某小区距离中心主要道路的距离的描述来表达这个小区低价的变化程度。通过纵轴和横轴的序列数据库我们可以看出,数据挖掘可以根据数据库中的数据的变化随时随地的进行调整,从而发现数据的变化特点和变化趋势,通过对这种变化的趋势和特点的变化,帮助人们处理计划,制定发展策略等。在文本数据库中大部分是高度化的长句和短文,数据挖掘的作用是发现、描述对象和类的特征,进行关键词和内容关联性分析以及文本对整理象的聚类。多媒体数据库存储的是图像、音频、视频数据,在其上进行数据挖掘,这是存储和搜索技术相结合的新兴技术,这种技术中,进行多媒体数据的特征的提取和基于相似性的模式匹配等。

数据库的建设是以程序设计为标准的。无论何种先进的技术都有它的局限性,数据挖掘也亦如此,它只能对信息进行初期处理,也就是说,如果收集的数据中出现丢失或冲突的现象,用数据挖掘的算法是不可行的。

3数据挖掘技术

3.1数据挖掘分析方法数据挖掘的分析方法可分为两类:直接数据挖掘和间接数据挖掘。直接数据挖掘指:L在指定的数据中,按照某一法则,提取其中可用数据,建立一个数学模型,并用此模型对余下的数据,或是对有的数据进行描述。直接数据挖掘有:分类、估值、预言。间接数据挖掘指:目标中的数据都是没有规则的,因而不能确定某一具体的变量,所以不能用模型来对其进行系统上的描述,只能通过数据之间联系,将彼此组合起来。间接数据挖掘有:相关性分组或关联规则、聚集、描述和可视化。下面本文将对分类和预测、关联分析和聚类分析三种数据挖掘方法介绍。

3.1.1分类和预测数据分析一般分为分类和预测两种形式,如果想要知道某种数据未来的走向,或是提取某种模型中重要的数据,可以利用数据分析形式的属性对其进行描述,然后得到自己想要的模型,并把数据合理的分类,以便使用原有数据对新数据进行预测。数据分析的两种形式,在信誉证实、医疗诊断、性能预测和选择购物等方面的用途也十分广泛。如在金融证券领域,想要在银行贷款,必须要分析贷款是否有足够安全性,风险性是否很高,如此便要建立一个分类模型,对其进行预测,例如想要成功销售一批计算机设备,我们必须要预测、分析哪类人可能是潜在的用户。

3.1.2关联分析关联分析在交易数据、关系数据以及其他信息载体中应用较为广泛,可以查找有关于某一个项目集合或者对象集合之间存在的频繁模式、关联、相关性、或因果结构。当然这种关联分析也可以用最小置信度和支持度找出所选范围内所有感兴趣的规则。其中最为著名的关联规则发现方法常用的是Apriori算法。关联分析大多应用在消费者一次购物时同时购买锪商品购物分析、某些商品和另外一些物品次序推销或促销以及大型工厂、制造厂里生产的产品目录设计等。如某所大学,所有学生记录中,有2%的人专业是会计且选修了数据库且成绩为A;在专业是计算机科学CS且选修了数据库DB的学生中有75%的人成绩为A。

3.1.3聚类分析聚类分析的方式就按照某种程度的度量方式来进行度量方法,这种方法中将用户的数据根据需要分解成相应有意义子集合。通过能否用于大数据量和不同的数据类型,能够发现不同开关和类型的聚集;对领域知识的要求昼少;对噪声或数据不同的顺序不敏感,来判断优劣,根据模型可解释。如:①一些特定症状的聚集可能预示了一个特定的疾病。②租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群。

3.2数据挖掘的一般步骤

3.2.1数据准备在数据挖掘初期,我们的目的是要完成初始数据的项目。而建模人员的工作要务就是在这些收集的现有数据中,提取与客户提供的主题相关的数据项,然后初步分析数据,首选用已有的程序去提取收集好的数据,然后进一步收集好的数据。然后进一步衍生变量,重复进行若干次(直到我们所要的数据变量都变成合格。)最后把这些数据整理,分类成一个文件,存于数据集市中。

3.2.2取样工作人员在上步的数据集中随机抽取样本。

3.2.3建立模型取样后,建模人员要对所取的样本进行逐个分析,并将数据分为两类:训练数据集体和验证数据集体,然后选用最佳方案来建立模型或规则集。一般来说,有多种方法来出库数据挖掘的问题的类型,而这些方法通常也是与数据在形式上一一压的。因此,在建立模型的工程中,经常需要返回到初级准备阶段。

3.2.4验证模型模型确立后,建设人员还应该根据验证前后模型的准确性。

3.2.5模型评估模型评估的标准是根据上面三个步骤的模型来作为评分的。挖掘主机评分的主程序中的数据都是由已建立的模型通过循环的方式获得的。

3.2.6执行如若要运用模型对新的数据进行处理,可以保留或改善模型。数据挖掘的步骤并不是一个流水线,所以它不可能一次性做完所有任务。过程中有许多乃至全部的步骤需要循环进行,所以每一个阶段不是一成不变的。

3.3数据挖掘工具的新的技术和应用热点介绍文本挖掘、网络挖掘两种。

3.3.1文本挖掘文本挖掘,顾名思义,就是从非结构化的文本中发现潜在的概念以及概念间的相互关系。在这项技术中,是分词技术中的关键部分,词典的运行。只有让计算机依据词典完成正确之后,才可以实现将非结构化信息转化为结构化信息,然后就可以进一步研究文本之间的关系。目前,像IBM、微软等主流挖掘工具以及google和SNS网站都已经在使用广西挖掘技术。但遗憾的是,目前这些工具大多只支持英文,还不支持中文挖掘。

3.3.2网络挖掘网络挖掘从主体上来看,可分为三种挖掘:文本挖掘、结构挖掘以及点击挖掘。

4数据挖掘(DM)实际应用

DM工具和软件已经在各个领域中得到广泛的应用,收到的效益显著。

4.1金融方面为了让市场经理以及业务员能够更好的融入到公司活动和设计新的市场活动中,可以整理用DM对不同的业务,不同的信息走向,以及一些决策进行合理的划分。

4.2客户关系管理方面DM不仅可以协助了解客户的行为,还可以找出产品的使用模式,从而一定程度上改变通道管理的程序,就好比只有理解顾客的作息周期性规律,才能更好的进行销售。

4.3在过程控制/质量监督保证方面大量变量之间的相互作用是通过DM来协调的,某些异常数据,DM会自动识别,并进行相应的处理措施,从而让技术人员能够发现问题所在的范围,并及时处理。

4.4远程通讯部门基于DM的分析协助组织策略变更以适应外部世界的变化,根据市场要求进行模式化的该百年来知道市场行为。在网络容量利用方面,DM客户在服务使用的结构和模式的了解,从而指导容量计划人员对网络设施作出最佳投资决策。

4.5使用DM进行军号事信息系统中的目标特征提取、态势关联规则挖掘等。

数据挖掘总结范文第2篇

【关键词】移动通信;数据挖掘技术

引言

信息时代的到来,使得人们对移动通信系统内部数据信息筛选功能的需求越来越大。然而,在实际系统建设过程中,移动通信系统并未数据挖掘技术应用提供一个良好的运用环境,这就使得数据信息筛选功能目标的实现仍有很长的一段路要走。针对这一问题,为加快移动通信系统优化建设的发展步伐,研究人员应在明确数据挖掘技术在移动通信系统应用现状的情况下,找出具有适用性以及实用性的技术运用策略。这是促进当前现代化经济建设背景下移动通信系统快速稳定发展的关键,相关人员应将其作用于实践。

1研究移动通信系统中数据挖掘技术应用的必要性

数据挖掘技术是从移动通信系统中大量具有不完全、模糊以及随机性的数据信息中,提取潜在且极具利用价值的信息知识内容。据相关数据统计,数据挖掘技术是一项具有交叉性特点的科学技术,其涉及统计学、数据库技术、可视化、信息科学以及机械学习能力等。当其作用于移动通信系统的网路优化过程,不仅能够发挥出数据信息的基本查询功能,还能从无序而模糊的数据信息环境中挖掘、整理以及提取出用户所需的信息内容。基于目前数据挖掘技术未在移动通信系统中起到真正的挖掘作用,研究人员应从系统运行的实际情况入手,找出数据挖掘技术的有效运用的阻碍与问题难点,从而对其进行控制解决。这是加快信息化发展的重要课题,相关建设人员应将其重视起来[1]。

2数据挖掘技术在移动通信中的应用局限

数据挖掘技术作用的移动通信,是由业务营运、受理网站以及客户服务中心共同组成的。一方面,上述系统组成内容是通过客户数据、营销数据以及账务数据的完整状态,以不同访问模式与数据格式分布在不同的系统环境中。因其具有独立性信息数据在移动通信系统运行过程中存在冗余和不一致问题,使得数据挖掘技术应用条件:单一视图(SinngleView)要求难以达成。目前,移动通信系统组成是由联机事物处理系统来进行管理的,其虽能实现移动通信在线事物目标的实时处理,但其不能为通信用户提供数据挖掘、查询以及检索功能,这是因为大量的数据均以完整的状态存储在系统环境中。此情况下,移动通信要想实现数据挖掘技术的应用目标,需根据企业级别建立起客户信息数据库,以将不尽相同的联机事物系统信息资源以目标需求的方式出现在用户面前从而提高客户数据使用环境的正确性与单一性[2]。

3移动通信中数据挖掘技术的有效运用策略

3.1建立数据库

移动通信数据库的建立是实现数据挖掘技术有效运用目标的基础内容,其与传统的联机事务处理系统不同,数据仓库具有集成、不可更新、面向主题以及随着时间变化的特性。为此,技术应用人员应将各个联机事务处理系统做出构建数据仓库的数据数据来源。①技术人员应以文件的方式,为客户提供基本资料、客户账单以及客户联系历史记录等数据信息。②对于接口文件的处理,要在ETL过程抽取、转换以及加载处理的过程中完成,即按照不同的而主题域组织、存储,来进行这些客户数据的管理。③通过数据仓库的接口,就可以对数据库中的客户数据进行数据挖掘与联机分析。研究表明,数据库体系的建立,是由企业级数据库、数据源以及决策支持组成的,因其构建的过程复杂性,技术人员应在明确数据挖掘技术应用方向的基础上进行目标建设[3]。

3.2明确数据挖掘应用方向

移动通信系统中的数据挖掘技术主要的应用方向为:客户行为、优惠策略仿真预测、客户忠诚度、反欺诈以及竞争对手等。以客户行为为例,数据挖掘技术人员应采用分类分析法和聚类分析法,从而总结出客户的生活方式、消费习惯以及社会联系等特征。而后,按照不同特征进行客户群划分,从而使76通信设计与应用运营商为其提供更为适用性的市场营销活动和客户服务。

3.3优化数据挖掘过程质量

①数据挖掘技术人员要做好数据准备工作,即应通过完成数据信息集成、目标内容选自以及查询软件预处理,来优化数据挖掘技术应用的质量。在构建数据集成系统时,技术人员要将移动通信大环境中的多个文件和数据进行整个处理,以避免因语义模糊问题而出现遗漏或是不良数据信息问题。数据选择目标,就是通过缩小数据库中数据信息的处理范围,来提高数据挖掘技术应用质量。而预处理,是降低挖掘技术工具的应用限制,来提升数据挖掘技术应用的科学合理性。②在进行移动通信系统的数据采掘过程中,先要决定假设的产生,即根据系统运行需求选择发现型还是验证型的数据采掘方式。前者为用户产生的假设;后者为用户对数据库中的知识内容提出了假设。而后,选择适用的工具进行数据知识的采掘作业,从而面对采掘发现的知识内容,以作用于移动通信系统网络优化。③对于技术应用结果的表述与解释,即,当用户不满意获取的信息数据结果,则要重复用户决策目标的信息提取过程,从而完成数据采掘过程。这里的数据采掘发现的知识形式通常是通过数据概念、运行规则、分布规律、存在模式、运行约束以及显示可视化来进行表示的。研究表明,上述数据内容均能以直接的方式,提供给移动通信用户,从而满足决策目标的需求[4]。

3.4运用质量控制措施

移动通信系统大多都存在数据库过大问题,技术应用人员可利用数据事务与细节技术,来掌握用户查找数据信息的行为规律与相关模式,来进行需求建设。具体来说,可采用数据抽样技术,来控制查询数据尺寸过大问题给挖掘技术针对性功能实现所带来的影响。在性能和成本方面,数据挖掘人员要满足许多数据挖掘系统的计算要求,即要针对相关软件系统,采用并行技术,来达到用户对移动通信系统应用的性能与成本目标。此外,在人员方面,要想提高数据挖掘技术运用质量,需要保证信息分析人员具备丰富的领域知识以及较强的调查能力,从而使其作用于移动通信系统的数据库建立与方向分析。对于数据可视化的质量控制,数据挖掘技术人员可通过设定行之有效的探索始点,并按照适当的隐喻,来进行数据表述[5]。

4结束语

综上所述,数据挖掘技术具有为移动通信系统进行信息数据管理提供数据查询、数据整理以及数据可靠性分析等功能。为此,相关建设人员应在明确数据挖掘技术作用于移动通信系统现状的前提下,确定研究力度加大的方向,从而快速地提升移动通信系统的优化建设应用。事实证明,客户在数据挖掘技术有效运行条件下,不仅能够获得自身想要了解的数据知识,还能够获取与之相关且并不自知的数据信息。这是促进移动通信网络系统信息化建设的重要课题内容,研究人员应将其作用于用户系统实践。

参考文献

[1]刘志鹏.MCDS:大规模移动通信数据计算的单机实现[J].中国科学技术大学学报,2016,01:36~46.

[2]刘剑.数据挖掘技术在移动通信终端营销领域的应用研究[J].信息与电脑(理论版),2016,03:17~21.

[3]陈慰旺,张艳芬.移动通信网络优化中数据挖掘技术的运用[J].信息通信,2016,06:201~202.

[4]刘春茂.基于GA-CLARANS数据挖掘技术的移动通信网络故障检测专家系统[J].信息与电脑(理论版),2014,01:158~159.

数据挖掘总结范文第3篇

1数据挖掘在4G移动通信网络优化中的基本要求

1.1突出通信网络的智能化

4G移动通信网络本身既复杂又庞大,想要对它进行全方位的分析是有一定的难度的,所以我们需要在同一个阶段,只对该阶段的数据进行针对性的采集和研究,并且总结出结果才可以进行下一个阶段的研究,最后再把各个阶段的数据之间的联系进行综合分析,但是在系统的分析过程中,要保证其智能化,从而更好地保证各个任务都能够在智能的环境中,自动地分布到有关阶段的服务器中。

1.2恰当的运用分分布式处理方法

因为4G移动通信网络中蕴藏着大量的数据资料,使得通信网络的优化过程比较艰难,所以在对移动通信网络进行优化的过程中,我们不能单纯地把所有的优化体系都融合在一个服务器之中,也不能单纯地依靠一个简单的优化体系,就对其他的过程进行优化,在优化的过程中我们要做到有层次性和区域性,依照分布式的原则进行相关的数据和信息的处理工作。

1.3智能性数据挖掘和研究的基本要求

我们在运用数据挖掘进行4G移动通信网络优化的时候,要按照一定的要求进行优化,所以,需要我们恰当地运用数据挖掘技术和工人的专业技术,对有关的数据资料进行分析和整理,从而保证数据资料分析的自动化和智能化,从而对结果进行总结和归纳。为网络优化工作的专业技术人员提供坚实的理论基础,以便他们能够更好地进行网络的优化和改革工作。

24G环境中数据挖掘在移动通信网络优化中的重要作用

2.1对站点的选择要恰当适中

在4G移动通信网络优化中有效的运用数据挖掘技术,能够帮助4G移动通信网络对站点进行合理恰当的选择,其中主要是运用禁忌搜索算法,以一个初始可行解为基础,选定相关的特定搜索方位(移动)进行摸索,有选择性地让特定的目标函数值变化最多的进行移动,使得移动站点的选择更加科学合理,也能有效地降低移动通信运营商在该方面的资金费用,还可以减少移动设备的维修资金,使得移动运营商获得更多的利润空间。

2.2对其进行正确的干扰分析

在对4G移动通信网络进行优化的过程中,通信网络的干扰分析主要是通过对数据的挖掘,通过这样的方式,能够保证它在有限的时间内最快地找到4G移动通信网络中的干扰位置和干扰物体,以便更好地处理相关问题的出现,为4G移动通信网络的顺利运行提供强有力的基础支持。

2.3对掉话现象进行科学的研究

在对4G移动通信网络中的GSM进行掉话分析的时候,需要使用科学的数据挖掘技术进行分析,对于需要进行检查的有关资料和数据进行整体的研究,并且对有关的类别进行针对性的研究,从而更好地保证在最快的时间内,有效地找打GSM掉话现象出现的主要原因。所以,科学的使用数据挖掘技术对4G移动通信网络进行优化,可以有效地运用实践序列的方法,针对4G移动通信网络中话务变化状况和变化特点进行及时的预测,争取在有效的时间内快速的分析出话务变化的特点和原因,以便更好地提升数据的分析效果,对于移动网络中出现的GSM掉话现象进行全面系统的研究和分析。

3结语

数据挖掘总结范文第4篇

数据挖掘最直接也是最重要和显著的作用,在于其能够提升企业的核心竞争力。

1.1挖掘企业内部的信息在企业之中,普遍存在着一些“信息孤岛”的现象,部门之间的信息混乱而且并不能够形成科学有效的全面性分析。相关的数据挖掘负责部门或者企业的管理者可以利用数据挖掘的技术对不同的部门在经营过程之中所形成的海量的数据进行相应的分析以及阐述,并且根据相应的分析对部门自身的管理的问题做出把控。

1.2搜集外部环境各种重要信息企业在生产以及经营的过程之中,政治、经济、政策、科技、金融等环境方面的变化,影响着市场、竞争对手、供求信息、消费者等主体的行为的变化,这些数据的收集、处理以及分析,是对企业的经营以及管理有着非常重要的作用,使得企业能够抓住市场的机遇,从而及时地调整管理方法和策略,能够促进以及实现企业的健康和稳定发展。

1.3内外部信息进行整合以及筛选数据挖掘的另一个主要的作用便是在处理企业的内部以及外部的信息的基础之上,对于涉及企业所有的信息进行整合以及筛选,最终目的是能够提供对于企业的发展有着重要作用的信息。通过对于企业的内、外部信息进行合并以及挖掘,找出企业的内部以及外部之间相关的影响的信息。从而实现企业的内外部信息的综合处理以及应用,在其中提取有价值的知识,并且增强企业的管理功能,提高企业的信息化管理的效率。

2数据挖掘在企业信息化之中的实际应用

企业的信息化的建设在企业之中是一项比较复杂并且需要长期的资金以及人力投资才能够完成的事情,企业的管理者需要从企业的自身出发,从而选拔经验比较丰富、技术水平较高、立场比较中立的主体对企业提供的数据进行诊断以及分析。数据挖掘本身与企业利润没有直接的关系,企业为了能够使得数据挖掘带来的效益表现在企业的利润之上需要进行一次有关于数据挖掘的循环:确定目标、选择数据集、数据挖掘、知识应用、计划执行、结果反馈。

2.1企业信息诊断阶段的应用企业的信息化的诊断阶段主要包括预备、正式以及总结三个部分。首先要对企业的相关的经营活动,无论外部以及内部都需要进行原始数据的收集,其中可以包括企业的产供销、研发过程管理以及外部经营环境等。然后整合到企业的数据库之中,根据数据挖掘需要达到的目标,编写数据挖掘需要的相应的数据算法,挖掘出相应的有价值的信息,从而为企业的发展战略、外部环境、企业文化甚至组织机构以及制度管理提供数据依据。

2.2在客户关系管理之中的应用数据挖掘之中非常重要的一点在于对于客户的自身的行为进行分析,客户的行为之中包括对于客户的满意程度、忠诚度、客户异常、客户保持等。在企业的经营生产之中,随着商业数据的不断增加,关于为了更好地服务客户进行的数据挖掘起着至关重要的作用。在对客户相关的数据挖掘之中,包含对于客户的识别以及评价,分析客户的相关行为的改变为企业带来的变化,从而使得企业与客户的关系达到最优。数据挖掘在客户的管理方面能够深化企业对于客户本身的管理,跟踪市场的变化,从而最终预测客户的消费趋势,最终开发出满足客户自身需要的个性化产品。

数据挖掘总结范文第5篇

[关键词]OLAP;数据挖掘;审计;商业智能

1商业智能模型

本文利用SQLServer2005构建基于商业智能的审计模型TAuditMin,如图1所示。审计过程分为:采集审计数据、建立数据仓库、OLAP多维分析、数据挖掘、前端展示等。

1.1源系统

数据挖掘的基础是大量的历史数据。这里的源系统是指与审计业务相关的各种关系型数据库,如金蝶数据库、用友数据库等。这些业务系统中的数据可以应用SSIS(MicrosoftSQLServer2005IntegrationServices),通过数据清洗、转换和加载(ETL)等步骤载入数据仓库,为多维分析和数据挖掘作准备。

1.2数据仓库

该部分的功能就是为数据挖掘提供多维数据集(Cube)和数据集(Dataset),用于数据挖掘的Cube也可以根据用户的要求作相应的更改。商业智能提供了自动创建Cube的功能,用户只需要设置好相应的维度表和量度组,通过一些简单的命令就能实现Cube的自动生成和重新生成。因此,数据仓库设计主要在于设计维度表和量度组,以及两者之间的关系。

1.3OLAP多维分析

OLAP为用户提供强大的数据分析功能。在数据仓库建好后,输入测试数据,测试数据仓库和模型。如果分析结果显示创建的模型有问题,则可以通过OLAP提供的功能重新创建模型,并且按照用户喜好的方式显示数据分析的结果。模型没有问题之后,就可以对ETL处理过的真实数据做相应的数据分析。

1.4数据挖掘

数据挖掘模型的建立以MDX语句为基础,同时也支持手工操作。模型建好以后,需要对选择数据挖掘的模型进行测试和训练。用于训练的数据可以来自于数据仓库生成的Cube,也可以直接使用其他数据集,如文本文件。模型训练的结果既可以直接浏览也可以生成报表在客户端展示,数据挖掘功能主要通过微软的SSAS和AMO实现。

1.5客户端

即数据挖掘模型、报表和OLAP分析结果的前端展现,是用户与系统交互界面。目前比较流行的方式是基于Web的B/S结构。

1.6发现审计线索

在数据分析的基础上,定位重点审计对象,利用先进的计算机技术或其他方式追踪线索,重点审计该类数据。

1.7形成审计报告

针对审计线索,加以重点审计,提交审计报告,以供分析和决策。

本文提出的解决方案将数据仓库、OLAP和数据挖掘等技术相结合,可指导审计人员高效地开展审计工作,增强审计人员的审计数据分析能力,提高审计的效率和效果。

2商业智能在审计中的应用

商业智能在审计中的应用主要包括OLAP和数据挖掘两部分,以下具体介绍这两部分的应用。

2.1OLAP在审计中的应用

通过数据仓库,可以利用OLAP技术,采用包含结构、趋势、同比、因素、TOPN等多种分析方法,自动生成图文并茂的分析报告,并可以在任意时间,生成任意内容(如财务、销售、仓库、采购、应收、应付),同时实现分析报告中的动态钻取,满足审计人员的需要。我们可以利用OLAP进行销售分析、应收款项分析、仓库库存分析以及财务决策评价等。

OLAP支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。如MDX查询语句:

withset[TenBest]as

’TopCount([Product].[BrandName].Members,10,[UnitSales])’

set[LastMonth]as

’Tail(Filter([Time].[Month].Members,NotIsEmpty([Time].CurrentMember)),1)’

set[Last6Months]as’

[LastMonth].item(0).item(0).Lag(6):

[LastMonth].item(0).item(0)’

select[Last6Months]onCOLUMNS,

[TenBest]onROWS

fromSales

可以方便地查询某商场最近6个月销售趋势最好的前10种商品及销售量。

又如,对应收账款进行分析,可以通过图表,直观显示账龄、金额等情况(如图2所示)。

2.2数据挖掘在审计中的应用

在审计中,运用数据挖掘算法,不仅能减轻审计人员的负担,而且能提高审计风险管理的质量[3]。具体包括决策树算法、聚类分析算法、贝叶斯算法、关联规则算法、时序算法、神经网络算法、回归算法等。在审计中,运用商业智能平台TAuditMin,不仅能减轻审计人员的负担,而且能提高审计风险管理的质量。