首页 > 文章中心 > 数据仓库

数据仓库

数据仓库

数据仓库范文第1篇

数据仓库是数据库概念的升级,和数据库相比,数据仓库要比数据库更加庞大;数据仓库主要用于分析数据,数据库主要用于捕获数据;数据仓库主要存储历史数据,数据库存储在线交易数据;数据仓库的基本元素是维度表,数据库的基本元素是事实表。

数据仓库的组成部分包括数据抽取工具、数据库、信息系统、数据仓库管理、元数据、数据集市、访问工具。数据仓库的数据建模分为四个阶段,分别是业务建模、领域概念建模、逻辑建模、物理建模。

数据仓库并不能取代数据库,两者是相辅相成的关系,数据仓库主要面向主题设计,数据库主要面向事务的设计。

资料拓展:数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。

(来源:文章屋网 )

数据仓库范文第2篇

关键词:数据库,数据仓库,数据处理

 

1.数据仓库的定义

数据仓库的英文名称为Data Warehouse,简写DW。W.H.Inmon。我们把它的定义为:数据仓库是一个数据 集合,它的特点是:用于支持管理决策时它是面向主题的,集成的,相对稳定的,能够反映历史变化的。从数据仓库的概念上我们可以从两个方面理解,一方面,数据仓库是用来支持决策的,主要面向分析 型数据处理,这一点有别于企业现有的操作型数据库;另一方面,数据仓库对多个异构的数据源进行有效集成,在集成后又按照主题重新进行了组合,并且包含历史数据,尽管如此,却一般不再修改其存放在数据仓库里的数据。

2.数据仓库的特点

(1)面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统

之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织,一个主题通常与多个操作型信息系统相关。。

(2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数

据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须保证数据仓库内的信息是关于整个企业的一致的全局信息。

(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时

发生变化。数据仓库的数据主要供企业决策分析只用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库之后,一般情况下将被长期保留,修改和删除操作很少,通常只需要定期的加载、刷新。。

(4)反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而

数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点到目前的各个阶段的信息,以对企业的发展历程和未来趋势做出定量分析和预测。

3.数据仓库的结构

如上图所示,整个数据仓库系统包含五个层次:

(1)数据源层。是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。。

(2)数据导入层。是数据在进入数据仓库前的一个临时存放区,通过数据调度工具将业务系统传送过来的数据表、文本文件等加载到临时存放区。

(3)数据服务层。是整个数据仓库系统的核心。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。

(4)应用服务层。应用服务层的功能主要是建立多维数据集、进行OLAP分析、生成各种静态报表并以WEB方式提供各种功能的查询分析。

(5)用户层。根据对数据仓库需求的不同,数据仓库的用户可以分为普通用户、技术用户、高级管理用户这三类。不同用户对数据仓库访问的需求层次以及复杂度都是不同的,简单的需求是访问一些固定的静态报表和查询分析,复杂的可以通过前端展现的工具生产一些灵活、动态的即席查询报表,以满足业务部门一些临时的、迫切的报表需求。

4.相关的网站和论坛:

(1)数据仓库之路 www.dwway.com/html/news.html

(2)MyDWBIhttp://www.mydwbi.com致力于打造最专业的中文数据仓库,商务智能社区

(3)商业智能和数据仓库爱好者http://www.bihuman.com/

(4)数据挖掘研究院 http://www.chinakdd.com/

5.研究和商业机构

(1) 北京大学移动通信数据仓库联合实验室

2006年5月由中国移动、北京大学、亚信集团联合建立,该实验室”是全球容量最大的数据仓库分析系统实验室,也有效的整合了三方得优势资源。中国移动通信目前构建了目前国际上最大的数据仓库系统,联合实验室的建立,既能推动中国移动自身数据仓库系统建设,也能明显推动数据仓库技术向纵深发展。

(2)中国人民大学数据仓库和商务智能实验室

2004年5月由中国人民大学和全球著名的数据仓库厂商NCRTeradata联合建立。该实验室承担了国家863计划、国家自然科学基金重点项目、教育部重点项目等国家重大科研任务。借助于NCRTeradata的优势技术,双方将通过密切的合作,共同开发具有中国行业特色的数据仓库和商务智能应用软件。

(3)北京汉端科技有限公司

北京汉端公司是一家专门从事商业智能信息化服务的企业,从1996年就开始专业做数据仓库,它在数据仓库领域是相当专业的,在这可以接触到最前沿的数据仓库技术。

(4)上证所金融创新实验室

2006由上海证券交易所成立,该实验室的数据全部来源于数据仓库系统。 上证所在推出金融新产品时,都曾通过数据仓库平台进行过测算和验证。通过实时数据仓库技术,为上证所的经营、监管、创新和服务决策提供数据支持,极大的提高了监管的效率和服务的性能,能够更好地服务市场和监管市场。

参考文献:

1伍小荣 伍庆华 数据仓库技术的研究现状和未来方向 [期刊论文] 现代电子技术2002(6)

2.向海华 数据库技术发展综述[期刊论文] 现代情报 2003(12)

3.王泽明浅谈数据仓库技术 [期刊论文] 计算机应用与软件2001-01-15

4.黄庆普 剖析数据仓库技术 [期刊论文] 华南金融电脑2003年11期

5.刘立波 数据仓库技术的研究与应用[期刊论文] 计算机工程与应用2002(15)

数据仓库范文第3篇

关键字:数据仓库商场(超市)计算机

一、前言

随着计算机技术的发展,越来越多的企业逐渐建立了各种各样的应用子系统,如销售系统、库存系统、财务系统、人事系统等。它们能够较好地满足企业OLTP(OnlineTransactionProcessing,联机事务处理)的应用需求。

但随着市场竞争的日益激烈,企业需要利用现有的数据,进行分析和推理,为企业的决策提供依据。当这种分析处理只涉及到很少的数据库表时是可行的。当数据量迅速地增长而且查询要求不断复杂化时,这种建立在OLTP基础上的DSS就不能很好地满足决策的需求。另外从大量的历史数据中获取信息,要求系统保存大量的历史数据。如果系统在进行事务处理时还要进行复杂的分析处理。这样对于频繁操作性处理的数据库系统而言,将会不堪重负。因此,需要重新组织数据,使其使于进行复杂分析。为适应这一需求,应运而生的就是数据仓库技术。

商场(超市)关系到大众生活水平的提高,它为大众生活提供了便利,同时由于商场(超市)货物、员工的复杂性,使得市场、人事管理、物品供需关系、设备管理显得更为复杂,所以商场(超市)更应该象其他企业一样,应用数据仓库技术完善自己的市场、管理、供需关系等等。

二、数据仓库技术概述

1.数据仓库的概念

“数据仓库是一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合”。面向主题、集成性、不可更新和随时间变化性是其基本特征。可以说,数据仓库是一种解决问题的方案,是用来更好地提取和管理并最终利用信息资源的办法。“它以传统的数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效手段,以人工智能技术作为挖掘知识和发现规律的科学途径”。数据仓库主要是面向联机分析处理和决策分析的,而不面向事务处理。数据仓库将信息按主题形式加以组织,来揭示信息的内在联系和事物的规律及事物之间的联系。对原有数据库系统中的数据进行重新组织、按需求综合以后,就得到数据仓库中数据。因此,数据仓库中的数据是高度集成的,反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合。数据仓库中的数据是不可更新的,就应用而言,却并非其中的数据一成不变,恰恰相反,数据仓库中的数据由于不断增加新的数据内容,定期刷新和添加,并剔除已经过时的数据内容,所以说,其数据内容是随时间而不断变化的。

2.数据仓库中数据的组织结构

数据仓库中的数据可分为两类,(1)按照数据的综合程度(称之为粒度)分为四个等级:早期细节级、当前细节级、轻度综合级、高度综合级。“元数据经过综合后,首先进入当前细节级,并根据具体需要进行进一步的综合从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级”。(2)元数据(metadata)是“关于数据的数据”,它能有效地管理数据仓库,对元数据可从构建时间元数据、使用元数据、控制元数据三个角度分类分析。数据仓库中的数据就是通过粒度划分和分割进行有效地存储的。

3.相关的信息开发工具

要满足用户全面、系统、多层次信息需求的目标,必须借助于数据仓库并建立数据仓库系统才能实现。“数据仓库系统是以数据仓库为基础,通过查询工具和分析工具,完成对信息的提取,满足用户的各种需求”。因此,进行复杂数据分析、提供管理决策还必须引入相应的数据仓库工具层。“数据仓库系统是多种技术的综合体,由数据仓库、数据仓库管理系统、数据仓库工具三个部分组成”。数据仓库工具层包括:多维分析工具、数据挖掘工具以及可视化工具。多维分析工具主要指联机分析处理(OLAP,On-lineAnalyticalProcessing),“OLAP是针对特定问题的联机数据访问和分析”。目前,这类产品己经有很多了,如BrioQuery,GQL,Impromptu,PowerPlay,Commander,InformationAdvantage等等。数据挖掘(DM,DataMining)是一种决策支持过程,它主要基于AI、机器学习、统计学等技术,高度自动化地分析原有数据,做出归纳型的推理,从中挖掘出潜在的信息用于决策。

三、数据仓库技术在商场(超市)中的应用

1.设备管理

数据仓库化是商场(超市)范围内数据的处理过程它将商场(超市)内分散的原始操作数据和来自外部的数据汇集和整理在一起,为商场(超市)提供完整、及时、准确和明了的决策信息,有效地服务于商场(超市)的全方位决策。作为一个决策支持环境,DW(DataWarhouse)收集存储了各种不同数据源中的数据。通过数据的组织给决策支持者提供分布在整个商场(超市)内部跨平台的数据。在对设备管理数据仓库的开发过程中,首先根据商场(超市)对设备管理的具体要求和设想,确定数据仓库开发的目标,规划系统的数据范围和功能制定工作计划;然后分阶段建立元数据模型,主题区数据模型,开发数据仓库逻辑模型;再根据逻辑模型设计多维数据结构维表,在对源数据进行分析的基础上,用数据转换程序(DTS)将其转入数据仓库中,最后是对数据仓库的使用和维护,添删数据,扩展功能等。

2.财务决策支持

典型的财务决策问题有:投资决策、筹资决策、成本决策、销售决策等。

财务决策支持系统需要的信息是通过日常业务数据所体现的整体趋势,或随时间变化而表现出来的变化趋势,必须对业务数据进行分类、析取、归纳、加工等处理才能得到这些信息。对数据信息的这些要求决定了财务决策支持系统的数据库有别于普通的业务数据库,因此,必须为企业建立数据仓库以适应决策支持系统的要求。

财务决策支持系统具有三个功能:决策、管理和核算。核算,即会计功能。在会计层,它完成会计原始数据的收集、记帐、算帐和报帐的业务处理后输出会计信息,同时将会计基础信息传输到管理层。管理,即管理信息功能。在管理层,进行会计基础信息的分析,并将分析结果输出的同时,再送给决策层。决策,即根据会计分析信息和其它管理信息进行预测、判断和决策,然后将决策方案下达到管理层。在管理层进行指标分解,编制财务计划,再下达到核算层,并对核算层的执行过程进行控制。

3.管理决策支持

在商场(超市)管理决策支持系统的构架方案中,OLTP应用系统中的数据库,可分为不同的类型,它是DSS的数据来源。大量不同事务的、可靠的、历史性的数据是建立DW的基础。OLTP从DW中的可集成数据出发,构建面向分析的多维数据模型,自动地发现数据中的潜在模式,并以这些模式为基础自动做出预测。DM中挖掘的知识可以直接用于指导OLAP的分析处理,而OLAP分析得出的新知识又可以补充到系统的知识库中。传统的DSS往往独立地设计并实现,将数据库、模型库和知识库,缺乏内在的统一性。而数据仓库、联机分析和数据挖掘组成的新的DSS,将三库有力地结合在一个多维的数据库中,利用多维分析工具,通过可视化工具将分析结果呈现给用户。

4.其他应用

4.1提高市场竞争力,提升客户服务水平。通过建立数据仓库,为客户资料的统计分析提供基本的信息源和辅助工具,已成为各个企业包括商场提高市场竞争能力和客户服务水平的关键。

4.2提高管理水平,降低成本,提高效率。随着市场经济竞争的发展和反垄断经营的推进,商场(超市)逐渐向规模化、集约化方向发展,各个公司迫切要求提高其自身的管理水平。数据仓库的建立可使企业更

加及时、准确地掌握自身的经营状况、资金情况、利润情况、客户群分布等重要信息。

虽然数据仓库技术在各个行业包括商场(超市)中的应用已日渐成熟,但作为商场(超市)不必要模仿其他行业,应该根据自己行业的特点有针对性地应用数据仓库技术,凸显自己的行业优势。

参考文献:

吴峨,即建军.财务管理决策支持系统的研究。信息系统工程,1995

孙林,张培衢.财务数据仓库系统的分析设计与实现。河南师范大学学报(自然科学版).2000

李海刚.基于数据仓库的数据挖掘及其在决策系统中的应用[J].现代计算机.2001

数据仓库范文第4篇

企业数据仓库建设的阶段性包括报表、查询、统计,数据分析,数据挖掘,运营导向(现场决策),运营自动化(自动决策)等等。

1、报表、查询、统计。

报表、查询、统计是多年以来IT技术辅助企业管理决策最常用的技术应用模式,这种模式为企业所有管理部门所熟悉和使用,因此,数据仓库技术必须以此为切入点,首先覆盖这种成熟应用模式的所有功能,让企业管理决策者的思维习惯和应用模式可以平滑地进行过渡,进一步,数据仓库技术必须在报表、查询、统计方面体现出比传统技术和应用更加强大的特点和功能,让企业管理决策者体会到数据仓库技术的与众不同。

2、数据分析。

在线分析处理技术(OLAP),通过业务建模,把原来二维的信息转换为多维的信息,以此为基础,OALP提供切片功能,即从多角度、多层次、多剖面地观察分析数据的手段,让企业管理决策者能够更加深入地掌握企业的经营状况;同时,OLAP提供钻取功能,即从任一角度自上而下的层层钻取、深入分析到问题源头的功能,反之,也可以自下而上层层汇总信息。OLAP动态、灵活的特征能够从容地面对不确定性的随机分析,并且提供良好的实时性,以及支持大批量用户并发查询;同时,OLAP应用提供友好的交互特性,以及通过图形用户界面(GUI)和语义层直接访问数据仓库的能力。OLAP能够帮企业改善决策的质量和速度。

3、数据挖掘。

数据挖掘使用诸如神经网络、规则归纳和集群之类的技术,用来发现数据之间的关系,做出基于数据的推断,这些推断的结论往往隐藏在数据之中,不十分明显,或者过于复杂以致采用一般的统计分析方法难以奏效。数据挖掘用于帮助企业发现经营活动中有关于客户消费行为、市场发展趋势等各种规律,让企业更深入地把握未来环境的动向,协助企业更为积极地制定、实施和管理公司的战略。

4、运营导向(现场决策)。

第1到第3阶段的数据仓库都以支持企业内部战略性决策为重点,第4阶段则重在战术性决策支持。数据仓库对战略性决策的支持是为企业长期决策提供必需的信息;战术性决策支持的重点则在企业对外的业务活动,为在业务现场执行企业战略的一线业务人员提供实时的决策支持。随着市场的成熟、竞争的加剧、全球化的挑战,市场细分、个性化服务、以客户为中心的经营思想对企业所提供的服务提出了向精细化转变的挑战,这种挑战让企业的服务活动需要更多的现场实时决策,同时也让企业面临更大的经营风险。数据仓库技术能够帮助企业从容面对这种挑战,它为企业的前端运营提供导向功能,使得每项业务最优化,从而整体提高了企业业务的质量,为企业的利润最大化提供了最有力的保障。

5、运营自动化(自动决策)。

随着电子商务技术、通讯技术、CallCenter技术、CRM的迅速发展及在企业应用中的普及,产生了各种各样的自动化销售、供应及服务模式,这一模式对企业的经营会随着时间的推移越来越重要,这一复杂的过程在无人介入的情况下自动发生,响应时间以秒或毫秒计。面对这种客户与企业IT系统的互动,企业需要十分个性化的客户关系优化决策过程,为了寻求决策的有效性和连续性,企业只能选择自动决策。

随着技术的进步,越来越多的决策由事件触发,然后自动发生,数据仓库技术允许用户采用事件触发和复杂决策支持功能,以最佳方案逐个产品、逐个机构作出决策。在CRM环境中,利用数据仓库技术,可以根据每一位客户的情况做出个性化的决策。

二、结论与建议

从第1阶段到第5阶段的建设过程,是数据仓库技术从支持战略决策到支持战术决策的拓展,是从为企业局部提供信息和决策支持到为整个企业提供信息和决策支持的拓展,第4和第5阶段数据仓库的运营导向和自动决策,是第1~3阶段开发的企业战略能够得以执行的保证。

数据仓库应用是一个逐渐演进的过程,后期每个阶段的数据仓库建设都必须以前一个阶段的成果为基础,而且每个阶段的应用建设都面向不同的企业用途,我们不能从第1阶段直接跳到第5阶段。当数据仓库应用发展到具有战略决策支持功能时,必然会提出战术决策的更高要求。数据仓库技术如果能用于整个企业,其商业价值会大大增加。向整个企业中成千上万的决策者(甚至通过CRM的应用,客户也可参与决策)提供信息,将给企业的业务发展带来巨大的优势。

数据仓库范文第5篇

关键词:气象数据仓库;联机分析处理;数据挖掘

中图分类号:TP311.13文献标识码:A文章编号:1007-9599 (2010) 11-0000-01

Meteorological Data Warehouse Industry and Data Mining

Zhuang Ting

(Weather Warning Center in Tianjin Binhai New Area,Tanggu300457,China)

Abstract:This paper summarizes the current meteorological data warehouse should contain content and meteorological data warehouse design,on-line analytical processing and data mining technology allows researchers to obtain meteorological weather data for its useful and complete with SQL SERVER meteorological data warehouse platform design,to provide support for meteorological research.

Keywords:Meteorological data warehousing;online analytical

processing;Data mining

随着通信技术和计算机技术的发展,每日的气象数据资料十分庞大,可谓是海量数据。采用高效的数据立方体计算技术以支持服务器进行快速决策支持查询。数据库在基层,数据仓库在上层,从传统的关系数据库应用环境向信息服务驱动的以数据仓库为基础的应用环境转移,是信息服务系统的必然趋势。

一、气象数据仓库系统的总体架构

(一)数据仓库系统

数据仓库包括3个方面的内容:数据仓库技术,用于数据的存储和组织;联机分析处理(OLAP),用于数据的分析;数据挖掘技术(DM),用于知识的自动发现。

数据仓库的架构见图1。

(二)气象数据仓库系统的建立

1.气象数据仓库建立的必要性。

传统的气象数据库,只包含了气象台站所在位置的气象资料,虽然在一定范围内具有代表性,但还是不能准确的反映该地区的气象情况。目前国家气象局已经完成了全国范围的自动气象站的布网。传统的气象信息数据库系统已经无法满足目前的海量的气象数据资料的存储和处理的需要,而气象数据仓库的建立正好弥补了传统的气象信息数据库系统的不足,所以建立气象数据仓库十分必要。

2.气象数据仓库存储与维度和粒度的设计。

数据模型是开发和构建数据仓库的基础;是联机分析处理和数据挖掘的重要条件。星型模型和雪花模型是基于关系数据库的数据仓库的两种典型的数据模型。“星型模型”是数据仓库广泛采用的数据模型,它能准确、简洁地描述出实体之间的逻辑关系,适用于软件开发,同时相对于雪花模型节点而言交叉点少,查询速度会更快。所以气象数据仓库选择采用星型模型。

3.以数据仓库为基础设计的VIPS系统的数据展示。

SQL Server Analysis Services可以使用Analysis Services的联机分析处理结果通过自定义的组合,实现多维分析展示。用户可自定义维度、维度限制、统计方式等,并可将结果通过网络。此过程中,Reporting Services提供了很友好的图形用户界面,可以为用户简化大量操作。

Reporting Services体系结构是一组集成的组件。该体系结构具有多层,其中包括应用程序层、服务器层和数据层。由于该体系结构是模块化的,且具有可伸缩性,也就是说Reporting Services是支持联机操作的。

以数据仓库为基础设计的VIPS系统,能在一个友好的图形用户界面上同时显示多个气象产品的集合。就是结合了华北地区几部多普勒雷达的基本反射率雷达产品,华北所有自动站的温压湿、风向风速等资料。这就很好的为预报员的工作提供服务。

三、数据挖掘

数据挖掘是知识发现的主要步骤,我们所面对的用户,一般都是领域方面的专家,而不是计算机专家,所以数据挖掘技术要针对用户需求而进行。气象数据挖掘有以下特点:可视化、智能化、挖掘过程的长期化。气象数据的诸多要素之间存在一定的关联,如降水、气温及干旱之间有一定的联系;采用适当的量化方法,如领域专家的经验值或模糊均值法(FMC);将连续的数值型数据,如降水、气温量化为5个语言值,采用基于语言值的关联规则,可挖掘出在降水、气温项集下的干旱指标,并可对干旱进行预测。

四、结束语

数据仓库的建设与知识的发现是一个长期的工作,数据仓库只能一步步进行设计和载入数据,快速的开发方法只会带来灾难性的后果。气象部门是国内少数积累了大量历史数据的部门之一,但由于数据的分散和不规范,研究人员普遍感到数据统计分析的不便,耗费太多精力。应用螺旋式开发方法,逐步建立气象数据仓库,并结合一些成熟的算法和软件进行气象统计分析,可以减少重复的研究。提高效率,使多年积累的气象数据成为财富,更好的发挥作用。

参考文献:

[1]王红霞,朱喜林,马季兰,王志伟.气象数据仓库建立及数据统计与挖掘[J].山西:太原理工大学学报,2006:101-103