企业CRM系统中数据仓库的应用设计

2024-09-16 版权声明 我要投稿

企业CRM系统中数据仓库的应用设计(精选6篇)

企业CRM系统中数据仓库的应用设计 篇1

1、数据的抽取,由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入到数据仓库。数据抽取在技术上主要涉及互连、复制、增量,转换、调度和监控等几个方面。

2、数据的存储和管理。数据仓库遇到的第一个问题是对大量数据的存储和管理。这里所涉及的数据量比传统事务处理大得多且随时间的推移而累积。数据仓库的组织管理方式决定了它有别于传统数据库的特性,同时也决定了其对外部数据表现形式。要决定采用什么产品和技术来建立数据仓库核心,则需要从数据仓库的技术特点着手分析。从当今的技术发展来看,面向决策支持扩充的并行关系数据库将是数据仓库的核心。

3、数据的表现。实际的应用中,客户需要通过对数据的统计来验证他们对某些事物的假设,以进行决策。与数理统计相似,数据挖掘与数据仓库也没有直接的联系,而且这个概念在现实中有些含混。数据挖掘强调的不仅仅是验证人们对数据特性的假设,而且它更要主动地寻找并发现蕴藏在数据之中的规律。市场上许多数据挖掘工具并不是真正寻找出数据的规律,而是验证尽可能多的假设,最后由人来判断其合理性。因此在当前的数据仓库应用中有效地利用数理统计就已经能够获得可观的效益。

二、客户数据仓库模型设计

1、数据结构图。星型和雪花结构是在数据仓库中最为广泛的数据结构,它们的主要优点是能提供多维的模式,并能实现对数据的快速查询和连接。星型结构是非范式、以查询为中心的模型,这种模型的最大优点是能够提供所谓的星连接,通过一步连接就可以获取大部分所需要的信息,并能很快得到输出结果,这种模型里信息可分为两大类:事实表和维表。

2、概念模型设计。概念模型设计是建立数据仓库的第一步,是主客观之间的一个桥梁,是客观世界到机器世界的一个中间层次。描述概念模型最常用的方法是E-R图法,运用E-R图可以清晰的表示客户、订单和产品之间的关系。

3、数据结构图,

星型和雪花结构是在数据仓库中应用最为广泛的数据结构,它们的主要优点是能够提供多为的模式,并能实现对数据的快速查询和连接。星型结构势非范式的,以查询为中心的模型,这种模型的最大优点是能够提供所谓的星连接,通过一步连接就可以获取大部分所需要的信息,并能很快得到输出结果,这种模型里信息可分为两大类:事实表和维表。

4、逻辑数据模型设计。逻辑模型式通用化的数据模型它的典型产品是实体关系图,用于描述现实世界中实体和实体间的关系。

(1)客户数据。少量的客户数据不足以提供有关客户偏好和消费的真实、实时的信息。从客户数据的来源来看,客户数据有一部分可以从企业现有的操作型系统获取,如ERP、SCM、HR系统但这对有效的客户智能实现是远远不够的。大多客户知识的发现需要集成至少5年甚至更长时间的客户数据。因此,能对客户智能起到全面支持作用的数据环境必须包括集成的客户数据和该客户的历史数据。

(2)产品数据。产品数据包括下面几个方面:产品类别信息:包括类别ID和名称;产品价格信息:产品ID、单价等;产品材料信息:材料ID、名称;供应商信息:供应商ID、名称、供应价、供应日期。

(3)订单信息数据。订单信息包括下面几个方面:订单固有信息:包括订单ID、日期等;客户信息:包括客户ID、名称等;产品信息:包括产品名称、设计属性等。

5、数据仓库的物理设计

(1)表空间设计。表空间设计主要是为了把逻辑意义的区分开,也为性能考虑,所以可以在表名前加前缀作为区分表所在的区。

(2)归档设计。由于数据在数据仓库中的频繁加载、删除,以及插入的操作,如果选用归档模式会使数据仓库产生大量日志。如果归档将严重影响性能,而且数据仓库对数据恢复的要求不高,所以采用非归档模式。

(3)安全性设计。数据库中所有法人用任务表全部放在一个用户下,以方便在各个区之间加载转换,再建一个用户用于展现,对所有的业务表只有只读权限。

(4)参数设计。由于数据仓库经常删除、插入,很少更新的特点,相对一般业务系统,加大块的大小,增加preused和减少prefree。

企业CRM系统中数据仓库的应用设计 篇2

1. 数据的抽取。

由于数据仓库是一个独立的数据环境, 它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入到数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面。

2. 数据的存储和管理。

数据仓库遇到的第一个问题是对大量数据的存储和管理。这里所涉及的数据量比传统事务处理大得多, 且随时间的推移而累积。数据仓库的组织管理方式决定了它有别于传统数据库的特性, 同时也决定了其对外部数据表现形式。要决定采用什么产品和技术来建立数据仓库核心, 则需要从数据仓库的技术特点着手分析。从当今的技术发展来看, 面向决策支持扩充的并行关系数据库将是数据仓库的核心。

3. 数据的表现。

实际的应用中, 客户需要通过对数据的统计来验证他们对某些事物的假设, 以进行决策。与数理统计相似, 数据挖掘与数据仓库也没有直接的联系, 而且这个概念在现实中有些含混。数据挖掘强调的不仅仅是验证人们对数据特性的假设, 而且它更要主动地寻找并发现蕴藏在数据之中的规律。市场上许多数据挖掘工具并不是真正寻找出数据的规律, 而是验证尽可能多的假设, 最后由人来判断其合理性。因此, 在当前的数据仓库应用中, 有效地利用数理统计就已经能够获得可观的效益。

二、客户数据仓库模型设计

1. 数据结构图。

星型和雪花结构是在数据仓库中最为广泛的数据结构, 它们的主要优点是能提供多维的模式, 并能实现对数据的快速查询和连接。星型结构是非范式、以查询为中心的模型, 这种模型的最大优点是能够提供所谓的星连接, 通过一步连接就可以获取大部分所需要的信息, 并能很快得到输出结果, 这种模型里信息可分为两大类:事实表和维表。

2. 概念模型设计。

概念模型设计是建立数据仓库的第一步, 是主客观之间的一个桥梁, 是客观世界到机器世界的一个中间层次。描述概念模型最常用的方法是E-R图法, 运用E-R图可以清晰的表示客户、订单和产品之间的关系。

3. 数据结构图。

星型和雪花结构是在数据仓库中应用最为广泛的数据结构, 它们的主要优点是能够提供多为的模式, 并能实现对数据的快速查询和连接。星型结构势非范式的, 以查询为中心的模型, 这种模型的最大优点是能够提供所谓的星连接, 通过一步连接就可以获取大部分所需要的信息, 并能很快得到输出结果, 这种模型里信息可分为两大类:事实表和维表。

4. 逻辑数据模型设计。逻辑模型式通用化的数据模型, 它的典型产品是实体关系图, 用于描述现实世界中实体和实体间的关系。

(1) 客户数据。少量的客户数据不足以提供有关客户偏好和消费的真实、实时的信息。从客户数据的来源来看, 客户数据有一部分可以从企业现有的操作型系统获取, 如ERP, SCM, HR系统但这对有效的客户智能实现是远远不够的。大多客户知识的发现需要集成至少5年甚至更长时间的客户数据。因此, 能对客户智能起到全面支持作用的数据环境必须包括集成的客户数据和该客户的历史数据。

(2) 产品数据。产品数据包括下面几个方面:产品类别信息:包括类别ID和名称;产品价格信息:产品ID, 单价等;产品材料信息:材料ID, 名称;供应商信息:供应商ID, 名称, 供应价, 供应日期。

(3) 订单信息数据。订单信息包括下面几个方面:订单固有信息:包括订单ID, 日期等;客户信息:包括客户ID, 名称等;产品信息:包括产品名称, 设计属性等。

5. 数据仓库的物理设计

(1) 表空间设计。表空间设计主要是为了把逻辑意义的区分开, 也为性能考虑, 所以可以在表名前加前缀作为区分表所在的区。

(2) 归档设计。由于数据在数据仓库中的频繁加载、删除, 以及插入的操作, 如果选用归档模式会使数据仓库产生大量日志。如果归档将严重影响性能, 而且数据仓库对数据恢复的要求不高, 所以采用非归档模式。

(3) 安全性设计。数据库中所有法人用任务表全部放在一个用户下, 以方便在各个区之间加载转换, 再建一个用户用于展现, 对所有的业务表只有只读权限。

(4) 参数设计。由于数据仓库经常删除、插入, 很少更新的特点, 相对一般业务系统, 加大块的大小, 增加preused和减少prefree。

(5) 备份恢复。这里采用每2天一次冷备份和一周一次逻辑备份。可以接受恢复两天前的数据, 然后通过ETL重新从源数据库中获取最新数据。

参考文献

[1]Bjqrn W.H ennestad, i nfusingt he organizationw ithc ustomerk nowledge, Scandinavian journal of management, 1999 (15)

[2]A drian Payne, A Strategic Framework for CRM, available at:http://www.dmreview.com, 2000

[3]曾妮丽陈亮童怡:商业智能中数据仓库的设计[J].商业现代化, 2007 (2) :28-29

企业CRM系统中数据仓库的应用设计 篇3

关键词:数据挖掘;银行客户关系管理系统;决策树

中图分类号:TP311.13

随着市场经济改革的不断深入,今天的中国银行业,已步入客户为主导的买方市场。无论是国有银行还是股份制商业银行,都已经认识到客户是其重要的商业资源,客户关系管理越来越受到企业的重视和关注。对于企业而言,能否对客户数据信息进行合理、有效地利用,成了他们在市场竞争中能否取得优势的基础和关键。

1 银行客户关系管理系统

银行要想在激烈的市场竞争中立于不败之地,必须转变银行的经营观念,只有实行以客户为中心的客户关系管理,与客户建立长期稳定的客户关系,不断完善客户的服务水平,使客户的收益最大化,提高客户的满意度,才能取得在金融竞争中的主动权。

银行客户关系管理(Customer Relationship Management,简称CRM)系统是一套客户信息分析系统,运用数据挖掘技术,分析现有客户和潜在客户相关的需求、交易行为,投资习惯等,从而为企业最大限度地获取经济效益。银行通过对银行存储的大量客户数据进行综合分析,发现在市场竞争中潜在的优质客户群,将客户进行分类,对不同的客户群体制定和实施不同的营销服务策略,提供个性化服务[1]。

2 数据挖掘技术

数据挖掘是从大量的数据信息中发现并提取潜在的有价值的信息的过程,目的是帮助分析人员寻找隐藏在各种数据之间的关联,寻找其中的规律,挖掘出潜在的模式和规则,为有效的决策提供支持和帮助。数据挖掘涉及数据库、人工智能、机器学习和统计分析等多个领域,是多种技术的综合[2]。

银行利用数据挖掘技术,通过对大量的客户数据信息进行深入的分析,對客户定位和分类,了解客户的消费倾向与消费模式,预测客户的风险性与利润性,作为对客户提供服务和产品营销的辅助手段。数据挖掘技术是CRM系统的核心技术,通过数据挖掘技术,迅速准确地把握客户的消费习惯和行为模式,才能帮助管理者调整市场策略,做出正确的决策,能够实现符合银行要求的高效的客户关系管理的目标。

3 银行CRM系统的目标

CRM是一种业务流程,银行将客户视为其重要资源,最大限度地满足客户要求,并建立与客户的相互信任,使企业和客户之间保持持久稳定的关系。CRM系统的目标主要有:(1)理解客户的真正需求。通过了解客户需要,为客户提供优质服务,提高客户的满意程度和忠诚度,提供差异化服务,增加新客户,留住原有客户,提高客户的利润贡献度。统计表明,银行从新客户身上赚钱的成本是往往是从现有客户身上赚钱成本的数倍。企业要留住老客户,要按照老客户的行为习惯和偏好提供服务,对推出的新金融产品,及时通知老客户,赢得他们的满意;(2)对客户进行细分,根据不同类客户的特点,采取相应的营销策略,对客户的行为进行引导。如何找出优质的有价值的客户,进行针对性的重点营销。通常情况下,占客户群20%的优质客户,实现的利润往往占到银行总利润的80%以上。CRM系统的任务就是根据对客户的数据分析,发现这一部分优质客户,针对不同的客户实施不同的策略。

4 数据挖掘技术在银行CRM系统中的应用

银行的数据库中存储着大量的客户业务数据记录,每个客户都有自己的投资和消费习惯。为了更好地赢得客户的信任,提高客户的服务水平,就要对银行的所有客户进行分类划分,为客户分类能够提高银行的服务效率,针对客户类别的不同采用不同的服务政策。数据挖掘技术可以将银行客户划分成不同的类,类别相同的客户拥有相似的属性。数据挖掘主要方法包括决策树算法、神经元网络算法、遗传算法以及关联规则挖掘等,其中,决策树是数据挖掘分类技术的常用方法[3]。

(1)决策树ID3算法的基本原理。ID3算法是由Quinlan在1986年提出来的,是最具影响的生成决策树的分类算法。ID3算法广泛应用于各种领域,ID3算法引入了信息论,提出了用熵来衡量一个决策树中非叶节点信息量大小的思想。ID3算法的输入是数据集包含的全部实例,输出是要构造的一棵决策树,其叶子节点标记为实例所属类别。在ID3算法中用非叶结点表示属性,而用叶子结点表示类别。构造决策树的过程中用信息增益作为节点属性的选择标准。在对每一个非叶结点进行节点属性测试时,获取其中属性信息增益的最大值的属性一个作为分裂结点。使用该属性对将当前节点的数据集划分成子集后,系统的熵值最小,对分类提供的信息量最大;(2)决策树ID3算法描述。用信息增益作为决策树节点属性的选择标准,使得在对每一个非叶结点进行测试时,能获得关于被测试记录中最大的类别信息。ID3选择具有最大信息增益的属性作为当前节点的测试属性,具体方法是:检测所有的属性,选择信息增益最大的属性作为决策树结点,由该属性的不同取值作为节点分支,再对各分支的对应的子集继续递归调用此方法确定决策树各节点及分支,直到所有子集的实例属于包含同一类别为止,最后得到一棵决策树,它可以用来对新的样本数据集进行分类;(3)决策树ID3算法在客户分类中的应用。在个人贷款申请的审批中,要对申请的贷款风险大小作出判断,通过对客户数据中债务、收入、工作类型的数据分析,进行判断是否有信用风险。

5 结束语

银行为了在市场竞争中赢得优势,必须为客户提供优质与个性化的服务。银行业只有尽快实施客户关系管理系统,进行准确的市场定位,以客户满意为出发点改善服务质量,降低市场营销成本,从而为银行带来更多的利润。在银行大量的客户数据中要发现有价值的信息和知识就必须采用数据挖掘技术,CRM系统就是利用数据挖掘的理论与技术构建预测客户未来行为的模型,以实现有效的客户关系管理。通过数据挖掘技术,在大量的客户数据中挖掘出潜在的模式和规则,包括预测客户的细分、发现重点客户、提高客户的忠诚度、预防客户的流失,帮助银行决策者及时对市场策略进行调整,作出正确的决策[4]。

参考文献:

[1]尹晓丽,方旭昇.数据挖掘技术在银行CRM中的应用[J].经济研究导刊,2009(20):112-113.

[2]赵卫军,李捷.数据仓库和数据挖掘在银行CRM中的应用[J].华南金融电脑,2007(15):8-11.

[3]于淑香.决策树ID3算法的研究与应用[J].沙洲职业工学院学报,2011(14):27-30.

[4]王小燕,周建民.数据挖掘技术在商业银行中的应用研究[J].华南金融电脑,2005(13):94-96.

作者简介:杜丽英(1969-),女,吉林长春人,讲师,硕士,研究方向:计算机应用。

作者单位:吉林建筑大学计算机科学与工程学院,长春 130118

企业CRM系统中数据仓库的应用设计 篇4

选择是痛苦的

人生老是在选择,多是对于与错的选择,也多是多项的选择。企业也是如斯,在CRM计划以及部署上也面临良多的选择,比如选型、项目关注点、系统关注点、施行标准、验收机制等。而这些选择中,有1些是相当首要的,抉择着整个CRM项目的走向以及成败。其当选型,象征着产品、供应商以及服务商和它们联合提供的解决方案的总体方向以及技术实现特色的肯定,直接影响着后期项目的任何变化。

当企业面临着这样的多个选项的单选题时,是很痛苦的。即便阅历了很长的CRM战略计划以及思想的动员、培训以后,仍是要痛苦的面临它,而它,却承载了更多更多的繁重,不管是管理因素、业务因素、技术因素仍是政治因素。

CRM是甚么?

CRM是客户瓜葛管理,这个已经经不用作为谜底了。问题的本源在于:CRM的核心是甚么?CRM项目的核心是甚么?CRM系统的核心是甚么?为何会问这个最基本的问题,在于良多企业或者人都容易偏离核心问题,在计划以及部署CRM的时候走入偏端。

在行业解决方案,咱们时常发现两派阵营在竞争,1个是所谓的标准CRM,1个是行业业务系统的营销系统,当它们在争吵的时候,还有1部份已经经开始将CRM与业务系统试图融会1起。现在的1个事实是:大部份行业方案,不管是来自CRM供应商的,仍是来自行业业务软件供应商的,都开始相互包融吸纳,互通有没有,只是各部份的实现程度不1样。于是,良多人认为这就是趋势,这就是规则。

错了!如果企业踏上这样的路途时,就象征着它的CRM战略计划已经经偏离了CRM的主航道,而开始走向非核心的业务。

咱们再回到开始的`问题,企业常常会疏忽CRM的核心是客户,是外部客户的满意度以及价值最大化,当这个核心被误会的时候,就是计划偏离的时候。

行业业务系统的对于与错

作为行业的业务系统软件或者者功能,咱们简称为“行业业务系统”,它们自身是没有过错的。业务系统更多的是寻求提高业务处理效力,也就是相似于ERP,是面向内部员工以及内部流程,而不是面向客户以及客户流程的。业务系统的优劣,更多影响的是业务处理效力,而这类影响并不是是举足轻重的,良多企业在没有业务系统的时候也能通过辅助手腕如手工、电子表格等实现;业务系统的不同,影响的还有员工的习气,内部员工使用业务系统的习气,而这类习气是1种劣性的第1次情结的,也就是第1次使用的系统逐步习气以后,当替代更好的系统时也觉患上不习气,也感觉不到益处。

业务系统的核心在于产品以及定单,由于企业的业务处理是缭绕这些运转的。在没有引进CRM战略以及流程以前是这样的,在引入以后却又是怎样样的呢?

CRM强调的是客户,是缭绕客户为中心的1切流程,体现在系统上就是统1的客户视图以及独一的客户入口,业务系统只是当分析客户、接触客户到交易的时候才进行记录状况以及结果的,而这个时候,CRM的首要价值已经经体现了很大1部份了。

CRM的战略框架与业务系统

1个企业如果没有战略性的框架,它的CRM部署是不会胜利的。而1个企业有了CRM战略计划以后,也不确保CRM部署的方向不会偏差。这类平衡,体现了变革中人的因素是如斯的首要,也象征着每一1个CRM项目的变化是无形而无模式的。

企业如果没有了CRM战略框架以及核心方向,咱们没法想象再具体再完善的业务系统来实现CRM的思想。即便业务系统如何完善,企业的客户却没有扭转,不管是状况仍是价值,仍是满意度,而扭转的可能更多的是内部的效力以及满意度,这是企业所要的吗?于细微处弃大节,这也是不断强调核心的本源。

有所患上,必有所失。企业需要判断的是我需要患上的是甚么?特别是核心的是甚么?然后才能去遗弃那些不是我必须的不是我核心的。 当企业的CRM利用进入1个行业利用的时期,咱们需要关注的是甚么?CRM?抑或者是业务系统?仍是2者的平衡? 你的谜底是甚么?

企业部署CRM项目的教训记忆犹心,而咱们的最大感触是过于强调系统功能以及功能的庞大,是1个误导,特别是在业务功能上。业务功能再强大,内部员工可能会使用的更顺手,内部效力会更高,然而对于客户行动的影响是有限的;而CRM推崇的是基于客户的细分、接触、关怀以及保存,是缭绕客户战略架构的核心方向,对于客户价值进行细分,进行差异化服务,进行1对于1关怀以及营销。这些是CRM的核心,而这些未必须要系统,即便是电子表格也能够进行,而采取系统也是CRM系统而不是业务系统。

这就是CRM系统与业务系统的最大区分。

企业CRM系统中数据仓库的应用设计 篇5

销售管理子系统主要是从市场管理子系统获取销售线索信息,形成商机,对协商价格、签订合同、组织发货、收取货款等一系列的工作直至销售目标实现全过程管理。在以客户为中心的CRM系统中,企业对客户的管理和关怀十分重要。在掌握大量的客户数据的基础上,对客户资源进行集中全面的管理,帮助企业建立客户全方位视图,从而能够延长客户生命周期,更深人地挖掘客户潜力,对提升客户价值有着重要的意义。销售管理子系统根据市场管理子系统所提供的销售线索,随着营销人员分派任务的进一步完成,将一些有现实需求的客户转入商机管理,更好地跟踪服务后提出审批的报价单,以便实现销售合同的签订,达到预期的销售目标。

一、数据流程分析

按照销售管理各阶段对容户进行全过程跟踪服务,最终取得销售的实现,

销售管理子系统的处理过程是:线索→商机→报价 →合同→订单→收款→分析。即从市场管理子系统中将客户资料形成销售线索;对这些销售线索经过全方位细致的分析,可以进一步转入商机;把握住商机并根据客户需求提出经过审批的商品报价单;协商商品价格使客户满意,双方签订销售合同,确立购销关系;开始组织订货,按客户的要求签订销售订单;根据销售合同的要求按期提供保质保量的商品,及时组织发货并开出销售发票,产生应收账款;考虑销售订单,根据销售任务等资料编制销售计划;利用各种分析方法,分析销售计划的完成情况。销售管理子系统的数据流程如图1所示。

图1 销售管理子系统的数据流程

企业CRM系统中数据仓库的应用设计 篇6

1 相关技术概述

1.1 数据仓库

数据仓库的概念首先是由美国科学家,数据仓库之父William H.Inmon在Building the Data Warehouse书中提出的。书中指出数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策[1]。

1.2 OLAP技术

联机分析处理(OLAP)的概念是由E.F.Codd在1993年首次提出的。他将OLAP定义为针对特定问题的联机数据访问和分析[2]。

1)多维数据模型:数据仓库和OLAP工具基于多维数据模型,该模型将数据看作数据立方体形式。数据立方体是由维和事实定义。维是观察数据的角度,比如企业要分析销售情况,涉及到时间、区域、分店、商品类型等,这些就是维度。每一个维度都有一个表与之关联。这样在数据仓库中就会有时间表,商品表等。而事实则被看作数量,用来分析维之间的关系。

多维数据模型可以以星型模式、雪花模式、事实星座模式[3]形式存在,其中星型模式是最常见的,它由事实表和一组维表组成。

2)多维数据模型上的OLAP操作:多维数据模型上的OLAP操作主要有上卷、下钻、切片与切块等。上卷操作通过一个维的概念分层向上攀升。下钻是上卷的逆操作。切片是在数据立方体上对某一个维进行选择,切割一个子立方体[1,4]。

2 企业销售系统数据仓库和多维数据模型的构建

企业销售系统的数据库中记录了每日各分店各类商品的销售量,而该数据库中也包含了很多与销售策略分析无关的表、记录。因而,需要从中提取需要的表单,经过数据清洗等一系列的步骤构建一个适合数据分析的数据仓库。而后,在该数据库上构建OLAP多维数据集,通过OLAP的相关操作进行分析与决策,具体步骤如图1所示。

2.1 数据仓库设计

初始数据库中数据表较多,可以根据不同的需要创建不同的数据仓库。由于数据仓库也是一种数据库,因而同样可以通过数据库管理系统进行数据仓库的创建、修改和删除。

首先,确定数据仓库的主题,依据主题创建数据仓库的逻辑结构。企业需要分析各分店各类商品的销售数据,那么确定销售主题,逻辑模型采用星型模式。逻辑结构中的事实表是核心,表1是就是一个事实表。

表1销售事实表包括日期键、分店键、区域键、商品键以及销售量和销售额两个度量值。第1条数据表明:2000年12月1日,A区1分店173号商品销售20件,销售额为4.2万。

逻辑结构中的维度表是对各键的具体描述,每个维度具体包含的主要字段如图2所示。

其次,当数据仓库的逻辑结构设计完后,就可以创建物理数据仓库了。数据仓库中的数据可以直接来源于原始数据库,也可以经过数据抽取、清洗、转换形成新的数据,这一过程可以在ETL阶段完成。

2.2 OLAP多维数据集创建

数据仓库设计完毕后,就可以根据不同的主题构建OLAP的多维数据集。下面锁定销售主题构建数据集,如图2所示。其中日期维作为时间维。

该数据集是一个4维结构的,其4-D立方体如图3所示。

3 多维数据集上的OLAP操作

数据立方体搭建完毕后,根据需要进行数据分析,分析结果可以以报表、图形等多种方式展示。以3月份A区园区店空调的销售数据为例,进行数据分析。

首先,在图所示的4-D立方体上进行切片操作,对日期维选定3月份,区域维选定A区,分店维选定园区分店,商品维选定空调,切出一个子方。其次,以报表形式展示销售数据,如图4所示。

在报表上进行下钻操作,查看详细信息,如图5所示。

决策分析者针对不同的主题构建不同的子方,据此进行数据分析,进行商业决策。

4 总结

将数据仓库和OLAP技术运用于企业销售系统,搭建数据仓库,构建OLAP的多维数据立方体,根据不同的主题切割相应的子方,获得数据间的关系,能帮助企业决策者分析销售数据,做出有利于企业的决策。

参考文献

[1]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,译.机械工业出版社,2001:26.

[2]占小忆.数据仓库和OLAP技术在在高校教学管理系统中的应用研究[J].中国科技信息,2010,22:122-123.

[3]张海敏,张自力,曾铮,等.基于数据仓库与联机分析技术的高考加分政策评估[J].计算机科学,2010,37(6):223-225.

上一篇:改写《悯农》300字作文下一篇:高三毕业经典留言摘抄