|
|
 |
|
 |
数据仓库之我见 (设计篇) |
热 ★★★ |
|
|
|
| 数据仓库之我见 (设计篇) |
|
|
| 作者:佚名 文章来源:本站整理 更新时间:2008-9-22 9:45:06 |
|
|
|
|
数据仓库之我见 (设计篇)
来源:不详 作者 佚名 点击数: 录入时间:07-12-19 21:28:17
建造数据仓库要做些什么? 一般说来,建造数据仓库主要两个方面:
1. 与操作性数据库的接口设计。
2. 数据仓库本身的设计。
看上去好像很简单,但事实并非就这么按部就班,假设我是一个数据库设计师,我完全可以不管三七二十一,先载入一部分数据,让DSS分析员(还没忘吧,就是那个给设计数据仓库的人要求的)分析去吧,等他先给点意见出来,我们在动手也不迟。
下面,我将按照提出问题、解决问题的顺序来上一堂学前班。
建造数据仓库的主要难点是什么? 首先纠正一个广泛存在的错误认识:建造数据仓库的过程就是从操作性数据中提取数据的过程,之所以说这是错的,主要是因为:操作性数据大都是非集成的(有谁见过一个计费程序可以把几年的账单条目统计一遍的),你不可能抽取出你真正需要的东西,例如这个月的平均花费,马磊在这个月的加班日等等,不用我说,你也知道:操作性数据主要是为应用程序服务,而每个系统或应用程序都有其特有的“独立性”,在开发的时候,谁会想到以后还要翻旧帐呢?
好了,换一个新的视角看问题:如果不仅仅是抽取的话,那还有些什么问题呢?如下:
第一个问题:系统集成。当成百上千张表放在一起,需要你来统计的时候,你敢肯定这个表的某一字段和另一张表的同名字段是一个含义么?或者反过来说:你敢肯定这个表的某一字段和另一张表的不相同的字段一定是毫无关系的么?这些问题可以归结成一个问题:系统缺乏集成性!解决这个问题的方法除了更好的设计你的数据库,只有靠你的耐心了。还有就是字段的转换问题,看下面这个例子:性别(sex)在数据库中有很多表达形式,可以写成m/f,也可以写成0/1来表示男/女,等等……怎么办?为了保证传唤到数据仓库的数据正确,我们必须建立不同的映射(Sorry,简单的说是:将上面提到的那种性质相同,表示的不同的数据用同一种形式表达出来),这也是一件需要耐心的工作!
第二个问题:存取现存系统的数据的效率。这很正常,当有很多表格和文件需要扫描的时候,谁能确切的知道一个文件被扫描过?如果,现存系统存在大量的数据,你为了得到其中某一些数据,而把整个数据库扫描一次,这件是一场悲剧。相信谁也不想这种事发生,具体的解决方法在下面的提出。
弄请”how to 避免这些问题”,先搞清楚从操作型环境到数据仓库可能要做那些装载工作(你会选那一项呢?)
l 装载档案数据。(联想一下布满灰尘的旧帐本就知道什么是档案了)
l 装载在操作性系统中目前已有的数据。(就在系统中的数据,还没有备份的)
l 将自数据库上次刷新以来在操作性环境中不断[1] [2] [3] [4] [5] [6] [7] 下一页 更多精彩:学习网->http://www.haohao888.com.cn 网络编程->http://www.51wlpc.com 电脑设备->http://www.xpmaster.cn
|
|
|
|
| 文章录入:admin 责任编辑:admin |
|
|
上一篇文章: 将窗口最小化为时钟旁的小图标(PowerBulider) 下一篇文章: 数据仓库之我见(概念篇) |
|
|
|
|
|
|
|
|
|
|
|
|