个操作数据模型,可以这样理解:
企业模型à操作模型à数据仓库模型
三个方面都很重要,而且互不相同。(有点像鸡和蛋的关系)
随便聊聊数据模型吧,分三个层次的建模:高层建模(实体模型RED)、中间层建模(数据项集DIS)和底层建模(物理层)。建造的顺序是由上向下,就好像大家坐在一起,讨论出来一个大体的架构,开始中间层的设计工作(因为RED需要的数据不可能简单的抽取到,需要一定的综合方法),然后根据中间层设计底层模型,(底层模型的数据是可以从操作型数据中得到的)。
呵呵,我还是不深入讨论了,给你留一点内容可以自己琢磨一下(而且本书也不是专门讲建模的教材)。
是不是有点晕了,什么数据建模、什么三个层次,别急,等你带着这些问题去看书的时候,问题很快就没有了,我之是建议你能纪录一下自己的问题,不至于在看书的时候,连问题都忘了。J
数据建模同时也是一个拼积木的过程,每次设计的结果都是一块独特积木,这有在凑够所有的积木之后,才可以完成一幅拼图。(一个任务)
以上介绍的是数据仓库的设计方法——数据建模。下面来谈一谈设计数据仓库的几个细节问题:(这可能会很枯燥) 规范化/反规范化 这种操作的目的是减少系统的I/O操作时间。具体的方法可以归纳为两句话:为了减少I/O操作所用的时间,将一些表合并(规范化),或者引入冗余数据(反规范化)。
数据仓库的快照 快照是一个事件的详细纪录。举例:你用了一大笔钱买了一件心爱的东西的时候,突然发现下半个月的生活费没有了,这就是那个事件,而产生的快照如下:
时间 | 键码 | 地点 金额 物品 …… 购买时的心情 | 账户余额 …… 购买后的心情 |
1 2 3 4
不难看出:第三段数据是离散的原始数据,第四段是事件发生后的因果数据(是联系的、可选的)总结一把,快照应该是对一个事件的真实记录,他应该包含以下内容:
l 键码。
l 时间单元。
l 只和键码关联的初始数据。
l 快照发生后所捕获的二次数据,和前面无直接的关系。
&nbs上一页 [1] [2] [3] [4] [5] [6] [7] 下一页
|