|
|
 |
|
 |
如何构建银行数据仓库 |
热 荐 ★★★ |
|
|
|
| 如何构建银行数据仓库 |
|
|
| 作者:佚名 文章来源:本站整理 更新时间:2008-9-19 9:45:26 |
|
|
|
|
一定应该准备。度量的时间特性,针对分析指标在时间维上的不同表现,可分为可累加指标、半可累加指标和不可累加指标。2、在原有数据基础上构建逻辑数据仓库如果直接使用OLTP系统中的数据进行数据分析处理,会遇到许多麻烦,有时甚至是不可能实现的。这并不是说关系数据库不好,而是因为其设计思路不适应较大规模数据分析。因此在使用这种方法时,需要注意下列问题的处理:*不同的时间单位这是实现过程中最常遇到的问题,也往往是最难解决的问题。OLTP系统中存储的时间往往采用与实际业务发生相同的时间单位,如帐务数据单位为日期,财务报表单位为月或半年。而面向分析时,往往要将不同时间单位的数据统一到同一个结果中,这样就必须存在适当的转换机制才能实现。*冗余信息所谓冗余信息,就是指不同关系表中存在的同一含义的字段,而同一含义不仅指这些字段的取得或计算方式一样,还指它们成立的条件一样,例如截止某一时间同一地区的同一贷种的贷款余额。在OLTP系统中,这样的字段往往是基于性能考虑而设计的,而在面向分析设计模型时,为了保证结果的唯一性和准确性,就必须用且只用其中之一的数据产生分析结果。*表间连接由于OLTP系统中表的设计面向业务处理,既要保证数据的完整性、一致性,又要考虑响应时间,因此表与表之间既相对独立,又相互依赖。在设计数据仓库逻辑模型时,对表间的连接必须做出相应取舍,既要保证分析数据能通过连接取得或计算出,又要避免出现环路,造成分析数据的歧义。另外,不同的连接途径还会出现不同的查询速度,影响数据分析的响应性能。*统计表的设计如果上述问题不能在原有数据库基础上得到很好的解决,那么权益之计就是构建统计表,即简单化的数据仓库,形式类似数据仓库的事实表,定时计算统计数据放入,将时间、冗余、连接等问题摈除,进行简单分析。二、数据抽取中的问题数据抽取是一件技术含量不高,但非常烦琐的工作,必须有专人负责数据抽取的工作。在对其进行设计时,要注意的问题有:1、数据抽取的规则要作为元数据进行规范和管理,抽取过程中的源表、源字段、目的表、目的字段、转换规则以及转换条件都要作好详细记录。这样不仅便于编程人员实现,而且在抽取规则或逻辑模型发生变化时也便于修改。2、如何记录业务数据库中的变动情况是数据抽取中一个重要的环节。由于数据仓库中按时间保存数据,因此不同时间点之间数据的差异就成为一个关键性因素。通常可以利用数据库管理系统提供的手段在数据库级产生数据变动日志,根据日志再判断数据的变动情况完成抽取,这样是一个从性能、可操作性以及对原业务系统的影响等多方面综合考虑都比较理想的方法。3、当数据仓库中同一表中的数据来自于原有系统中不同的表,甚至不同的库时,抽取时务必保证这些数据单位一致,而且都满足同一时间条件。4、数据抽取不仅要考虑数据的提取,还要考虑抽取的时间安排和执行方式,这样才是一个完整的数据抽取方案,也才能保证抽取出来的数据准确、可用。三、后期维护、优化中的问题数据仓库的建设是一个长期工作,它同其他系统一样需要在运行的过程中不断进行调整、完善。这其中包括两方面的工作:1、性能数据仓库涉及海量数据的查询,数据的大量写入读出,不仅对数据库系统的要求很高,而且与OLTP系统的要求极为不同,因此在系统设计、实施和维护的过程中,数据仓库系统的性能都是一个不可忽视的问题。尤其是在运行期间,要密切关注应用对系统资源的消耗情况,针对应用的特点及时对系统进行调整,包括调整数据库参数、数据分片放置、创建特殊索引乃至提高系统配置等。2、模型应用与需求是相互促进、不断发展的,随着信息系统建成运行,用户在对系统了解不断加深的过程中 上一页 [1] [2] [3] [4] 下一页
|
|
|
|
| 文章录入:admin 责任编辑:admin |
|
|
上一篇文章: 怎样去宣传数据仓库? 下一篇文章: 如何返回指定行数之间的查询结果? |
|
|
|
|
|
|
|
|
|
|
|
|