当前位置:首页 > 开发 > 系统架构 > 架构 > 正文

数据仓库 二

发表于: 2014-06-12   作者:blackproof   来源:转载   浏览次数:
摘要: 数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策   ------------------------------------------------ 数据仓库与传统数据库区别     数据生命为5-10年,反之60-90天   数据为每天的复制快照,不能更新,反之包含当前值,可更新  

数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策

 

------------------------------------------------

数据仓库与传统数据库区别

 

 

数据生命为5-10年,反之60-90天

 

数据为每天的复制快照,不能更新,反之包含当前值,可更新

 

 

数据总是包含某时间元素,反之可包含也可不包含

 

--------------------------------------------------

 

数据粒度,粒度的双重级别

 

数据分割,小数据块容易建立索引,扫描,恢复,监控

按照1.时间 2.商业线 3.地理位置 4.组织单位

 

数据仓库中的数据组织:

简单堆积   按天的统计堆积

轮转综合   按天,按周,按月统计堆积

简单直接   按天统计,按月连接

连续       同上,连接连续文件

 

数据仓库清理:

数据进入轮转综合文件

转到大容量介质上

数据清除

数据转移层

数据仓库 二

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
一、前言 分布式数据仓库模型的架构设计,受分布式技术的影响,很多有自己特色的地方,但是在概念模
在上篇随笔《数据仓库开发之路之一--准备工作》中粗略介绍了一下数据仓库项目应用中涉及到的一些知
 在我们这个系统里面,我们的数据颗粒度是天。好了,既然是简化版,我们也就不用那么罗嗦,什么需求
一、前言   工作内容的变更,导致重新回到数据仓库模型的架构和设计,于是花点时间比较系统的回顾
一、前言   最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构
工作之余抽点时间出来写写博文,希望对新接触的朋友有帮助。今天在这里和大家一起学习一下模块目标
中小型企业商业智能平台的开发和实现(数据仓库、BI系统、真实项目实战) 课程分类:数据和数据仓库
1、数据仓库的定义 数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的、随着时间的流逝发
概述 粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合
本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在M
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号