当前位置:首页 > 开发 > 行业应用 > 正文

数据仓库和数据挖掘的OLAP 技术

发表于: 2013-10-12   作者:aoyouzi   来源:转载   浏览次数:
摘要: 数据仓库和数据挖掘的OLAP 技术 数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理决策制定   面向主题的:数据仓库围绕一些主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是构造组织机构的日常操作和事务处理。因此,数据仓库排除对于决策无用的数据,提供特定主题的简明视图。 集成的:通常,构造数据仓库是将多个异种数据源,如关系数据库

数据仓库和数据挖掘的OLAP 技术

数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理决策制定

 

面向主题的:数据仓库围绕一些主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是构造组织机构的日常操作和事务处理。因此,数据仓库排除对于决策无用的数据,提供特定主题的简明视图。

集成的:通常,构造数据仓库是将多个异种数据源,如关系数据库、一般文件和联机事务处理记录,集成在一起。使用数据清理和数据集成技术,确保命名约定、编码结构、属性度量的一致性。

时变的:数据存储从历史的角度(例如,过去5-10年)提供信息。数据仓库中的关键结构,

隐式或显式地包含时间元素。

非易失的:数据仓库总是物理地分离存放数据;这些数据源于操作环境下的应用数据。由于这种分离,数据仓库不需要事务处理、恢复和并行控制机制。通常,它只需要两种数据访问:数据的初始化装入和数据访问。

 

联机操作数据库系统的主要任务是执行联机事务和查询处理。这种系统称为联机事务处理

OLTP)系统。,数据仓库系统在数据分析和决策方面为用户或“知识工人”提供服务。这种系统可以用不同的格式组织和提供数据,以便满足不同用户的形形色色需求。这种系统称为联机分析处理(OLAP)系统。

 

“为什么不直接在这种数据库上进行联机分

析处理,而是另外花费时间和资源去构造一个分离的数据仓库?”分离的主要原因是提高两个系统的性能

操作数据库是为已知的任务和负载设计的,如使用主关键字索引和散列,检索特定的记录,

和优化“罐装的”查询。另一方面,数据仓库的查询通常是复杂的,涉及大量数据在汇总级的计算,可能需要特殊的数据组织、存取方法和基于多维视图的实现方法。在操作数据库上处理OLAP查询,可能会大大降低操作任务的性能。此外,操作数据库支持多事务的并行处理,需要加锁和日志等并行控制和恢复机制,以确保一致性和事务的强健性。,数据仓库与操作数据库分离是由于这两种系统中数据的结构、内容和用法都不相同

 

数据方允许以多维对数据建模和观察。它由维和事实定义。

 

维是透视或关于一个组织想要记录的实体;每一个维都有一个表与之相关联。该表称为维表,它进一步描述维。

 

多维数据模型围绕中心主题(例如,sales)组织。该主题用事实表表示。事实是数值度

量的。把它们看作数量,是因为我们想根据它们分析维之间的关系

 

数据仓库和数据挖掘的OLAP 技术

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
之前看了认识数据以及数据的预处理,那么,处理之后的数据放在哪儿呢?就放在一个叫“数据仓库”的
一.数据仓库概念 数据仓库是一个面向主题的,集成的,随时间而变化的,不容易丢失的数据集合,支持
Kylin是一个开源、分布式的OLAP分析引擎,它由eBay公司开发,并且基于Hadoop提供了SQL接口和OLAP接
《数据挖掘:概念与技术》 基本信息 原书名:Data Mining:Concepts and Techniques,Third Edition
数据挖掘分类技术 从分类问题的提出至今,已经衍生出了很多具体的分类技术。下面主要简单介绍四种最
数据挖掘分类技术 从分类问题的提出至今,已经衍生出了很多具体的分类技术。下面主要简单介绍四种最
数据挖掘分类技术 作者:sccot 撰写日期:2012-02-28 1、过分拟合问题: 造成原因有:(1)噪声造成
数据挖掘分类技术 从分类问题的提出至今,已经衍生出了很多具体的分类技术。下面主要简单介绍四种最
数据挖掘分类技术 从分类问题的提出至今,已经衍生出了很多具体的分类技术。下面主要简单介绍四种最
数据仓库是一个从多个数据源收集的信息储存库,存放在一个一致的模式下,并且通常驻留在单个站点。
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号