数据仓库
数据仓库表现出以下特点,以支持管理层的决策过程:
-
面向主题 - 数据仓库是面向主题的,因为它为我们提供围绕一个主题而组织的持续经营的信息。这些主题可以是产品,客户,供应商,销售,收入等数据仓库不注重持续经营,而它专注于建模和决策分析数据。
-
集成 - 数据仓库是集成来自异类源如关系数据库,平面文件等,这整合提高数据的有效分析数据构成。
-
时间变量 - 在数据仓库中的数据是确定与一个特定的时间段。在数据仓库中的数据从历史的角度来看提供的信息。
-
非易失性 - 非挥发性的是指当新的数据被添加到它的先前的数据不会被删除。数据仓库是分开的操作数据库,因此经常发生的改变操作数据库不反映在数据仓库中。
数据仓库
数据仓库的建设和使用数据仓库的过程。数据仓库是通过整合来自多个异构数据源的数据构成。这个数据仓库支持的分析报告,结构和/或特殊查询和决策。
数据仓库涉及数据清理,数据集成和数据整合。集成异构数据库集成到我们有两种方法如下异构数据库:
-
查询驱动的方法
-
更新驱动的方法
查询驱动的方法
这是传统的方法来集成异构数据库。这种方法被用来建立封装和集成多个异构数据库的顶部。这些积分器也被称为介质。
处理查询驱动的方法
-
当查询被颁发给一个客户端,一个元数据字典查询翻译成适合于所涉及的各个异构的网站查询。
-
现在,这些查询映射并发送到局部查询处理器。
-
从异构位点的结果都集成到一个全局回答集。
缺点
这种方法有以下缺点:
-
查询驱动的方法需要复杂的整合和筛选的过程。
-
这种做法是非常低效的。
-
这种方法是常用的查询非常昂贵。
-
这种方法也是查询非常昂贵,需要聚合。
更新驱动的方法
我们提供了另一种方法来传统的方法。今天的数据仓库系统如下更新驱动的方法,而不是前面讨论的传统方法。在更新驱动的方法从多个异构数据源的信息集成在预先存储在仓库中。此信息可直接查询和分析。
优点
这种方法具有以下优点:
-
这种方法提供了高性能。
-
该数据被复制,处理,集成,注释,总结和调整的提前语义数据存储。
查询处理不需要接口与所述处理在本地源。
从数据仓库(OLAP)数据挖掘(OLAM)
联机分析挖掘整合了联机分析处理与多维数据库的数据挖掘和知识挖掘。下面是显示集成OLAP和OLAM的图:

OLAM重要性:
这里是OLAM的重要性列表:
-
数据在数据仓库的高品质 - 数据挖掘工具都需要工作在集成的,一致的,并清理数据。这些步骤是非常昂贵的数据预处理。通过这样的预处理构建的数据仓库均采用优质有价值的数据源,OLAP和数据挖掘为好。
-
围绕数据仓库可用信息处理基础设施 - 信息处理的基础设施指的是访问,集成,整合和多个异构数据库,网络接入和服务设施,报表和OLAP分析工具的转变。
-
基于OLAP的探索性数据分析 - 需要有效的数据挖掘探索性数据分析。 OLAM提供各种子组数据,并在不同的抽象层次的机构进行数据挖掘。
-
在线选择数据挖掘功能 - OLAP集成多个数据挖掘功能,联机分析挖掘为用户提供了灵活动态地选择所需的数据挖掘功能和交换数据挖掘任务。