Oracle数据库数据恢复、性能优化»论坛 › Oracle › Oracle数据库管理 › 数据仓库data warehouse 的定义

999 积分	1 好友	942 主题

发消息

[数据仓库] 数据仓库data warehouse 的定义

1^#

发表于 2013-10-10 23:44:37 | 查看: 3203| 回复: 0

数据仓库data warehouse 的定义

数据仓库：定义
有许多种数据仓库定义。其中最著名和最为广泛认可的是 W. H. Inmon 提出的定义。
数据仓库是面向主题的、集成的、具有非易失性的并且随时间变化的数据集合，可用于支持管理层决策。
Oracle 对于数据仓库的定义
Oracle 数据仓库方法中的数据仓库定义描述了数据仓库的许多最常见特征。
面向主题
联机事务处理 (OLTP) 系统中存储的数据是为了尽可能有效地支持特定业务流程（例如，订单录入、市场活动管理等）；而数据仓库中的数据是根据常见主题区域（例如，客户、产品等等）存储的，目的是为了便于访问。这是因为针对数据仓库提出的问题是无穷无尽的。数据仓库所答复的每个问题又会产生新的问题。因此，数据仓库设计的重点在于使用户能够轻松地访问数据，以便于答复目前和将来的问题。

随时间而变化
数据仓库中包含跨不同时段的数据切片。通过这些数据切片，用户可以查看当前报表和历史报表。
历史性
一个数据仓库通常包含若干年的数据。这是支持趋势、预测和基于时间的绩效报告（例如，当年与去年相比）所必需的。
信息检索和决策支持
数据仓库是一个用于获取信息来回答问题的工具。它不能用于直接输入数据；而成批更新则是用于刷新数据仓库的规范操作。
原子数据和概要数据
根据数据仓库的用途，它可能包含原子数据（单个事务处理级别的详细数据）、概要数据或者同时包含这两者。

数据仓库的属性
在 Bill Inmon 提出的数据仓库定义中，引用了数据仓库的主要属性：
面向主题
集成
非易失性
随时间而变化

面向主题
面向主题的数据是围绕企业的主要主题区域进行组织的，对于如何在企业范围理解这些主题非常有用。例如，银行运营系统保留着独立的客户储蓄、贷款和其它交易的记录。数据仓库将这些独立数据聚集在一起，从而提供财务信息。您可以访问与企业的任何主要主题区域相关的面向主题的数据：
客户财务信息
电信行业的收费电话
航空旅客的预订信息
保险索赔数据
数据将进行转换，以便符合一致性要求并且对数据仓库有意义。

集成
许多组织的数据都分散在独立的系统中，因此很难集成为一组有意义的信息来进行分析。数据仓库的一个重要特征是，数据是完全集成的。即使基础源数据以不同的方式存储，数据在数据仓库中也是以全局可接受的方式存储的。转换和集成过程会非常耗时且成本很高。该过程需要组织的各个部门鼎力合作，尤其是高层经理应做出决策并分配资源和资金。
数据一致性
在将数据加载到数据仓库之前，必须处理数据不一致情况和异常。数据的命名惯例、衡量标准、编码结构和物理属性应该是一致的。
数据冗余
在数据仓库环境中，明细层不存在数据冗余；数据仓库中只包含物理选定并移动到数据仓库中的数据；不过，以聚集（汇总或平均值）和概要形式出现的选择性冗余和故意冗余在数据仓库中是必要的，它可以改善查询的性能，尤其是细化分析的性能。

随时间而变化
数据仓库中的数据在本质上是历史数据；它通常不包含实时的事务处理数据。与典型运营系统中的一到三个月的数据相比，数据仓库中表示的数据跨越很长的时间范围，从两年到十年不等。这些数据可用于分析过去和现在的趋势，并且可以借助“假设”方案进行预测。
时间元素
数据仓库中始终包含一个重要的时间元素，例如季度、月、周或日。该元素决定了加载数据的时间。日期可以是单个快照日期，例如 10-JAN-02，或者可以是一个范围，例如 01-JAN-02 到 31-JAN-02。
按时段获取的快照
数据仓库中的数据实质上是一系列按时段获取的快照，其粒度不会发生更改。
特殊日期
时间维通常包含分析所需的所有日期，其中包括诸如假日和活动这样的特殊日期。

非易失性
通常，数据仓库中的数据是只读的。在第一次加载中，数据加载到数据仓库，之后则定期刷新。数据仓库中的数据由业务用户进行访问。数据仓库操作通常包括：
加载最初的数据仓库数据集（通常称为第一次加载）
定期刷新数据（称为刷新周期）
访问数据
将数据快照加载到数据仓库后，它很少更改。因此，在物理设计级别不考虑数据操纵。物理数据仓库针对数据检索和分析进行了优化。
刷新周期
数据仓库中的数据将进行刷新，也就是添加快照。刷新周期由业务用户决定。刷新周期的粒度不必与该周期的数据（数据存储级别）相同。例如，可以选择每周刷新数据仓库，而数据的粒度可能是每天。

更改数据仓库中的数据
下面的操作展示了数据仓库的典型操作：
将初始数据集加载到数据仓库中，该过程通常称为第一次加载。这是用来度量业务的数据，也是包含分析业务所用标准的数据。
核心数据仓库数据的快照将会根据刷新周期频繁地添加（多次发生），并且使用来自多个源系统的数据。
数据仓库中的数据可能会因多种原因而发生更改：
用来分析业务的数据可能会发生更改；数据仓库必须保持最新，以使数据准确无误。
业务决定了需要使用多少历史数据来进行分析。例如，五年的数据。较早的数据将进行归档或者清除。
不适当或不准确的数据值可能会删除，或者迁移到数据仓库外部。

数据仓库与联机事务处理 (OLTP)
响应时间和数据操作
数据仓库的构造原因与联机事务处理 (OLTP) 系统极为不同。OLTP 系统是针对插入数据进行优化的，用于在发生事务处理时存储数据。数据仓库则是针对取出数据进行优化的，用于在分析时提供快速的响应。
由于在 OLTP 环境中往往有大量的活动，因此快速响应是至关重要的。不过，数据仓库应用程序是分析型而不是操作型的，因此性能尽管不是非常关键的，但仍起着重要的作用。
数据的性质
每个数据库中存储的数据在性质上有所不同：数据仓库中包含一段时间的数据的快照，可用于支持时间序列分析；而 OLTP 系统存储短期内的非常详细的数据，例如 30 到 60 天的数据。

数据组织
数据仓库是特定于主题的，并且支持分析，因此按相应的方式排列数据。OLTP 系统的目的是支持亚秒级响应，必须对数据进行排列以便优化应用程序。例如，订单录入系统中可能使用表来保存订单的各个元素；而数据仓库可能保存相同的数据，但按主题（例如客户、产品等等）对数据进行排列。
数据源
由于创建数据仓库的目的是支持分析活动，因此可以集成来自各种源的数据。OLTP 系统的运营数据存储只保存内部数据或捕获操作或事务处理所需的数据。
除了上述差异外，使用曲线和用户期望也值得一提：
使用曲线
运营系统和数据仓库具有不同的使用曲线。运营系统的使用曲线的可预测性较高，而数据仓库的使用曲线的可预测性较低、变化更多并且更具随机性。
对数据仓库的访问不仅每天可能都有所不同，甚至可能受到诸如季节变化这样的外力的影响。因此，您不能指望运营系统既能应对繁重的分析查询 (DSS)，又能不间断地处理需要高事务处理速率的事务处理负载。
用户期望
在个人计算机前端体验到的数据仓库和 OLTP 环境之间的响应时间差异可能会非常显著。您必须调整用户对于响应时间的期望。针对查询响应时间设定合理的、可实现的目标，可以在第一次增量开发过程中评估和证明这些目标。然后，可以在服务级别协议 (SLA) 中定义和指定这些目标并达成一致。
如果用户习惯于基于 PC 的系统的快速响应，他们可能会发现数据仓库太慢。不过，应该对用户进行培训，确保用户了解数据仓库有多大、其中包含多少数据以及这些信息可以给用户和业务带来哪些好处。

企业级数据仓库
总的来说，企业级数据仓库中存储所有业务主题区域的数据，以便最终用户进行分析。数据仓库的范围是整个企业以及企业中的所有运营方面。企业级数据仓库通常是（并且应该是）通过一系列增量开发解决方案创建的。永远不要以单个项目创建企业级数据仓库；这样的数据仓库将无法使用。
有了企业级数据仓库后，所有用户都访问该数据仓库，它可以提供：
公司的企业级数据的单一来源
企业级数据仓库中每个主题区域的单一同步数据来源
向数据集市分发数据的单一分发点
指数级增长和使用
在实施数据仓库后，数据仓库的大小会不断增长。每次刷新数据仓库时，将会添加更多的数据、删除数据或归档数据。刷新操作按照一定的周期发生。成功的数据仓库的增长速度非常快，可能每个月以 GB 量级增长，一段时间内会以 TB 量级增长。如果经证明，数据仓库是成功的，数据仓库的使用率会显著增长，并且数据仓库的增长通常比预期更快。

数据仓库与数据集市
定义
数据集市是数据仓库事实和概要数据的子集，可以为用户提供特定于各自部门需求的信息。它可以是一个满足职能或部门信息需求的面向主题的数据仓库；也可以是对本地物料进行本地分析的按地理划分的子集；或者可以是一个微型的企业级数据仓库，其中组合了多个主题区域的数据，并用作企业数据仓库的核心数据源。
范围
数据仓库涉及多个主题区域，并且通常由诸如公司信息技术团队这样的中央组织部门实施和控制。它通常称为中央数据仓库或企业数据仓库。
主题
数据集市是一个部门范围的数据仓库，主要用于单一业务部门 (LOB) 或职能范围，例如销售、财务或市场营销。

数据源
数据仓库组合的数据来自多个源系统。数据集市组合的数据通常来自较少的几个源。
实施时间
数据集市的复杂性通常要比数据仓库低，因此更易于构建和维护。
数据集市可以在创建企业级数据仓库过程的“概念论证”步骤中构建。

从属数据集市
数据集市可分为两种类型：从属和独立。分类主要是根据数据集市的数据源进行的。
从属数据集市
从属数据集市的特征如下：
数据源是数据仓库。从属数据集市的内容依赖于数据仓库。
提取、转换和加载 (ETL) 过程非常简单。从属数据集市从已创建的中央数据仓库提取数据。因此，构建数据集市的主要工作（即数据清理和提取）已完成。从属数据集市只需将数据从一个数据库移到另一个数据库中。
数据集市是企业计划的一部分。构建从属数据集市通常是为了改善性能和提高可用性、更好地进行控制并降低对特定部门相关数据进行本地访问时所产生的电信成本。

独立数据集市
独立数据集市是从头开始构建的独立系统，这些系统直接从运营数据源或外部数据源中提取数据。独立数据集市的特征如下：
数据源为运营系统和外部数据源。
ETL 过程是非常困难的。因为独立数据集市从混杂或不一致的数据源中提取数据，所以需要花费精力进行错误处理和数据集成。
构建数据集市的目的是为了满足分析的需要。创建独立数据集市通常是为了构建快速解决方案来满足分析需要。

典型数据仓库组件
源系统
源系统表现为存在于以下位置中的数据：
生产操作系统
归档文件
不直接与公司运营系统关联的内部文件，例如单个电子表格和工作簿
来自公司外部的数据
数据临时存储区
数据临时存储区类似于施工现场。这是在将数据加载到数据仓库之前，大部分数据清理和准备工作的执行位置。它既是一个存储区，也是一组通常称为提取、转换和加载 (ETL) 的过程。通常业务用户不允许访问该位置，而且该位置不适合于查询和报告之用。
临时存储区是数据仓库实施的一个典型要求。它可以是一个运营数据存储 (ODS) 环境、一组平面文件、关系数据库服务器中的一系列表或者是数据存放工具使用的专有数据结构。

运营数据存储 (ODS)
ODS 相当于频繁更新的运营数据的集成副本。实施 ODS 通常是为了提供运营报表，尤其是在旧系统和 OLTP 系统未提供足够的运营报表时。ODS 还是一个用于向数据仓库提供运营数据的平台。
元数据
元数据是有关实际数据的信息。元数据有许多表现方式和形式，并且支持数据仓库的技术、管理和业务用户组。
数据表示区
数据表示区是用于存储数据并针对查询、报告和分析来优化数据的位置。它由数据仓库或一系列集成的数据集市构成。
数据访问工具
数据访问工具供业务团体用来查询数据仓库的表示区。它们可以是即席查询工具、数据挖掘工具或应用程序工具。选择的工具取决于用户的信息需求。工具必须是直观的并且易于使用，这一点非常重要。使用有意义的、特定于业务的方式向用户显示数据仓库数据是非常重要的，这样用户可以轻松地解释这些数据。
用户具有不同的查询要求，一个查询工具不可能满足所有用户需求。用户可能需要执行简单到复杂的业务建模、跨多个时段的数据趋势分析、复杂的细化活动、对预先准备的概要信息的简单查询、假设分析、详细的趋势分析和预测以及数据挖掘。
许多高级数据访问工具实际上可能会将其结果重新上载到运营源系统或数据仓库的临时存储区和表示区。

数据仓库开发方法
数据仓库最具挑战性的方面不在于其技术难度，而在于如何针对公司的组织结构和文化来选择最佳的数据仓库方法，以及如何处理在实施过程中不可避免的组织和政策问题。
开发数据仓库的各种方法有：
“大爆炸 (Big Bang)”方法
增量方法
自上而下的增量方法
自下而上的增量方法

“大爆炸 (Big Bang)”方法
过去，IT 部门尝试使用单一项目方法来提供企业级数据仓库实施。数据仓库开发是一项非常艰巨的任务，认为解决方案可以一次性构建完毕是一种错误观点。开发数据仓库需要很长一段时间，这通常意味着在项目完成之前，用户需求和技术已发生变化。
在此方法中，将执行以下任务：
分析组织的总体信息需求。
构建企业数据仓库以便支持这些需求。
根据需要建立直接访问，或者通过划分为各个数据集市来建立访问。

优点
相对于其它方法而言，这种方法实际上并不具备任何优点，并且在大多数情况下应避免使用。
唯一真正的优点是：数据仓库是作为其它重大项目或程序（例如重新设计）的一部分构建的，它们之间是相互依赖的。
在启动数据仓库项目之前，必须建立起数据仓库的“总体结构”。
缺点
这种方法的缺点如下：
风险非常高
需要较长的时间才能获得业务效益
存在需求发生更改的风险，需求在分析期间会发生更改注：由于业务需求会动态地发生更改，因此在项目启动阶段设定的需求将不再可行。

自上而下的增量方法
优点
此方法的优点如下：
可以更快地实施并获得回报。通常，确定范围、定义研究和初始实施的过程都会缩短，这样可以在六到七个月内完成。
能够显著地降低风险，因为该方法避免了“大爆炸 (Big Bang)”方法中的繁重分析
突出高层业务需求。
在各主题区域之间实现协同增效。由于可实现跨职能报告和单个信息源，因此能够最大程度地利用信息。
缺点
此方法的缺点如下：
在业务上获得任何投资回报之前，需要增加先期投入。
如果业务是全局性的，则难以定义范围的边界。
除非客户需要跨职能报告，否则可能不适用。

自下而上的增量方法
此方法类似于自上而下的方法，但重点是数据而不是业务效益。在此方法中，IT 部门对该项目负责，因为 IT 部门希望负责该项目，或者企业已将该项目委托给 IT 部门。
优点
此方法的优点如下：
这是“概念论证”型方法，因此通常对 IT 部门非常具有吸引力。
因为此方法以 IT 部门为重点，所以 IT 部门更倾向于选择这种方法。
缺点
此方法的缺点如下：
因为该解决方案模型通常是根据源系统开发的，并且这些源系统将封装在当前业务流程中，所以模型的总体可扩展性将受到影响。
IT 人员通常是最后了解业务更改的人员，所以 IT 部门可能会设计出某些在最终交付之前已过时的内容。
由于此方法中的框架定义往往要狭窄得多，因此在每个增量开发过程中通常需要大量的重新设计工作。

缺点（续）
因为在初始的增量开发过程中，各个业务部门很少会就数据定义达成一致，因此解决方案可能会被下一个涉及的业务部门拒绝。
IT 人员熟悉数据，但不熟悉信息。他们通常不会考虑数据的现实性，这样会极大地降低总体业务效益。

增量方法
在增量开发方法中，通过开发符合完整的数据仓库体系结构的增量解决方案，可以管理数据仓库的增长。该方法并不将构建企业级数据仓库作为第一个可交付项，而是在开始时只构建一个或两个主题区域，将它们作为可扩展的数据集市实施，然后提供给最终用户试用。接下来，观察用户实际使用数据仓库的情况，向系统添加下一个主题区域，或者对系统功能进行下一个增量开发。这也是一个循环开发过程。这种循环开发能够确保数据仓库符合组织的需求。
优点
通过增量开发来提供战略性的数据仓库解决方案
提供可扩展、可伸缩的体系结构
支持企业组织的信息需求
快速地实现业务效益，从而确保更早地获得投资回报
允许一次根据一个主题或应用程序区域构建一个数据仓库
允许构造集成的数据集市环境

数据仓库设计和实施的组成部分
接下来的几页中将介绍下面各个组成部分：
方法
体系架构
提取、转换和加载 (ETL)
实施
操作和支持

方法
方法是指一组用于完成所定义目标的详细步骤或过程。在开发任何系统时使用方法都是非常重要的。在数据仓库环境中尤其如此。数据仓库需要对每项资源进行庞大的投资，每项资源的成功都是至关重要的。
要避免数据仓库实施失败，必须使用一个方法并始终遵循该方法。失败通常是由于两种原因造成的。第一种失败原因是数据仓库未及时交付，第二种是数据仓库未能满足业务用户的需求。一个好的方法有助于通过明确可交付项来管理预期结果。
但是，不要受制于方法中的步骤。采用侧重于结果而不是活动的方法。这样可以确保可交付项的一致性，同时接受各种工作方式之间的差异。

体系架构
就业务和技术角度而言，体系结构定义一个组件集合并指定它们之间的关系。体系结构活动的目标是一个满足业务信息需求的单一集成数据仓库。
下面是数据仓库体系结构的一些组件：
数据源
数据采集
数据管理
数据分发
信息目录
数据访问工具

提取、转换和加载 (ETL)
这些过程是在数据仓库中创建高质量信息的基础。您从源系统中获取数据；执行清理、校验和验证，然后将数据转换为一致的状态；最后将数据移到数据仓库中。
提取：从各种运营系统中选择特定运营属性的过程。
转换：集成、校验、验证、清理所选数据并且为数据加时间戳，使所选数据在目标数据库中具有一致和统一格式的过程。被拒绝的数据将返回给数据所有者以便进行更正和重新处理。
加载：将数据从中间存储区移到目标数据仓库数据库的过程。
ETL 工具一些专用的工具，用于使这些任务的设置、维护和管理变得相对轻松。专用工具可能会是非常昂贵的选择，这样促使许多数据仓库都使用定制的 ETL 程序，这些程序可以使用 COBOL、C++、PL/SQL 或其它编程语言或应用程序开发工具进行编写。Oracle Warehouse Builder (OWB) 是 Oracle 开发的 ETL 工具。在后续课程中可以找到有关 OWB 的详细讨论。

实施
实施可交付项：
分析
确认和优化需求。
设计
收集各种规范并准备数据仓库或数据集市的设计图。
构建
将数据仓库或数据集市和所有必需的支持工具准备就绪并进行测试。
部署
接受将数据仓库或数据集市用于业务。

操作和支持
按照有意义的、业务特定的方式向最终用户显示数据仓库数据，并选择为满足用户的信息需求而定制的查询工具。
定期刷新数据仓库中的数据。
对不断变化的数据源、需求和技术做出响应。
监视、管理和优化数据仓库中的数据。

增量方法的各个阶段
高效的数据仓库项目管理需要使用项目阶段。项目阶段确定要完成的任务、所需的资源，指导和报告工作以及在开始下一阶段之前所必需的质量保证。项目阶段划分是一种管理技术，可以使项目团队的重点放在短期目标上，并向高管层传达项目进度信息。
策略
定义数据仓库的业务目标和用途。
定义数据仓库团队和执行主导人。
定义成功衡量标准。
定义
定义增量开发工作的范围和目标。
确定技术和数据仓库体系结构。
概述数据访问方法。

分析
检查用户的信息、数据采集和数据访问需求。
定义数据仓库和数据集市的关系或多维模型。
确定用于数据采集、数据质量、管理、元数据和数据访问组件的适当工具。
设计
将分析阶段中确定的需求转换为详细的设计规范。
完成技术体系结构安装。
为数据仓库、数据集市、元数据资料档案库和多维结构创建数据库设计。
创建集成测试、系统测试、回归测试、工作量测试和即席查询测试的测试计划。
构建
创建并测试数据库结构、数据采集模块、数据仓库管理模块、元数据模块、数据访问模块以及报表和查询。
优化数据库结构以便满足设计标准和性能目标。
交付介绍如何使用和维护数据仓库的文档。
生产
安装数据仓库。
使用户准备好使用数据仓库并监视性能和最终用户访问。
对已实施的增量开发执行详细的评估。
确定其它访问和信息需求。
借助业务需求和用户输入，推动正在进行的数据仓库开发。

确定数据仓库策略阶段可交付项
每个数据仓库项目阶段都有可交付项。策略阶段的可交付项侧重于定义数据仓库解决方案的业务目标和用途。
总体数据仓库解决方案的用途和目标是设置和管理期望值的基本要素。策略阶段还明确地定义数据仓库团队和执行主导人。
业务目的和目标：记录战略业务目的和目标
数据仓库的用途、目标和范围：记录企业数据仓库的用途和目标、它的范围以及预期使用方式
企业数据仓库逻辑模型：是一个概括的逻辑信息模型，它以图形方式表示企业的主要实体和关系
增量开发里程碑：记录数据仓库的实际范围、每次增量开发的可接受的可交付项里程碑以及源数据可用性

确定数据仓库策略阶段可交付项（续）
源系统数据流：概述源系统数据流、数据流的来源、业务职能和源系统之间的数据流、可靠程度以及数据易失性
主题区域差异分析：记录信息需求与数据源提供该信息的能力之间的差异
数据采集策略：记录提取、转换源系统中的数据并将数据加载到目标环境以便执行初始加载和后续刷新的方法
数据质量策略：概述数据管理、错误和异常处理、数据清理以及审计和控制数据的方法
元数据策略：记录捕获、集成和访问数据仓库环境中所有组件的元数据的策略
数据访问环境：记录如何确定、选择和设计工具来支持最终用户访问数据仓库中的数据
培训策略：概述开发和最终用户培训需求，确定需要培训的技术和业务人员并建立执行培训计划的时间框架

案例分析简介：Roy 独立学区 (RISD)
在 2000 年 1 月，RISD 和 Oracle 代表进行了会面，讨论了有关数据仓库项目的详细信息。RISD 数据仓库环境将向整个学区中的决策制定者提供相关信息，帮助提高学生成绩。用户将通过基于 Windows 的、能够访问 Internet 的计算机来访问该系统，这些计算机应当符合计算机初学者和专家的要求。Discoverer 报表数据将在线提供，并且在适当的情况下可下载到本地应用程序（例如电子表格和 PC 数据库），以便执行附加分析或与本地数据进行集成。
用户组将仅限于访问与其职责、需求和技能关联的信息。大多数最终用户查看的是简单报表。面板报表将向各个用户组提供表格形式和/或图形化的汇总信息。系统将经过精心设计，使 RISD 能够在新数据可用时开发相关的报表。一些高级用户将直接创建新报表并运行这些报表，而一些最终用户将查看标准报表和参数化报表。此项目将使用 Oracle 数据仓库方法 (DWM) 和项目管理方法 (PJM)。
该数据仓库的目标是通过基于 Web 的界面，向学区中不同层次的决策制定者提供有用的一致信息，目的在于提高学生成绩、研究学生成绩趋势，并且及时地实施或调整机构的干预措施和程序。

案例分析简介：Roy 独立学区 (RISD)（续）
Oracle 已设计了一个用于规划、设计、开发和部署 RISD 数据仓库的方案。董事会批准了该方案并签署了合同。下面是 Oracle 和 RISD 达成的方案的一些要点：
Oracle 将负责开发用于 RISD 数据仓库的开发、测试和生产实例的技术体系结构。
Oracle 将负责开发逻辑和物理数据模型，用于支持在项目初始阶段收集的报告和分析需求。
RISD 将负责清理从运营数据存储 (ODS) 中提取的数据，然后再加载到 RISD 数据仓库。
ETL 过程将经过精心设计，能够删除加载的数据，并且重新加载包含 RISD 提供的更正数据的替换文件。（Oracle Warehouse Builder 将用于 ETL。）
此外，所有数据都将存储在 RISD ODS 中，然后提取并加载到数据仓库中。RISD 将负责开发提取程序并进行测试，以便获取源数据然后加载到 ODS 中。Oracle 将负责设计、开发和测试软件来填充数据仓库的目标表和实体化视图。
RISD 数据仓库项目将用于支持学生信息系统 (SIS)。RISD 将每年为各个主题区域提供平面文件，例如各州发展相互评估 (SDAA II)、英语阅读熟练程度测试 (RPTE)、本地发展相互评估 (LDAA)、学业能力测试预考 (PSAT) 结果等等。RISD 还将定期为新学生提供补充数据文件。
其它年度平面文件当前是由评估办公室使用的。
报表将根据以下主题区域创建：德克萨斯州知识与技能评估 (TAKS)、各州发展相互评估 (SDAA II)、年度进步指标 (AYP)、英语阅读熟练程度测试 (RPTE) 评估等等（前两个报表的优先级较高）。一些诸如 AP 考试通过率这样的报表将由 RISD 开发。
报表将根据主题区域创建并与门户进行集成。所有最终用户和一般公众都可以通过由校园 EAI 实施的 Oracle 门户来访问数据仓库报表。由于该门户由校园 EAI 实施，因此 Oracle 将仅提供 Portlet 内容。
数据访问安全性将根据用户角色（例如，学校董事会、学校职员、教师、校内人员、学生和公众）来实施。
数据验证和报表用户认可测试由 RISD 开展。
RISD 负责数据仓库的所有备份和恢复过程。不过，Oracle 将协助 RISD 开发一个过程，用于调度数据仓库的数据源到数据仓库的更新。

分享0

下载专业ORACLE数据库恢复工具PRM-DUL For Oracle http://www.parnassusdata.com/

如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!

诗檀软件专业数据库修复团队

服务热线： 13764045638 QQ: 47079569 邮箱：service@parnassusdata.com

收藏0 回复只看该作者道具举报

返回列表

		自动登录	找回密码
密码			注册

[数据仓库] 数据仓库data warehouse 的定义

浏览过的版块