SQL3000叁头丛书:数据仓库的组成都部队分

此番摘录 来源于
SQL3000齐声丛书中 制造和行使数据仓库概述
为的是对数据仓库有个大致的认识

U.S.民代表大会名鼎鼎消息工程学家W.H.Inmon在《建立数据仓库》一书中
对数据仓库做了如下概念:
数据仓库(Data Warehouse)是多个
面向大旨的、集成的、稳定的、包罗历史数据的数量集合,
它用于协理管理中的决策制定进程。

==================

数据仓库的组成都部队分

多少集市 

             在稍微数据仓库版本中,数据集市是微型的数据仓库;
             而在稍微版本中,数据集市仅仅是数据仓库的一段。
             数据集市平时用于为单位的职能部门提供消息。
             典型示例是销售部门、仓库储存和发货部门、财务部门、高级管理机构等的数量集市。
             数据集市还可用来将数据仓库数据分段以反映按地理划分的事体,
             在那之中的各个地区都以对峙自治的。
             例如,大型服务单位或许将地域运作核心视为单独的事体单元,
             各类那样的单元都有投机的数码集市以补充主数据仓库。
             在稍微设计中,数据集市是一心独立的数据仓库,
             作为分布式数据仓库的积极分子补充完整布局。
             而在多少设计中,数据集市则通过定期更新接收来自主数据仓库的数量,
             在那种景况下,数据集市的效果平常受限于客户端的显得服务。
   
             无论数额集市提供何种功用,它们都不可能不被设计为主数据仓库的组件,
             以使数据的集团、格式和架构在全部数据仓库内保持一致。

关周密据库 

              关周到据库用于数据仓库系统,其效果是
              在数码准备数据库中近年来存款和储蓄、清理和更换传入的数量,
              容纳和管理数据仓库数据库中的大批量数目,并援助数据集市。

数据源 

              数据仓库用于为领导者提供消息。
             
为此,数据仓库必须未来自单位中许多源的多少聚集和联合为同1的数据集,
              以纯正地反映单位的作业运转情形和历史记录。     

数量准备区

              用于数据仓库的数目必须从数据源中析取,
              进行清理及格式化以保险1致性,并更换为数据仓库架构。
              数据准备区有时称为数据中间存款和储蓄区,它是关全面据库,
              在那里从数量源中析取数据,将数据转换为常用格式,
              检查1致性和引用完整性,并预备装入数据仓库数据库。

             
使用数据仓库和独门于数据源的数据准备区可拉长期管理理数据仓库的频率。
             
数据准备区应将原有数据同数据仓库数据隔断开,以维护数据仓库的完整性,
             
并同意数据仓库执行其准备展现消息和援救客户端访问的机要功能。       

体现服务

              数据仓库的指标是显现业务消息供单位的领导使用。
             
借使未有工具协助分析和评估,包罗数亿条数据的数据仓库对首领士将绝不用处。
             
那几个分析工具在简短的报表和高等的数码挖掘算法之间恐怕截然不相同。

              预约义报表
                         简单的预约义汇总报表能够定期或根据须求,
                         为管理职员提供有个别即时点的事体意况快速照相。
                         更尖端的报表能够显得预约义的事务转移的动向。
                         那样的报表很有用,并且间接都以从联机事务 (OLTP)
系统中生成。
                         若要捕获最新状态,
                         必须不停地从数据源系统中变化快速照相的详细音信和集中报表。
                         定期报表与数据仓库的创新相协调,
                         并且能够转换到数据仓库以压缩可操作系统的载荷。
                        
使用历史数据评估趋势的报表应在数据仓库中完成,
                        
数据仓库中隐含具有卓殊格式且时刻可用的历史数据,
                        并且能够拍卖大批量的汇总数据。       
              联机分析处理
                        
预订义报表很符合其分外目标,但不切合探测分析。
                         分析者希望在数量中发现样子和很是,
                          并探测数据的差异区域以找到趋势和分外的发源。
                         联机分析处理 (OLAP) 是一个解析工具,
                           目的在于救助对大气的数据仓库数据开始展览那种分析。
              挖掘模型
                         OLAP
是将数据协会为预订义的多维结构以便于探测,
                         而数据挖掘与 OLAP 相反,
                        
其目标是实践探测分析并识别新闻中有趣且有价值的事物,
                         如将数据分组以供分析者或管理职员检查。
                          数据挖掘还可创立决策树,
                          用于依照现有数量成分的特色预测今后的数额。
              应用程序接口
                         SQL Server 3000 提供了诸多 API,
                        可用来依据数据仓库的急需付出客户端应用程序

最后用户分析

               Microsoft SQL Server 三千 及其零部件
               提供了叁个用于访问数据仓库数据的开放式环境。
              那为单独的软件创建商提供了机遇,
               使其可为最终用户开发高档的数量解析和出示应用程序。
              有千千万万适用于 SQL Server 2000及其零部件的第一方客户端应用程序。

              SQL Server 3000 还与 Microsoft Office 3000 很好地融会,
              使得最后用户能够轻松利用工具分析数据仓库数据。
              使用 Microsoft Office 三千 的零部件可查询 SQL Server 两千数据库,
              将数据仓库数据统1到Microsoft Excel 电子表格、Microsoft
Access 数据库或其它文书档案中。
              Excel 两千 PivotTables 可径直连接到SQL Server 2000Analysis Services 多维数据集以探测数据,
             
而且用户可以创立本地多维数据集,以便在从数据仓库脱机时用它们。

相关文章