SQL ServerSQL2000齐丛书:数据仓库的有些

本次摘录 来源于
SQL2000旅丛书中 创建同利用数据仓库概述
为的是本着数据仓库有只大概的认识

美国知名信息工程学家W.H.Inmon在《建立数据仓库》一题中
本着数据仓库做了如下概念:
数据仓库(Data Warehouse)是一个
面向主题的、集成的、稳定的、包含历史数据的数集合,
其用于支持管理面临之决策制定过程。

==================

数据仓库的一对

数会 

             在小数据仓库版本被,数据会是微型的数据仓库;
             而于有点版本中,数据会仅仅是数据仓库的如出一辙段落。
             数据会通常用于为单位之职能部门提供信息。
             典型示例是销售单位、库存及发货部门、财务部门、高级管理机构齐之数会。
             数据会还而用以将数据仓库数据分段以反映按地理划分的事务,
             其中的每个地方还是相对自治之。
             例如,大型服务单位或将处运作中心就是单独的业务单元,
             每个这样的单元都起谈得来之数据会以补充主数据仓库。
             在有点设计中,数据会是截然独立的数据仓库,
             作为分布式数据仓库的成员补充完整组织。
             而以聊设计着,数据会则经过定期更新接收来自主数据仓库的数目,
             在这种状态下,数据会的功能时受限于客户端的展示服务。
   
             无论数额会提供何种作用,它们还必须叫设计为主数据仓库的零件,
             以使数据的团伙、格式和搭在方方面面数据仓库内保持一致。

关系数据库 

              关系数据库用于数据仓库系统,其作用是
              在数码准备数据库中即存储、清理与换传入的数目,
              容纳和保管数据仓库数据库被的豁达数量,并支持数据会。

数据源 

              数据仓库用于为官员提供信息。
             
为这个,数据仓库必须用来自单位中许多源的数额聚集和合并为同样的数据集,
              以纯正地反映单位的事情运行情况以及历史记录。     

数量准备区

              用于数据仓库的数码要从数量源中析取,
              进行清理及格式化以保持一致性,并转移为数据仓库架构。
              数据准备区有时称数据中存储区,它是关系数据库,
              在这里从数量源中析取数据,将数据易为常用格式,
              检查一致性和援完整性,并预备装入数据仓库数据库。

             
使用数据仓库和独门于数据源的数额准备区可增长管理数据仓库的效率。
             
数据准备区应将旧数据和数据仓库数据隔离开,以护数据仓库的完整性,
             
并同意数据仓库执行其准备显示信息和支持客户端访问的重点力量。       

显示服务

              数据仓库的目的是显现业务信息供单位之企业主使用。
             
如果无工具帮助分析和评估,包含数亿漫长数据的数据仓库对领导将毫无用处。
             
这些分析工具在简易的表和高等的数目挖掘算法之间可能截然不同。

              预定义报表
                         简单的预定义汇总报表可以定期或者根据需要,
                         为管理人员提供有即经常接触之政工状态快照。
                         更高级的表可以展示预定义的事务转移的势头。
                         这样的表格很有因此,并且一直都是自同事务 (OLTP)
系统受到生成。
                         若要捕获最新状态,
                         必须不停地于数据源系统遭到变化快照的详细信息和集中报表。
                         定期报表及数据仓库的翻新相调和,
                         并且可变换到数据仓库以减少只是操作系统的负荷。
                        
使用史数据评估趋势的表应于数据仓库中就,
                        
数据仓库中带有有相当格式且天天可用之史数据,
                        并且可处理大量之汇集数据。       
              联机分析处理
                        
预定义报表很符合该突出目的,但非入探测分析。
                         分析者希望于数据遭到发觉方向及大,
                          并探测数据的例外区域为寻找到趋势及死的来自。
                         联机分析处理 (OLAP) 是一个剖析工具,
                           旨在救助对大气之数据仓库数据进行这种分析。
              挖掘模型
                         OLAP
是将数据组织为预定义的多维结构以便让探测,
                         而数挖掘和 OLAP 相反,
                        
其目的是推行探测分析并识别信息遭到有趣且有价之物,
                         如以数据分组以供应分析者或管理人员检查。
                          数据挖掘还只是创决策树,
                          用于因现有数量元素的表征预测未来之数。
              应用程序接口
                         SQL Server 2000 提供了无数 API,
                        可用于因数据仓库的需要开销客户端应用程序

最终用户分析

               Microsoft SQL Server 2000 及其零部件
               提供了一个用以访问数据仓库数据的开放式环境。
              这为独立的软件制造商提供了机,
               使该可也最终用户开发高档的数目解析及显示应用程序。
              有无数适用于 SQL Server 2000
及其零部件的老三着客户端应用程序。

              SQL Server 2000 还和 Microsoft Office 2000 很好地合,
              使得最终用户可以轻松使用工具分析数据仓库数据。
              使用 Microsoft Office 2000 的零件可查询 SQL Server 2000
数据库,
              将数据仓库数据统一到Microsoft Excel 电子表格、Microsoft
Access 数据库或外文档中。
              Excel 2000 PivotTables 可一直连接至SQL Server 2000
Analysis Services 多维数据集以探测数据,
             
而且用户可以创建本地多维数据集,以便在打数据仓库脱机时用它。

相关文章