SQL两千手拉手丛书:使用和保证数据仓库

本次摘录 来源于
SQL三千协同丛书中 创造和选择数据仓库概述

为的是对数据仓库有个大致的认识

运用数据仓库

SQL 查询
——— 
                最后用户很少使用结构化查询语言 (SQL)
查询直接待上访问数据仓库数据。
               分析 SQL
查询很复杂,必须持有数据库专业知识才能正确创造。
               数据仓库中的数据量平时十分大,以至于须求完善的 SQL
技术取得实惠的质量。
               假使1个 SQL
查询将多个或八个维度表联接到带有数百万行的真情数据表,
               并且动用聚合函数(如
SUM)汇总和分组结果,会强烈扩充其余关周详据库的载荷,
               而且平时会发出1块分析无法承受的属性。

               SQL
查询普通由数据库专家成立,与在较低活动之间定期执行的预约义报表一起利用。
               能够创建帮助汇总表优化那几个查询的性子;
               必须在装载数据仓库时开端设计和填充这几个表,然后在每便换代数据仓库时更新它们。

OLAP 和数据挖掘

               联机分析处理 (OLAP)
是应用多维数看新闻证明式(称为多维数据集)提供对数据仓库数据举行快捷访问的技术。
               多维数据集为维度表中的数量和数据仓库中的事实数据表建模,并为客户端应用程序提供周密的询问和分析成效。 
 
               数据挖掘利用复杂算法分析数据并创办模型来代表有关数据的音信。
               数据挖掘模型可用以预测新数据的风味或识别具有相似性格的多寡实体组。
 
               多维数据集和数量挖掘模型必须经过规划、配置和处理后才能由客户端应用程序使用,
               并且时不时要求在数据仓库数据更新时更新。
 

English Query

               English Query
提供用于支付客户端应用程序的种类,以使最后用户能够利用立陶宛语单词和短语访问数据。
               English Query 可用于访问由 Microsoft SQL Server 两千Analysis Services 创制的数据仓库数据库或多维数据集中的数码。

               若要耗费 English Query
应用程序,首先必须创立多个模子将数据库表、字段、多维数据集和数量与意大利共和国语单词和短语相关。
               然后,能够生成 English Query 应用程序并将其联合到自定义
Web 或客户端应用程序由最终用户使用。

Microsoft Office 2000
——————— 
               Microsoft SQL Server 2000 数据库中的数据仓库数据可由
Microsoft Office 组件访问,
               如 Microsoft Excel 或 Microsoft Access。
               然则,超越一56%据仓库中的数据量平时注脚,必要创建并保护相当的询问或数额表以补助最后用户使用这个组件。
               必须创立那类特殊的查询和表并作为数据仓库的1有个别开始展览爱慕。

               一个不等是 Excel PivotTables 和 SQL Server 两千 Analysis
Services 的三合1。
               Analysis Services 用于创设和管理 OLAP
数据时,最终用户很不难通过分析服务器连接到多维数据集联机分析数据,
               或在她们的地头电脑上创立多维数据集脱机使用。

Web 访问和创办报表
—————— 
               向最后用户提供数据仓库数据访问能力的 Web
应用程序备受欢迎,
               因为客户端能够利用正式的 Web
浏览器,而不用非得设置、配置和维护分外的应用程序。
               最初只可以查看静态 Web
页上呈现的多少,未来,最新技术协理成立高级交互式应用程序,
               使客户端得以查询和翻新数据仓库和多维数据汇总的数码。

脱机 OLAP 多维数据集

               联机分析处理 (OLAP)
中利用的多维数据集提供数据仓库数据的多维视图,
               最后用户发现在他们搜寻业务难题的答案时很不难选择和浏览该视图。
               Microsoft SQL Server 三千 Analysis Services
通过其用来客户端应用程序的 PivotTable 服务组件,
               提供创建数据仓库多维数据集的子集并在本地保存它们以便脱机分析的遵守。
               最后用户应用程序仍是可以在脱机方式下利用 PivotTable
服务,直接从关周到据库创设脱机多维数据集

其三方应用程序

 

自定义应用程序

SQL3000同步丛书:维护数据仓库

此番摘录 来源于
SQL3000手拉手丛书中 成立和使用数据仓库概述
为的是对数据仓库有个大概的认识

=============

护卫数据仓库

创新数据仓库数据

               更新数据仓库数据包含定期从可操作系统中析取数据,清除和更换数据和将新数据装入数据仓库。
               每一趟数据更新还包蕴:
               在 Microsoft SQL Server 三千 Analysis Services
用于同台分析处理 (OLAP) 的境况下必须完毕壹道多维数据集的天职;
               还非得革新具有作为数据仓库一部分的多寡集市。
 
               用于定期更新的析取、清理和更换数据的进度,
               在精神上与先河装载数据仓库所采用的长河同样,
               但更新进度平时比开端装载进度不难且自动化水平更高。
               在初始装载进度中制定的历程和自动化职务能够减掉更新进程中所需的手工业工作量。
               伊始装载进度中分辨和实践的对源可操作系统的拨乱反正也减小了总得在更新进程中化解的分歧和谬误的数目。
               然则,平日有那种场所,在更新进程中需求手工业干预以保证数量准备装入数据仓库。
 
               起初数据装载和数量更新之间的2个差异之处在于,
               在将数据装入数据仓库可由用户接纳在此之前,应在革新数据上不断地证明引用完整性。
               更新平常包涵丰盛和改变维度表以及向实际数据表添加行。
               在将新更改的多少装入数据仓库在此以前,应反省个中间壹致性并在数据仓库中的当前多少上印证。
 
               在创新数据已预加防患装入数据仓库后,
               能够应用 Transact-SQL、数据转换服务 (DTS) 或 bcp
实用工具更新数据仓库表。
               依照为最后用户提供数据仓库数据访问能力的来得应用程序的设计和促成,
               也许须要在更新进度中使数据仓库脱机以防查询结果不1致。

管制数据仓库

               管理数据仓库与管理共同事务处理 (OLTP)
系统既相似又差别。
               相似之处在于:
               在关全面据库中蕴藏和保卫安全数据仓库数据,所以用于管理关周全据库的工具也得以用于数据仓库。
               分歧之处在于:
               OLTP
系统平日兼有大批量不平稳数据的业务更新的性格,而数据仓库经常全体大量安居的野史数据的特色。
               这几个出入必要对数据仓库管理职分选取分歧的措施,如备份数据和机关执行反复现身的任务。
 
               备份数据仓库数据
                联机事务处理 (OLTP 系统抓获外来数据并立异数据库。
                为保险不丢掉数据,系统在作业执行时记下事务,管理员则制定包蕴定期的全体和增量数据库备份的备份策略。
  这么些方针目的在于防止数据丢失,最大程度地缩减对可操作事务处理的影响,以及从系统故障中急迅恢复生机。
  
  相反,数据仓库存款和储蓄多量安静的历史数据,遵照被管理的时间限制调度进行更新。
  对于数据仓库,在陈设备份策略时应尽量减少完整备份并对数据更新使用增量备份。
  
  在苏醒时间约束上,数据仓库故障比 OLTP 故障数见不鲜更灵敏且范围更少。
  与 OLTP
系统相比,更宽大的回涨时间约束平日使得很少要求进行全体数据仓库备份。
  例如,销售事实表只怕带有数百万行反映10年历史的行销。
  在工作执行到年终停止时,差不多不太或然更改销售数目。
  
  重复备份没更改的数码是不需要的,备份策略中应思索那或多或少。
  依照苏醒时间约束和数据量,能够创设一个策略,使用增量备份备份在数据仓库更新进程中新增的数目,
  然后创立只含有在年终得了后的此时此刻年度内激增的多寡的备份。
  从彻底的数据仓库数据库故障中还原供给装载八个备份,
  当前年度从前的每一年各有3个备份,然后是时下年度创新的增量备份。
 自动化数据仓库职责
  管护数据仓库涉及大气的职分。
  这几个职分中的很多可经过 Microsoft SQL Server 2000中的种种工具自动执行。
  能够调度定期实现适当的义务。
  

优化数据仓库品质

 对于分析并汇总三个连片表中的多量行的询问,数据仓库必须提供对那类查询的迅猛评估。
 Microsoft SQL Server 3000提供可用于优化包蕴数据仓库数据的关周全据库质量的新闻。
 数据库的性质会受您所做的多多精选的熏陶,
 比如在数据库的逻辑设计、它的物理完结、索引优化、查询优化等地点的抉择。

相关文章