假如这个世界上只剩下你一个人,当你正坐在屋子里的时候,这时突然响起了敲门声...
使用 Microsoft SQL Server 分析服务
使用 Microsoft SQL Server 分析服务
7HG3lK xI0qC\ J G0Analysis Services概观
~e~(b^ b%B9_9d7h0安装Analysis Services
.x(e)lQI%|0使用Analysis ServicesITPUB个人空间vC\ ^.E
本章总结ITPUB个人空间]i?({;I&u
Microsoft SQL Server 2000 Analysis Services(过去被称为 OLAP Services),是 SQL Server 2000 中设计来协助您从事 在线分析处理(online analytical processing,OLAP) 的一个组件,利用这个组件可让您在您的数据仓储与数据超市中存取与采撷资料。在本章中,您可学习到何谓 Analysis Services 组件,如何安装以及如何使用这些组件;此外,您也会学习到 SQL Server 2000 中 Analysis Service 新增的功能。由于本书主要是写给 SQL Server 管理员而非应用程序开发人员,因此我们的讨论将仅止于安装、设定与管理 Analysis Services 等主题,应用程序开发的部分则不在讨论范围之内。ITPUB个人空间XL o9{}B]
________________________________________
"P)C5xu|C(n wk/J&`0说明ITPUB个人空间"S/Z1KnXV0v
在 本章中,我们可能会不断的提到 数据仓储(data warehouse) 与 资料超市(data mart) 这两个专有名词。数据仓储可以从几个不同的方向来定义,其中之一是把它视为一个商业数据的仓库,其储存了从公司 在线交易处理(online transaction processing,OLTP) 系统所获得的历史数据以及当前数据。数据超市类似于数据仓储,不过其所包含的资料仅与公司的某一方面有关。举例来说,公司可能拥有一个数据仓储,内含应付 帐款、应收帐款以及人力资源等数据,以及一个数据超市,内含应付帐款资料。组成数据仓储与数据超市的数据通常被规划成星状结构描述或雪花状结构描述,这些 在本章稍后都会有所说明。本章所讨论的概念大部份均能用在数据仓储与数据超市,因此除非特别说明,我们使用数据仓储来同时代表这两种数据库。ITPUB个人空间;S:_7q6je@ a
________________________________________ITPUB个人空间Nr9C@!t%F1M1s
Analysis Services 概观ITPUB个人空间J-~ ^:G(r
ITPUB个人空间 MB%O4^ Of%{1|#M9_ Z
Analysis Services 是一套工具,可用来协助您开发与管理用于在线分析处理的数据。Analysis Services 由 Analysis Service 服务器、English Query 以及其它支持组件所组成。Analysis Service 服务器建构数据的 cube 协助您进行多维度分析,Cube一词是用来描述一个汇总或摘要的数据集合,藉以处理复杂的分析查询,如每月销售结果与销售计划。(Cube 会在本章稍后 〈OLAP Cubes〉 一节中详细说明。)
] h wg;Pf)UAo0在多维度分析中,多个查询会从不同的观点或维度来搜寻数据库。举例来说,假设现有一 个自行车商数据库,其中仍保持着去年的销售数据。在多维度分析作业中的一个查询可能正在搜寻客户购买习惯,另一个查询搜寻的却是每月销售量,同时更有一个 查询找的是某一特定款式的自行车或组件的销售成绩。虽然数据是分享给所有的查询,但每个查询却以不同的观点(维度)来看待资料。
DQ%H6{S'@s0Analysis Service 组件ITPUB个人空间'fZRl[*SG
U)HQk4j'Hi6U0Analysis Services 提供了一些工具与精灵,让您可用来存取多维度资料。Analysis Service 由下列组件组成:
'_}l+c:le`$s0• 分析管理员 :提供一个 GUI 来使用 Analysis Service,如建立 Cube、管理安全性以及浏览数据来源。ITPUB个人空间?^rJ#u
ITPUB个人空间5J AR#F R7T#K
• 资料仓储架构 :一组实作 SQL Server 2000 数据仓储功能的组件与 API。
Q-l#[P+t;U&R0 ITPUB个人空间S3s;T/x#X^e"S
• 数据转换服务(DTS) :协助加载及转换数据到数据超市或数据仓储。DTS 是由汇入精灵与汇出精灵组成,可用来迁移数据及转换数据。DTS 的细节介绍请参阅 第24章 。
m)L e)Ej/h0 ITPUB个人空间~^!{zCn`
• 储存机制(Repository) :包含一些接口、数据库结构描述模型,以及预先定义的数据转换方式以符合数据仓储架构。因为数据转换是建立在有规则的基础上,所以它们的定义可以储存起来,以供将来重新使用。
e0lU"@9F0
3sY.V$l_ R0• 资料采撷(Data Mining) :提供了定义与实作多维度 cube 的算法。
3y b"O/{ Y@@z0
5T;c1x8Pt&` J$a:g-V0• English Query :英文语系的问题转换为可以在数据库上执行的 SQL 陈述式。ITPUB个人空间hy.`3S'fy
3m&V }$S^5RY-Rv)b!YO T0• 延伸标记语言(XML) :提供一个标准格式化与数据呈现的语言。XML 是应用程序对应用程序之间数据转换的重要组件,并可用来将数据出版至因特网。
bVJf:`$e @j4N0
v%l(P T t(rZZ0在本章中,我们会将这些组件组合在一起,犹如组合拼图的各个部分,藉以提供一个统合的工具。
3~ \+UE'r/s0OLAP CubeITPUB个人空间9R/Py5B)ut4nq$A
ITPUB个人空间6km)QBbn
在 Analysis Services 中资料的主要表现形式是 OLAP cube。 Cube 是详细数据以及摘要数据的多维度表现形式, 详细数据 是特定数据列的数据,而 摘要数据 是汇总数据。Cube 是基于数据自身的分析需求而设计的。每一个 cube 代表一个不同的商务实体,如销售额、存货等等。Cube 的每一个面表示资料中不同维度的情状。换言之,cube 是由数据许多不同的面向所组成,所以称为一个「数据 cube」。ITPUB个人空间1? Fc&O#OhXnI!s
Analysis Services cube 可透过两种数据库结构描述来建立:星状结构描述和雪花结构描述。 结构描述(Schemas) 事实上是一个发展中的论题,但为了适当的描述 Analysis Services,我们在这里简单的了解一下结构描述。这两种结构描述都是由事实数据表和维度数据表构成。Analysis Services 在数据表中汇总这些数据以建立 cube。让我们更详细一点来看这个过程。
v3M6[P-CD0事实资料表ITPUB个人空间7P7KE?E!w2w_'V&F:RM"k
|!F$yU9VW0 事实数据表 (fact table) 是数据仓储中储存历史数据的数据表,这些历史数据是数据仓储的核心信息。在我们的自行车商范例中,这个信息是一个发生在自行车商行的交易记录(包括数据库 交易与销售交易)。这个记录内的数据涵盖了交易日期、交易类型、销售项目、交易的总金额、顾客姓名、销售员姓名等等。这个记录可用来作为多维度分析的基 础。
$b0c;p*^)SG:e G0正如您所看到的,事实数据表的数据是以商业交易为中心的数据。这些交易可以是某物品的销售、信用卡交易和利润等等。基本上,事实数据表记录着一些商业事件的类型。ITPUB个人空间J#Of:yX"?*T
数据仓储中的事实数据表是数据库中最大的数据表,并且也是操作最频繁的数据表。您可能想象得到,事实资料表可以包括数百万个记录,且能够占据超过 1TB(或 1024 GB)的空间。ITPUB个人空间/W,y_q(L%eE5x
维度资料表ITPUB个人空间6I6PGwFU7a-f;j
ITPUB个人空间-C c~#i@}z&h(^ H
维度数据表(dimension table) 用来定义事实数据表中的字段,例如售货员姓名、交易类型或是项目等等。这个过程与 正规化(normalization) 过程相类似,两者都是拣取有用的数据以加快处理的效率。事实数据表包含交易的历史信息,而维度数据表所包含的信息,则指出如何从事实资料表中取得有用的材 料。换言之,维度资料表是用来载明事实资料表中所包含的资料的意义。ITPUB个人空间PZVY6R/vT
举例来说,对于一个包含着销售记录的事实数据表而言,可能有一个维度数据表包含着与销售代表有关的信息,可用来建立像是每个业务员的月份销售额这类摘要资料;而另一个维度数据表则是包含着地区信息,可用来建立每地区月份销售额这类摘要数据。ITPUB个人空间A'Z)cy0k,E'B
维度数据表并不像事实资料表那般庞大,相反的是维度数据表通常很小且往往仅含有几个数据列。数据仓储一般说来只会有一个到两个事实资料表,但却有好几个维度资料表。
jV!C0qVLZ|0结构描述
+ZZ*?r2QHuk0 ITPUB个人空间8q})i'f-K
星状结构描述(star schema) 是相当常见的一种资料仓储架构,它由一个事实数据表和一些维度数据表组成。星状结构描述意味着一个事实数据表被维度数据表所环绕,呈一颗星的形状。每一个 维度数据表相当于事实数据表中的一个资料行。这些维度数据表是用来架构分析的基础,以便我们对事实数据表中的数据进行分析。
!`'nH]W5A0 雪花结构描述(snowflake schema) 中,几个维度资料表在联结到事实数据表之前相互联结,换句话说,先建立一些维度数据表的阶层,每一层相当于事实资料表中的一个资料行。图 29-1 显示了星状结构描述与雪花结构描述。
WPtB&u\A0Y0图29-1 星状与雪花结构描述ITPUB个人空间DM(z8bV6T
资料汇总
%j'y-p6b E3AZ0 ITPUB个人空间t})_ nKz
Analysis Services 是以维度数据表内的数据为基础,从而建立事实数据表内数据行的汇总。举例来说,与员工相关的维度数据表可用来建立以员工为基础的销售数据摘要信息。与项目 相关的维度数据表可用来建立以项目为基础的数据的摘要信息。因为汇总是基于维度数据表来建立数据的不同切面(也就是维度),所以可构造一个数据的虚拟 cube,如前所述。
(T+w+I9Q^G/h0由 Analysis Services 建立的 OLAP cube,本质上就是依照星状或雪花结构描述来进行计算的汇总函数。您使用 Analysis Services 精灵来建立这些汇总,进而利用汇总来建立商业模型,做出商业决策。
%eIB2|;C)hnQ0中继资料(Metadata)
Lu dB8ZrLC0
}5t;Img%CE|e0「中 继数据」是用来描述与数据相关的数据,因此,用来描述数据库数据的摘要与详细数据便被称为中继资料。以我们刚刚的例子来说,销售数据表即周围的维度数据表 表现了数据的状态。我们建立的摘要信息(业务员的销售数据、各项物品的销售资料)便是中继资料。Analysis Services 的主要益处便是建立中继数据(摘要数据表或汇总)的能力,利用 Analysis Services,您可以简单地建立中继资料随后应用于各种工作,而不用很麻烦的亲手维护这些数据。
6?D _8Q-?!I L @._0SQL Server 2000 数据分析增强功能ITPUB个人空间+JL8|({!B v.w
ITPUB个人空间K0R,Q,sA:R
SQL Server 2000 在数据分析及数据仓储上提供了不少新增功能,这些新增或增强功能包括了一些工具与信息,能用来增进数据分析的处理。在本节中,您会学习到这些新增功能中最主要的部分。ITPUB个人空间b\AY5XpE4e6Eni
数据采撷增强功能
j9}9S;f)I i0
)}@ hj x s+f0Analysis Services 已整合了新的数据采撷技术,可用来发现关系型数据库与 OLAP cube 之间的数据关联性。这些关联性可被加入到现有的 OLAP cube 已提供额外的数据分析。其中一个独一无二的数据采撷新功能是 Microsoft Decision Tree。Microsoft Decision Tree 使用精密的分类技术与算法来分析数据,接着它会建构一或多个决策树,可用来针对新数据进行预测分析。举例来说,我们的自行车商行便可透过这项技术建构决策 树来分析潜在客户的信用历史数据与交易历史数据,由此预测该客户的信用风险。ITPUB个人空间iH Fl"} V)~9b1h
数据采撷的另一个新功能是丛集的使用。用于数据采撷的丛集技术与 第12章 中所描述的丛集类型不并相同。当 Analysis Services 执行丛集时,它会使用一种被称为最邻近法的算法将数据录分组成具有类似特性的丛集。许多时候,这些关联性都会被隐藏或不易被察觉。因此,丛集技术可以说打 开了数据分析的另一扇大门。ITPUB个人空间x:KC3np QS
此外,SQL Server 数据采撷组件也包含了一些新的精灵与对话框,让数据采撷变得更易于利用。这些新增功能让 DBA 在建立与维护数据超市或数据仓储时,可以更快地执行大部分相关的工作。
+I{Ko:K2w(T0维度增强功能ITPUB个人空间]v;QJU}N,B W
ITPUB个人空间9Vin!{1A)Z'zh
SQL Seever 包含了数种新增的维度资料表。SQL Server 现在支持父子式维度、关系型 OLAP(ROLAP)维度以及可写入的维度。ITPUB个人空间cydubJ
父子式维度允许来源数据表中成员之间父子式连结的阶层架构定义。父子式关联性的一个例子是一个来自各部分的组件组合结构。父代为单一的部份,可以拥有许多的子组件,即子代。当进行数据分析时,可使用父子式维度来加强子组件与该部份的连系。ITPUB个人空间k,LGN o
ROLAP 维度可用来解决 Analysis Services 使用的标准多维度 OLAP(MOLAP)模式的容量限制问题。MOLAP 模式允许维度可包含近乎 500 万个成员。一旦成员的成长超过了这个限度,就需要 ROLAP 维度。ROLAP 维度可成长得极为庞大,不过在查询成员集时 MOLAP 模式的效能却比 ROLAP 要好很多。因此,只有在维度非常庞大时才应定义为 ROLAP 模式。
P7] ~LyO rRbj0当您使用可写入维度(write-enabled dimension)时,维度的成员可透过分析管理员以及支持回写的客户端应用程序来更新。可使用 SQL Server 角色来控制客户端应用程序对维度的写入存取。SQL Server 角色将在 第34章 介绍。ITPUB个人空间+Q2p:I3A5NE0@
安全性增强功能
7HG3lK xI0qC\ J G0Analysis Services概观
~e~(b^ b%B9_9d7h0安装Analysis Services
.x(e)lQI%|0使用Analysis ServicesITPUB个人空间vC\ ^.E
本章总结ITPUB个人空间]i?({;I&u
Microsoft SQL Server 2000 Analysis Services(过去被称为 OLAP Services),是 SQL Server 2000 中设计来协助您从事 在线分析处理(online analytical processing,OLAP) 的一个组件,利用这个组件可让您在您的数据仓储与数据超市中存取与采撷资料。在本章中,您可学习到何谓 Analysis Services 组件,如何安装以及如何使用这些组件;此外,您也会学习到 SQL Server 2000 中 Analysis Service 新增的功能。由于本书主要是写给 SQL Server 管理员而非应用程序开发人员,因此我们的讨论将仅止于安装、设定与管理 Analysis Services 等主题,应用程序开发的部分则不在讨论范围之内。ITPUB个人空间XL o9{}B]
________________________________________
"P)C5xu|C(n wk/J&`0说明ITPUB个人空间"S/Z1KnXV0v
在 本章中,我们可能会不断的提到 数据仓储(data warehouse) 与 资料超市(data mart) 这两个专有名词。数据仓储可以从几个不同的方向来定义,其中之一是把它视为一个商业数据的仓库,其储存了从公司 在线交易处理(online transaction processing,OLTP) 系统所获得的历史数据以及当前数据。数据超市类似于数据仓储,不过其所包含的资料仅与公司的某一方面有关。举例来说,公司可能拥有一个数据仓储,内含应付 帐款、应收帐款以及人力资源等数据,以及一个数据超市,内含应付帐款资料。组成数据仓储与数据超市的数据通常被规划成星状结构描述或雪花状结构描述,这些 在本章稍后都会有所说明。本章所讨论的概念大部份均能用在数据仓储与数据超市,因此除非特别说明,我们使用数据仓储来同时代表这两种数据库。ITPUB个人空间;S:_7q6je@ a
________________________________________ITPUB个人空间Nr9C@!t%F1M1s
Analysis Services 概观ITPUB个人空间J-~ ^:G(r
ITPUB个人空间 MB%O4^ Of%{1|#M9_ Z
Analysis Services 是一套工具,可用来协助您开发与管理用于在线分析处理的数据。Analysis Services 由 Analysis Service 服务器、English Query 以及其它支持组件所组成。Analysis Service 服务器建构数据的 cube 协助您进行多维度分析,Cube一词是用来描述一个汇总或摘要的数据集合,藉以处理复杂的分析查询,如每月销售结果与销售计划。(Cube 会在本章稍后 〈OLAP Cubes〉 一节中详细说明。)
] h wg;Pf)UAo0在多维度分析中,多个查询会从不同的观点或维度来搜寻数据库。举例来说,假设现有一 个自行车商数据库,其中仍保持着去年的销售数据。在多维度分析作业中的一个查询可能正在搜寻客户购买习惯,另一个查询搜寻的却是每月销售量,同时更有一个 查询找的是某一特定款式的自行车或组件的销售成绩。虽然数据是分享给所有的查询,但每个查询却以不同的观点(维度)来看待资料。
DQ%H6{S'@s0Analysis Service 组件ITPUB个人空间'fZRl[*SG
U)HQk4j'Hi6U0Analysis Services 提供了一些工具与精灵,让您可用来存取多维度资料。Analysis Service 由下列组件组成:
'_}l+c:le`$s0• 分析管理员 :提供一个 GUI 来使用 Analysis Service,如建立 Cube、管理安全性以及浏览数据来源。ITPUB个人空间?^rJ#u
ITPUB个人空间5J AR#F R7T#K
• 资料仓储架构 :一组实作 SQL Server 2000 数据仓储功能的组件与 API。
Q-l#[P+t;U&R0 ITPUB个人空间S3s;T/x#X^e"S
• 数据转换服务(DTS) :协助加载及转换数据到数据超市或数据仓储。DTS 是由汇入精灵与汇出精灵组成,可用来迁移数据及转换数据。DTS 的细节介绍请参阅 第24章 。
m)L e)Ej/h0 ITPUB个人空间~^!{zCn`
• 储存机制(Repository) :包含一些接口、数据库结构描述模型,以及预先定义的数据转换方式以符合数据仓储架构。因为数据转换是建立在有规则的基础上,所以它们的定义可以储存起来,以供将来重新使用。
e0lU"@9F0
3sY.V$l_ R0• 资料采撷(Data Mining) :提供了定义与实作多维度 cube 的算法。
3y b"O/{ Y@@z0
5T;c1x8Pt&` J$a:g-V0• English Query :英文语系的问题转换为可以在数据库上执行的 SQL 陈述式。ITPUB个人空间hy.`3S'fy
3m&V }$S^5RY-Rv)b!YO T0• 延伸标记语言(XML) :提供一个标准格式化与数据呈现的语言。XML 是应用程序对应用程序之间数据转换的重要组件,并可用来将数据出版至因特网。
bVJf:`$e @j4N0
v%l(P T t(rZZ0在本章中,我们会将这些组件组合在一起,犹如组合拼图的各个部分,藉以提供一个统合的工具。
3~ \+UE'r/s0OLAP CubeITPUB个人空间9R/Py5B)ut4nq$A
ITPUB个人空间6km)QBbn
在 Analysis Services 中资料的主要表现形式是 OLAP cube。 Cube 是详细数据以及摘要数据的多维度表现形式, 详细数据 是特定数据列的数据,而 摘要数据 是汇总数据。Cube 是基于数据自身的分析需求而设计的。每一个 cube 代表一个不同的商务实体,如销售额、存货等等。Cube 的每一个面表示资料中不同维度的情状。换言之,cube 是由数据许多不同的面向所组成,所以称为一个「数据 cube」。ITPUB个人空间1? Fc&O#OhXnI!s
Analysis Services cube 可透过两种数据库结构描述来建立:星状结构描述和雪花结构描述。 结构描述(Schemas) 事实上是一个发展中的论题,但为了适当的描述 Analysis Services,我们在这里简单的了解一下结构描述。这两种结构描述都是由事实数据表和维度数据表构成。Analysis Services 在数据表中汇总这些数据以建立 cube。让我们更详细一点来看这个过程。
v3M6[P-CD0事实资料表ITPUB个人空间7P7KE?E!w2w_'V&F:RM"k
|!F$yU9VW0 事实数据表 (fact table) 是数据仓储中储存历史数据的数据表,这些历史数据是数据仓储的核心信息。在我们的自行车商范例中,这个信息是一个发生在自行车商行的交易记录(包括数据库 交易与销售交易)。这个记录内的数据涵盖了交易日期、交易类型、销售项目、交易的总金额、顾客姓名、销售员姓名等等。这个记录可用来作为多维度分析的基 础。
$b0c;p*^)SG:e G0正如您所看到的,事实数据表的数据是以商业交易为中心的数据。这些交易可以是某物品的销售、信用卡交易和利润等等。基本上,事实数据表记录着一些商业事件的类型。ITPUB个人空间J#Of:yX"?*T
数据仓储中的事实数据表是数据库中最大的数据表,并且也是操作最频繁的数据表。您可能想象得到,事实资料表可以包括数百万个记录,且能够占据超过 1TB(或 1024 GB)的空间。ITPUB个人空间/W,y_q(L%eE5x
维度资料表ITPUB个人空间6I6PGwFU7a-f;j
ITPUB个人空间-C c~#i@}z&h(^ H
维度数据表(dimension table) 用来定义事实数据表中的字段,例如售货员姓名、交易类型或是项目等等。这个过程与 正规化(normalization) 过程相类似,两者都是拣取有用的数据以加快处理的效率。事实数据表包含交易的历史信息,而维度数据表所包含的信息,则指出如何从事实资料表中取得有用的材 料。换言之,维度资料表是用来载明事实资料表中所包含的资料的意义。ITPUB个人空间PZVY6R/vT
举例来说,对于一个包含着销售记录的事实数据表而言,可能有一个维度数据表包含着与销售代表有关的信息,可用来建立像是每个业务员的月份销售额这类摘要资料;而另一个维度数据表则是包含着地区信息,可用来建立每地区月份销售额这类摘要数据。ITPUB个人空间A'Z)cy0k,E'B
维度数据表并不像事实资料表那般庞大,相反的是维度数据表通常很小且往往仅含有几个数据列。数据仓储一般说来只会有一个到两个事实资料表,但却有好几个维度资料表。
jV!C0qVLZ|0结构描述
+ZZ*?r2QHuk0 ITPUB个人空间8q})i'f-K
星状结构描述(star schema) 是相当常见的一种资料仓储架构,它由一个事实数据表和一些维度数据表组成。星状结构描述意味着一个事实数据表被维度数据表所环绕,呈一颗星的形状。每一个 维度数据表相当于事实数据表中的一个资料行。这些维度数据表是用来架构分析的基础,以便我们对事实数据表中的数据进行分析。
!`'nH]W5A0 雪花结构描述(snowflake schema) 中,几个维度资料表在联结到事实数据表之前相互联结,换句话说,先建立一些维度数据表的阶层,每一层相当于事实资料表中的一个资料行。图 29-1 显示了星状结构描述与雪花结构描述。
WPtB&u\A0Y0图29-1 星状与雪花结构描述ITPUB个人空间DM(z8bV6T
资料汇总
%j'y-p6b E3AZ0 ITPUB个人空间t})_ nKz
Analysis Services 是以维度数据表内的数据为基础,从而建立事实数据表内数据行的汇总。举例来说,与员工相关的维度数据表可用来建立以员工为基础的销售数据摘要信息。与项目 相关的维度数据表可用来建立以项目为基础的数据的摘要信息。因为汇总是基于维度数据表来建立数据的不同切面(也就是维度),所以可构造一个数据的虚拟 cube,如前所述。
(T+w+I9Q^G/h0由 Analysis Services 建立的 OLAP cube,本质上就是依照星状或雪花结构描述来进行计算的汇总函数。您使用 Analysis Services 精灵来建立这些汇总,进而利用汇总来建立商业模型,做出商业决策。
%eIB2|;C)hnQ0中继资料(Metadata)
Lu dB8ZrLC0
}5t;Img%CE|e0「中 继数据」是用来描述与数据相关的数据,因此,用来描述数据库数据的摘要与详细数据便被称为中继资料。以我们刚刚的例子来说,销售数据表即周围的维度数据表 表现了数据的状态。我们建立的摘要信息(业务员的销售数据、各项物品的销售资料)便是中继资料。Analysis Services 的主要益处便是建立中继数据(摘要数据表或汇总)的能力,利用 Analysis Services,您可以简单地建立中继资料随后应用于各种工作,而不用很麻烦的亲手维护这些数据。
6?D _8Q-?!I L @._0SQL Server 2000 数据分析增强功能ITPUB个人空间+JL8|({!B v.w
ITPUB个人空间K0R,Q,sA:R
SQL Server 2000 在数据分析及数据仓储上提供了不少新增功能,这些新增或增强功能包括了一些工具与信息,能用来增进数据分析的处理。在本节中,您会学习到这些新增功能中最主要的部分。ITPUB个人空间b\AY5XpE4e6Eni
数据采撷增强功能
j9}9S;f)I i0
)}@ hj x s+f0Analysis Services 已整合了新的数据采撷技术,可用来发现关系型数据库与 OLAP cube 之间的数据关联性。这些关联性可被加入到现有的 OLAP cube 已提供额外的数据分析。其中一个独一无二的数据采撷新功能是 Microsoft Decision Tree。Microsoft Decision Tree 使用精密的分类技术与算法来分析数据,接着它会建构一或多个决策树,可用来针对新数据进行预测分析。举例来说,我们的自行车商行便可透过这项技术建构决策 树来分析潜在客户的信用历史数据与交易历史数据,由此预测该客户的信用风险。ITPUB个人空间iH Fl"} V)~9b1h
数据采撷的另一个新功能是丛集的使用。用于数据采撷的丛集技术与 第12章 中所描述的丛集类型不并相同。当 Analysis Services 执行丛集时,它会使用一种被称为最邻近法的算法将数据录分组成具有类似特性的丛集。许多时候,这些关联性都会被隐藏或不易被察觉。因此,丛集技术可以说打 开了数据分析的另一扇大门。ITPUB个人空间x:KC3np QS
此外,SQL Server 数据采撷组件也包含了一些新的精灵与对话框,让数据采撷变得更易于利用。这些新增功能让 DBA 在建立与维护数据超市或数据仓储时,可以更快地执行大部分相关的工作。
+I{Ko:K2w(T0维度增强功能ITPUB个人空间]v;QJU}N,B W
ITPUB个人空间9Vin!{1A)Z'zh
SQL Seever 包含了数种新增的维度资料表。SQL Server 现在支持父子式维度、关系型 OLAP(ROLAP)维度以及可写入的维度。ITPUB个人空间cydubJ
父子式维度允许来源数据表中成员之间父子式连结的阶层架构定义。父子式关联性的一个例子是一个来自各部分的组件组合结构。父代为单一的部份,可以拥有许多的子组件,即子代。当进行数据分析时,可使用父子式维度来加强子组件与该部份的连系。ITPUB个人空间k,LGN o
ROLAP 维度可用来解决 Analysis Services 使用的标准多维度 OLAP(MOLAP)模式的容量限制问题。MOLAP 模式允许维度可包含近乎 500 万个成员。一旦成员的成长超过了这个限度,就需要 ROLAP 维度。ROLAP 维度可成长得极为庞大,不过在查询成员集时 MOLAP 模式的效能却比 ROLAP 要好很多。因此,只有在维度非常庞大时才应定义为 ROLAP 模式。
P7] ~LyO rRbj0当您使用可写入维度(write-enabled dimension)时,维度的成员可透过分析管理员以及支持回写的客户端应用程序来更新。可使用 SQL Server 角色来控制客户端应用程序对维度的写入存取。SQL Server 角色将在 第34章 介绍。ITPUB个人空间+Q2p:I3A5NE0@
安全性增强功能