这是最好的时代,这是最坏的时代,这是智慧的时代,这是愚蠢的时代;这是信仰的时期,这是怀疑的时期;这是光明的季节,这是黑暗的季节;这是希望之春,这是失望之冬;人们面前有着各样事物,人们面前一无所有;人们正在直登天堂;人们正在直下地狱。 我也要与时俱进了,被itpub2.0牵着尾巴,拼命的奔跑,不停的灌水...

9 关于数据仓库维度数据处理的方法探究系列——雪花维

上一篇 / 下一篇  2008-02-13 17:20:17 / 个人分类:数据仓库专区

雪花架构是星型架构的一个扩展,有多个表定义一个或多个维度。在雪花架构中,只将主维度表和事实数据表联接。其他维度表联接到主维度表。
Ya%e_B{0

5雪花维概述

5.1概述

常规维度是指那些既不是虚拟维度、父子维度,也不是数据挖掘维度的维度。与父子维度不同(其层次结构是不均衡层次结构),常规维度中的层次结构要么均衡层次结构,要么是不齐整层次结构。常规维度包含的级别数目与定义时选择的列数目相同。这些级别一般按照常规到特定的顺序排列。(微软SQLServer2000联机帮助概念)

常规维度可以基于多个联接表。如果一个常规维度基于多个表,而且它没有雪花架构,则将它添加到多维数据集中时将采用这种架构。如果一个常规维度基于单个表,而且用星型架构将该维度添加到多维数据集中,则该多维数据集将保留星型架构。(微软SQLServer2000联机帮助概念)

因此雪花架构是星型架构的一个扩展,有多个表定义一个或多个维度。在雪花架构中,只将主维度表和事实数据表联接。其他维度表联接到主维度表。

5.2实现

事实上雪花维度既可以是由多个表联合组成的,也可以由一个表的多个有固定层次结构的;当然多个表也可以融合成为一个表或者视图,实际项目中也会这么做。

多个表的关联组合会带来一定的隐患,主要是键值不能匹配或者缺失,上级找不到下级,下级找不到父级,所以处理起来比较困难,当然通过表关联比较符合数据库的设计原则;通过将两个表放到一起就可以有效的缓解,数据不一致的情况。

对于两个不同的表的处理,请参见3.3.1覆盖,只不过在完成表的处理之后,需要对这两张表进行视图合并,增加无键值时的缺省值。

当然也可以通过存储过程将两张表合并到一张表中,具体情况根据业务需求而实现。

代码

CREATE TABLE t_tmp_xxx

(

IDVARCHAR(20) NOT NULL,

SuperID VARCHAR(20) NOT NULL,

NameVARCHAR(50),

CONSTRAINT PK_t_tmp_xxx PRIMARY KEY (ID)

)

go

CREATE TABLE t_tmp_super_xxx

(

SuperID VARCHAR(20) NOT NULL,

NameVARCHAR(50) ,

CONSTRAINT PK_t_tmp_super_xxx PRIMARY KEY (SuperID)

)

go

CREATE TABLE t_dem_xxx

(

IDVARCHAR(20) NOT NULL,

NameVARCHAR(50) ,

SuperID VARCHAR(20) NOT NULL,

SuperNameVARCHAR(50),

CONSTRAINT PK_t_dem_xxx PRIMARY KEY (ID)

)

go

INSERT INTO t_tmp_xxx VALUES('1','1','a')
l?8n1op QX O~0INSERT INTO t_tmp_xxx VALUES('2','2','b')
Ax1[f,f!dr0INSERT INTO t_tmp_xxx VALUES('3','3','c')ITPUB个人空间A2Y2b&fYe5u N? ur
INSERT INTO t_tmp_super_xxx VALUES('2','bb')
V*b@ I rzr+`O1X0INSERT INTO t_tmp_super_xxx VALUES('4','dd')

Go

CREATE VIEW v_dem_xxx AS

SELECT '-1' as ID,’缺省’ Name,'-1' SuperID, ‘缺省' SuperName

Union All

SELECT a.ID ID,a.name Name,

CASE WHEN b.superid IS NULL THEN '-1' ELSE b.superid END SuperID,

CASE WHEN b.superid IS NULL THEN’缺省' ELSE b.name END SuperName

FROM t_tmp_xxx a LEFT JOIN t_tmp_super_xxx b

ON a.SuperID=b.SuperID


TAG:

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日历

« 2008-09-05  
 123456
78910111213
14151617181920
21222324252627
282930    

数据统计

  • 访问量: 22154
  • 日志数: 65
  • 建立时间: 2007-12-07
  • 更新时间: 2008-08-31

RSS订阅

Open Toolbar