学院首页 | 学院概况 | 语言文字 | 人才培养 | 科学研究 | 学生园地 | 两学一做 | 师资团队 | 下载专区 | English 
学术动态
 

数据仓库设计的重新审视

2011/10/04 23:55:50  作者:  点击:[]

数据仓库跟随我们已经有四分之一个世纪。它的架构和基础设施经过这段时期已经在很大程度上稳定了。多年来,一系列用于设计和建立数据仓库和数据集市的方法不断发展。然而,一次又一次,一个项目又一个项目,有一个问题不停地被重复:“为什么准确又可靠地估计数据仓库的大小与开发数据仓库所需时间是如此之难?”

5月20日,星期五,WhereScape在Boulder商业智能BI)智囊团会议 (BBBT) 上发布了他们的新产品WhereScape 3D。3D代表了“数据驱动设计(Data Driven Design)”,是一种新颖而有吸引力的方法,用来特别支持数据仓库和数据集市开发项目的设计阶段和专注于数据的专家,这些专家的知识和技能对于避免经常困扰着这些项目在开发阶段时出现的规模和范围的问题至关重要。

作为发布的一部分,WhereScape提供了一个白色皮书。在白皮书中,首先探究了困扰数据仓库开发项目的问题和最常见的由供应商和开发人员做出的权衡 — 在交付速度和交付一致性信息之间做出抉择。结论是简单的。这样的权衡越来越徒劳无功。商务需求和技术功能需要数据仓库和数据集市的交付既有速度又有一致性。而且有对项目的规模和持续时间有可靠的预计。

对这些问题的一个非常有说服力的解决方案,来自对设计和建立数据仓库与数据集市的流程从一个非常特殊的角度的重新审视 ― 需要对数据和特殊技术的理解。由此,白皮书提出了数据驱动设计的理念和一些关键的建议,如何设计数据仓库和常见的工作以便对项目范围和计划做出最大精确度和可靠性评估。

那么,数据驱动的设计有什么不同呢? 简单地说,在我们引进ETL(提取,转换和加载)工具及ETL(提取,转换和加载)的专家之前,数据驱动的设计侧重于数据仓库或数据集市开发项目的规划阶段。这个规划阶段将所有已知的、可以发现的关于两种关键的开发组件(源数据和目标模型或数据库)同时在逻辑层和物理层上建立文件。这种关注的原因很简单:如果对这两种组件你知道的最多,你就有更好的机会避免在开发阶段如此常见的一些开发陷阱。

对我们来说,那就是IT的价值!WhereScape免费提供了3D。 对于数据仓库项目经理来说,没有任何理由不去下载它和尝试它!

上一条:2013 中国计算机大会( CNCC2013 )征文 下一条:数据仓库中的数据清洗

 


Copyright © 2011-2020 重庆大学 大数据与软件学院. All Rights Reserved
地址:重庆市大学城·重庆大学虎溪校区行政楼B2栋 电话:65678333  65112331 邮政编码:401331