数据集市常见问题

如题所述


国外咨询机构在评估数据集市的成本时提供了某些参考,但国内由于国情差异,可能需要针对具体情况开展独立调研。以客户主题数据集市为例,一般成本在20万到50万元人民币之间,设计时推荐采用迭代式方法,通过多次交付不完善但功能逐步增加的"试用"产品,以更好地理解客户需求并调整产品。这种方法虽然周期长、成本高,但能有效降低项目风险,适合大型和高风险项目。


在实际建设中,国内通常先从特定主题的数据集市着手,如客户信息,再逐步构建数据仓库。数据仓库和数据集市的顺序选择取决于项目设计方法,关键在于能否解决现有问题并保持未来扩展性。数据集市中的"独立"概念可能会导致混淆,供应商的术语定义不统一可能导致决策困难,例如在选择部门级数据集市还是企业级数据仓库时。


数据集市主要分为独立型和从属型,独立型直接从操作环境获取数据,适合小企业快速解决问题,投资成本相对较低。然而,独立型数据集市的扩展和统一性有限,不适合长期作为全企业数据仓库的基础。多个独立数据集市的累积并不能自动形成企业级仓库,因为它们各自为部门服务,可能导致信息孤岛。Inmon的比喻进一步强调了数据仓库和数据集市在结构上的本质区别。


从长远看,如果企业追求统一的数据仓库以实现全局数据分析,独立型数据集市可能不是最佳选择。相比之下,从属型数据集市因其稳定性,可能成为未来数据集市建设的主要方向。



扩展资料

数据集市(Data Mart) ,也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。

温馨提示:答案为网友推荐,仅供参考
相似回答