译者序

学习大师的著作通常令人满怀景仰,而翻译大师的著作又往往让人惴惴不安。Inmon的著作总是将复杂的技术讲解得通俗易懂,体现出清晰的知识脉络,阐述观点的视角也非常独到。“授人以鱼,不如授之以渔。”这本书讲述的是原理、架构和方法论,颇有授人以“捕鱼之术”的味道。本书有三个比较重要的关键词:数据架构、大数据和Data Vault。对于工程技术人员、管理人员(包括行政管理人员和信息管理人员)以及从事各种数据分析和研究的科研人员而言,本书绝对是一本不可错过的好书。

从本质上讲,数据架构与建筑架构并无二致。没有良好定义的架构,就难以支撑起数据的捕获、计算、分析和管理运维等各个环节,更不用说管理和使用海量数据了。为什么我们的数据总是难以集成和交换?为什么我们的信息系统总是不够可靠,生命周期是那么短暂?为什么我们难以从数据中分析挖掘出业务价值?关键就在于我们在数据架构设计上投入的精力太少,总是草草地完成(甚至是跳过)设计阶段的工作,急匆匆地进入实施阶段,而忽略了数据的本质特性。

“大数据”的概念出现之后,在一种急功近利的狂躁情绪的牵引下,在商业包装和媒体炒作的推动下,在信息化的很多角落里,很多人正在试图将原来的“小垃圾桶”换成新的“大垃圾桶”;但是,真正从大数据技术中获益的人要远少于宣传大数据的人,而且“大数据”这个词实际上正面临着滥用的危险。在我们的各种数据标准尚不够完善之时,在我们的数据架构仍然存在短板之时,我们的大数据走不了多远。在静下心来读完这本书之后,相信你对此会有更为深刻的体会,不会再被各种有关大数据的华丽辞藻和神话传说迷住双眼。

Data Vault是本书的核心内容,蕴含着Inmon等人对数据仓库这门技术在大数据环境下如何发展和走向成熟的思考。在本书翻译之初,我曾经信誓旦旦地对编辑说,要在翻译工作结束之后为Data Vault这个英文词组找一个对应的汉语词组。遗憾的是,在全部翻译工作完成之后仍然未能如愿。我曾经试图将Data Vault翻译成“数据仓”“数据宝库”“数据仓储”“数据库所”等,但是又觉得这其中的每一个都有不妥。Data Vault的内涵比数据仓库丰富得多,也更加雄心勃勃。就我的理解来说,如果将企业视为一个封闭世界,那么Data Vault所面向的就是这个世界穹顶之下的所有数据。为了避免混淆和误导,在找到一个足够准确的词组之前,我觉得还是不作翻译为好。

虽然已经竭尽绵力,但是译文仍难免有错误和疏漏之处,还望读者海涵。感谢图灵公司的各位编辑为本书付出的心血与汗水。

唐富年

2016年3月于济南

目录

  • 译者序
  • 前言
  • 第 1 章 企业数据
  • 第2章 大数据 
  • 第3章 数据仓库
  • 第4章 Data Vault
  • 第5章 作业环境
  • 第6章 数据架构 
  • 第7章 重复型分析
  • 第8章 非重复型分析
  • 第9章 作业分析1 
  • 第10章 作业分析2
  • 第11章 个人分析
  • 第12章 复合式的数据架构
  • 词汇表