前言

前言

近几年,许多人开始对如何分析大规模系统中的流数据感兴趣,部分原因是,在某些场景下对实时数据进行实时分析显得非常有价值和吸引力。然而,通过低延迟的应用程序及时获得有用的信息,只是高性能流处理带来的众多好处之一。

本书介绍的 Apache Flink(以下简称 Flink)作为一种高度创新的开源流处理器,具备惊人的潜力,能够帮助你在以流为基础的各种计算中获益。Flink 不仅可以真正实现实时的容错性分析,还可以分析历史数据,并且极大地简化数据处理流程。最让人惊喜的是,Flink 用同一种底层技术来实现流处理和批处理。它拥有完备的语义和强大的性能,这使得应用程序的开发变得简单,其架构也使得应用程序的维护变得容易。

本书将全面介绍 Flink 的功能,并且讲解常见的使用方法,包括如何在生产环境中使用它。Flink 社区由来自世界各地的开发人员和用户组成,整个社区十分活跃,并且成长迅速。第一届 Flink 专属研讨会定名为 Flink Forward,于 2015 年 10 月在德国柏林举行,第二届于 2016 年 9 月举行。还有各种线下聚会在全球范围内举行,新的 Flink 用例在聚会中被大家广泛讨论。

如何阅读本书

本书对技术人员和非技术人员都有帮助。对于本书所讲解的设计理念和功能,你并不需要具备特殊技能或者拥有流处理经验就能理解,但是如果对大数据系统有一定的了解,将会使阅读获得更好的效果。如果需要尝试运行本书中的示例代码,则需要具备 Java 或者 Scala 的经验。本书会清楚地讲解示例背后的核心概念,即使不懂代码也并不影响阅读。

第 1~3 章阐述 Flink 是基于哪些需求被开发出来的,以及它如何满足这些需求;还会介绍流处理架构的优势,以及 Flink 的整体设计。第 4 章至附录对 Flink 的功能进行更深层的技术性阐释。

排版约定

 该图标表示一般性注解。

 该图标表示提示或建议。

电子书

扫描如下二维码,即可购买本书电子版。

{%}

目录