Hadoop应用架构
9推荐 收藏
14.2K阅读
图灵程序设计丛书

Hadoop应用架构

Mark Grover , Ted Malaska , Jonathan Seidman , Gwen Shapira (作者) 郭文超 (译者)
上市销售
本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。

为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

电子书
¥34.99
格式
mobi   pdf

纸质书
¥54.51 ¥69.00

出版信息

  • 书  名Hadoop应用架构
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 傅志红
  • 出版日期2017-01-18
  • 书  号978-7-115-44243-7
  • 定  价69.00 元
  • 页  数278
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名Hadoop Application Architectures
  • 原书号9781491900086

所属分类

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

-使用Hadoop进行数据存储和建模的着眼点和思路
-将数据输入、输出系统的最佳方案
-MapReduce、Spark和Hive等数据处理框架介绍
-数据去重、窗口分析等常见Hadoop处理模式应用
-在Hadoop上采用Giraph、GraphX等图形处理工具
-综合使用工作流以及Apache Oozie等调度工具
-以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理
-点击流分析、欺诈检验和数据仓库的架构案例

Hadoop之父Doug Cutting作序推荐。
“对Hadoop有所了解”与“能够使用Hadoop形成实际解决方案”之间的一座桥梁!

目录

版权声明 阅读
O'Reilly Media, Inc. 介绍 阅读
译者序 阅读
阅读
前言 阅读
第一部分 考虑 Hadoop 应用的架构设计 阅读
第 1 章 Hadoop 数据建模 阅读
第 2 章 Hadoop 数据移动
第 3 章 Hadoop 数据处理
第 4 章 Hadoop 数据处理通用范式
第 5 章 Hadoop 图处理
第 6 章 协调调度
第 7 章 Hadoop 近实时处理
第二部分 案例研究
第 8 章 点击流分析 阅读
第 9 章 欺诈检测
第 10 章 数据仓库
附录 A Impala 中的关联
作者简介
封面介绍

作者介绍

Mark Grover
Apache Sentry项目管理委员会成员,《Hive编程指南》作者之一,曾参与Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等项目,并为Apache Bigtop项目和Apache Sentry(项目孵化中)项目贡献代码。

Ted Malaska
Cloudera公司的资深解决方案架构师,致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局(FINRA,Financial Industry Regulatory Authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。

Jonathan Seidman
Cloudera公司的解决方案架构师,协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组(Chicago Hadoop User Group)及芝加哥大数据(Chicago Big Data)的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管,为最为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。

Gwen Shapira
Cloudera公司的解决方案架构师,知名博主,拥有15年从业经验,协助客户设计高扩展性的数据架构。曾任Pythian高级顾问、Oracle ACE主管以及NoCOUG董事会成员,活跃于诸多业内会议。

大家也喜欢

  • 精通Hadoop

    Sandeep Karanth   刘淼   唐觊隽   陈智威   译

    本书是一本循序渐进的指导手册,重点介绍了Hadoop的高级概念和特性。内容涵盖了Hadoop 2.X版的改进,...

暂无评论!