精通Hadoop
14推荐 收藏
13.1K阅读
图灵程序设计丛书

精通Hadoop

Sandeep Karanth (作者) 刘淼 , 唐觊隽 , 陈智威 (译者)
本书是一本循序渐进的指导手册,重点介绍了Hadoop的高级概念和特性。内容涵盖了Hadoop 2.X版的改进,MapReduce、Pig和Hive等的优化及其高级特性,Hadoop 2.0的专属特性(如YARN和HDFS联合),以及如何使用Hadoop 2.0版本扩展Hadoop的能力。

如果你想拓展自己的Hadoop知识和技能,想应对具有挑战性的数据处理问题,想让Hadoop作业、Pig脚本和Hive查询运行得更快,或者想了解升级Hadoop的好处,那么本书便是你的不二选择。

通过阅读本书,你将能够:

理解从Hadoop 1.0到Hadoop 2.0的变化
定制和优化Hadoop 2.0中的MapReduce作业
探究Hadoop I/O和不同的数据格式
深入学习YARN和Storm,并通过YARN集成Hadoop和Storm
基于亚马逊Elastic MapReduce部署Hadoop
探究HDFS替代品,学习HDFS联合
掌握Hadoop安全方面的主要内容
使用Mahout和RHadoop进行Hadoop数据分析

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

电子书
¥24.99
格式
mobi   pdf

纸质书
¥38.71 ¥49.00

出版信息

  • 书  名精通Hadoop
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版日期2016-01-04
  • 书  号978-7-115-41105-1
  • 定  价49.00 元
  • 页  数268
  • 印刷方式黑白
  • 开  本16开
  • 出版状态暂时缺货
  • 原书名Mastering Hadoop
  • 原书号978-1783983643

所属分类

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

Hadoop是大数据处理的同义词。Hadoop的编程模型简单,“一次编码,任意部署”,且生态圈日益完善,已成为一个可供不同技能水平的程序员共同使用的全方位平台。今天,面临着处理和分析大数据的任务,Hadoop成了理所当然的工具。Hadoop 2.0扩展了羽翼,能覆盖各种类型的应用模式,并解决更大范围的问题。

目录

版权声明 阅读
推荐序一 阅读
推荐序二 阅读
译者序 阅读
前言 阅读
致谢 阅读
第 1 章 Hadoop 2.X 阅读
第 2 章 MapReduce进阶
第 3 章 Pig进阶 阅读
第 4 章 Hive进阶
第 5 章 序列化和Hadoop I/O
第 6 章 YARN——其他应用模式进入Hadoop的引路人
第 7 章 基于YARN的Storm——Hadoop中的低延时处理
第 8 章 云上的Hadoop
第 9 章 HDFS替代品
第 10 章 HDFS联合
第 11 章 Hadoop安全
第 12 章 使用Hadoop进行数据分析
附录 微软Windows中的Hadoop

作者介绍

<作者介绍>
Sandeep Karanth

Scibler公司联合创始人,负责数据智能产品的架构;DataPhi Labs公司联合创始人兼首席架构师,专注于构建和实施软件系统。他拥有14年以上的软件行业从业经验,既设计过企业数据应用,也开发过新一代移动应用。他曾就职于微软总部和微软印度研究院。他的Twitter账号是@karanths,GitHub账号是https://github.com/Karanth。

<译者介绍>

刘淼 毕业于浙江大学计算机科学与技术专业。曾就职于惠普公司,先后担任技术专家、研发经理等职位。现任1号店资深架构师,领导大数据基础平台的建设。专注于分布式存储与计算、大数据分析等。

唐觊隽 曾就职于阿里软件、中国民航信息网络股份有限公司上海分公司。现任1号店高级架构师,主要负责大数据基础平台的建设。专注于数据仓库、分布式计算、软件建模、敏捷开发等。

陈智威 毕业于中山大学物理系微电子专业,曾就职于华为交换机产品部、1号店基础架构部,擅长网络通信、分布式计算等。现于佛罗里达州立大学计算机系攻读机器学习方向硕士学位。

大家也喜欢

  • Hadoop应用架构

    Mark Grover   Ted Malaska   Jonathan Seidman   Gwen Shapira   郭文超   译

    本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中...

  • 喜欢看电子书 学习的朋友可以关注一下 大讲台网 这家网站是电子书学习Hadoop的
    zhensg2008  发表于 2016-01-29 11:05:05
    推荐
    • 广告~广告~

      bushkarl  发表于 2016-05-31 18:58:09
  • 一般我不喜欢精通系列的书觉得怎么可能一本书就精通了,可是看了这本书后是有收获的,因为以前只是对hadoop了解不深,看了之后才有了更深的理解,推荐购买,通过这本书可以更深的理解hadoop的整体生态
    xunlei1221  发表于 2016-04-01 13:12:07
    推荐