Hive实战
7推荐 收藏
10.3K阅读
图灵程序设计丛书

Hive实战

斯科特·肖 , 安德烈亚斯·弗朗索瓦·弗穆尔恩 , 安库尔·古普塔 , 戴维·杰鲁姆加德 (作者) 唐富年 (译者)
上市销售
实践Hadoop数据仓库解决方案,在大数据时代“炼数成金”
Hive“出身名门”,是最初由Facebook公司开发的数据仓库工具。它简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。本书由数据库专家和大数据专家共同撰写,具体内容包括:Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性,等等。本书旨在为读者打牢基础,从而踏上专业的大数据处理之旅。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

PS:也会在图灵社区电报频道更新

出版信息

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或...

本书特色

面对与日俱增的海量数据,能否从中提取商业价值直接关乎公司的市场竞争力。Hive是大数据生态圈必不可少的数据仓库,它为存储在Hadoop文件系统中的数据提供便捷的类SQL查询、统计和分析,从而为公司进入大数据生态圈并迈向商业智能铺平道路。

本书着眼于Hive在真实环境中的应用,内容囊括Hive的方方面面,是针对大数据分析人员的实践参考指南。

- 理解Hive的架构和数据类型
- 高效执行DML操作
- 查询半结构化数据
- 巧妙提升Hive的性能
- 了解Hive的安全性及发展趋势

目录

前言 阅读
致谢 阅读
第1章 为Hive打好基础:Hadoop  阅读
第2章 Hive简介
第3章 Hive架构
第4章 Hive表DDL
第5章 数据操作语言
第6章 将数据装载到Hive
第7章 查询半结构化数据
第8章 Hive分析
第9章 Hive性能调优
第10章 Hive的安全性
第11章 Hive的未来
附录A 建立大数据团队
附录B Hive函数

作者介绍

斯科特·肖(Scott Shaw)
Hortonworks公司高级解决方案工程师,曾为微软公司的商业智能项目担任顾问,拥有近20年的数据管理经验。作为演讲者和培训师,他致力于普及分布式计算、大数据概念、商业智能、Hive和Hadoop。

安德烈亚斯·弗朗索瓦·弗穆尔恩(Andreas François Vermeulen)
集数据科学家、数据仓库架构师、博士研究员、企业顾问等角色于一身,曾获“英国数据科学技术先锋”称号,广泛涉足数据工程、商业智能、云架构、深度学习等多个领域。

安库尔·古普塔(Ankur Gupta)
Hortonworks公司高级解决方案工程师,曾在Oracle公司担任顾问,有多年从事数据架构师和Oracle数据库管理员的经验,著有Oracle GoldenGate 11g Complete Cookbook。

戴维·杰鲁姆加德(David Kjerrumgaard)
Streamlio公司解决方案架构主管,曾是Hortonworks公司的系统架构师和数据流实践主管,拥有Certified Developer for Apache Hadoop认证,精通Hive、Kafka、Spark、Storm等技术。
  • 什么时候才能翻译出版呢?
    robin6036  发表于 2018-03-30 09:50:37
    推荐
  • 终于又一本hive的书了
    卡萨诺瓦  发表于 2018-06-18 14:23:56
    推荐
  • 期待
    kynasln  发表于 2018-08-12 13:51:30
    推荐
  • 大概还有多久能出电子版呢?
    消失的影子  发表于 2018-09-21 17:21:46
    推荐
    • 非常抱歉,因为没有电子版权,所以这本书只会有纸质版。

      谢婷婷  发表于 2018-10-25 08:37:56
  • 期待电子版。。。。
    CharlesLi  发表于 2018-10-24 17:15:13
    推荐
    • 非常抱歉,因为没有电子版权,所以这本书只会有纸质版。

      谢婷婷  发表于 2018-10-25 08:37:49
  • 问一下,纸质版具体什么时间能买到?
    robin6036  发表于 2018-10-27 10:33:44
    推荐
    • 您好!目前正在印刷,预计11月上架。

      谢婷婷  发表于 2018-10-29 08:45:41
  • 你好,为什么随书下载的文件夹中.csv测试文件是空的?
    test20999  发表于 2018-12-25 20:21:48
    推荐
    • 您好,请告诉我具体的文件名,我查一下。

      谢婷婷  发表于 2018-12-26 08:45:41
    • @谢婷婷 文件路径如下 e3849dc5-f67c-4242-9179-db6ac2672705/ESM Ch 5 and 8 ExampleData/datawarehouse/00rawdata

      test20999  发表于 2018-12-26 09:17:10
    • @test20999 这个目录底下的文件用了Git LFS存储大文件,所以直接打开只显示如下所示的内容。
      version https://git-lfs.github.com/spec/v1
      oid sha256: xxx
      size: xxx
      您试试用Git LFS命令打开。

      谢婷婷  发表于 2018-12-26 09:47:30
    • 哦哦,直接去github下载就好了.
      https://github.com/apress/practical-hive

      test20999  发表于 2018-12-26 14:42:17
    • @test20999 谢谢分享您的解决办法。:)

      谢婷婷  发表于 2018-12-27 08:27:56