Spark快速大数据分析
24推荐 收藏
31.5K阅读

Spark快速大数据分析

Holden Karau , Andy Konwinski , Patrick Wendell , Matei Zaharia (作者) 王道远 (译者)
本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

电子书
¥29.99
格式
mobi   pdf

纸质书
¥46.61 ¥59.00

出版信息

所属分类

本书特色

如今,所有领域的数据量都在急剧增长。如何才能高效利用这些数据呢?本书介绍了开源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。

本书由Spark开发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。

目录

版权声明 阅读
O'Reilly Media, Inc. 介绍 阅读
推荐序 阅读
译者序 阅读
阅读
前言 阅读
第 1 章 Spark 数据分析导论 阅读
第 2 章 Spark 下载与入门
第 3 章 RDD 编程
第 4 章 键值对操作
第 5 章 数据读取与保存
第 6 章 Spark 编程进阶
第 7 章 在集群上运行 Spark
第 8 章 Spark 调优与调试
第 9 章 Spark SQL
第 10 章 Spark Streaming
第 11 章 基于 MLlib 的机器学习
作者简介和封面介绍

作者介绍

<作者介绍>
Holden Karau是Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。

Andy Konwinski是Databricks联合创始人,Apache Spark项目技术专家,还是Apache Mesos项目的联合发起人。

Patrick Wendell是Databricks联合创始人,也是Apache Spark项目技术专家。他还负责维护Spark核心引擎的几个子系统。

Matei Zaharia是Databricks的CTO,同时也是Apache Spark项目发起人以及Apache基金会副主席。

大家也喜欢

  • Spark机器学习(第2版)

    [印]拉结帝普•杜瓦   [印]曼普利特•辛格•古特拉   [南非]尼克•彭特里思   蔡立宇   黄章帅   周济民   译

    本书结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵...

  • Spark高级数据分析(第2版)

    [美] 桑迪·里扎   [美] 于里·莱瑟森   [英] 肖恩·欧文   [美] 乔希·威尔斯   龚少成   邱鑫   译

    本书是使用Spark进行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近...

  • Spark最佳实践

    本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍...

  • Spark高级数据分析

    Sandy Ryza   Uri Laserson   Sean Owen   Josh Wills   龚少成   译

    本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金...

  • Spark机器学习

    Nick Pentreath   蔡立宇   黄章帅   周济民   译

    本书介绍了Spark的基础知识,从利用Spark API来载入和处理数据,到将数据作为多种机器学习模型的输入。...

相关文章

  • 好吧,图灵看上的书,一定不会差~~~
    Learning Spark: Lightning-Fast Big Data Analytics 好好研究一下去 ~~
    Benedict Jin  发表于 2015-03-09 19:49:01
    推荐
  • 这本挺不错的...
    xringxie  发表于 2015-03-10 23:20:31
    推荐
  • 什么时候才能出呀
    罗宇  发表于 2015-05-19 16:31:17
    推荐
  • 好书,期待
    feng xu  发表于 2015-09-11 18:32:39
    推荐
  • 非常好,对学习大数据计算提供了很大的帮助
    Second Mouse  发表于 2016-02-16 11:42:38
    推荐
  • 挺好的一本书,翻译,逻辑都不错!
    Roliy  发表于 2016-04-13 17:43:45
    推荐
  • 这书不错...,条理清晰, 刚好适合我
    不良人  发表于 2016-08-06 14:14:20
    推荐
  • 好书, 五颗星~
    程超  发表于 2016-08-19 11:14:39
    推荐