图书

  • Spark高级数据分析(第2版)

    [美] 桑迪·里扎   [美] 于里·莱瑟森   [英] 肖恩·欧文   [美] 乔希·威尔斯   龚少成   邱鑫   译

    本书是使用Spark进行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近...

  • Spark最佳实践

    本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍...

  • Spark高级数据分析

    Sandy Ryza   Uri Laserson   Sean Owen   Josh Wills   龚少成   译

    本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金...

  • Spark快速大数据分析

    Holden Karau   Andy Konwinski   Patrick Wendell   Matei Zaharia   王道远   译

    本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具—...

  • Spark机器学习

    Nick Pentreath   蔡立宇   黄章帅   周济民   译

    本书介绍了Spark的基础知识,从利用Spark API来载入和处理数据,到将数据作为多种机器学习模型的输入。...

  • 码农·如何成为一位数据科学家(第17期)

    图灵社区出品  

    数据科学家每天的工作流程是什么?数据科学的学习路径是什么?在本期《码农》中,你将听到来自数据科学家们的回答。除...

  • Spark机器学习(第2版)

    [印]拉结帝普•杜瓦   [印]曼普利特•辛格•古特拉   [南非]尼克•彭特里思   蔡立宇   黄章帅   周济民   译

    本书结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。本书基...

  • 袁野 10推荐

    OpenStack、Spark、Container齐聚OpenCloud 2015

    ![enter image description here][1] OpenCloud 2015大会:4月16—18日 地点:国家会议中心 详情点击: [http://occ.csdn.net/][3]。 2015年,云计算已经成为IT技术和服务领域新常态。IT基础设…...

  • 盼盼姐 9推荐

    Coursera数据工程师董飞:硅谷大数据的过去与未来(图灵访谈)

    董飞,Coursera数据工程师。曾先后在创业公司酷迅,百度基础架构组,Amazon 云计算部门,LinkedIn担任高级工程师,负责垂直搜索,百度云计算平台研发和广告系统的架构。董飞本科毕业于南开大学,硕士毕业于杜克大学计算机系。他在知乎上分享过多个引起强烈反响的问答,其中包…...

  • 盼盼姐 9推荐

    连城:大数据场景下的“搔到痒处”和“戳到痛处”(图灵访谈)

    连城,Databricks工程师,Apache Spark committer。《Erlang/OTP并发编程实战》与《Erlang并发编程(第一篇)》译者。目前从事Apache… ...

  • 盼盼姐 9推荐

    IBM美女工程师Holden Karau:寻找友善的人一起共事(图灵访谈)

    Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks Cloud的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负…...

  • 盼盼姐 6推荐

    《Spark快速大数据分析》作者Holden Karau访谈问题有奖征集(图灵访谈)

    Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks云的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负责Goog…...

  • 盼盼姐 2推荐

    [英] IBM美女工程师Holden Karau:寻找友善的人一起共事(图灵访谈)

    Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks Cloud的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负…...

  • 黄思喆 2推荐

    Spark 学习笔记

    Spark 学习笔记 Spark作为分布式系统框架的后起之秀(据说)各方面都要优于hadoop,有本地缓存,原生支持潮潮的scala, 对python的支持强大到直接可以用ipython notebook 作为交互界面。 还有几个正在开发中的分支框架分别用于机器学习和社交网络…...

  • 袁野 2推荐

    2014 Spark亚太峰会

    ![enter image description here][1] 2014年亚太地区规格最高的Spark技术盛会! 面向大数据、云计算开发者、技术爱好者的饕餮盛宴! 云集国内外Spark技术领军人物及灵魂人物! 技术交流、应用分享、源码研究、商业案例探询! 大会规模 …...

  • 袁野 2推荐

    OpenCloud 2015参会者的三大特征

    由CSDN主办、CSDN专家顾问团支持的OpenCloud 2015大会即将于4月16日-18日在国家会议中心拉开序幕。本次峰会设置了“2015 OpenStack技术大会”、“2015 Spark技术峰会”、“2015 Container技术峰会”三大峰会及多场深度行业实战培…...

  • 陈孟寒 推荐

    推 荐 序

    数据的爆炸式增长和隐藏在这些数据背后的商业价值催生了一代又一代的大数据处理技术。十年前Hadoop横空出世,Cloudera首席架构师Doug Cutting先生将Google的MapReduce思想用开源的方式实现出来,由此拉开了基于MapReduce的大数据处理框架在企业中…...

  • 陈孟寒 推荐

    译 者 序

    大数据是这几年科技和应用领域炙手可热的话题,而Spark又是大数据领域里最活跃的技术。对Spark这个技术,国内研究比较多的是原理和源代码,而许多客户抱怨Spark应用落地难。造成这一现象的一个主要原因是Spark技术比较新,许多应用还处在探索阶段。Cloudera公司作为全球…...

  • 陈孟寒 推荐

    自从在加州大学伯克利分校创立Spark 项目起,我就时常心潮澎湃。不仅因为Spark 可以帮助人们快速构建并行系统,更因为Spark 帮助了越来越多的人使用大规模计算。因此看到这本介绍Spark 高级分析的书,我非常欣慰!该书由数据科学领域四位专家Sandy、Uri、Sean …...

  • 陈孟寒 推荐

    前 言

    作者:Sandy Ryza 我不想我的人生有很多遗憾。2011年的某个慵懒的时刻,我在正绞尽脑汁地想如何把高难度的离散优化问题最优地分配给计算机集群处理,真是很难想到有什么好方法。我的导师跟我讲,他听说有个叫Spark的新技术,可我基本上没当回事。Spark的想法太好了,让人…...

  • 刘华 推荐

    大数据时代的电光火石

    课程名称:开源力量公开课第四十九期 - Spark:大数据时代的电光火石 ![enter image description here][1] 报名地址:[http://www.osforce.cn/openclass/65/show?id=ituring][2] 课程背景…...

  • 黄思喆 推荐

    基于树莓派的集群实验(一)--spark on yarn

    基于树莓派的集群实验(一)--spark on yarn 终于有时间尝试集群安装了,可惜没有多余的电脑,手头有树莓派就拿来凑活用了。 本文将具体讲解如何再树莓派上安装hadoop和spark,并与自己本地的mac尝试构建分布式系统集群。 由于树莓派本身性能有限,这篇文章更多的…...

  • 壹佰案例 推荐

    微博如何做到1小时增加一千台服务器应对鹿晗恋情带来的流量暴增

    10月8日中午12点,鹿晗和关晓彤宣布恋情,年近30的我并不关心小鲜肉们的分分合合,但是作为壹佰案例这个软件研发行业自媒体的小编,我更关注因此引发的微博宕机事件。 ![enter image description here][1] 鹿晗公布恋情的微博获得462884次转发…...

  • 开发者头条 推荐

    程序员如何赚钱:我的 10 年赚钱经【4.11 热门分享回顾】

    这是一份昨天在开发者头条上最受大家欢迎的优质文章列表,头条君每日清晨为您送达,不见不散! 昨日最佳 Top 3: 程序员如何赚钱:我的 10 年赚钱经(五) [PHP 异步编程:手把手教你实现 co 与 Koa](h… ...

  • Hive 推荐

    Spark性能优化--数据本地性

    数据本地化目的,只移动计算,不移动数据,避免网络资源浪费。 1.首先了解Application任务执行流程: • 在Spark Application提交后,Driver会根据action算子划分成一个个的job,然后对每一 个job划分成一个个的stage,stage内部…...

  • msup 推荐

    2017年TOP100summit开幕在即, 15位大咖担任联席主席甄选最值得学习的100个研发案例

    从万维网到物联网,从信息传播到人工智能,20年间软件研发行业趋势发生了翻天覆地的变化。大数据、云计算、AI等新兴领域逐渐改变我们的生活方式,Devops、容器、深度学习、敏捷等技术方式和工作理念对软件研发从业者提出更高要求。 由麦思博(msup)有限公司主办的第六届全球软件案…...

  • 陈孟寒 推荐

    第1章:大数据分析

    作者:Sandy Ryza (数据应用)就像香肠,最好别看见它们是怎么做出来的。 ——Otto von Bismarck • 用数千个特征和数十亿个交易来构建信用卡欺诈检测模型 • 向数百万用户智能地推荐数百万产品 • 通过模拟包含数百万金融工具的投资组合来评估金融…...