图分析可以揭示复杂系统和大规模网络的运作机制,图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快...
本书提供了一个框架,从整体上介绍与大数据项目开发相关的基本概念,帮助读者评估大数据项目,理解成功的现代数据项目...
本书结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵...
本书是使用Spark进行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近...
本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍...
本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金...
本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具—...
本书介绍了Spark的基础知识,从利用Spark API来载入和处理数据,到将数据作为多种机器学习模型的输入。...
数据科学家每天的工作流程是什么?数据科学的学习路径是什么?在本期《码农》中,你将听到来自数据科学家们的回答。除...
![enter image description here][1] OpenCloud 2015大会:4月16—18日 地点:国家会议中心 详情点击: [http://occ.csdn.net/][3]。 2015年,云计算已经成为IT技术和服务领域新常态。IT基础设…...
Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks Cloud的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负…...
董飞,Coursera数据工程师。曾先后在创业公司酷迅,百度基础架构组,Amazon 云计算部门,LinkedIn担任高级工程师,负责垂直搜索,百度云计算平台研发和广告系统的架构。董飞本科毕业于南开大学,硕士毕业于杜克大学计算机系。他在知乎上分享过多个引起强烈反响的问答,其中包…...
连城,Databricks工程师,Apache Spark committer。《Erlang/OTP并发编程实战》与《Erlang并发编程(第一篇)》译者。目前从事Apache… ...
Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks云的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负责Goog…...
![enter image description here][1] 2014年亚太地区规格最高的Spark技术盛会! 面向大数据、云计算开发者、技术爱好者的饕餮盛宴! 云集国内外Spark技术领军人物及灵魂人物! 技术交流、应用分享、源码研究、商业案例探询! 大会规模 …...
Holden Karau是IBM首席软件工程师,负责改进Apache Spark并协助开发者向Spark贡献代码。Holden曾是Databricks的软件开发工程师,负责Spark和Databricks Cloud的后端开发。她曾在Google和亚马逊从事软件开发工作,分别负…...
由CSDN主办、CSDN专家顾问团支持的OpenCloud 2015大会即将于4月16日-18日在国家会议中心拉开序幕。本次峰会设置了“2015 OpenStack技术大会”、“2015 Spark技术峰会”、“2015 Container技术峰会”三大峰会及多场深度行业实战培…...
Spark 学习笔记 Spark作为分布式系统框架的后起之秀(据说)各方面都要优于hadoop,有本地缓存,原生支持潮潮的scala, 对python的支持强大到直接可以用ipython notebook 作为交互界面。 还有几个正在开发中的分支框架分别用于机器学习和社交网络…...
数据的爆炸式增长和隐藏在这些数据背后的商业价值催生了一代又一代的大数据处理技术。十年前Hadoop横空出世,Cloudera首席架构师Doug Cutting先生将Google的MapReduce思想用开源的方式实现出来,由此拉开了基于MapReduce的大数据处理框架在企业中…...
大数据是这几年科技和应用领域炙手可热的话题,而Spark又是大数据领域里最活跃的技术。对Spark这个技术,国内研究比较多的是原理和源代码,而许多客户抱怨Spark应用落地难。造成这一现象的一个主要原因是Spark技术比较新,许多应用还处在探索阶段。Cloudera公司作为全球…...
自从在加州大学伯克利分校创立Spark 项目起,我就时常心潮澎湃。不仅因为Spark 可以帮助人们快速构建并行系统,更因为Spark 帮助了越来越多的人使用大规模计算。因此看到这本介绍Spark 高级分析的书,我非常欣慰!该书由数据科学领域四位专家Sandy、Uri、Sean …...
作者:Sandy Ryza 我不想我的人生有很多遗憾。2011年的某个慵懒的时刻,我在正绞尽脑汁地想如何把高难度的离散优化问题最优地分配给计算机集群处理,真是很难想到有什么好方法。我的导师跟我讲,他听说有个叫Spark的新技术,可我基本上没当回事。Spark的想法太好了,让人…...
作者:Sandy Ryza (数据应用)就像香肠,最好别看见它们是怎么做出来的。 ——Otto von Bismarck • 用数千个特征和数十亿个交易来构建信用卡欺诈检测模型 • 向数百万用户智能地推荐数百万产品 • 通过模拟包含数百万金融工具的投资组合来评估金融…...
...
...
...
...
...
...