大数据:互联网大规模数据挖掘与分布式处理(第2版)
4推荐 收藏
12.7K阅读

大数据:互联网大规模数据挖掘与分布式处理(第2版)

Jure Leskovec , Anand Rajaraman , Jeffrey David Ullman (作者) 王斌 (译者)
本书源自作者在斯坦福大学教授的“海量数据挖掘”(CS246: Mining Massive Datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。

众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍了实践中行之有效的数据处理算法,是在校学生和相关从业人员的必备读物。主要内容包括:

分布式文件系统以及MapReduce工具;
相似性搜索;
数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
搜索引擎技术,如谷歌的PageRank;
频繁项集挖掘;
大规模高维数据集的聚类算法;
Web应用中的关键问题——广告管理和推荐系统;
社会网络图挖掘;
降维处理,如SVD分解和CUR分解;
大规模机器学习。
本书配套网站提供了英文版初稿及相关资料的链接:http://www.mmds.org/。
纸质书
¥62.41 ¥79.00

其他购买方式?

出版信息

  • 书  名大数据:互联网大规模数据挖掘与分布式处理(第2版)
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版日期2015-07-13
  • 书  号978-7-115-39525-2
  • 定  价79.00 元
  • 页  数388
  • 印刷方式黑白
  • 开  本16开
  • 出版状态上市销售
  • 原书名Mining of Massive Datasets
  • 原书号978-1107077232

目录

译 者 序 阅读
前  言 阅读
第1章 数据挖掘基本概念 阅读
第2章 MapReduce及新软件栈
第3章 相似项发现
第4章 数据流挖掘
第5章 链接分析
第6章 频繁项集
第7章 聚类
第8章 Web广告
第9章 推荐系统
第10章 社会网络图挖掘
第11章 降维处理
第12章 大规模机器学习

作者介绍

Jure Leskovec 斯坦福大学计算机科学系助理教授,研究方向是大型社交和信息网络的数据挖掘。他的研究成果获得了很多奖项,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,还获得了很多最佳论文奖,同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《麻省理工科技评论》《连线》、NBC、BBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台(SNAP,http://snap.stanford.edu)。Twitter账号是@jure。

Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman的职业生涯非常成功:1996年创办Junglee公司,两年后被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司于2011年被沃尔玛集团收购,Rajaraman被聘为沃尔玛负责全球电子商务业务的高级副总裁。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。Twitter账号是@anand_raj。

Jeffrey David Ullman 美国国家工程院院士,计算机科学家。早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD创新奖、高德纳奖、冯诺依曼奖等多项科研大奖;他是“龙书”《编译原理》、数据库名著《数据库系统实现》等多部经典著作的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第二作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

大家也喜欢

  • Python数据挖掘入门与实践(第2版)

    罗伯特·莱顿   亦念   译

    本书以实践为宗旨,对数据挖掘进行了详细地入门引导。本书囊括了比赛结果预测、电影推荐、特征提取、好友推荐、破解验...

  • Java数据科学实战

    [美] 迈克尔 • R. 布茹斯托维奇   姜建锦   赵绪营   张岩   译

    本书基于清晰的、面向对象的Java代码,讨论了数据科学研究的一些基本原理。考虑到项目所需的可伸缩性、稳健性以及...

  • Python科学计算最佳实践:SciPy指南

    [澳]胡安•努内兹-伊格莱西亚斯   [美]斯特凡•范德瓦尔特   [澳]哈丽雅特•达士诺   陈光欣   译

    本书旨在介绍开源的Python算法库和数学工具包SciPy。近年来,基于NumPy和SciPy的完整生态系统迅...

  • Python社会媒体挖掘

    [意] 马尔科·邦扎尼尼   陈小莉   陶俊杰   译

    本书共分为9章,从社会媒体API、数据挖掘技巧和Python的数据科学工具这3个主题进行阐释。主要内容包括:如...

  • 数据挖掘与分析:概念与算法

    Mohammed J. Zaki   Wagner Meira Jr.   吴诚堃   译

    本书是专注于数据挖掘与分析的基本算法的入门图书,内容分为数据分析基础、频繁模式挖掘、聚类和分类四个部分,每一部...

  • 出电子版不?
    旁观者  发表于 2015-06-17 17:02:29
    推荐
  • 电子版,电子版,电子版....
    不良人  发表于 2016-08-11 08:47:49
    推荐
  • 有没有人给换这本书啊
    Actimermao  发表于 2017-11-23 22:29:50
    推荐
  • 给银子,求这本书
    Actimermao  发表于 2017-11-23 22:30:05
    推荐
  • 电子版
    Leeyon  发表于 2018-11-19 01:02:57
    推荐