大数据:互联网大规模数据挖掘与分布式处理(第2版)
4推荐 收藏
11.1K阅读

大数据:互联网大规模数据挖掘与分布式处理(第2版)

Jure Leskovec , Anand Rajaraman , Jeffrey David Ullman (作者) 王斌 (译者)
本书源自作者在斯坦福大学教授的“海量数据挖掘”(CS246: Mining Massive Datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。

众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍了实践中行之有效的数据处理算法,是在校学生和相关从业人员的必备读物。主要内容包括:

分布式文件系统以及MapReduce工具;
相似性搜索;
数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
搜索引擎技术,如谷歌的PageRank;
频繁项集挖掘;
大规模高维数据集的聚类算法;
Web应用中的关键问题——广告管理和推荐系统;
社会网络图挖掘;
降维处理,如SVD分解和CUR分解;
大规模机器学习。
本书配套网站提供了英文版初稿及相关资料的链接:http://www.mmds.org/。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

纸质书
¥62.41 ¥79.00

出版信息

  • 书  名大数据:互联网大规模数据挖掘与分布式处理(第2版)
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版日期2015-07-13
  • 书  号978-7-115-39525-2
  • 定  价79.00 元
  • 页  数388
  • 印刷方式黑白
  • 开  本16开
  • 出版状态暂时缺货
  • 原书名Mining of Massive Datasets
  • 原书号978-1107077232

目录

译 者 序 阅读
前  言 阅读
第1章 数据挖掘基本概念 阅读
第2章 MapReduce及新软件栈
第3章 相似项发现
第4章 数据流挖掘
第5章 链接分析
第6章 频繁项集
第7章 聚类
第8章 Web广告
第9章 推荐系统
第10章 社会网络图挖掘
第11章 降维处理
第12章 大规模机器学习

作者介绍

Jure Leskovec 斯坦福大学计算机科学系助理教授,研究方向是大型社交和信息网络的数据挖掘。他的研究成果获得了很多奖项,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,还获得了很多最佳论文奖,同时也被《纽约时报》《华尔街日报》《华盛顿邮报》《麻省理工科技评论》《连线》、NBC、BBC等流行的社会媒体刊载。他还创建了斯坦福网络分析平台(SNAP,http://snap.stanford.edu)。Twitter账号是@jure。

Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman的职业生涯非常成功:1996年创办Junglee公司,两年后被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司于2011年被沃尔玛集团收购,Rajaraman被聘为沃尔玛负责全球电子商务业务的高级副总裁。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。Twitter账号是@anand_raj。

Jeffrey David Ullman 美国国家工程院院士,计算机科学家。早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD创新奖、高德纳奖、冯诺依曼奖等多项科研大奖;他是“龙书”《编译原理》、数据库名著《数据库系统实现》等多部经典著作的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第二作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

大家也喜欢

  • Python科学计算最佳实践:SciPy指南

    [澳]胡安•努内兹-伊格莱西亚斯   [美]斯特凡•范德瓦尔特   [澳]哈丽雅特•达士诺   陈光欣   译

    本书旨在介绍开源的Python算法库和数学工具包SciPy。近年来,基于NumPy和SciPy的完整生态系统迅...

  • Python社会媒体挖掘

    [意] 马尔科·邦扎尼尼   陈小莉   陶俊杰   译

    本书共分为9章,从社会媒体API、数据挖掘技巧和Python的数据科学工具这3个主题进行阐释。主要内容包括:如...

  • 数据挖掘与分析:概念与算法

    Mohammed J. Zaki   Wagner Meira Jr.   吴诚堃   译

    本书是专注于数据挖掘与分析的基本算法的入门图书,内容分为数据分析基础、频繁模式挖掘、聚类和分类四个部分,每一部...

  • 社会媒体挖掘

    Reza Zafarani   Mohammad Ali Abbasi   Huan Liu   刘挺   秦兵   赵妍妍   译

    “这本讲述社会媒体的书结构非常合理,对学术界和产业界来说十分有用。该书以清晰易懂的方式全面地讲述了社会网络分析...

  • 出电子版不?
    旁观者  发表于 2015-06-17 17:02:29
    推荐
  • 电子版,电子版,电子版....
    不良人  发表于 2016-08-11 08:47:49
    推荐
  • 有没有人给换这本书啊
    Actimermao  发表于 2017-11-23 22:29:50
    推荐
  • 给银子,求这本书
    Actimermao  发表于 2017-11-23 22:30:05
    推荐
  • 电子版
    Leeyon  发表于 2018-11-19 01:02:57
    推荐