机器学习实战
133推荐 收藏
155.1K阅读
图灵程序设计丛书

机器学习实战

Peter Harrington (作者) 李锐 , 李鹏 , 曲亚东 , 王斌 (译者)
本书Python 3代码,请见https://github.com/pbharrin/machinelearninginaction3x,也可在社区本页下载
机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。

本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

读者好评:
“易学易懂,用处很大。”
—Alexandre Alves,Oracle CEP的架构师

“精心织构的代码完美地诠释出机器学习的核心要义。”
—Patrick Toohey,Mettler-Toledo Hi-Speed软件工程师

“实例很棒!可用于任何领域!”
—John Griffin,Hibernate Search in Action一书的合作者

“叙述循序渐进,巧妙地阐述了算法之间的差异。”
—Stephen McKamey,Isomer Innovations技术实践总监
电子书
¥39.99
格式
mobi   pdf

纸质书
¥54.51 ¥69.00

出版信息

  • 书  名机器学习实战
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 傅志红
  • 出版日期2013-06-05
  • 书  号978-7-115-31795-7
  • 定  价69.00 元
  • 页  数332
  • 印刷方式黑白
  • 开  本16开
  • 出版状态上市销售
  • 原书名Machine Learning in Action
  • 原书号978-1617290183

同系列书

  • JavaScript高级程序设计(第4版)

    [美]马特·弗里斯比(Matt Frisbie)   李松峰   译

    本书是JavaScript经典图书的新版。第4版涵盖ECMAScript 2019,全面、深入地介绍了Java...

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

本书特色

使用Python阐述机器学习概念
介绍并实现机器学习的主流算法
面向日常任务的高效实战内容

目录

版权声明 阅读
献词 阅读
译者序 阅读
前言 阅读
致谢 阅读
关于本书 阅读
关于作者 阅读
关于封面 阅读
第一部分 分类 阅读
第1章 机器学习基础 阅读
第2章 k-近邻算法 阅读
第3章 决策树 阅读
第4章 基于概率论的分类方法:朴素贝叶斯
第5章 Logistic回归
第6章 支持向量机
第7章 利用AdaBoost元算法提高分类性能
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
第9章 树回归
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标注数据分组
第11章 使用Apriori算法进行关联分析
第12章 使用FP-growth算法来高效发现频繁项集
第四部分 其他工具
第13章 利用PCA来简化数据
第14章 利用SVD简化数据
第15章 大数据与MapReduce
附录A Python入门
附录B 线性代数
附录C 概率论复习
附录D 资源

作者介绍

作者简介
Peter Harrington 拥有电气工程学士和硕士学位,他曾经在美国加州和中国的英特尔公司工作7年。Peter拥有5项美国专利,在三种学术期刊上发表过文章。他现在是Zillabyte公司的首席科学家,在加入该公司之前,他曾担任2年的机器学习软件顾问。Peter在业余时间还参加编程竞赛和建造3D打印机。

译者简介
李锐,博士,中科院信息工程研究所助理研究员,研究兴趣为信息检索、机器学习及社交网络分析。
李鹏,博士,中科院信息工程研究所助理研究员,研究兴趣为信息检索、机器学习及社交网络分析。
王斌,博士,博士生导师,中科院计算技术研究所副研究员,中科院信息工程研究所客座研究员,研究兴趣为信息检索、社交网络分析及自然语言处理,《信息检索导论》、《大数据:互联网大规模数据挖掘与分布式处理》译者。
曲亚东,中科院计算技术研究所博士,在信息安全、视频监控等领域均主持过数千万投资的项目。希望能通过本书帮助大家进入机器学习领域。热心助人,有求会应,新浪微博:@大嘴啃四方。

相关文章

  • 请问 书中的数据集在哪下载?
    neverMark  发表于 2017-11-02 14:50:41
    推荐
  • 书中为啥没给原始数据集?这样如何跑代码?比如第21页的约会数据集,不知道这个数据集长什么样。。。自己编的数据集跑代码有错误
    1064431086  发表于 2015-10-12 10:09:19
    推荐
    • 好吧,我错啦,数据集在随书下载里面有。。。

      1064431086  发表于 2015-10-12 10:16:10
    • 数据集我也是找了好长时间呀,弄得我还弄了个国外vpn 去下载

      一样的防  发表于 2017-08-14 21:04:51
    • @一样的防 请问您能发一份数据集给我吗?一直没有找到数据集在哪?

      neverMark  发表于 2017-11-02 14:52:24
    • @一样的防 邮箱811646900@qq.com

      neverMark  发表于 2017-11-02 14:52:57
    • 数据集跟脚本能能发一份给我吗, 757892667@qq.com ,谢谢~

      里中静流  发表于 2017-12-04 23:20:59
    • @里中静流 点开页面右侧“随书下载”,下载本书源代码,其中就有数据集。

      傅志红  发表于 2017-12-05 07:44:03
  • 早点上市啊 好期待啊。研究生也读这个了
    Tio  发表于 2013-04-28 08:16:59
    推荐
  • 2013-11-10 10:43 P22,datingDataMat, datingLabels = kNN.file2matrix('datingTestSet.txt')

    这句是错的,datingTestSet.txt文件格式不符合file2matrix函数所需,正确的应该是datingTestSet2.txt这个文件。http://www.manning.com/pharrington/excerpt_errata.html原版出版社的官方已经纠正了这个问题。 (正在咨询作译者)

    看来译者不理你们了
    lu4nx  发表于 2014-01-13 16:51:30
    推荐
    • 主要是python不能像R一样用factor来处理离散型变量 略蛋疼

      Yuntao Chen  发表于 2014-01-21 18:02:19
    • 恩,不过这里是文件名写错了:)

      lu4nx  发表于 2014-01-23 11:25:39
    • 确实 到现在还没修复

      ArtsCrafts  发表于 2014-06-26 20:19:58
    • 2也是错的,这段代码有问题吧,就是file2maxtrix这个函数?根本循环不下去

      卡恰卡恰  发表于 2018-10-29 16:43:22
  • PDF 已更新所有勘误(2014-1-7)
    图灵编辑部  发表于 2014-04-21 15:32:11
    推荐
  • 代码是哪里下载的啊?半天没找着...
    parsifal  发表于 2017-11-09 19:46:12
    推荐
    • 点开页面右侧的“随书下载”。

      傅志红  发表于 2017-11-10 07:39:36
    • 谢咯 :)

      parsifal  发表于 2017-11-15 14:58:48
  • 这本书是机翻的吧。。。
    Insist_Wu  发表于 2019-04-21 16:30:54
    推荐
  • 什么时候能出版呢?望穿秋水了~
    jarvis1988  发表于 2012-05-02 18:06:49
    推荐
    • 6月份能上市了。

      丁晓昀  发表于 2013-04-24 10:33:57
  • 同问会出电子版吗
    ian027  发表于 2013-06-06 16:07:10
    推荐
    • 暂时不会。未获授权。

      武卫东  发表于 2013-06-07 16:38:24
  • 电子书下载到一半,下载不了了。
    ArtsCrafts  发表于 2014-06-25 00:05:22
    推荐
    • Safari和Chrome下测试均出现这种情况,经续传后(在Chrome中是重新下载)得以正常下载。

      李鑫  发表于 2014-06-25 00:16:11
  • in action系列的书适合了解底层细节的人读,入门的人只能看个大概
    xhn_0032  发表于 2017-11-18 03:13:49
    推荐
  • 在当当买了这本书,结果没有提供脚本跟案例的数据集,问客服说要来这边下载,这边又要付费的,有点无语了,钱还能这么挣的?? 谁有这个数据集跟脚本呢,有的话发一份到我邮箱,感激不尽,757892667@qq.com,再次谢谢~
    里中静流  发表于 2017-12-04 23:08:49
    推荐
  • 作者的python3版本 https://github.com/pbharrin/machinelearninginaction3x
    urumchi  发表于 2017-12-28 15:07:05
    推荐
  • 输入书上的例子很费劲啊,好多都不出结果,初学者也不知道问题出在哪里了。
    zhongtiaoshandefeng  发表于 2018-01-26 17:59:22
    推荐
  • 7.2章节,第一段落, 弱分类器的错误率会高于50%,这句话有误。
    应该是错误率低于50%, 或者准确率高于50%
    uncle_ll  发表于 2020-02-03 19:05:38
    推荐