机器学习实战
117推荐 收藏
89.2K阅读
图灵程序设计丛书

机器学习实战

Peter Harrington (作者) 李锐 , 李鹏 , 曲亚东 , 王斌 (译者)
机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。

本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

读者好评:
“易学易懂,用处很大。”
—Alexandre Alves,Oracle CEP的架构师

“精心织构的代码完美地诠释出机器学习的核心要义。”
—Patrick Toohey,Mettler-Toledo Hi-Speed软件工程师

“实例很棒!可用于任何领域!”
—John Griffin,Hibernate Search in Action一书的合作者

“叙述循序渐进,巧妙地阐述了算法之间的差异。”
—Stephen McKamey,Isomer Innovations技术实践总监

输入“周末读书”优惠码

《Python数据处理》

电子书限时直减20

电子书
¥39.99
格式
mobi   pdf

纸质书
¥62.10 ¥69.00

出版信息

  • 书  名机器学习实战
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 傅志红
  • 出版日期2013-06-05
  • 书  号978-7-115-31795-7
  • 定  价69.00 元
  • 页  数332
  • 印刷方式黑白
  • 开  本16开
  • 出版状态上市销售
  • 原书名Machine Learning in Action
  • 原书号978-1617290183

同系列书

  • HTTP权威指南

    David Gourley   Brian Totty   Marjorie Sayer   Sailu Reddy   Anshu Aggarwal   陈涓   赵振平   译

    本书是HTTP及其相关核心Web技术方面的权威著作,主要介绍了Web应用程序是如何工作的,核心的因特网协议如何...

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详细地阐述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • Web性能权威指南

    Ilya Grigorik   李松峰   译

    本书作者是世界顶尖的Web性能工程师,他在书中深入浅出地讲解并演示了针对TCP、UDP和TLS协议的性能优化最...

本书特色

使用Python阐述机器学习概念
介绍并实现机器学习的主流算法
面向日常任务的高效实战内容

目录

版权声明 阅读
献词 阅读
译者序 阅读
前言 阅读
致谢 阅读
关于本书 阅读
关于作者 阅读
关于封面 阅读
第一部分 分类 阅读
第1章 机器学习基础 阅读
第2章 k-近邻算法
第3章 决策树
第4章 基于概率论的分类方法:朴素贝叶斯 阅读
第5章 Logistic回归
第6章 支持向量机
第7章 利用AdaBoost元算法提高分类性能
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
第9章 树回归
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标注数据分组
第11章 使用Apriori算法进行关联分析
第12章 使用FP-growth算法来高效发现频繁项集
第四部分 其他工具
第13章 利用PCA来简化数据
第14章 利用SVD简化数据
第15章 大数据与MapReduce
附录A Python入门
附录B 线性代数
附录C 概率论复习
附录D 资源

作者介绍

作者简介
Peter Harrington 拥有电气工程学士和硕士学位,他曾经在美国加州和中国的英特尔公司工作7年。Peter拥有5项美国专利,在三种学术期刊上发表过文章。他现在是Zillabyte公司的首席科学家,在加入该公司之前,他曾担任2年的机器学习软件顾问。Peter在业余时间还参加编程竞赛和建造3D打印机。

译者简介
李锐,博士,中科院信息工程研究所助理研究员,研究兴趣为信息检索、机器学习及社交网络分析。
李鹏,博士,中科院信息工程研究所助理研究员,研究兴趣为信息检索、机器学习及社交网络分析。
王斌,博士,博士生导师,中科院计算技术研究所副研究员,中科院信息工程研究所客座研究员,研究兴趣为信息检索、社交网络分析及自然语言处理,《信息检索导论》、《大数据:互联网大规模数据挖掘与分布式处理》译者。
曲亚东,中科院计算技术研究所博士,在信息安全、视频监控等领域均主持过数千万投资的项目。希望能通过本书帮助大家进入机器学习领域。热心助人,有求会应,新浪微博:@大嘴啃四方。

相关文章

  • 早点上市啊 好期待啊。研究生也读这个了
    Tio  发表于 2013-04-28 08:16:59
    推荐
  • 2013-11-10 10:43 P22,datingDataMat, datingLabels = kNN.file2matrix('datingTestSet.txt')

    这句是错的,datingTestSet.txt文件格式不符合file2matrix函数所需,正确的应该是datingTestSet2.txt这个文件。http://www.manning.com/pharrington/excerpt_errata.html原版出版社的官方已经纠正了这个问题。 (正在咨询作译者)

    看来译者不理你们了
    lu4nx  发表于 2014-01-13 16:51:30
    推荐
    • 主要是python不能像R一样用factor来处理离散型变量 略蛋疼

      RogerChen  发表于 2014-01-21 18:02:19
    • 恩,不过这里是文件名写错了:)

      lu4nx  发表于 2014-01-23 11:25:39
    • 确实 到现在还没修复

      ArtsCrafts  发表于 2014-06-26 20:19:58
  • PDF 已更新所有勘误(2014-1-7)
    图灵编辑部  发表于 2014-04-21 15:32:11
    推荐
  • 什么时候能出版呢?望穿秋水了~
    jarvis1988  发表于 2012-05-02 18:06:49
    推荐
    • 6月份能上市了。

      丁晓昀  发表于 2013-04-24 10:33:57
  • 同问会出电子版吗
    ian027  发表于 2013-06-06 16:07:10
    推荐
    • 暂时不会。未获授权。

      武卫东  发表于 2013-06-07 16:38:24
  • 电子书下载到一半,下载不了了。
    ArtsCrafts  发表于 2014-06-25 00:05:22
    推荐
    • Safari和Chrome下测试均出现这种情况,经续传后(在Chrome中是重新下载)得以正常下载。

      李鑫  发表于 2014-06-25 00:16:11
  • 书中为啥没给原始数据集?这样如何跑代码?比如第21页的约会数据集,不知道这个数据集长什么样。。。自己编的数据集跑代码有错误
    1064431086  发表于 2015-10-12 10:09:19
    推荐
    • 好吧,我错啦,数据集在随书下载里面有。。。

      1064431086  发表于 2015-10-12 10:16:10
    • 数据集我也是找了好长时间呀,弄得我还弄了个国外vpn 去下载

      一样的防  发表于 2017-08-14 21:04:51
    • @一样的防 请问您能发一份数据集给我吗?一直没有找到数据集在哪?

      neverMark  发表于 2017-11-02 14:52:24
    • @一样的防 邮箱811646900@qq.com

      neverMark  发表于 2017-11-02 14:52:57
  • 请问下各位大神,我Logistic回归那章对于梯度上升优化算法的思想理解的还不是很透彻,有没有哪本书有详细讲解梯度上升优化算法的思想的?(记得高数有将梯度,但这个梯度上升优化算法的思想还真不知道哪本教材里面会讲。。。)
    1064431086  发表于 2015-11-03 17:27:32
    推荐
    • 可以去coursera看看Andrew Ng的课 讲的很清楚

      BlackRiver  发表于 2017-03-31 15:14:06
  • 一定要结合 Andrew Ng 的公开课和大量 Blog 来学习,否则从梯度上升还是就已经不可能看懂了。而且建议先学理论部分,然后再看《实战》中的实践代码。
    bachue  发表于 2016-12-28 16:28:36
    推荐
    • 梯度下降 Ng已经讲的言简意赅了

      BlackRiver  发表于 2017-03-31 15:13:32
  • 会有电子版吗,请问
    ian027  发表于 2013-05-21 08:45:54
    推荐
  • 期待电子版~
    假装纯情  发表于 2013-06-04 15:31:00
    推荐
  • 前几天刚买的,还不错
    李岩哲  发表于 2013-07-27 16:22:23
    推荐
  • 请问电子书是中文版的么?
    尖叫书生  发表于 2013-07-29 14:35:08
    推荐
  • 书中的某些代码在Python2.7上跑不通
    尖叫书生  发表于 2013-07-30 15:23:03
    推荐
  • pdf电子书能不能更新一下,还是最早的版本。这么多勘误项目,难道都需要读者自己标记啊。。。
    张崇明  发表于 2013-09-22 17:44:07
    推荐