致谢

这是目前为止本书最容易写的部分……

首先,我要感谢Manning出版社的工作人员,尤其是本书的编辑Troy Mott,如果没有他的支持和热情帮助,本书不会出版。我还要感谢Maureen Spencer,她对最终稿进行了润色,和她在一起工作相当愉快。

其次,我要感谢Arizona州立大学的Jennie Si老师,她允许我在未注册的情况下听她的“离散随机系统”课。还要感谢MIT的Cynthia Rudin,他给我推荐了论文“Top 10 Algorithms in Data Mining”(数据挖掘十大算法)1,促成了本书的写作思路。Mark Bauer、Jerry Barkely、Jose Zero、Doug Chang、Wayne Carter以及Tyler Neylon对本书亦有贡献,在此一并感谢。

1 Xindong Wu等,“Top 10 Algorithms in Data Mining”,Journal of Knowledge and Information Systems 14, no. 1 (December 2007)。

特别要感谢在成书过程当中提供珍贵反馈意见的评阅人,他们是:Keith Kim、Franco Lombardo、Patrick Toohey、Josef Lauri、Ryan Riley、Peter Venable、Patrick Goetz、Jeroen Benckhuijsen、Ian McAllister、Orhan Alkan、Joseph Ottinger、Fred Law、Karsten Strøbæk、Brian Lau、Stephen McKamey、Michael Brennan、Kevin Jackson、John Griffin、Sumit Pal、Alex Alves、Justin Tyler Wiley和John Stevenson。

技术校对人员Tricia Hoffman和Alex Ott在本书出版之前对技术内容进行了快速审阅,对于他们的意见和反馈我表示感谢。当阅读书中的代码时,Alex表现得像一个冷血杀手!谢谢他对本书的贡献。

我还要感谢那些通过MEAP购买和阅读早期版本的读者,以及对作者在线论坛做出贡献的人们(甚至是发“钓鱼贴”的用户)。如果没有这些人的帮助,这本书就不是现在这个样子。

我还要感谢我的家庭在写书期间给予的支持。感谢我爱人的鼓励以及在写书期间对我的非规律生活的宽容。

最后,我要感谢硅谷这个伟大的地方,我和我爱人在这里工作、交流思想和情感。

目录

  • 版权声明
  • 献词
  • 译者序
  • 前言
  • 致谢
  • 关于本书
  • 关于作者
  • 关于封面
  • 第一部分 分类
  • 第1章 机器学习基础
  • 第2章 k-近邻算法
  • 第3章 决策树
  • 第4章 基于概率论的分类方法:朴素贝叶斯
  • 第5章 Logistic回归
  • 第6章 支持向量机
  • 第7章 利用AdaBoost元算法提高分类性能
  • 第二部分 利用回归预测数值型数据
  • 第8章 预测数值型数据:回归
  • 第9章 树回归
  • 第三部分 无监督学习
  • 第10章 利用K-均值聚类算法对未标注数据分组
  • 第11章 使用Apriori算法进行关联分析
  • 第12章 使用FP-growth算法来高效发现频繁项集
  • 第四部分 其他工具
  • 第13章 利用PCA来简化数据
  • 第14章 利用SVD简化数据
  • 第15章 大数据与MapReduce
  • 附录A Python入门
  • 附录B 线性代数
  • 附录C 概率论复习
  • 附录D 资源