序言

被邀请作为美团工程师的代表为本书写篇简单的序言,我深感荣幸。

本书是一本关于机器学习和数据挖掘在真实的业务场景如何落地、如何发挥作用的书。它是美团的算法工程师们利用工作之余的时间,集体创作完成的。作者来自美团公司的各个部门,既包括负责用户画像、文本图像理解这样偏基础的研发部门,也包括广告、搜索以及推荐这样的产品研发团队。本书的写作内容和过程也充分体现了美团工程师团队的气质——踏实务实,同时又热爱学习和分享。

机器学习以及数据挖掘相关技术如今在美团公司内的几乎所有环节和场景都有应用,从直接关系到用户体验的搜索和推荐,再到提高配送人员效率的智能配送和调度算法,以及商家端的广告系统和智能选址等服务,甚至App的bug分类,这些你能想到或者不能想到的机器学习乃至人工智能相关技术都发挥了巨大的价值。当然,我们做的这些工作还远远不够,越是在O2O领域持续工作,我们越能感受到人工智能技术可能给这个行业带来的巨大改变和广阔前景。机器学习、运筹调度、IOT、AR、语音以及视觉感知等所有这些方向,都还有巨大的技术挑战和应用空间等着我们去突破,从而让人们“吃得更好,活得更好”。

和传统的机器学习相关的理论教科书相比,本书侧重于这些理论如何在真实的业务场景落地,所使用的都是美团公司内的真实案例。这也是我们编写本书的初衷。我们注意到在这个人工智能技术成为中国的国家战略的时代,有很多卓越的国内外学者贡献了大量的机器学习和人工智能的理论书籍,但作为第四代工业革命浪潮的代表技术,其在各行各业内的具体应用案例和工程实践也同样重要,而这方面的书籍是相对较少的。希望我们在这本书中的分享能够起到抛砖引玉的作用,同时也能在这方面给广大读者带来一定的收获。

最后,也非常欢迎对本书有任何建议或者意见的读者,联系美团技术团队。机器学习以及人工智能技术,一方面理论还在飞速发展,另一方面新的应用也层出不穷。作为这方面从业者的我们,尤其希望和大家产生交流和碰撞。我们深信,交流和碰撞是促使我们进步的动力。

张锦懋

美团首席科学家

目录

  • 序言
  • 前言
  • 第一部分 通用流程
  • 第1章 问题建模
  • 第2章 特征工程
  • 第3章 常用模型
  • 第4章 模型融合
  • 第二部分 数据挖掘
  • 第5章 用户画像
  • 第6章 POI实体链接
  • 第7章 评论挖掘
  • 第三部分 搜索和推荐
  • 第8章 O2O场景下的查询理解与用户引导
  • 第9章 O2O场景下排序的特点
  • 第10章 推荐在O2O场景中的应用
  • 第四部分 计算广告
  • 第11章 O2O场景下的广告营销
  • 第12章 用户偏好和损失建模
  • 第五部分 深度学习
  • 第13章 深度学习概述
  • 第14章 深度学习在文本领域中的应用
  • 第15章 深度学习在计算机视觉中的应用
  • 第六部分 算法工程
  • 第16章 大规模机器学习
  • 第17章 特征工程和实验平台