本书简要而全面地介绍了数据挖掘的理论和方法,为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题︰数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章︰前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。

这本书同时也是国外大学的教材,看译者序中提及许多国内高校也用它作为教材。因此这本书讲原理比较多。比较透彻,充满了数学符号和公式。详细讲述了分类、关联分析、聚类分析三种数据挖掘算法的原理。我发现有些数据挖掘的参数在微软的帮助文档中没说明白,看这本书说的比较清楚。我想看的是能指导实际的数据挖掘操作的书,因此对书中的公式基本跳过。只看了看书中讲到的算法解决的各种问题及其思路。

总之,是非常好的一本书,建议初学者购买,通俗易懂,这是一本偏理论的,配合实践型的《机器学习实战》 效果更佳。