数据挖掘导论(英文版)
0推荐 收藏
4.7K阅读
图灵原版计算机科学系列

数据挖掘导论(英文版)

Pang-Ning Tan (作者)
终止销售
本书对数据挖掘进行了全面介绍,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章:前面一章讲述基本概念、代表性算法和评估技术,而后面一章较深入地讨论高级概念和算法。目的是在使读者透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量例子、图表和习题。
本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为从事数据挖掘研究和应用开发工作的技术人员的参考书。
纸质书
¥59.00

其他购买方式?

出版信息

  • 书  名数据挖掘导论(英文版)
  • 系列书名图灵原版计算机科学系列
  • 执行编辑关于本书的内容有任何问题,请联系 傅志红
  • 出版日期2005-12-20
  • 书  号7-115-14144-4
  • 定  价59.00 元
  • 页  数550
  • 开  本16开
  • 出版状态终止销售
  • 原书名Introduction to Data Mining
  • 原书号0-321-32136-7

同系列书

本书特色

与许多其他同类图书不同,本书将重点放在如何用数据挖掘知识解决各种实际问题。
只要求具备很少的预备知识——不需要数据库背景,只需要很少的统计学或数学背景知识。
书中包含大量的图表、综合示例和丰富的习题,并且使用示例、关键算法的简洁描述和习题,尽可能直接地聚焦于数据挖掘的主要概念。
教辅内容极为丰富,包括课程幻灯片、学生课题建议、数据挖掘资源(如数据挖掘算法和数据集)、联机指南(使用实际的数据集和数据分析软件,为本书介绍的部分数据挖掘技术提供例子讲解)。
向采用本书作为教材的教师提供习题解答。

目录

Preface

1 Introduction
1.1 What is Data Mining?
1.2 Motivating Challenges
1.3 The Origins of Data Mining
1.4 Data Mining Tasks
1.5 Scope and Organization of the Book
1.6 Bibliographic Notes
1.7 Exercises

2 Data
2.1 Types of Data
2.2 Data Quality
2.3 Data Preprocessing
2.4 Measures of Similarity and Dissimilarity
2.5 Bibliographic Notes
2.6 Exercises

3 Exploring Data
3.1 The Iris Data Set
3.2 Summary Statistics
3.3 Visualization
3.4 OLAP and Multidimensional Data Analysis
3.5 Bibliographic Notes
3.6 Exercises

4 Classification: Basic Concepts, Decision Trees, and Model Evaluation
4.1 Preliminaries
4.2 General Approach to Solving a Classification Problem
4.3 Decision Tree Induction
4.4 Model Overfitting
4.5 Evaluating the Performance of a Classifier
4.6 Methods for Comparing Classifiers
4.7 Bibliographic Notes
4.8 Exercises

5 Classification: Alternative Techniques
5.1 Rule-Based Classifier
5.2 Nearest-Neighbor Classifiers
5.3 Bayesian Classifiers
5.4 Artificial Neural Network (ANN)
5.5 Support Vector Machine (SVM)
5.6 Ensemble Methods
5.7 Class Imbalance Problem
5.8 Multiclass Problem
5.9 Bibliographic Notes
5.10 Exercises

6 Association Analysis: Basic Concepts and Algorithms
6.1 Problem Definition
6.2 Frequent Itemset Generation
6.3 Rule Generation
6.4 Compact Representation of Frequent Itemsets
6.5 Alternative Methods for Generating Frequent Itemsets
6.6 FP-Growth Algorithm
6.7 Evaluation of Association Patterns
6.8 Effect of Skewed Support Distribution
6.9 Bibliographic Notes
6.10 Exercises

7 Association Analysis: Advanced Concepts
7.1 Handling Categorical Attributes
7.2 Handling Continuous Attributes
7.3 Handling a Concept Hierarchy
7.4 Sequential Patterns
7.5 Subgraph Patterns
7.6 Infrequent Patterns
7.7 Bibliographic Notes
7.8 Exercises

8 Cluster Analysis: Basic Concepts and Algorithms
8.1 Overview
8.2 K-means
8.3 Agglomerative Hierarchical Clustering
8.4 DBSCAN
8.5 Cluster Evaluation
8.6 Bibliographic Notes
8.7 Exercises

9 Cluster Analysis: Additional Issues and Algorithms
9.1 Characteristics of Data, Clusters, and Clustering Algorithms
9.2 Prototype-Based Clustering
9.3 Density-Based Clustering
9.4 Graph-Based Clustering
9.5 Scalable Clustering Algorithms
9.6 Which Clustering Algorithm?
9.7 Bibliographic Notes
9.8 Exercises

10 Anomaly Detection
10.1 Preliminaries
10.2 Statistical Approaches
10.3 Proximity-Based Outlier Detection
10.4 Density-Based Outlier Detection
10.5 Clustering-Based Techniques
10.6 Bibliographic Notes
10.7 Exercises
  • 我个人认为这本书很不错,非常符合我的教学思路。内容编排合理,由浅入深,由数据、分类、关联规则、聚类到异常检测的内容组织很符合学生的学习及认识规律,易于组织教学。且分类、关联、聚类的内容分两章介绍,一章为基本主题,另一章为提高主题,便于教师进行教学内容的组织及选择。我已向请我授课的中科院研究生院广州教学点指定该书作为教材,另外我将在我系本科生课程上推荐此教材。
    cxs  发表于 2006-02-16 08:56:30
    推荐
  • 浏览书的内容后,感觉该书的结构合理,适合作为研究生和高年级本科生的教材。
    cxs  发表于 2006-02-16 09:12:44
    推荐
  • 书不错,就是没有索引。附录省掉页还可以接受,索引省掉就不太好了。
    cyfdecyf  发表于 2008-09-08 18:51:45
    推荐