内容简介
本书全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本必读书。
本书第1版曾是受读者欢迎的数据挖掘专著,是一本可读性极佳的教材。第2版充实了数据挖掘领域研究新进展的题材,增加了讲述最新的数据挖掘方法的若干章节。本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材。
编辑推荐
本书全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本必读书。
本书第1版曾是受读者欢迎的数据挖掘专著,是一本可读性极佳的教材。第2版充实了数据挖掘领域研究新进展的题材,增加了讲述最新的数据挖掘方法的若干章节。本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材。
目录
出版者的话
专家指导委员会
中文版序
译者序
序
前言
第1章 引言
1.1 什么激发了数据挖掘,为什么它是重要的
1.2 什么是数据挖掘
1.3 对何种数据进行数据挖掘
1.3.1 关系数据库
1.3.2 数据仓库
1.3.3 事务数据库
1.3.4 高级数据和信息系统与高级应用
1.4 数据挖掘功能—可以挖掘什么类型的模式
1.4.1 概念/类描述:特征化和区分
1.4.2 挖掘频繁模式、关联和相关
1.4.3 分类和预测
1.4.4 聚类分析
1.4.5 离群点分析
1.4.6 演变分析
1.5 所有模式都是有趣的吗
1.6 数据挖掘系统的分类
1.7 数据挖掘任务原语
1.8 数据挖掘系统与数据库系统或数据仓库系统的集成
1.9 数据挖掘的主要问题
1.10 小结
习题
文献注释
第2章 数据预处理
2.1 为什么要预处理数据
2.2 描述性数据汇总
2.2.1 度量数据的中心趋势
2.2.2 度量数据的离散程度
2.2.3 基本描述数据汇总的图形显示
2.3 数据清理
2.3.1 缺失值
2.3.2 噪声数据
2.3.3 数据清理作..