内容简介
我们产生和收集数据的能力正在快速增长。除了大多数商业、科学和政府事务的日益计算机化会产生数据之外,数码相机、发布工具和条码的广泛应用也会产生数据。在数据收集方面,扫描的文体和图像平台、卫星遥感系统和国际互联网已经使我们的生活被巨大的数据量所包围。这种爆炸性的数据增长促使我们比以往更迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
本书第1版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。但是,自第1版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这一方面进行了加强,增加了多个章节讲述最新的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社群网络数据和多重关系数据。
本书适合作为高等院校计算及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材,同时也可供从事数数据挖掘研究和应用开发工作的相关人员作为必备的参考书。
本书主要特点是:全面实用地论述了从实际业务数据中抽取出的读者需要知道的概念和技术。更新并结合了来自读者的反馈、数据挖掘领域的技术变化以及统计和机器学习方面的更多资料。包含了许多算法和实际示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。
编辑推荐
本书第2版更新和改进了原本已十分丰富和全面的第1版内容,并增添了新的重要课题,例如挖掘流数据、挖掘社群网络和挖掘空间、多媒体和其他复杂数据。本书将是一本适用于数据挖掘和知识发现课程的优秀教材。
--Gregory Piatetsky-Shapiro, KDnuggets的总裁
本书第2版最完整、最全面地讲述了数据挖掘领域的重要知识和技术创新。相比内容已经相当全面的第1版,第2版展示了该领域的最新研究成果,例如挖掘流、时序数据和序列数据以及挖掘空间、多媒体、文本和Web数据。本书是数据挖掘和知识发现领域内所有教师、研究人员、开发人员和用户都必读的一本书。
--Hans-Peter Kriegel, 德国慕尼黑大学
我们产生和收集数据的能力正在快速增长。除了大多数商业、科学和政府事务的日益计算机化会产生数据之外,数码相机、发布工具和条码的广泛应用也会产生数据。在数据收集方面,扫描的文本和图像平台、卫星遥感系统和国际互联网已经使我们的生活被巨大的数据量所包围。这种爆炸性的数据增长促使我们比以往更加迫切地需要新技术和自动化工具来帮助我们将这些数据转换为有用的信息和知识。
本书第1版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著,是一本可读性极佳的教材。它从数据库角度全面系统地介绍了数据挖掘的基本概念、基本方法和基本技术以及数据挖掘的技术研究进展,重点关注其可行性、有用性、有效性和可伸缩性问题。但是,自第1版出版之后,数据挖掘领域的研究又取得了很大的进展,开发出了新的数据挖掘方法、系统和应用。第2版在这一方面进行了加强,增加了多个章节讲述最新的数据挖掘方法,以便能够挖掘出复杂类型的数据,包括流数据、序列数据、图结构数据、社群网络数据和多重关系数据。
本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材,同时也可供从事数据挖掘研究和应用开发工作的相关人员作为必备的参考书。
本书主要特点
●全面实用地论述了从实际业务数据中抽取出的读者需要知道的概念和技术。
●更新并结合了来自读者..
目录
Foreword vii
Preface ix
Chapter1 Introduction
1.1 What Motivated Data Mining? Why Is It Important?
1.2 So, What Is Data Mining?
1.3 Data Mining-On What Kind of Data?
1.3.1 Relational Databases
1.3.2 Data Warehouses
1.3.3 TransactionalDatabases
1.3.4 Advanced Data and Information Systems and Advanced Applications
1.4 Data Mining Functionalities---What Kinds of Patterns Can Be Mined?
1.4.1 Concept/Class Description: Characterization and Discrimination
1.4.2 Mining Frequent Patterns, Associations, and Correlations
1.4.3 Classification and Prediction 24 1.4.4 Cluster&..