图书介绍

数据挖掘与知识发现【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

数据挖掘与知识发现
  • 李雄飞,董元方,李军等编著 著
  • 出版社: 北京:高等教育出版社
  • ISBN:9787040304787
  • 出版时间:2010
  • 标注页数:304页
  • 文件大小:31MB
  • 文件页数:317页
  • 主题词:数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘与知识发现PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 引言1

1.2 KDD与数据挖掘2

1.2.1 KDD定义2

1.2.2 KDD过程3

1.2.3 数据库技术发展与数据挖掘4

1.3 数据挖掘的对象与环境5

1.3.1 数据与系统特征5

1.3.2 数据结构6

1.3.3 数据库系统7

1.4 数据挖掘方法与相关领域9

1.4.1 数据挖掘相关领域9

1.4.2 粗糙集10

1.4.3 聚类10

1.4.4 关联规则11

1.4.5 决策树11

1.4.6 模糊集12

1.4.7 规则归纳12

1.4.8 进化计算13

1.5 KDD系统与应用14

本章小结16

习题116

第2章 关联规则17

2.1 引言17

2.2 关联规则基本模型17

2.2.1 关联规则基本模型17

2.2.2 Apriori算法18

2.2.3 LIG算法21

2.2.4 FP算法27

2.3 多级关联规则与多维关联规则30

2.3.1 多级关联规则30

2.3.2 多维关联规则32

2.4 关联规则价值衡量与发展36

2.4.1 规则价值衡量36

2.4.2 基于约束的关联规则38

2.4.3 关联规则新进展39

本章小结41

习题242

第3章 聚类分析43

3.1 聚类分析简介43

3.2 聚类分析中的数据类型45

3.3 划分方法47

3.3.1 k-均值算法47

3.3.2 k-中心点算法48

3.3.3 EM算法49

3.4 层次方法51

3.4.1 凝聚的和分裂的层次聚类51

3.4.2 利用层次方法进行平衡迭代归约和聚类53

3.4.3 利用代表点聚类54

3.4.4 采用动态建模技术的层次聚类算法54

3.5 基于密度的方法57

3.6 基于网格的方法59

3.7 基于模型的聚类方法62

3.8 孤立点分析63

本章小结64

习题364

第4章 决策树66

4.1 引言66

4.2 信息论66

4.2.1 信息传输与数据挖掘66

4.2.2 信息论主要概念67

4.3 ID3算法69

4.4 决策树的剪枝76

4.4.1 预剪枝77

4.4.2 后剪枝77

4.4.3 决策树的性能评价80

4.5 决策树算法的改进80

4.5.1 二叉树决策算法80

4.5.2 按增益比率估值的方法81

4.5.3 按分类信息估值的方法82

4.5.4 按划分距离估值的方法82

4.6 C4.5算法83

4.7 CART算法84

4.8 SLIQ算法86

4.9 决策树与数据预处理87

4.9.1 数据概化与约简87

4.9.2 抽样方法88

4.9.3 维归约及特征子集的选取88

4.9.4 冗余特征子集删除89

4.9.5 离散化处理90

4.9.6 改变数据结构90

4.10 算法改进91

4.10.1 多决策树综合技术91

4.10.2 决策树的增量学习92

本章小结93

习题493

第5章 贝叶斯网络94

5.1 贝叶斯网络基本概念94

5.2 不确定性推理与联合概率分布96

5.3 贝叶斯网络中的独立关系98

5.3.1 条件独立99

5.3.2 有向分离和条件独立100

5.3.3 因果影响独立100

5.3.4 环境独立101

5.4 贝叶斯网络学习102

5.4.1 结构学习102

5.4.2 搜索算法105

5.4.3 基于约束的方法107

5.4.4 参数学习109

5.5 贝叶斯网络分类器110

5.5.1 朴素贝叶斯网络分类器111

5.5.2 半朴素贝叶斯分类器与选择贝叶斯分类器114

5.5.3 树增广朴素贝叶斯网络分类器115

5.5.4 广义朴素贝叶斯网络分类器117

本章小结118

习题5118

第6章 人工神经网络120

6.1 人工神经元及人工神经网络模型120

6.1.1 M-P模型120

6.1.2 人工神经元的形式化描述121

6.1.3 神经网络的分类122

6.1.4 人工神经网络的学习方式123

6.2 前向神经网络123

6.2.1 感知器123

6.2.2 多层前向神经网络的BP算法124

6.2.3 径向基函数神经网络129

6.3 反馈神经网络130

6.3.1 前向神经网络与反馈神经网络的比较130

6.3.2 反馈神经网络模型130

6.3.3 离散型Hopfield神经网络131

6.3.4 连续型Hopfield神经网络133

6.3.5 Boltzmann机134

6.4 自组织竞争神经网络模型135

6.5 基于人工神经网络的数据挖掘138

本章小结138

习题6138

第7章 支持向量机139

7.1 学习机器泛化性能的界139

7.1.1 VC维140

7.1.2 Rn中有向超平面对点的打散141

7.1.3 VC维和参数个数141

7.1.4 通过最小化h最小化界142

7.1.5 实例142

7.1.6 结构风险最小化143

7.2 线性支持向量机143

7.2.1 可分情形143

7.2.2 Karush-Kuhn-Tucker条件145

7.2.3 测试145

7.2.4 非可分情形146

7.3 非线性支持向量机147

7.3.1 硬间隔非线性支持向量机148

7.3.2 软间隔非线性支持向量机148

7.3.3 v-SVM分类器149

7.3.4 处理不平衡数据的加权SVM150

7.3.5 多类别SVM分类150

7.3.6 Mercer条件及Mercer定理151

7.3.7 非线性支持向量机实例151

7.4 支持向量机的VC维152

7.5 支持向量机应用152

7.5.1 手写体数字识别152

7.5.2 文本分类153

7.5.3 生物信息学中的SVM应用154

本章小结156

习题7156

第8章 粗糙集157

8.1 近似空间157

8.1.1 近似空间与不可分辨关系157

8.1.2 知识与知识库158

8.2 近似与粗糙集160

8.2.1 近似与粗糙集的基本概念160

8.2.2 粗糙集的基本性质161

8.3 粗糙集的特征描述162

8.3.1 近似精度162

8.3.2 粗糙集隶属函数163

8.3.3 拓扑特征164

8.4 知识约简164

8.4.1 约简与核164

8.4.2 相对约简和相对核165

8.5 知识的依赖性167

8.6 信息系统168

8.6.1 信息系统的定义168

8.6.2 分辨矩阵与分辨函数169

8.7 决策表170

8.8 决策规则172

8.9 扩展的粗糙集模型173

8.9.1 可变精度粗糙集模型173

8.9.2 相似模型174

本章小结175

习题8175

第9章 模糊集177

9.1 模糊集定义与隶属函数177

9.1.1 模糊集定义与隶属函数177

9.1.2 模糊集合的表示法179

9.2 模糊集的基本运算180

9.3 分解定理与扩展原理182

9.4 模糊集的特征184

9.5 模糊集的度量185

9.5.1 模糊度185

9.5.2 模糊集间的距离186

9.5.3 模糊集的贴近度187

9.6 模糊关系187

9.6.1 模糊关系定义187

9.6.2 模糊关系的运算与性质188

9.6.3 模糊等价关系与模糊相似关系190

9.7 模糊聚类分析190

9.7.1 模糊划分191

9.7.2 模糊相似系数的标定方法191

9.7.3 模糊聚类分析193

9.7.4 传递闭包法195

9.7.5 最大树法197

9.7.6 模糊C-均值聚类198

9.8 模糊集与粗糙集200

本章小节201

习题9201

第10章 模型选择与模型评估202

10.1 模型的过拟合202

10.2 没有天生优越的分类器204

10.3 模型、模型选择和模型评估207

10.4 简单划分和交叉验证210

10.5 自助法211

10.6 Occam剃刀211

10.7 最小描述长度准则212

10.8 信息准则213

10.8.1 Akaike信息准则214

10.8.2 Bayesian信息准则214

10.9 比较分类器的方法215

10.9.1 估计准确率的置信区间215

10.9.2 比较两个模型的性能216

10.9.3 比较两种分类法的性能217

10.10 聚类评估218

10.10.1 假设检验219

10.10.2 聚类评估中的假设检验221

10.10.3 相对准则224

本章小结224

习题10224

第11章 数据预处理与可视化技术225

11.1 数据清理225

11.1.1 填补空缺值225

11.1.2 消除噪声数据226

11.1.3 实现数据一致性227

11.2 数据集成与转换227

11.2.1 数据集成227

11.2.2 数据转换228

11.3 数据归约与浓缩229

11.3.1 数据立方体聚集229

11.3.2 维归约230

11.3.3 数据压缩230

11.3.4 数值归约232

11.4 概念分层235

11.4.1 概念分层的概念235

11.4.2 概念分层的类型236

11.4.3 数值数据的概念分层与离散化236

11.4.4 分类数据的概念分层238

11.5 可视化技术概述238

11.5.1 可视化技术分类239

11.5.2 可视化技术在数据挖掘中的应用241

11.6 过程可视化243

11.7 数据可视化245

11.7.1 折线图245

11.7.2 复合饼图245

11.7.3 散点图247

11.7.4 盒图247

11.7.5 平行坐标法248

11.7.6 圆环分段表示249

11.8 结果可视化250

11.8.1 关联规则251

11.8.2 分类252

11.8.3 聚类255

本章小结255

习题11256

第12章 数据挖掘工具与产品257

12.1 数据挖掘标准257

12.1.1 数据挖掘标准化概述257

12.1.2 数据挖掘过程标准258

12.1.3 数据挖掘接口标准259

12.1.4 数据挖掘的语言标准261

12.1.5 数据挖掘的Web标准265

12.1.6 数据挖掘标准的应用与未来发展趋势266

12.2 数据挖掘工具的介绍268

12.2.1 数据挖掘工具发展过程概述268

12.2.2 数据挖掘工具简介269

12.2.3 WEKA270

12.2.4 SPSS283

12.3 数据挖掘产品分析292

12.3.1 通用数据挖掘产品292

12.3.2 专用挖掘产品293

本章小结294

习题12294

附录 中英文术语对照295

参考文献301

热门推荐