图书介绍
数据流分类【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- 胡学钢,李培培,张玉红,吴信东著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302405993
- 出版时间:2015
- 标注页数:386页
- 文件大小:54MB
- 文件页数:401页
- 主题词:数据采集-研究
PDF下载
下载说明
数据流分类PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
引言篇3
第1章 数据挖掘3
1.1 KDD定义和过程3
1.2 数据挖掘的概念和任务5
1.3 数据挖掘中的十大算法6
1.3.1 C4.5 算法6
1.3.2 k-Means算法6
1.3.3 SVM算法7
1.3.4 Apriori算法8
1.3.5 EM算法8
1.3.6 PageRank算法9
1.3.7 AdaBoost算法9
1.3.8 kNN算法10
1.3.9 Naive Bayes算法10
1.3.10 CART算法11
1.4 数据挖掘中的应用热点11
1.5 小结12
参考文献13
第2章 数据流挖掘15
2.1 背景15
2.2 数据流的应用领域及定义16
2.3 数据流处理的理论基础与挖掘技术17
2.3.1 基于数据的方法18
2.3.2 基于任务的方法19
2.4 数据流挖掘的挑战与任务19
2.4.1 传统数据挖掘面临的挑战20
2.4.2 数据流挖掘的挑战21
2.4.3 数据流的挖掘任务22
2.5 小结25
参考文献25
第3章 数据流分类的关键研究问题28
3.1 引言28
3.2 概念描述模型与大纲数据提取问题29
3.2.1 概念描述模型29
3.2.2 数据流大纲的提取方法与策略30
3.3 数据流的概念漂移检测问题31
3.3.1 概念漂移的基础知识31
3.3.2 概念漂移的处理方法33
3.3.3 研究进展35
3.3.4 技术方案37
3.4 噪音数据流问题38
3.4.1 问题描述38
3.4.2 研究进展与技术方案39
3.5 数据分布不平衡问题39
3.5.1 问题描述39
3.5.2 不平衡数据分布的处理方法41
3.5.3 研究进展44
3.5.4 技术方案45
3.6 不完全标记数据流分类问题45
3.6.1 问题描述45
3.6.2 不完全标记数据的处理方法46
3.6.3 研究进展47
3.6.4 技术方案48
3.7 数据流的特征高维稀疏问题50
3.7.1 问题描述50
3.7.2 研究进展与技术方案50
3.8 数据流分类的评价体系51
3.8.1 问题描述51
3.8.2 概念漂移检测方法的评估指标52
3.8.3 数据流分类评估方法52
3.8.4 设计方案53
3.9 本章小结53
参考文献54
基 础 篇65
第4章 分类模型与方法65
4.1 分类的基本知识65
4.2 分类模型的评估方法65
4.3 决策树模型66
4.3.1 传统的决策树模型66
4.3.2 随机决策树模型70
4.4 Bayes模型73
4.4.1 贝叶斯分类的一般原理73
4.4.2 常见的贝叶斯分类模型74
4.5 其他分类模型77
4.5.1 神经网络77
4.5.2 概念格77
4.5.3 粗糙集合79
4.6 集成方法82
4.6.1 集成分类的基本知识82
4.6.2 经典的集成分类方法83
参考文献84
第5章 特征选择88
5.1 研究背景及意义88
5.2 特征选择概述90
5.2.1 特征选择的相关概念90
5.2.2 特征选择的过程91
5.2.3 特征选择的分类95
5.3 经典特征选择方法概述97
5.3.1 Relief方法98
5.3.2 信息熵方法98
5.3.3 粗糙集合方法99
5.3.4 遗传算法100
5.3.5 One-R方法101
5.3.6 LARS算法102
5.4 特征选择面临的挑战104
参考文献104
专题 篇111
第6章 数据流的集成分类方法研究111
6.1 引言111
6.2 数据流分类的集成策略111
6.2.1 WE集成方法112
6.2.2 AP集成方法113
6.2.3 WE与AP混合集成方法113
6.2.4 基于WE的混合集成方法114
6.3 基于决策树模型的集成分类方法122
6.3.1 基于UFFT的集成分类方法123
6.3.2 基于随机决策树的集成分类方法130
6.4 本章小结148
参考文献149
第7章 数据流中概念漂移检测与分类问题研究152
7.1 引言152
7.2 基于增量式决策树的数据流概念漂移检测与分类方法153
7.2.1 CVFDT系列数据流概念漂移检测与分类方法153
7.2.2 RDT系列数据流概念漂移检测与分类方法157
7.3 面向不同漂移特征的概念漂移数据流分类算法158
7.3.1 基于C4.5 和Naive Bayes混合模型的概念漂移数据流分类算法158
7.3.2 基于变体RDT模型的概念漂移数据流检测与分类方法165
7.3.3 CDRDT算法:一种快速的数据流概念漂移检测与分类算法175
7.3.4 基于双层窗口的概念漂移数据流分类算法190
7.4 本章小结198
参考文献198
第8章 不完全标记数据流分类问题研究205
8.1 引言205
8.2 不完全标记数据流的处理技术206
8.2.1 基于k-Means与增量式决策树的模型207
8.2.2 基于k-Modes与增量式决策树的模型213
8.3 不完全标记数据流中的概念漂移检测219
8.3.1 研究现状220
8.3.2 基于聚类概念簇差异的概念漂移检测机制222
8.3.3 实验结果与分析227
8.4 不完全标记数据流中的重现概念漂移检测229
8.4.1 研究现状229
8.4.2 基于聚类概念簇差异的重复再现概念检测机制231
8.4.3 实验结果与分析234
8.5 算法框架与实验分析237
8.5.1 SUN算法框架237
8.5.2 SUN算法的实验结果与分析238
8.5.3 REDLLA算法框架240
8.5.4 REDLLA算法的实验结果与分析241
8.6 不完全标记数据流分类任务中的开放性问题245
8.7 本章小结246
参考文献246
第9章 面向应用数据的特征降维方法研究251
9.1 引言251
9.2 文本分类中的特征降维252
9.2.1 经典文本特征降维算法254
9.2.2 基于语义信息的特征降维方法257
9.3 基于本体的特征降维算法261
9.3.1 相关定义261
9.3.2 算法框架263
9.3.3 算法技术细节264
9.3.4 实验结果与分析266
9.4 基于迭代Lasso的肿瘤分类信息基因选择方法278
9.4.1 引言278
9.4.2 方法GSIL系统框架280
9.4.3 实验结果与分析284
9.4.4 小结291
9.5 流环境下实时的特征降维方法291
9.5.1 引言291
9.5.2 IV指标定义293
9.5.3 基于IV指标的特征选择方法FS-IV296
9.5.4 FS-IV的实验结果及分析297
9.5.5 FS-IV在入侵检测数据流中的应用300
9.5.6 FS-IV在网络交易数据流中的应用303
9.6 本章小结305
参考文献306
实验资源篇315
第10章 数据流分类算法实验工具包ETDSv1.0315
10.1 引言315
10.2 软件的配置、运行与功能316
10.2.1 软件的配置与运行316
10.2.2 软件功能317
10.3 数据生成器318
10.3.1 视图界面中数据生成器主菜单319
10.3.2 数据库两大生成器菜单功能介绍319
10.4 SRMTDS算法322
10.4.1 SRMTDS算法参数设定菜单322
10.4.2 SRMTDS算法特征数据库读取与算法运行菜单326
10.5 SRMTCD(MSRT)算法328
10.5.1 SRMTCD(MSRT)算法参数设定菜单328
10.5.2 SRMTCD(MSRT)算法特征数据库读取与算法运行菜单331
10.6 EDT算法333
10.6.1 EDT算法参数设定菜单334
10.6.2 EDT算法特征数据库读取与算法运行菜单337
10.7 EDTC算法340
10.7.1 EDTC算法参数设定菜单340
10.7.2 EDTC算法特征数据库读取与算法运行菜单342
10.8 CDRDT算法345
10.8.1 CDRDT算法参数设定菜单345
10.8.2 CDRDT算法特征数据库读取与算法运行菜单347
10.9 DWCDS算法349
10.9.1 DWCDS算法参数设定菜单349
10.9.2 DWCDS算法特征数据库读取与算法运行菜单351
10.10 附录353
10.10.1 数据流实验工具算法布局图353
10.10.2 数据流分类算法运行流程图353
第11章 经典的数据流分类算法实验工具355
11.1 VFML355
11.1.1 VFDTc算法355
11.1.2 CVFDT算法358
11.2 MOA364
11.2.1 MOA的界面操作365
11.2.2 MOA命令行使用方法375
参考文献377
第12章 数据流分类算法常用的实验数据集378
12.1 非概念漂移数据流378
12.1.1 合成数据集378
12.1.2 真实数据集378
12.2 概念漂移数据集379
12.2.1 合成数据集379
12.2.2 真实数据集381
参考文献384
热门推荐
- 3730543.html
- 348732.html
- 3624301.html
- 856897.html
- 2537369.html
- 404432.html
- 3546801.html
- 1952747.html
- 1242837.html
- 2883549.html
- http://www.ickdjs.cc/book_2145118.html
- http://www.ickdjs.cc/book_1317879.html
- http://www.ickdjs.cc/book_799022.html
- http://www.ickdjs.cc/book_1084702.html
- http://www.ickdjs.cc/book_3016510.html
- http://www.ickdjs.cc/book_2739787.html
- http://www.ickdjs.cc/book_3694849.html
- http://www.ickdjs.cc/book_1273644.html
- http://www.ickdjs.cc/book_1526377.html
- http://www.ickdjs.cc/book_2093946.html