图书介绍
实用机器学习【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- (美)亨里克·布林克(Henrik Brink),(美)约瑟夫W.理查兹(Joseph W.Richards),(美)马克·弗特罗夫(Mark Fetherolf)著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111569220
- 出版时间:2017
- 标注页数:207页
- 文件大小:36MB
- 文件页数:224页
- 主题词:机器学习
PDF下载
下载说明
实用机器学习PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1部分 机器学习工作流程3
第1章 什么是机器学习3
1.1 理解机器学习3
1.2 使用数据进行决策6
1.2.1 传统方法6
1.2.2 机器学习方法9
1.2.3 机器学习的五大优势12
1.2.4 面临的挑战12
1.3 跟踪机器学习流程:从数据到部署13
1.3.1 数据集合和预处理13
1.3.2 数据构建模型14
1.3.3 模型性能评估16
1.3.4 模型性能优化16
1.4 提高模型性能的高级技巧17
1.4.1 数据预处理和特征工程17
1.4.2 用在线算法持续改进模型18
1.4.3 具有数据量和速度的规模化模型18
1.5 总结19
1.6 本章术语19
第2章 实用数据处理20
2.1 起步:数据收集21
2.1.1 应包含哪些特征22
2.1.2 如何获得目标变量的真实值23
2.1.3 需要多少训练数据24
2.1.4 训练集是否有足够的代表性26
2.2 数据预处理26
2.2.1 分类特征27
2.2.2 缺失数据处理28
2.2.3 简单特征工程31
2.2.4 数据规范化32
2.3 数据可视化33
2.3.1 马赛克图34
2.3.2 盒图35
2.3.3 密度图37
2.3.4 散点图38
2.4 总结38
2.5 本章术语39
第3章 建模和预测40
3.1 基础机器学习建模40
3.1.1 寻找输入和目标间的关系41
3.1.2 寻求好模型的目的42
3.1.3 建模方法类型43
3.1.4 有监督和无监督学习44
3.2 分类:把数据预测到桶中45
3.2.1 构建分类器并预测46
3.2.2 非线性数据与复杂分类49
3.2.3 多类别分类51
3.3 回归:预测数值型数据52
3.3.1 构建回归器并预测54
3.3.2 对复杂的非线性数据进行回归56
3.4 总结57
3.5 本章术语58
第4章 模型评估与优化59
4.1 模型泛化:评估新数据的预测准确性60
4.1.1 问题:过度拟合与乐观模型60
4.1.2 解决方案:交叉验证62
4.1.3 交叉验证的注意事项65
4.2 分类模型评估66
4.2.1 分类精度和混淆矩阵68
4.2.2 准确度权衡与ROC曲线68
4.2.3 多类别分类71
4.3 回归模型评估74
4.3.1 使用简单回归性能指标75
4.3.2 检验残差76
4.4 参数调整优化模型77
4.4.1 机器学习算法和它们的调整参数77
4.4.2 网格搜索78
4.5 总结81
4.6 本章术语82
第5章 基础特征工程83
5.1 动机:为什么特征工程很有用83
5.1.1 什么是特征工程83
5.1.2 使用特征工程的5个原因84
5.1.3 特征工程与领域专业知识85
5.2 基本特征工程过程86
5.2.1 实例:事件推荐86
5.2.2 处理日期和时间特征87
5.2.3 处理简单文本特征89
5.3 特征选择91
5.3.1 前向选择和反向消除93
5.3.2 数据探索的特征选择94
5.3.3 实用特征选择实例95
5.4 总结98
5.5 本章术语98
第2部分 实际应用103
第6章 案例:NYC出租车数据103
6.1 数据:NYC出租车旅程和收费信息103
6.1.1 数据可视化104
6.1.2 定义问题并准备数据107
6.2 建模109
6.2.1 基本线性模型109
6.2.2 非线性分类器111
6.2.3 包含分类特征112
6.2.4 包含日期-时间特征113
6.2.5 模型的启示114
6.3 总结115
6.4 本章术语116
第7章 高级特征工程117
7.1 高级文本特征117
7.1.1 词袋模型117
7.1.2 主题建模119
7.1.3 内容拓展122
7.2 图像特征123
7.2.1 简单图像特征123
7.2.2 提取物体和形状125
7.3 时间序列特征128
7.3.1 时间序列数据的类型128
7.3.2 时间序列数据的预测130
7.3.3 经典时间序列特征131
7.3.4 事件流的特征工程135
7.4 总结135
7.5 本章术语136
第8章 NLP高级案例:电影评论情感预测138
8.1 研究数据和应用场景138
8.1.1 数据集初探139
8.1.2 检查数据139
8.1.3 应用场景有哪些140
8.2 提取基本NLP特征并构建初始模型142
8.2.1 词袋特征143
8.2.2 用朴素贝叶斯算法构建模型144
8.2.3 tf-idf算法规范词袋特征147
8.2.4 优化模型参数148
8.3 高级算法和模型部署的考虑152
8.3.1 word2vec特征152
8.3.2 随机森林模型154
8.4 总结156
8.5 本章术语156
第9章 扩展机器学习流程157
9.1 扩展前需考虑的问题157
9.1.1 识别关键点158
9.1.2 选取训练数据子样本代替扩展性159
9.1.3 可扩展的数据管理系统160
9.2 机器学习建模流程扩展162
9.3 预测扩展165
9.3.1 预测容量扩展166
9.3.2 预测速度扩展166
9.4 总结168
9.5 本章术语169
第10章 案例:数字显示广告170
10.1 显示广告170
10.2 数字广告数据171
10.3 特征工程和建模策略172
10.4 数据大小和形状173
10.5 奇异值分解175
10.6 资源估计和优化177
10.7 建模178
10.8 K近邻算法178
10.9 随机森林算法180
10.10 其他实用考虑181
10.11 总结182
10.12 本章术语183
10.13 摘要和结论183
附录 常用机器学习算法185
名词术语中英文对照187
热门推荐
- 678580.html
- 1156991.html
- 3697060.html
- 3113381.html
- 3145467.html
- 3890863.html
- 3604007.html
- 3853832.html
- 1828641.html
- 2180059.html
- http://www.ickdjs.cc/book_724485.html
- http://www.ickdjs.cc/book_3326135.html
- http://www.ickdjs.cc/book_3372683.html
- http://www.ickdjs.cc/book_584497.html
- http://www.ickdjs.cc/book_60748.html
- http://www.ickdjs.cc/book_2006024.html
- http://www.ickdjs.cc/book_649589.html
- http://www.ickdjs.cc/book_1428827.html
- http://www.ickdjs.cc/book_3198600.html
- http://www.ickdjs.cc/book_3204938.html