图书介绍

Python机器学习基础教程【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

Python机器学习基础教程
  • (德)安德里亚斯·穆勒著;张亮译 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115475619
  • 出版时间:2018
  • 标注页数:285页
  • 文件大小:26MB
  • 文件页数:300页
  • 主题词:软件工具-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python机器学习基础教程PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言1

1.1为何选择机器学习1

1.1.1机器学习能够解决的问题2

1.1.2熟悉任务和数据4

1.2为何选择Python4

1.3 scikit-learn4

1.4必要的库和工具5

1.4.1 Jupyter Notebook6

1.4.2 NumPy6

1.4.3 SciPy6

1.4.4 matplotlib7

1.4.5 pandas8

1.4.6 mglearn9

1.5 Python 2与Python 3的对比9

1.6本书用到的版本10

1.7第一个应用:鸢尾花分类11

1.7.1初识数据12

1.7.2衡量模型是否成功:训练数据与测试数据14

1.7.3要事第一:观察数据15

1.7.4构建第一个模型:k近邻算法16

1.7.5做出预测17

1.7.6评估模型18

1.8小结与展望19

第2章 监督学习21

2.1分类与回归21

2.2泛化、过拟合与欠拟合22

2.3监督学习算法24

2.3.1一些样本数据集25

2.3.2 k近邻28

2.3.3线性模型35

2.3.4朴素贝叶斯分类器53

2.3.5决策树54

2.3.6决策树集成64

2.3.7核支持向量机71

2.3.8神经网络(深度学习)80

2.4分类器的不确定度估计91

2.4.1决策函数91

2.4.2预测概率94

2.4.3多分类问题的不确定度96

2.5小结与展望98

第3章 无监督学习与预处理100

3.1无监督学习的类型100

3.2无监督学习的挑战101

3.3预处理与缩放101

3.3.1不同类型的预处理102

3.3.2应用数据变换102

3.3.3对训练数据和测试数据进行相同的缩放104

3.3.4预处理对监督学习的作用106

3.4降维、特征提取与流形学习107

3.4.1主成分分析107

3.4.2非负矩阵分解120

3.4.3用t-SNE进行流形学习126

3.5聚类130

3.5.1 k均值聚类130

3.5.2凝聚聚类140

3.5.3 DBSCAN143

3.5.4聚类算法的对比与评估147

3.5.5聚类方法小结159

3.6小结与展望159

第4章 数据表示与特征工程161

4.1分类变量161

4.1.1 One-Hot编码(虚拟变量)162

4.1.2数字可以编码分类变量166

4.2分箱、离散化、线性模型与树168

4.3交互特征与多项式特征171

4.4单变量非线性变换178

4.5自动化特征选择181

4.5.1单变量统计181

4.5.2基于模型的特征选择183

4.5.3迭代特征选择184

4.6利用专家知识185

4.7小结与展望192

第5章 模型评估与改进193

5.1交叉验证194

5.1.1 scikit-learn中的交叉验证194

5.1.2交叉验证的优点195

5.1.3分层K折交叉验证和其他策略196

5.2网格搜索200

5.2.1简单网格搜索201

5.2.2参数过拟合的风险与验证集202

5.2.3带交叉验证的网格搜索203

5.3评估指标与评分213

5.3.1牢记最终目标213

5.3.2二分类指标214

5.3.3多分类指标230

5.3.4回归指标232

5.3.5在模型选择中使用评估指标232

5.4小结与展望234

第6章 算法链与管道236

6.1用预处理进行参数选择237

6.2构建管道238

6.3在网格搜索中使用管道239

6.4通用的管道接口242

6.4.1用make_pipeline方便地创建管道243

6.4.2访问步骤属性244

6.4.3访问网格搜索管道中的属性244

6.5网格搜索预处理步骤与模型参数246

6.6网格搜索选择使用哪个模型248

6.7小结与展望249

第7章 处理文本数据250

7.1用字符串表示的数据类型250

7.2示例应用:电影评论的情感分析252

7.3将文本数据表示为词袋254

7.3.1将词袋应用于玩具数据集255

7.3.2将词袋应用于电影评论256

7.4停用词259

7.5用tf-idf缩放数据260

7.6研究模型系数263

7.7多个单词的词袋(n元分词)263

7.8高级分词、词干提取与词形还原267

7.9主题建模与文档聚类270

7.10小结与展望277

第8章 全书总结278

8.1处理机器学习问题278

8.2从原型到生产279

8.3 测试生产系统280

8.4构建你自己的估计器280

8.5下一步怎么走281

8.5.1理论281

8.5.2其他机器学习框架和包281

8.5.3排序、推荐系统与其他学习类型282

8.5.4概率建模、推断与概率编程282

8.5.5神经网络283

8.5.6推广到更大的数据集283

8.5.7磨练你的技术284

8.6总结284

关于作者285

关于封面285

热门推荐