图书介绍

大数据分析【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

大数据分析
  • 程学旗主编 著
  • 出版社: 北京:高等教育出版社
  • ISBN:7040516326
  • 出版时间:2019
  • 标注页数:337页
  • 文件大小:48MB
  • 文件页数:351页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 基本概念与基本知识1

1.1大数据与大数据分析1

1.2重要的问题和概念4

1.3大数据分析算法、系统和应用5

1.4大数据分析科学家和工程师7

1.5本书的结构8

第2章 大数据统计分析方法11

2.1相关性分析11

2.1.1相关性理论的产生11

2.1.2相关关系12

2.1.3传统的统计相关性分析方法13

2.1.4大数据中的统计相关性分析16

2.2因果推断20

2.2.1因果推断简介20

2.2.2相关关系与因果关系20

2.2.3无模型因果推断21

2.2.4基于模型的因果推断22

2.2.5大数据中的因果推断24

2.2.6Yule-Simpson悖论25

2.3采样分析26

2.3.1采样与随机模拟27

2.3.2蒙特卡罗方法28

2.3.3马尔可夫链蒙特卡罗方法31

2.3.4并行采样方法34

2.4小结及进一步阅读35

习题37

第3章 大数据机器学习方法39

3.1描述性分析39

3.1.1聚类分析39

3.1.2矩阵分解46

3.2预测性分析55

3.2.1分类分析方法55

3.2.2排序学习64

3.3深度学习分析方法72

3.4强化学习分析方法79

3.4.1代表性方法82

3.4.2大数据分析中的强化学习85

3.5小结及进一步阅读88

习题89

第4章 机器学习理论91

4.1机器学习基础91

4.1.1基本概念92

4.1.2损失函数与风险函数93

4.1.3经验风险最小化与结构风险最小化95

4.2过拟合、模型选择以及正则化96

4.2.1 训练误差与测试误差96

4.2.2过拟合与模型选择96

4.2.3正则化与交叉验证98

4.3偏差方差分解102

4.4 PAC学习理论106

4.4.1一个简单的例子106

4.4.2 PAC学习理论基本概念107

4.4.3有限假设空间下的推导109

4.4.4 VC维111

4.4.5 Rademacher复杂度113

4.5非独立同分布学习115

4.5.1非独立情形115

4.5.2非同分布情形116

4.6小结及进一步阅读118

习题118

第5章 大数据算法理论119

5.1组合优化算法119

5.1.1近似算法119

5.1.2次模优化121

5.2在线算法127

5.2.1秘书问题127

5.2.2在线调度129

5.2.3在线二部图匹配132

5.2.4在线学习中的多臂老虎机问题137

5.3流式算法141

5.3.1流模型和流算法简介141

5.3.2图上的流模型142

5.3.3统计类问题的流模型144

5.3.4聚类问题的流模型148

5.4参数算法150

5.4.1参数算法设计基本技巧152

5.4.2参数算法下界156

5.5小结及进一步阅读157

习题158

第6章 文本大数据分析159

6.1文本表达159

6.1.1单词的表示159

6.1.2句子的表示172

6.2文本匹配181

6.2.1文本匹配任务182

6.2.2基于规则的文本匹配184

6.2.3基于学习的文本匹配187

6.3文本生成192

6.3.1文本生成简介192

6.3.2人机对话生成196

6.3.3图片标题生成201

6.3.4文本生成的评价203

6.4小结及进一步阅读205

习题207

第7章 知识计算209

7.1知识图谱简介209

7.2知识抽取210

7.2.1实体抽取210

7.2.2关系抽取215

7.2.3属性抽取223

7.2.4实体关系联合抽取228

7.3知识融合232

7.3.1实体对齐232

7.3.2实体链接235

7.3.3知识更新238

7.4知识推理239

7.4.1基于逻辑的推理模型239

7.4.2基于图的推理模型241

7.4.3基于表示学习的推理模型245

7.5小结及进一步阅读251

习题254

第8章 网络数据挖掘255

8.1网络排序255

8.1.1节点中心度255

8.1.2边中心度260

8.2网络聚类264

8.2.1网络划分264

8.2.2社区发现268

8.3网络表示学习272

8.3.1 Laplacian eigenmaps273

8.3.2 DeepWalk275

8.3.3 LINE276

8.3.4 SDNE277

8.4小结及进一步阅读279

习题280

第9章 社会媒体分析281

9.1网络影响力最大化281

9.2基于位置的社交网络285

9.3大图的异常检测288

9.3.1基于密度子图的检测方法290

9.3.2基于谱图子空间的检测方法292

9.3.3信念传播294

9.3.4视觉引导的自动检测295

9.3.5基于信号处理的检测方法296

9.4社会媒体分析新应用297

9.4.1社会媒体中的广告投放297

9.4.2移动互联网环境的推荐系统300

9.4.3社交网络中的风险控制303

9.5小结及进一步阅读308

习题308

第10章 大数据分析系统架构311

10.1数据与计算的演变历程311

10.1.1数据规模的演变311

10.1.2计算范式的演变313

10.2大数据分布式计算模型317

10.2.1大数据分析算法的挑战317

10.2.2数据与参数分发策略319

10.2.3数据更新策略321

10.3大数据计算系统323

10.3.1 MapReduce系统324

10.3.2 Spark系统326

10.3.3参数服务器Parameter Server330

10.3.4 TensorFlow系统334

10.4小结及进一步阅读337

习题337

热门推荐