图书介绍

Storm实时数据处理【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

Storm实时数据处理
  • (澳)安德森著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111466635
  • 出版时间:2014
  • 标注页数:191页
  • 文件大小:24MB
  • 文件页数:206页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Storm实时数据处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 搭建开发环境1

1.1 简介1

1.2 搭建开发环境1

1.3 分布式版本控制3

1.4 创建“Hello World”Topology6

1.5 创建Stom集群——配置机器12

1.6 创建Storm集群——配置Storm18

1.7 获取基本的点击率统计信息23

1.8 对Bolt进行单元测试31

1.9 实现集成测试34

1.10 将产品部署到集群37

第2章 日志流处理38

2.1 简介38

2.2 创建日志代理38

2.3 创建日志Spout40

2.4 基于规则的日志流分析45

2.5 索引与持久化日志数据49

2.6 统计与持久化日志统计信息53

2.7 为日志流集群创建集成测试55

2.8 创建日志分析面板59

第3章 使用Trident计算单词重要度71

3.1 简介71

3.2 使用Twitter过滤器创建URL流71

3.3 从文件中获取整洁的词流76

3.4 计算每个单词的相对重要度81

第4章 分布式远程过程调用85

4.1 简介85

4.2 通过DPRC实现所需处理流程85

4.3 对Trident Topology进行集成测试90

4.4 实现滚动窗口Topology95

4.5 在集成测试中模拟时间98

第5章 在不同语言中实现Topology100

5.1 简介100

5.2 在Qt中实现多语言协议100

5.3 在Qt中实现SplitSentence Bolt105

5.4 在Ruby中实现计数Bolt108

5.5 在Clojure中实现单词计数Topology109

第6章 Storm与Hadoop集成113

6.1 简介113

6.2 在Hadoop中实现TF-IDF算法115

6.3 持久化来自Storm的文件121

6.4 集成批处理与实时视图122

第7章 实时机器学习127

7.1 简介127

7.2 实现事务性Topology129

7.3 在R中创建随机森林分类模型134

7.4 基于随机森林的事务流业务分类143

7.5 在R中创建关联规则模型149

7.6 创建推荐引擎152

7.7 实时在线机器学习157

第8章 持续交付162

8.1 简介162

8.2 搭建CI服务器162

8.3 搭建系统环境164

8.4 定义交付流水线166

8.5 实现自动化验收测试170

第9章 在AWS 上部署Storm177

9.1 简介177

9.2 使用Pallet在AWS上部署Storm177

9.3 搭建虚拟私有云181

9.4 使用Vagrant在虚拟私有云上部署Storm189

热门推荐