图书介绍

片上网络原理与设计【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

片上网络原理与设计
  • 王志英主编;马胜等著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111555162
  • 出版时间:2017
  • 标注页数:339页
  • 文件大小:123MB
  • 文件页数:358页
  • 主题词:计算机体系结构

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

片上网络原理与设计PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 序言2

第1章 绪论2

1.1 众核处理器时代2

1.2 以通信为核心的跨层次优化3

1.3 片上网络简介5

1.3.1 拓扑结构6

1.3.2 路由算法7

1.3.3 流控机制8

1.3.4 路由器微结构10

1.3.5 性能评价指标13

1.4 片上网络研究现状14

1.4.1 拓扑结构的研究14

1.4.2 单播通信路由的研究15

1.4.3 聚合通信路由的研究16

1.4.4 流控机制的研究17

1.4.5 路由器微结构的研究18

1.5 真实处理器的片上网络19

1.5.1 MIT RAW处理器19

1.5.2 TileraTILE64处理器21

1.5.3 Sony/Toshiba/IBM Cell处理器23

1.5.4 U.T.Austion TRIPS处理器24

1.5.5 Intel Teraflops处理器26

1.5.6 Intel SCC处理器27

1.5.7 Intel Larrabee处理器29

1.5.8 Intel Knights Corner处理器30

1.5.9 真实处理器片上网络特性总结32

1.6 全书内容概述34

1.7 参考文献36

第二部分 逻辑层实现48

第2章 单周期翼通道路由器结构48

2.1 引言48

2.2 翼通道路由器体系结构50

2.2.1 翼通道单周期路由器总体结构50

2.2.2 翼通道工作原理55

2.3 路由器微体系结构设计58

2.3.1 通道分配部件58

2.3.2 快速仲裁部件60

2.3.3 SIG管理单元和SIG控制单元61

2.4 实验评估62

2.4.1 模拟环境62

2.4.2 流水线延迟分析63

2.4.3 延迟与吞吐率64

2.4.4 面积与功耗67

2.5 本章小结68

2.6 参考文献69

第3章 动态虚通道路由器71

3.1 引言71

3.2 拥塞感知的动态虚通道结构72

3.2.1 动态虚通道72

3.2.2 拥塞缓解策略74

3.3 拥塞感知的多端口共享缓冲结构75

3.3.1 多端口共享缓冲的动态虚通道75

3.3.2 拥塞缓解策略78

3.4 DVC路由器微结构78

3.4.1 虚通道控制部件79

3.4.2 拥塞缓解电路81

3.4.3 虚通道仲裁部件与开关仲裁部件82

3.5 HiBB路由器微结构84

3.5.1 虚通道控制部件85

3.5.2 虚通道仲裁部件与输出端口仲裁部件86

3.5.3 虚通道调整结构88

3.6 实验评估89

3.6.1 DVC路由器评估89

3.6.2 HiBB路由器评估92

3.7 本章小结95

3.8 参考文献96

第4章 虚拟总线拓扑结构98

4.1 引言98

4.2 相关研究99

4.3 研究动机100

4.3.1 基本片上通信网络100

4.3.2 片上网络问题分析101

4.3.3 基于事务的总线通信优势103

4.4 虚拟总线片上网络103

4.4.1 拓扑结构103

4.4.2 虚拟总线机制105

4.4.3 饿死与死锁避免111

4.4.4 VBON路由器结构111

4.5 实验评估112

4.5.1 模拟框架113

4.5.2 合成流量评估115

4.5.3 真实应用评估118

4.5.4 功耗分析119

4.5.5 开销分析119

4.6 本章小结120

4.7 参考文献120

第三部分 网络层路由和流控设计124

第5章 区域隔离路由算法124

5.1 引言124

5.2 相关研究126

5.3 研究动机127

5.3.1 局部自适应算法的局限性128

5.3.2 应用程序内部的干扰129

5.3.3 应用程序之间的干扰130

5.4 区域隔离路由算法131

5.4.1 拥塞信息传播网络132

5.4.2 DBAR路由器微结构134

5.4.3 路由函数设计136

5.5 实验评估139

5.5.1 路由函数评估140

5.5.2 单区域性能142

5.5.3 多区域性能145

5.5.4 集中型网格网络性能148

5.6 硬件开销讨论151

5.6.1 连线资源151

5.6.2 路由器开销151

5.6.3 功耗和能量延迟积151

5.7 进一步讨论152

5.7.1 拥塞信息传播网络带宽152

5.7.2 DBAR的可扩展性153

5.7.3 拥塞信息传播延迟153

5.8 本章小结153

5.9 参考文献153

第6章 完全自适应路由算法的流控机制158

6.1 引言158

6.2 相关研究161

6.2.1 死锁避免理论161

6.2.2 完全自适应路由算法设计162

6.3 研究动机162

6.3.1 虚通道分配策略162

6.3.2 路由灵活性163

6.4 流控和路由设计165

6.4.1 全报文发送165

6.4.2 逃逸虚通道的积极分配策略168

6.4.3 完全自适应路由算法171

6.4.4 路由器微结构171

6.5 合成流量模式评测173

6.5.1 合成流量模式结果174

6.5.2 路由算法的缓存利用率176

6.5.3 敏感性分析178

6.6 真实应用程序评测181

6.6.1 实验方法和实验配置182

6.6.2 PARSEC测试集结果182

6.7 流控机制的详细分析183

6.7.1 缓存利用率的详细分析183

6.7.2 流控机制的公平性分析187

6.8 进一步讨论189

6.8.1 报文长度和虚通道深度189

6.8.2 DAMQ和混合流控机制190

6.9 本章小结190

6.10 参考文献190

第7章 切片气泡流控机制195

7.1 引言195

7.2 传统设计的局限197

7.2.1 dateline197

7.2.2 本地气泡策略198

7.2.3 关键气泡策略198

7.2.4 处理变长报文的低效性199

7.3 切片气泡流控机制及策略200

7.3.1 理论描述200

7.3.2 本地切片气泡策略202

7.3.3 关键切片气泡策略202

7.3.4 饿死现象203

7.4 路由器流水线和微结构205

7.4.1 FBFC路由器205

7.4.2 VCT路由器206

7.5 实验方法207

7.6 一维Torus网络性能评测208

7.6.1 性能208

7.6.2 缓存利用率210

7.6.3 短报文和长报文的传输延迟211

7.7 二维Torus网络性能评测212

7.7.1 4×4Torus网络性能212

7.7.2 单切片报文比例敏感性分析214

7.7.3 缓存数量敏感性分析215

7.7.4 8×8Torus网络可扩展性分析216

7.7.5 饿死现象分析217

7.7.6 PARSEC测试集实验结果219

7.7.7 大规模系统和消息传递编程模式220

7.8 开销:功耗和面积221

7.8.1 测试方法学222

7.8.2 功耗222

7.8.3 面积225

7.8.4 与网格网络的比较226

7.9 进一步讨论和相关工作229

7.9.1 进一步讨论229

7.9.2 相关工作229

7.10 本章小结230

7.11 参考文献231

第8章 高效能与公平性流控235

8.1 基于当值缓存高效能路由器设计235

8.1.1 引言235

8.1.2 高效能路由器236

8.1.3 实验设计240

8.1.4 实验评估241

8.1.5 小结243

8.2 基于报文剩余跳数的自适应流控244

8.2.1 引言244

8.2.2 报文之间的相互作用245

8.2.3 公平性流控246

8.2.4 实验评估249

8.2.5 小结252

8.3 参考文献253

第四部分 软件层编程模式支持256

第9章 一致性协议聚合通信支持256

9.1 引言256

9.2 归约消息组合框架259

9.2.1 消息组合表格式260

9.2.2 消息组合实例260

9.2.3 消息组合表项的不足262

9.3 均衡自适应多播路由算法262

9.4 路由器流水线和微结构264

9.5 实验评估266

9.5.1 性能267

9.5.2 BAM和RPM多播虚拟网络性能271

9.5.3 消息组合表大小272

9.5.4 敏感性分析274

9.6 功耗和能量延迟积分析276

9.7 相关研究277

9.7.1 消息组合277

9.7.2 片上网络多播路由算法278

9.8 本章小结278

9.9 参考文献279

第10章 MPI原语的定制通信架构283

10.1 引言283

10.2 研究背景284

10.3 研究动机286

10.3.1 在NoC上实现MPI286

10.3.2 MPI函数优化286

10.4 定制通信架构287

10.4.1 体系结构概述287

10.4.2 定制的片上网络设计:VBON288

10.4.3 MPI原语实现:MU288

10.5 实验评估295

10.5.1 方法295

10.5.2 实验结果297

10.6 本章小结303

10.7 参考文献304

第11章 MPI通信协议优化308

11.1 引言308

11.2 研究背景309

11.2.1 MPI的通信协议309

11.2.2 现存问题310

11.2.3 相关工作313

11.3 研究动机314

11.4 自适应通信协议315

11.4.1 目标与方法315

11.4.2 基本MPI加速的片上网络设计316

11.4.3 ADCM结构的支持318

11.4.4 与理想协议的比较323

11.5 实验评估324

11.5.1 方法324

11.5.2 合成流量结果326

11.5.3 真实应用程序328

11.5.4 敏感性分析330

11.5.5 硬件开销331

11.6 本章小结331

11.7 参考文献332

第五部分 后记336

第12章 结语与展望336

12.1 结语336

12.2 展望338

热门推荐