图书介绍

基于CUDA的并行程序设计PDF|Epub|txt|kindle电子书版本下载

基于CUDA的并行程序设计
  • 刘金硕,邓娟,周峥,曾秋梅等编著 著
  • 出版社: 北京:科学出版社
  • ISBN:9787030405319
  • 出版时间:2014
  • 标注页数:265页
  • 文件大小:55MB
  • 文件页数:274页
  • 主题词:图象处理-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

基于CUDA的并行程序设计PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 并行计算概述1

1.1 并行计算简介1

1.2 并行处理的计算机体系结构2

1.2.1 并行计算机分类2

1.2.2 并行计算机的物理结构模型3

1.3 并行算法的设计方法7

1.3.1 并行算法的相关概念7

1.3.2 设计并行算法应注意的问题9

1.3.3 并行算法的通用设计方法11

1.4 基于各种并行处理体系结构的算法对比13

1.4.1 SIMD算法13

1.4.2 MIMD算法17

1.4.3 MIMD进程通信和死锁18

1.4.4 MIMD任务调度19

1.5 小结23

参考文献23

第2章 GPU概述25

2.1 GPU的发展25

2.2 GPU的体系结构27

2.2.1 NVIDIA公司的GPU体系结构27

2.2.2 AMD公司的GPU体系结构30

2.3 多核CPU和GPU的协同工作原理31

2.4 GPU并行与分布式对比33

2.5 采用多核CPU和GPU的异构集群34

2.6 小结35

参考文献35

第3章 CUDA编程基础37

3.1 CUDA简介37

3.2 CUDA并行新思维37

3.3 CUDA的安装及配置38

3.3.1 CUDA在Mac OS X中的配置38

3.3.2 CUDA在Linux中的配置41

3.3.3 CUDA在Windows中的配置44

3.4 CUDA编程模型46

3.4.1 CUDA C语言47

3.4.2 执行结构73

3.4.3 内核函数73

3.4.4 线程层次75

3.4.5 存储器结构与线程映射机制77

3.4.6 通信机制78

3.4.7 CUDA的软件体系79

3.5 nvcc编译器79

3.5.1 nvcc编译流程79

3.5.2 兼容性分析81

3.6 “HelloWorld”CUDA编程实例82

3.7 小结90

参考文献90

第4章 GPU存储器使用技巧92

4.1 GPU的8种存储器及其访问机制92

4.2 全局存储器的使用技巧94

4.3 共享存储器的使用技巧97

4.4 纹理存储器的使用技巧101

4.4.1 纹理存储器的特性101

4.4.2 绑定到纹理的数据类型101

4.4.3 纹理参考声明102

4.4.4 运行时纹理参考属性102

4.4.5 纹理存储器的使用方法103

4.5 主机端页锁定内存的使用技巧105

4.5.1 页锁定内存的特性105

4.5.2 零复制(zero-copy)106

4.5.3 异步执行107

4.6 小结108

参考文献109

第5章 CUDA编程优化110

5.1 概述110

5.2 性能分析111

5.2.1 测时111

5.2.2 CUDA程序性能分析工具112

5.2.3 CUDA程序性能分析和优化117

5.3 存储器访问优化119

5.4 任务划分119

5.5 指令优化120

5.5.1 存储器访问的指令优化120

5.5.2 算术运算的指令优化121

5.5.3 线程同步的指令优化122

5.5.4 控制流的指令优化122

5.6 优化实例123

5.7 小结128

参考文献128

第6章 基于C++的遥感影像处理的CUDA优化129

6.1 遥感影像常用处理算法的GPU加速129

6.1.1 均值滤波算法的CUDA并行化优化129

6.1.2 高斯滤波算法的CUDA并行化优化130

6.1.3 大图像分块的均值和方差算法132

6.1.4 图像处理算法的串并行实验结果对比与分析139

6.2 基于CUDA的SAR影像SIFT匹配141

6.2.1 遥感影像数据采集和影像几何特征141

6.2.2 SIFT匹配算法原理143

6.2.3 SIFT匹配算法的CUDA并行化优化148

6.3 水平集曲线演化算法用于遥感图像轮廓提取164

6.3.1 遥感图像轮廓提取技术164

6.3.2 水平集曲线演化方法164

6.3.3 水平集曲线演化算法的CUDA并行优化166

6.4 小结181

参考文献182

第7章 基于OpenGL的体绘制技术实现剪切波数据三维可视化的CUDA优化183

7.1 地震剪切波数据的三维可视化183

7.2 体绘制技术和光线投射算法183

7.3 基于OpenGL的CUDA编程185

7.4 基于OpenGL的CUDA光线投射算法设计186

7.4.1 光线投射算法模型设计186

7.4.2 光线投射算法流程186

7.4.3 基于CUDA的光线投射算法设计188

7.4.4 可变采样步长优化方法191

7.5 体绘制效率提升的GPU访存优化策略193

7.5.1 采用纹理存储器策略的体绘制算法优化193

7.5.2 采用全局存储器策略的体绘制算法优化194

7.5.3 采用全局+共享策略的体绘制算法优化195

7.5.4 采用常量存储器策略的体绘制算法优化197

7.5.5 采用纹理存储器的体绘制198

7.6 GPU访存优化策略效率分析205

7.7 剪切波三维可视化GPU加速实验结果与分析207

7.7.1 准备工作207

7.7.2 串并行实现光线投射算法的实验对比208

7.7.3 中国大陆南北带地区剪切波速度数据的可视化结果与分析208

7.8 小结209

参考文献209

第8章 基于MATLAB的生物细胞图像病理诊断的CUDA优化211

8.1 真菌隐球酵母菌病理诊断211

8.2 基于MATLAB的CUDA编程211

8.3 基于MATLAB的高噪声细胞图像处理的CUDA实现216

8.3.1 imadjust灰度调整算法加速216

8.3.2 imerode腐蚀算法加速217

8.3.3 imtophat高帽滤波算法加速220

8.4 实验结果与分析222

8.5 小结225

参考文献225

第9章 基于CUDA的核外计算集群中间件227

9.1 基于CUDA的中间件技术227

9.1.1 中间件技术介绍227

9.1.2 DataCutter混合编程架构228

9.2 分布式核外计算中间件230

9.2.1 核外计算技术230

9.2.2 基于CUDA的混合分布式全局数据管理231

9.2.3 分布式数据服务协议234

9.2.4 基于感知的任务调度策略237

9.2.5 DOoC中间件239

9.3 中间件编程接口241

9.3.1 LAF编程框架241

9.3.2 DOoC+LAF架构242

9.4 实验结果与分析243

9.4.1 实验环境243

9.4.2 外存访问与混合计算能力测试243

9.4.3 MFDn绿色计算测试245

9.4.4 特征值求解器249

9.5 小结252

参考文献253

附录A 数学函数256

附录B 原子函数264

热门推荐