图书介绍
释放多核潜能 英特尔Parallel Studio并行开发指南PDF|Epub|txt|kindle电子书版本下载
![释放多核潜能 英特尔Parallel Studio并行开发指南](https://www.shukui.net/cover/14/30292617.jpg)
- 英特尔亚太研发有限公司,北京并行科技公司编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302235033
- 出版时间:2010
- 标注页数:287页
- 文件大小:108MB
- 文件页数:304页
- 主题词:并行程序-程序设计-软件工具-指南
PDF下载
下载说明
释放多核潜能 英特尔Parallel Studio并行开发指南PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 并行开发理论基础1
1.1 并行相关概念1
1.1.1 并发与并行、并行度1
1.1.2 粒度1
1.1.3 加速比及其定律2
1.1.4 可扩展性与并行效率4
1.1.5 负载均衡4
1.1.6 吞吐量与延迟4
1.1.7 热点与瓶颈4
1.2 多核并行4
1.2.1 多核软硬件现实5
1.2.2 多核架构5
1.2.3 多核并行手段6
1.2.4 多核并行设计方法7
1.2.5 多核多线程系统8
1.2.6 多核多线程同步9
1.2.7 多核多线程实现的问题11
1.3 小结11
第2章 英特尔Parallel Studio基础12
2.1 英特尔Parallel Studio介绍12
2.1.1 英特尔Parallel Studio背景12
2.1.2 英特尔Parallel Studio的组成12
2.1.3 英特尔Parallel Studio的特色13
2.1.4 英特尔Parallel Studio的使用者14
2.2 英特尔Parallel Studio快速上手14
2.2.1 英特尔Parallel Studio的下载安装14
2.2.2 选择案例14
2.2.3 实践动手第一步:采用Parallel Studio运行串行程序15
2.2.4 实践动手第二步:选用合适的实现对代码并行化17
2.2.5 实践动手第三步:定位错误18
2.2.6 实践动手第四步:性能优化20
2.3 小结23
第3章 英特尔Parallel Composer详解24
3.1 Composer概述24
3.2 英特尔C/C++编译器25
3.2.1 自动并行和OpenMP并行25
3.2.2 过程间优化29
3.2.3 档案导引优化29
3.2.4 编译器向量化30
3.3 英特尔并行调试器32
3.3.1 英特尔并行调试器概述32
3.3.2 线程数据共享侦测32
3.3.3 可重入函数调用侦测34
3.3.4 SSE寄存器窗口34
3.3.5 OpenMP多线程调试35
3.3.6 并行区域的串行执行36
3.4 英特尔TBB线程构建模块36
3.4.1 英特尔TBB概述37
3.4.2 功能模块分类与介绍37
3.4.3 编译和运行TBB多线程程序37
3.5 英特尔IPP性能基元38
3.5.1 英特尔IPP概述38
3.5.2 主要函数及其功能39
3.5.3 编译和运行45
3.6 小结45
第4章 并行化方法46
4.1 基本概念46
4.1.1 Amdahl定律46
4.1.2 进程与线程47
4.2 并行化方法48
4.3 并行化设计49
4.3.1 任务划分49
4.3.2 功能划分51
4.3.3 并行化开发中的一些思考51
4.4 案例分析:用蒙特卡罗方法计算π值55
4.5 小结58
第5章 英特尔Parallel Composer案例分析59
5.1 案例5-1:Composer的使用——向量化和自动并行化59
5.2 案例5-2:并行调试器的使用62
5.3 案例5-3:通过TBB进行字符串查找66
5.4 案例5-4:IPP压缩和解压缩案例介绍69
5.5 小结71
第6章 英特尔Parallel Inspector详解72
6.1 Inspector概述72
6.2 启动Inspectort73
6.2.1 工作流程73
6.2.2 启动73
6.3 配置查找错误的类型和粒度75
6.3.1 基于线程的相关错误及粒度76
6.3.2 基于内存的相关错误及粒度77
6.4 定位和解决发现的错误79
6.4.1 检查错误79
6.4.2 查看和分析错误80
6.5 小结81
第7章 软件纠错方法82
7.1 基本概念82
7.1.1 软件查错或纠错82
7.1.2 白盒测试82
7.1.3 黑盒测试83
7.2 并行软件的纠错84
7.3 线程并行的常见错误84
7.3.1 线程间死锁85
7.3.2 线程间竞争86
7.3.3 内存泄露87
7.4 小结89
第8章 并行软件纠错案例90
8.1 案例8-1:线程间相互作用导致的死锁问题90
8.2 案例8-2:线程竞争94
8.3 案例8-3:内存泄露99
8.4 小结101
第9章 英特尔Parallel Amplifier详解102
9.1 Amplifier概述102
9.1.1 如何开始Amplifier102
9.1.2 如何使用符号信息103
9.1.3 环境和对象106
9.2 Amplifier的几个概念107
9.3 Amplifier的分析运行109
9.3.1 分析运行的几个选项109
9.3.2 选择分析模式110
9.3.3 如何选择分析模式110
9.3.4 如何在命令行下运行分析模式110
9.3.5 热点:分析程序哪里耗时111
9.3.6 并行度:展现并行程序的另外一个特点111
9.3.7 锁和等待:分析程序在哪里等待112
9.3.8 选择数据采集的时段112
9.4 Amplifier中浏览性能数据结果112
9.4.1 总览112
9.4.2 在Bottom-up和Top-down中切换113
9.4.3 选择和管理栈类型114
9.4.4 选择颜色方案114
9.4.5 按照不同类型划分组114
9.4.6 在命令行模式下查看性能数据114
9.5 Amplifier解释性能数据结果115
9.5.1 总览115
9.5.2 解释热点分析结果115
9.5.3 解释并行度分析结果116
9.5.4 解释锁和等待分析结果116
9.6 Amplifier中的源代码117
9.7 Amplifier中对比性能数据结果117
9.8 Amplifier中管理结果文件119
9.9 小结120
第10章 性能优化方法121
10.1 性能优化概述121
10.1.1 性能和性能优化是计算机领域不变的主题121
10.1.2 性能优化的定义121
10.2 性能优化通用方法122
10.2.1 性能优化的顺序122
10.2.2 系统级别的性能优化122
10.2.3 应用级别的性能优化123
10.2.4 微架构级别的性能优化123
10.2.5 性能优化工作循环123
10.2.6 性能优化循环的常见问题123
10.3 并行应用性能优化方法125
10.3.1 概述125
10.3.2 减少关键路径上的时间126
10.3.3 检查是否选择最优的并行方法126
10.3.4 检查是否选择合适的层级开始并行127
10.3.5 Amdahl定律的检查:减少串行部分的比例127
10.3.6 检查程序的负载均衡问题127
10.3.7 检查程序的粒度问题128
10.3.8 采用合适的线程库128
10.3.9 检查同步性能问题129
10.3.10 检查硬件导致的扩展性问题130
10.4 小结130
第11章 性能优化案例131
11.1 IO并行:系统级优化案例131
11.2 锁的实现:锁优化案例133
11.3 同步与负载均衡:生产消费类型的优化案例134
11.4 优化临界区:WinThread循环计算型优化案例144
11.5 负载均衡与归约:OpenMP循环计算型优化案例148
11.6 线程数,桶数与锁:Hash表与TBB优化案例153
11.7 选择合适的层级并行:任务与数据并行优化案例164
11.8 避免硬件性能瓶颈:内存与高速缓存优化案例165
11.9 算法选择:排序优化与TBB案例168
11.10 内存操作TBB优化案例172
11.11 小结174
第12章 英特尔Parallel Advisor详解175
12.1 Advisor基础175
12.1.1 Advisor总览175
12.1.2 如何开始Advisor175
12.2 Advisor工作流程177
12.3 Annotations178
12.4 Advisor工具179
12.4.1 Survey179
12.4.2 Suitability180
12.4.3 Correctness181
12.5 使用案例183
12.5.1 SpMV并行化183
12.5.2 DGEMM并行化188
12.6 小结194
第13章 总体系统化案例195
13.1 数独195
13.1.1 串行算法196
13.1.2 并行优化211
13.1.3 小结212
13.2 最短路径213
13.2.1 串行算法213
13.2.2 并行优化232
13.2.3 小结235
13.3 基数排序236
13.3.1 串行算法237
13.3.2 并行优化245
13.3.3 小结247
13.4 骑士巡游248
13.4.1 串行算法249
13.4.2 并行优化265
13.4.3 小结271
13.5 商业软件Paraview271
13.5.1 问题描述272
13.5.2 并行优化272
13.5.3 小结284
附录A 英文术语表285