图书介绍
GPU精粹 3PDF|Epub|txt|kindle电子书版本下载
![GPU精粹 3](https://www.shukui.net/cover/3/30258510.jpg)
- (美)阮金编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302220701
- 出版时间:2010
- 标注页数:692页
- 文件大小:146MB
- 文件页数:711页
- 主题词:图象处理-程序设计
PDF下载
下载说明
GPU精粹 3PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第Ⅰ部分 几何体2
第1章 使用GPU生成复杂的程序化地形7
1.1 介绍7
1.2 Marching Cubes算法和密度函数7
1.2.1 在单元内生成多边形8
1.2.2 查找表9
1.3 地形生成系统概述10
1.3.1 在地形块内部生成多边形10
1.3.2 生成密度值11
1.3.3 写一个有趣的密度函数11
1.3.4 定制地形14
1.4 在地形块中生成多边形16
1.4.1 边缘数据17
1.4.2 生成地形块:方法119
1.4.3 生成地形块:方法219
1.4.4 生成地形块:方法321
1.5 纹理和光影23
1.6 对实际应用的考虑27
1.6.1 细节层次27
1.6.2 外部对象的碰撞和光照问题28
1.7 结论29
1.8 参考资料29
第2章 群体动画渲染31
2.1 目的32
2.2 实例化的简单回顾32
2.3 技术细节33
2.3.1 基于常量的实例化34
2.3.2 使用动画纹理的调色板蒙皮35
2.3.3 几何变化38
2.3.4 LOD系统39
2.4 其他考虑因素39
2.4.1 颜色变化39
2.4.2 性能39
2.4.3 整合40
2.5 结论40
2.6 参考资料40
第3章 DirectX 10混合形状:打破限制41
3.1 介绍41
3.2 Dawn例子的实现43
3.2.1 DirectX 10的特性43
3.2.2 定义网格43
3.2.3 流输出的方法44
3.2.4 缓冲区-模板方法47
3.3 运行例子51
3.4 性能51
3.5 参考资料52
第4章 下一代SpeedTree渲染53
4.1 介绍53
4.2 轮廓裁减53
4.2.1 轮廓鳍挤压54
4.2.2 高度追踪56
4.2.3 轮廓细节层次58
4.3 阴影59
4.3.1 树叶自遮挡59
4.3.2 级联阴影贴图61
4.4 树叶光照62
4.4.1 两边光照62
4.4.2 镜面光照64
4.5 高动态范围和反锯齿64
4.6 半透明覆盖65
4.6.1 将半透明覆盖应用于SpeedTree65
4.6.2 细节层次的交叉衰减65
4.6.3 轮廓边反锯齿66
4.7 结论68
4.8 参考资料69
第5章 普遍自适应的网格优化71
5.1 介绍71
5.2 总览72
5.3 自适应优化模式73
5.4 渲染工作流74
5.4.1 深度标签计算74
5.4.2 CPU阶段的渲染循环75
5.4.3 GPU阶段的优化处理76
5.5 结果76
5.6 结论和改进79
5.7 参考资料79
第6章 GPU生成的树的过程式风动画81
6.1 介绍81
6.2 GPU上的过程式动画81
6.3 现象学方法82
6.3.1 风场82
6.3.2 树的概念结构82
6.3.3 模拟的两种分类83
6.4 模拟步骤86
6.5 渲染树89
6.6 分析和比较90
6.6.1 优势91
6.6.2 劣势91
6.6.3 性能评估91
6.7 结论92
6.8 参考资料92
第7章 GPU上基于点的变形球可视化93
7.1 变形球、光滑粒子流体力学和表面粒子93
7.1.1 各种方法的对比94
7.1.2 在GPU上基于点的表面可视化95
7.2 限制粒子96
7.2.1 定义显式表面96
7.2.2 速度限制等式97
7.2.3 在GPU中计算密度场99
7.2.4 选择散列函数99
7.2.5 创建并查询散列表100
7.3 局部粒子斥力102
7.3.1 斥力等式102
7.3.2 GPU端最近的邻居104
7.4 全局粒子传播106
7.5 性能109
7.6 渲染110
7.7 结论111
7.8 参考资料111
第Ⅱ部分 光照和阴影114
第8章 区域求和的差值阴影贴图119
8.1 介绍119
8.2 相关工作120
8.3 percentage-closer过滤120
8.4 差值阴影贴图122
8.4.1 过滤差值阴影贴图123
8.4.2 偏离124
8.4.3 光渗色126
8.4.4 数值稳定性128
8.4.5 实现注释129
8.4.6 差值阴影贴图和软阴影130
8.5 区域求和差值阴影贴图131
8.5.1 生成区域求和表132
8.5.2 数字固定性重访问132
8.5.3 结果133
8.6 percentage-closer软阴影135
8.6.1 遮挡体查找135
8.6.2 渐变区域尺寸估计135
8.6.3 阴影过滤136
8.6.4 结果136
8.7 结论136
8.8 参考资料137
第9章 使用全局照明实现互动的电影级重光照139
9.1 介绍139
9.2 算法总览140
9.3 聚集样本141
9.4 一次反射的间接照明143
9.5 用于压缩的小波144
9.6 增加多次反射146
9.7 对稀疏矩阵数据进行压缩147
9.8 基于GPU的重光照引擎148
9.8.1 直接照明149
9.8.2 小波变换149
9.8.3 稀疏矩阵乘法151
9.9 结果152
9.10 结论153
9.11 参考资料153
第10章 在可编程GPU中实现并行分割的阴影贴图155
10.1 介绍155
10.2 算法156
10.2.1 步骤1:分割视锥体157
10.2.2 步骤2:计算光的变换矩阵160
10.2.3 步骤3和4:产生PSSM和综合阴影163
10.3 基于硬件的实现方法164
10.3.1 多步方法164
10.3.2 DirectX 9级别的加速166
10.3.3 DirectX 10级别的加速168
10.4 进一步的优化177
10.5 结果177
10.6 结论180
10.7 参考资料180
第11章 使用层次化的遮挡剔除和几何体着色器得到高效鲁棒的阴影体183
11.1 介绍183
11.2 阴影体综述183
11.2.1 Z-Pass和Z-Fail184
11.2.2 阴影体生成185
11.2.3 性能和优化方法186
11.3 实现方法186
11.3.1 针对低质量网络的鲁棒阴影186
11.3.2 使用几何体着色器动态生成阴影体188
11.3.3 使用层次化遮挡裁剪提高性能192
11.4 结论194
11.5 参考资料195
第12章 高质量的环境遮挡197
12.1 回顾197
12.2 问题198
12.2.1 圆盘形状的失真199
12.2.2 高频的尖点失真199
12.3 一个鲁棒的解决方法200
12.3.1 对不连续性进行光滑处理200
12.3.2 移除尖点并加入细节201
12.4 结果204
12.5 性能205
12.6 一些注意事项206
12.6.1 强制收敛206
12.6.2 可调整的参数207
12.7 后续工作209
12.8 参考资料210
第13章 作为后置处理的体积光照散射211
13.1 介绍211
13.2 云隙光212
13.3 体积光照散射212
13.4 后置处理像素着色器214
13.5 屏幕空间遮挡方法215
13.5.1 遮挡pre-pass方法215
13.5.2 遮挡模板方法216
13.5.3 遮挡对比方法216
13.6 一些注意事项216
13.7 演示216
13.8 扩展217
13.9 结论217
13.10 参考资料218
第Ⅲ部分 渲染220
第14章 用于真实感实时皮肤渲染的高级技术225
14.1 皮肤外观225
14.1.1 皮肤表面反射226
14.1.2 皮肤子表面反射227
14.2 皮肤渲染系统总述228
14.3 镜面表面反射229
14.4 散射理论233
14.4.1 漫反射剖面233
14.4.2 使用漫反射剖面渲染234
14.4.3 漫反射剖面的形状235
14.4.4 一个高斯和漫反射剖面236
14.4.5 拟合预测的或测量的剖面237
14.4.6 配置漫反射剖面238
14.4.7 对皮肤的高斯和拟合238
14.5 高级子表面散射239
14.5.1 纹理空间漫反射240
14.5.2 改进的纹理空间漫反射241
14.5.3 经过修改的半透明阴影贴图256
14.6 一个快速的布隆过滤器260
14.7 结论261
14.8 后续工作261
14.9 参考资料262
第15章 可播放的全方位捕捉265
15.1 介绍265
15.2 数据捕捉流水线266
15.3 动态纹理的压缩和解压268
15.3.1 主要分量分析268
15.3.2 压缩270
15.3.3 解压缩271
15.3.4 可变PCA272
15.3.5 实际使用中的考虑273
15.4 串连特性274
15.5 结论275
15.6 参考资料280
第16章 Crysis中植被的过程化动画和着色283
16.1 过程化动画283
16.2 植被着色287
16.2.1 环境光照288
16.2.2 边的光滑化288
16.2.3 整合289
16.2.4 实现细节289
16.3 结论291
16.4 参考资料292
第17章 鲁棒的多镜面反射和折射293
17.1 介绍293
17.2 跟踪辅助光线294
17.2.1 层次化距离图的生成295
17.2.2 层次化距离图的光线跟踪295
17.3 反射和折射300
17.4 结果302
17.5 结论306
17.6 参考资料306
第18章 用于浮雕映射的松散式锥形步进309
18.1 介绍309
18.2 浮雕映射总览310
18.3 锥形步进映射313
18.4 松散式锥形步进313
18.4.1 计算松散式锥形映射图314
18.4.2 使用松散式锥形映射图进行渲染317
18.5 结论320
18.6 补充读物321
18.7 参考资料321
第19章 Tabula Rasa中的延迟着色323
19.1 介绍323
19.2 一些背景知识324
19.3 所支持的向前着色324
19.3.1 一个受限的特效集325
19.3.2 单效果,多技术325
19.3.3 光照优先度326
19.4 先进的光照特性326
19.4.1 双向光照327
19.4.2 球体映射327
19.4.3 盒式光照328
19.4.4 阴影贴图328
19.4.5 进一步的扩展330
19.5 可读取深度和法线缓存的优点331
19.5.1 高级水体和折射331
19.5.2 与分辨率无关的边检测332
19.6 一些注意事项334
19.6.1 材质属性334
19.6.2 精确度336
19.7 优化336
19.7.1 高效的光照体积337
19.7.2 模板掩码337
19.7.3 动态分支338
19.8 问题338
19.8.1 混合透明度几何体338
19.8.2 内存带宽339
19.8.3 内存管理340
19.9 结果340
19.10 结论342
19.11 参考资料343
第20章 基于GPU的重要性采样345
20.1 介绍345
20.2 渲染公式346
20.2.1 蒙特卡洛积分346
20.2.2 重要性采样346
20.2.3 对材质函数进行采样347
20.3 拟随机低差异序列349
20.4 使用mipmap过滤的样本350
20.5 性能353
20.6 结论355
20.7 补充读物及参考资料355
第Ⅳ部分 图像效果358
第21章 真正的Impostor363
21.1 介绍363
21.2 算法和实现细节364
21.3 结果367
21.4 结论368
21.5 参考资料369
第22章 在GPU上处理法线贴图371
22.1 传统实现371
22.1.1 投影371
22.1.2 包围盒372
22.2 加速结构373
22.2.1 一致网格373
22.2.2 3D数值微分分析373
22.3 GPU的处理374
22.3.1 序号限制375
22.3.2 内存和结构限制375
22.4 实现376
22.4.1 设置以及预处理376
22.4.2 单路径实现378
22.4.3 多路径实现383
22.4.4 反走样383
22.5 结果383
22.6 结论385
22.7 参考资料386
第23章 高速的离屏粒子387
23.1 动机387
23.2 离屏渲染388
23.2.1 离屏深度测试388
23.2.2 获取深度388
23.3 向下采样深度389
23.3.1 点采样深度390
23.3.2 最大深度采样391
23.4 深度测试与柔和粒子391
23.5 alpha混合392
23.6 混合分辨率渲染393
23.6.1 边检测394
23.6.2 与模板进行合成394
23.7 结果396
23.7.1 图像质量396
23.7.2 性能396
23.8 结论398
23.9 参考资料398
第24章 保持线性的重要性399
24.1 介绍399
24.2 光照、显示以及颜色空间399
24.2.1 数字图像捕捉、生成及显示中的问题399
24.2.2 题外话:何为线性400
24.2.3 显示器并非线性,渲染器为线性400
24.3 症状402
24.3.1 非线性输入纹理402
24.3.2 mipmap402
24.3.3 光照403
24.3.4 负负不得正403
24.4 解决方法405
24.4.1 输入图像(扫描、绘画以及数字图片)406
24.4.2 输出图像(最终渲染)407
24.4.3 中间颜色缓存408
24.5 结论408
24.6 补充读物408
第25章 在GPU上渲染向量图411
25.1 介绍411
25.2 二次曲线411
25.3 三次样条413
25.3.1 弯形曲线417
25.3.2 环形曲线418
25.3.3 尖形曲线419
25.3.4 二次曲线419
25.4 三角化420
25.5 抗锯齿421
25.6 代码422
25.7 结论423
25.8 参考资料424
第26章 通过颜色进行对象探测:使用GPU进行实时视频图像处理425
26.1 图像处理概况425
26.2 根据颜色进行对象检测427
26.2.1 创建标记428
26.2.2 查找质心430
26.2.3 将一幅图像整合到输入信号上432
26.3 结论433
26.4 补充读物433
第27章 作为后置处理效果的运动模糊435
27.1 介绍435
27.2 从深度缓存提取对象位置436
27.3 执行运动模糊438
27.4 处理动态对象439
27.5 屏蔽对象439
27.6 额外的工作439
27.7 结论439
27.8 参考资料439
第28章 实用景深后期处理441
28.1 介绍441
28.2 相关工作441
28.2.1 总览441
28.2.2 特定技术442
28.3 景深442
28.4 算法的改进443
28.4.1 最初的随机方法(Stochastic Approach)444
28.4.2 作为聚集的散射方法444
28.4.3 模糊方法445
28.5 完整的算法448
28.5.1 深度信息448
28.5.2 可变宽度的模糊448
28.5.3 散光圈半径449
28.5.4 关于第一人称视角武器的考虑450
28.5.5 完整的着色器代码450
28.6 结论455
28.7 局限和后续工作456
28.8 参考资料458
第Ⅴ部分 物理仿真460
第29章 GPU上实时刚体仿真465
29.1 介绍466
29.1.1 平移466
29.1.2 旋转467
29.1.3 形状表示468
29.1.4 碰撞检测469
29.1.5 碰撞交互470
29.2 GPU上刚体仿真470
29.2.1 概述470
29.2.2 数据结构472
29.2.3 步骤1:计算粒子值473
29.2.4 步骤2:网格生成474
29.2.5 步骤3:碰撞检测与交互475
29.2.6 步骤4:动量计算476
29.2.7 步骤5:计算位置和四元组476
29.2.8 渲染476
29.2.9 性能477
29.3 应用477
29.3.1 颗粒状材料478
29.3.2 液体478
29.3.3 耦合479
29.4 结论480
29.5 附录480
29.6 参考资料480
第30章 实时仿真与3D流体渲染483
30.1 介绍483
30.2 仿真484
30.2.1 背景484
30.2.2 流体运动方程485
30.2.3 速度求解485
30.2.4 固-流体交互490
30.2.5 烟雾501
30.2.6 火502
30.2.7 水502
30.2.8 性能考虑503
30.2.9 存储504
30.2.10 数值问题504
30.3 渲染506
30.3.1 体积渲染506
30.3.2 液体渲染511
30.4 结论512
30.5 参考资料512
第31章 使用CUDA进行快速N-body仿真515
31.1 介绍515
31.2 全对N-body仿真516
31.3 全对N-body算法的CUDA实现518
31.3.1 体-体之间力的计算518
31.3.2 块计算519
31.3.3 把块聚集到线程块中520
31.3.4 定义线程块的网格521
31.4 性能评测522
31.4.1 优化523
31.4.2 性能结果分析525
31.5 以前使用GPU进行N-body仿真的方法526
31.6 分层的N-body方法526
31.7 结论527
31.8 参考资料527
第32章 使用CUDA进行宽阶段碰撞检测531
32.1 宽阶段算法531
32.1.1 排序和搜索531
32.1.2 空间划分532
32.1.3 并行空间划分534
32.2 空间划分的一种CUDA实现535
32.2.1 初始化536
32.2.2 构建单元ID数组537
32.2.3 单元ID数组的排序538
32.2.4 创建碰撞单元列表547
32.2.5 遍历碰撞单元列表548
32.3 性能结果548
32.4 结论549
32.5 参考资料549
第33章 用于碰撞检测的LCP算法的CUDA实现551
33.1 并行处理551
33.2 物理流程552
33.3 确定接触点553
33.3.1 连续方法553
33.3.2 离散方法(基于一致性)554
33.3.3 解析接触点554
33.4 数学优化554
33.4.1 线性规划554
33.4.2 线性互补问题555
33.4.3 二次规划556
33.5 凸面距离计算556
33.6 使用CUDA的LCP并行解决方案558
33.7 结果561
33.8 参考资料563
第34章 使用单过程GPU扫描和四面体转换的有向距离场565
34.1 介绍565
34.1.1 有向距离场总览565
34.1.2 方法的概览566
34.2 扫描方法中的泄露瑕疵566
34.2.1 平面测试566
34.2.2 如何构建包围体567
34.2.3 多边形模型的折叠569
34.3 四边形GPU扫描方法570
34.3.1 计算壳571
34.3.2 计算四边形的交叉区域571
34.3.3 使用角度权重的伪法线计算有向距离572
34.4 结果575
34.5 结论578
34.6 后续工作578
34.6.1 算法的改进578
34.6.2 对实现方法进行改进578
34.7 补充读物578
34.8 参考资料580
第Ⅵ部分 GPU计算582
第35章 使用GPU进行病毒特征的快速匹配587
35.1 介绍587
35.2 模式匹配589
35.3 GPU实现590
35.4 结果593
35.5 结论和后续工作595
35.6 参考资料596
第36章 用GPU进行AES加密和解密597
36.1 用于整数流处理的新功能597
36.1.1 转换反馈模式597
36.1.2 GPU编程扩展598
36.2 AES算法概述599
36.3 AES在GPU上的实现601
36.3.1 输入/输出和状态602
36.3.2 初始化603
36.3.3 轮操作603
36.3.4 最后一轮607
36.4 性能607
36.4.1 顶点程序与片段程序607
36.4.2 与基于CPU的加密的比较608
36.5 对并行的考虑608
36.5.1 操作的块密码模式608
36.5.2 用于并行处理的模式609
36.6 结论和后续工作610
36.7 参考资料611
第37章 使用CUDA进行高效的随机数生成及应用613
37.1 Monte Carlo仿真614
37.2 随机数生成器616
37.2.1 简介616
37.2.2 均匀到高斯的转换生成器617
37.2.3 高斯转换的类型620
37.2.4 Wallace高斯生成器621
37.2.5 把Wallace高斯生成器集成到仿真中624
37.3 示例程序625
37.3.1 亚式期权626
37.3.2 回顾期权的变体627
37.3.3 结果629
37.4 结论630
37.5 参考资料630
第38章 使用CUDA进行地球内部成像633
38.1 介绍633
38.2 地震数据634
38.3 地震数据处理635
38.3.1 震波传播637
38.3.2 使用SRMIP算法进行震波偏移638
38.4 GPU实现640
38.4.1 GPU/CPU通信641
38.4.2 CUDA的实现642
38.4.3 震波传播内核643
38.5 性能646
38.6 结论646
38.7 参考资料647
第39章 使用CUDA的并行前缀和(扫描方法)649
39.1 介绍649
39.2 实现650
39.2.1 并行扫描的雏形650
39.2.2 一种高效的并行扫描算法652
39.2.3 避免bank冲突654
39.2.4 随机长度的数组656
39.2.5 进一步优化及性能结果657
39.2.6 CUDA对OpenGL实现的优势659
39.3 扫描的应用660
39.3.1 流压缩660
39.3.2 区域求和表661
39.3.3 基数排序663
39.3.4 前人的贡献665
39.4 结论666
39.5 参考资料666
第40章 高斯函数的增量计算669
40.1 介绍和相关工作669
40.2 多项式向前差分671
40.3 增量高斯算法673
40.4 误差分析675
40.5 性能677
40.6 结论678
40.7 参考资料678
第41章 使用几何体着色器处理紧凑和可变长度的GPU反馈681
41.1 介绍681
41.2 为什么要使用几何体着色器681
41.3 几何体着色器的动态输出682
41.4 算法和应用684
41.4.1 构建直方图684
41.4.2 压缩686
41.4.3 Hough变换686
41.4.4 角点检测689
41.5 优势:GPU本地性和SLI690
41.6 性能和限制691
41.6.1 总括691
41.6.2 Hough图最大值检测的性能691
41.7 结论692
41.8 参考资料692