国产第1页_91在线亚洲_中文字幕成人_99久久久久久_五月宗合网_久久久久国产一区二区三区四区

讀書月攻略拿走直接抄!
歡迎光臨中圖網 請 | 注冊
> >>
大規模并行處理器程序設計(原書第4版)

包郵 大規模并行處理器程序設計(原書第4版)

出版社:機械工業出版社出版時間:2025-03-01
開本: 16開 頁數: 356
中 圖 價:¥82.1(6.9折) 定價  ¥119.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大規模并行處理器程序設計(原書第4版) 版權信息

  • ISBN:9787111772767
  • 條形碼:9787111772767 ; 978-7-111-77276-7
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

大規模并行處理器程序設計(原書第4版) 本書特色

第4版重要更新:·增加關于CUDA的新內容,包括較新的庫,如CUDNN。·新增關于常用并行模式(模板、歸約、排序)的章節,并對之前的章節(卷積、直方圖、稀疏矩陣、圖遍歷、深度學習)進行了全面更新。·新增一章專門討論GPU架構,包含Ampere等新的架構示例。·優化關于問題分解策略和性能方面的討論,增加新的優化檢查清單。

大規模并行處理器程序設計(原書第4版) 內容簡介

本書內容簡潔、直觀、實用,強調計算思維能力和并行編程技巧。本書主要分為四個部分:第 一部分介紹異構并行計算編程的基礎概念,包括數據并行化、GPU架構、CUDA編程及程序性能優化方法等內容;第二部分介紹并行模式,包括卷積、模板、并行直方圖、歸約、前綴和、歸并等內容;第三部分介紹高級模式及應用,包括排序、稀疏矩陣計算、圖遍歷、深度學習、迭代式磁共振成像重建、靜電勢能圖和計算思維等內容;第四部分介紹高級編程實踐,包括異構計算集群編程、CUDA動態并行化等內容。本書不僅適合高等院校計算機相關專業的學生學習,也適合并行計算領域的技術人員參考。

大規模并行處理器程序設計(原書第4版)大規模并行處理器程序設計(原書第4版) 前言

前  言
Programming Massively Parallel Processors: A Hands-on Approach, Fourth Edition

我們非常自豪地向你介紹本書。
融合多核CPU和多線程GPU的大眾市場計算系統已經將萬億級別的計算能力引入筆記本電腦中,將億億級別的計算能力引入計算集群中。在如此強大的計算動能下,我們正處于科學、工程、醫學以及商業領域廣泛應用計算實驗的黎明。我們也親歷了GPU計算在金融、電子商務、石油與天然氣、制造等關鍵產業垂直市場的廣泛滲透。通過具有前所未有的規模、精確度、安全性、可控性與可視性的計算實驗,這些領域的突破將得以實現。本書為這一愿景提供了關鍵要素,即將并行編程教授給數百萬研究生和本科生,使得計算思維和并行編程技能能夠與微積分技能一樣廣泛普及。

大規模并行處理器程序設計(原書第4版) 目錄

目  錄
Programming Massively Parallel Processors: A Hands-on Approach, Fourth Edition
譯者序
推薦序
前言
致謝
第1章 引言 1
1.1 異構并行計算 2
1.2 為什么需要速度與并行性 5
1.3 加快實際應用的速度 6
1.4 并行編程中的挑戰 7
1.5 相關的并行編程接口 8
1.6 本書的總體目標 9
1.7 本書的章節安排 10
參考文獻 12
**部分 基本概念
第2章 異構數據并行計算 14
2.1 數據并行性 14
2.2 CUDA C程序結構 16
2.3 向量加法核 17
2.4 設備全局存儲和數據傳輸 19
2.5 核函數和線程 22
2.6 調用核函數 25
2.7 編譯 27
2.8 總結 27
2.8.1 函數聲明 27
2.8.2 內核調用和網格啟動 27
2.8.3 內置(預定義)變量 28
2.8.4 運行時應用程序編程接口 28
練習 28
參考文獻 30
第3章 多維網格和數據 31
3.1 多維網格組織 31
3.2 將線程映射到多維數據 33
3.3 圖像模糊:更復雜的內核 38
3.4 矩陣乘法 41
3.5 總結 44
練習 44
第4章 計算架構和調度 46
4.1 現代GPU架構 46
4.2 塊調度 47
4.3 同步和透明可擴展性 47
4.4 線程束和SIMD硬件 49
4.5 控制發散 53
4.6 線程束調度和延遲容忍 55
4.7 資源劃分和占用率 56
4.8 查詢設備屬性 58
4.9 總結 60
練習 60
參考文獻 61
第5章 內存架構和數據局部性 62
5.1 內存訪問效率的重要性 62
5.2 CUDA內存類型 64
5.3 利用平鋪減少內存流量 68
5.4 平鋪的矩陣乘法內核 70
5.5 邊界檢查 74
5.6 內存使用對占用率的影響 76
5.7 總結 78
練習 78
第6章 性能方面的考慮 81
6.1 內存合并 81
6.2 隱藏內存延遲 87
6.3 線程粗化 91
6.4 優化清單 93
6.5 了解計算瓶頸 96
6.6 總結 96
練習 96
參考文獻 97
第二部分 并行模式
第7章 卷積:常量內存和緩存 100
7.1 背景 100
7.2 并行卷積:一種基本算法 103
7.3 常量內存和緩存:概念與實例 105
7.4 邊緣單元平鋪卷積 108
7.5 使用邊緣單元緩存的平鋪卷積 111
7.6 總結 113
練習 113
第8章 模板 115
8.1 背景 115
8.2 并行模板:基本算法 118
8.3 用于模板掃描的共享內存平鋪 119
8.4 線程粗化 121
8.5 寄存器平鋪 123
8.6 總結 125
練習 125
第9章 并行直方圖:原子操作和
私有化 126
9.1 背景 126
9.2 原子操作與基本直方圖內核 128
9.3 原子操作的延遲和吞吐量 131
9.4 私有化 132
9.5 粗化 134
9.6 聚合 137
9.7 總結 138
練習 138
參考文獻 139
第10章 歸約和*小化發散 140
10.1 背景 140
10.2 歸約樹 141
10.3 一個簡單的歸約內核 143
10.4 *小化控制發散 145
10.5 *小化內存發散 148
10.6 *小化全局內存訪問 149
10.7 對任意輸入長度進行分層歸約 150
10.8 利用線程粗化減少開銷 152
10.9 總結 154
練習 154
第11章 前綴和(掃描):并行算法的工作效率 156
11.1 背景 156
11.2 基于Kogge-Stone算法的并行
掃描 158
11.3 關于速度與工作效率的考慮 162
11.4 基于Brent-Kung算法的并行
掃描 163
11.5 利用粗化提高工作效率 167
11.6 任意長度輸入的分段并行掃描 168
11.7 利用單次掃描提高內存訪問
效率 171
11.8 總結 172
練習 173
參考文獻 173
第12章 歸并:動態輸入數據
識別 175
12.1 背景 175
12.2 串行歸并算法 176
12.3 并行化方法 177
12.4 共秩函數的實現 178
12.5 基本并行歸并內核 182
12.6 用于改進內存合并的平鋪歸并
內核 183
12.7 循環緩沖區歸并內核 187
12.8 用于歸并的線程粗化 192
12.9 總結 192
練習 193
參考文獻 193
第三部分 高級模式及應用
第13章 排序 196
13.1 背景 196
13.2 基數排序 197
13.3 并行基數排序 198
13.4 內存合并優化 200
13.5 基值的選擇 202
13.6 利用線程粗化改善合并 204
13.7 并行歸并排序 205
13.8 其他并行排序方法 205
13.9 總結 206
練習 207
參考文獻 207
第14章 稀疏矩陣計算 208
14.1 背景 208
14.2 具有COO格式的簡單SpMV
內核 209
14.3 利用CSR格式分組非零行 211
展開全部

大規模并行處理器程序設計(原書第4版) 作者簡介

胡文美(Wen-mei W. Hwu)
NVIDIA公司杰出研究科學家兼高級研究總監。伊利諾伊大學厄巴納-香檳分校榮休教授,并行計算研究中心首席科學家。他在編譯器設計、計算機體系結構、微體系結構和并行計算方面做出了卓越貢獻,是IEEE Fellow、ACM Fellow,榮獲了包括ACM-IEEE CS Eckert-Mauchly獎、ACM Grace Murray Hopper獎、ACM SIGARCH Maurice Wilkes獎在內的眾多獎項。他擁有加州大學伯克利分校計算機科學博士學位。

大衛·B. 柯克(David B. Kirk)
美國國家工程院院士,NVIDIA Fellow,曾任NVIDIA公司首席科學家。2002年,他榮獲ACM SIGGRAPH計算機圖形學成就獎,以表彰其在把高性能計算機圖形系統推向大眾市場方面做出的杰出貢獻。他擁有加州理工學院計算機科學博士學位。
胡文美(Wen-mei W. Hwu)
NVIDIA公司杰出研究科學家兼高級研究總監。伊利諾伊大學厄巴納-香檳分校榮休教授,并行計算研究中心首席科學家。他在編譯器設計、計算機體系結構、微體系結構和并行計算方面做出了卓越貢獻,是IEEE Fellow、ACM Fellow,榮獲了包括ACM-IEEE CS Eckert-Mauchly獎、ACM Grace Murray Hopper獎、ACM SIGARCH Maurice Wilkes獎在內的眾多獎項。他擁有加州大學伯克利分校計算機科學博士學位。

大衛·B. 柯克(David B. Kirk)
美國國家工程院院士,NVIDIA Fellow,曾任NVIDIA公司首席科學家。2002年,他榮獲ACM SIGGRAPH計算機圖形學成就獎,以表彰其在把高性能計算機圖形系統推向大眾市場方面做出的杰出貢獻。他擁有加州理工學院計算機科學博士學位。

伊扎特·埃爾·哈吉(Izzat El Hajj)
貝魯特美國大學計算機科學系助理教授。他的研究方向是針對新興并行處理器和內存技術的應用加速和編程支持,特別是GPU和存算一體。他擁有伊利諾伊大學厄巴納-香檳分校電氣與計算機工程博士學位。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 小妖精又紧又湿高潮h视频69 | 久久精品毛片 | 久久久网站 | www视频在线免费观看 | 深夜在线小视频 | 久久网综合 | 亚洲人交性视频 | 日本在线网 | 国产麻豆剧传媒精品国产av | 国产精品亚洲第五区在线 | 久久国产精品久久国产精品 | 中文字幕一区二区三区精华液 | 99久久精品日本一区二区免费 | 美女的mm视频网站 | 亚洲人jizz日本人处 | 人妻去按摩店被黑人按中出 | 中文字幕日韩人妻在线视频 | 久久国产成人精品国产成人亚洲 | 亚洲成av人片久久 | 亚洲高清综合 | 色狠狠av一区二区三区 | 99免费在线观看 | 国产自产拍精品视频免费看 | 中文字幕亚洲欧美日韩高清 | 黄色网址在线免费播放 | 久久99精品久久久久久h | 日本高清免费不卡毛片 | 日本免费一区二区三区 | 视频在线观看一区 | 91麻豆精品国产91久久久久 | 色姑娘综合网 | 一区二区在线精品免费视频 | 色综合久久88色综合天天 | 精品人妻潮喷久久久又裸又黄 | 少妇被躁爽到高潮 | 亚洲欧美精品网站在线观看 | 一区二区三区精品视频免费播放 | 麻豆精品人妻一区二区三区蜜桃 | 久久精品国产亚洲7777小说 | 成人妇女免费播放久久久 | 草草影院在线ccyycom |