包郵深度神經網絡高效計算大模型輕量化原理與關鍵技術

作者：程健,王培松,胡慶浩等編

出版社：電子工業出版社出版時間：2024-08-01

開本： 16開 頁數： 288

本類榜單：計算機/網絡銷量榜

中圖價:¥58.4(5.9折) 定價 ~~¥99.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

商品詳情
商品評論(0條)

中圖價:¥58.4 加入購物車

版權信息
內容簡介
目錄
作者簡介

深度神經網絡高效計算大模型輕量化原理與關鍵技術版權信息

ISBN：9787121484018
條形碼：9787121484018 ; 978-7-121-48401-8
裝幀：平塑勒
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
計算機理論

深度神經網絡高效計算大模型輕量化原理與關鍵技術內容簡介

近些年來，在深度學習的推動下，人工智能步入新的發展階段。然而，隨著深度學習模型性能的提升，其計算復雜度也在不斷增加，深度學習模型的運行效率面臨巨大挑戰。在這種情況下，深度學習高效計算成為在更大范圍內應用人工智能的重要環節。本書圍繞深度學習模型計算，重點從深度學習模型優化、算法軟件加速、硬件架構設計等方面展開介紹深度學習高效計算，主要包括低秩分解、剪枝、量化、知識蒸餾、精簡網絡設計與搜索、深度神經網絡高效訓練、卷積神經網絡高效計算、大模型高效計算、神經網絡加速器設計等內容。本書既適合高校相關專業學生，也可作為從業者的案頭參考。

深度神經網絡高效計算大模型輕量化原理與關鍵技術目錄

1 概述1
1.1 深度學習與人工智能1
1.2 深度學習高效計算 2
1.2.1 深度學習計算面臨困難 2
1.2.2 主要研究方向3
1.3 本章小結 4

2 神經網絡與深度學習基礎5
2.1 神經網絡5
2.1.1 感知機 5
2.1.2 多層感知機 6
2.1.3 深度學習 7
2.2 神經網絡訓練10
2.2.1 梯度下降 10
2.2.2 損失函數 11
2.2.3 過擬合與正則化 13
2.3 典型深度神經網絡15
2.3.1 卷積神經網絡15
2.3.2 循環神經網絡16
2.3.3 圖神經網絡 16
2.3.4 自注意力神經網絡16
2.4 本章小結 17

3 深度學習框架介紹18
3.1 什么是深度學習框架18
3.2 深度學習框架的基本組成19
3.2.1 張量 19
3.2.2 算子 19
3.2.3 計算圖20
3.2.4 自動微分支持20
3.2.5 并行計算支持21
3.3 深度學習訓練框架21
3.3.1 TensorFlow 22
3.3.2 PyTorch22
3.3.3 Caffe 22
3.3.4 MXNet 23
3.3.5 PaddlePaddle23
3.3.6 MindSpore24
3.4 深度學習推理框架 24
3.4.1 TensorFlow Lite24
3.4.2 MNN 25
3.4.3 NCNN 25
3.4.4 MACE 25
3.4.5 SNPE26
3.4.6 華為HiAI 26
3.4.7 TensorRT.26
3.4.8 QNN 27
3.5 本章小結 27

4 低秩分解28
4.1 張量基礎 28
4.1.1 張量定義 28
4.1.2 張量運算 29
4.1.3 特殊類型張量32
4.2 矩陣SVD 分解 33
4.2.1 特征值與特征向量33
4.2.2 特征值分解 34
4.2.3 SVD 分解34
4.2.4 全連接層SVD 分解 35
4.2.5 卷積層SVD 分解 36
4.3 張量低秩分解38
4.3.1 Tucker 分解39
4.3.2 CP 分解 41
4.3.3 BTD 分解 44
4.4 本章小結46

5 深度神經網絡剪枝47
5.1 神經網絡剪枝簡介 47
5.1.1 剪枝的基本概念和定義47
5.1.2 剪枝的作用與意義48
5.1.3 神經網絡剪枝發展簡史 49
5.1.4 剪枝的基本類型 50
5.2 稀疏網絡存儲格式51
5.2.1 非結構化剪枝存儲格式51
5.2.2 結構化剪枝存儲格式53
5.3 神經網絡剪枝算法53
5.3.1 基于重要性度量的剪枝 53
5.3.2 基于稀疏正則化的剪枝方法58
5.3.3 基于逐層特征重構的剪枝61
5.3.4 運行時剪枝算法 62
5.3.5 基于初始化的剪枝算法 65
5.3.6 基于自動機器學習的剪枝算法 66
5.4 本章小結 71

6 量化72
6.1 量化基礎73
6.1.1 量化函數 73
6.1.2 量化計算 77
6.1.3 量化粒度 80
6.2 訓練后量化81
6.2.1 量化參數求解82
6.2.2 量化誤差校正86
6.2.3 訓練后量化經典方法88
6.2.4 訓練后量化流程 91
6.3 量化感知訓練91
6.3.1 QAT 基礎 92
6.3.2 QAT 經典方法 94
6.3.3 QAT 流程 98
6.4 進階課題 99
6.4.1 混合精度量化100
6.4.2 無數據量化 105
6.4.3 二值量化 108
6.5 本章小結 113

7 知識蒸餾114
7.1 何為知識 114
7.2 如何蒸餾 118
7.2.1 軟標簽蒸餾 118
7.2.2 隱層特征蒸餾124
7.3 相關應用 128
7.3.1 魯棒訓練 128
7.3.2 語義分割 130
7.3.3 目標檢測 131
7.4 本章小結 135

8 精簡網絡設計與搜索136
8.1 手工設計神經網絡架構136
8.1.1 Network In Network 136
8.1.2 ResNeXt138
8.1.3 SqueezeNet 140
8.1.4 MobileNet 141
8.1.5 ShuffleNet 144
8.2 神經網絡架構搜索144
8.2.1 基于權重共享的神經網絡架構搜索 147
8.2.2 基于預測器的神經網絡架構搜索154
8.2.3 基于先驗指標的神經網絡架構搜索 155
8.3 本章小結 156

9 深度神經網絡高效訓練方法 158
9.1 深度神經網絡高效訓練簡介158
9.1.1 什么是高效訓練方法158
9.1.2 高效訓練方法基本類型159
9.1.3 高效訓練算法的意義159
9.2 深度神經網絡訓練基本流程160
9.2.1 數據預處理 160
9.2.2 前向傳播 161
9.2.3 反向傳播 162
9.2.4 權重更新 163
9.3 深度神經網絡分布式訓練163
9.3.1 參數服務器模式 164
9.3.2 Ring All-Reduce 模式 165
9.4 面向數據預處理的高效訓練方法 167
9.4.1 基于GPU 的數據預處理167
9.4.2 基于數據重復的數據預處理168
9.5 基于梯度壓縮的高效分布式訓練 169
9.5.1 梯度剪枝方法170
9.5.2 梯度量化方法170
9.5.3 本地殘差梯度積累171
9.5.4 本地梯度截斷172
9.6 面向顯存優化的高效訓練算法173
9.6.1 網絡訓練內存構成173
9.6.2 梯度檢查點 174
9.6.3 內存下放 175
9.6.4 激活壓縮的訓練176
9.7 面向計算過程的網絡訓練加速177
9.7.1 FP16 混合精度訓練算法177
9.7.2 基于低比特量化的訓練加速算法 178
9.7.3 稠密和稀疏網絡交替訓練算法 179
9.7.4 基于稀疏反向傳播的訓練加速 180
9.8 本章小結 181

10 卷積神經網絡高效計算182
10.1 im2col 算法183
10.1.1 一維卷積的im2col 算法183
10.1.2 二維卷積的im2col 算法185
10.1.3 多輸入通道的二維卷積的im2col 算法188
10.1.4 多輸出通道的二維卷積的im2col 算法189
10.2 矩陣乘算法優化與實現191
10.2.1 基礎實現 191
10.2.2 矩陣重排 192
10.2.3 分塊矩陣乘算法 196
10.2.4 向量化計算198
10.3 內存高效的快速卷積算法 199
10.3.1 im2col 算法的問題200
10.3.2 單通道二維卷積的MEC 算法202
10.3.3 多通道二維卷積的MEC 算法204
10.3.4 空間復雜度分析 205
10.4 Winograd 快速卷積算法 206
10.4.1 Winograd 快速卷積206
10.4.2 多通道二維卷積的Winograd 算法 209
10.4.3 復雜度分析211
10.5 稀疏卷積高效計算213
10.5.1 模式剪枝213
10.5.2 動機及剪枝方式 213
10.5.3 塊剪枝216
10.5.4 2:4 剪枝 218
10.6 本章小結 220

11 大模型高效計算 222
11.1 大模型概述222
11.1.1 大模型發展歷程 222
11.1.2 Transformer 架構223
11.1.3 計算特性分析 225
11.2 大模型壓縮方法226
11.2.1 大模型量化226
11.2.2 大模型剪枝231
11.3 高效訓練與微調237
11.3.1 大模型高效訓練算法 237
11.3.2 大模型參數高效微調方法 244
11.4 系統優化 248
11.4.1 算子融合優化：FlashAttention248
11.4.2 存儲管理優化：Paged Attention 252
11.4.3 并行服務優化：Continuous Batching253
11.5 高效解碼 254
11.5.1 推測解碼255
11.5.2 思維導圖257
11.6 本章小結 258

12 神經網絡加速器設計基礎260
12.1 為什么要設計神經網絡加速器260
12.2 神經網絡加速器設計基礎 262
12.2.1 硬件描述語言基礎263
12.2.2 計算單元265
12.2.3 存儲結構及片上網絡 270
12.2.4 數據流272
12.2.5 分塊及映射275
12.3 深度學習算法架構協同設計279
12.3.1 結構化稀疏加速器279
12.3.2 可變位寬加速器 281
12.3.3 其他協同設計方案284
12.4 網絡-架構協同搜索 286
12.4.1 基于強化學習的網絡-架構協同搜索 287
12.4.2 基于梯度的網絡-架構協同搜索288
12.5 本章小結 289

13 實戰DNN 加速器設計291
13.1 加速器整體架構291
13.2 接口互聯 292
13.3 構成部件 293
13.3.1 協處理器293
13.3.2 處理單元陣列 296
13.3.3 存儲系統302
13.4 軟件設計 305
13.5 可配置參數與架構拓展·306
13.6 本章小結 307
參考文獻309

展開全部

深度神經網絡高效計算大模型輕量化原理與關鍵技術作者簡介

程健，中國科學院自動化研究所模式識別國家重點實驗室研究員、博士生導師。1998年和2001年在武漢大學分別獲理學學士和碩士學位，2004年在中國科學院自動化研究所獲模式識別與智能系統博士學位。研究興趣包括深度學習、芯片架構設計、圖像與視頻分析等。近幾年帶領團隊提出了系列基于量化學習的模型壓縮和加速算法，并研發了量化神經處理器（QNPU）芯片架構。相關成果曾先后獲得中科院盧嘉錫青年人才獎、中國電子學會科技一等獎、中國圖象圖形學學會科技二等獎等。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
龍榆生：詞曲概論/大家小書
龍榆生：詞曲概論/大家小書
龍榆生
¥8.7~~¥24.0~~
>
小考拉的故事-套裝共3冊
小考拉的故事-套裝共3冊
[澳] 多蘿西·沃爾著，崔育平譯
¥36.7~~¥68.0~~
>
羅庸西南聯大授課錄
羅庸西南聯大授課錄
羅庸
¥14.1~~¥32.0~~
>
名家帶你讀魯迅:故事新編
名家帶你讀魯迅:故事新編
魯迅著，陳漱渝主編
¥13.0~~¥26.0~~
>
上帝之肋:男人的真實旅程
上帝之肋:男人的真實旅程
[美] 羅伯特·布萊著，田國力/盧文戈譯
¥20.2~~¥35.0~~
>
月亮與六便士
月亮與六便士
毛姆
¥19.1~~¥42.0~~
>
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
易竹賢
¥9.9~~¥23.0~~
>
伯納黛特,你要去哪(2021新版)
伯納黛特,你要去哪(2021新版)
[美] 瑪利亞·森普爾著，何雨珈譯
¥16.9~~¥49.8~~