国产第1页_91在线亚洲_中文字幕成人_99久久久久久_五月宗合网_久久久久国产一区二区三区四区

讀書月攻略拿走直接抄!
歡迎光臨中圖網 請 | 注冊
> >
深度神經網絡高效計算 大模型輕量化原理與關鍵技術

包郵 深度神經網絡高效計算 大模型輕量化原理與關鍵技術

出版社:電子工業出版社出版時間:2024-08-01
開本: 16開 頁數: 288
中 圖 價:¥58.4(5.9折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

深度神經網絡高效計算 大模型輕量化原理與關鍵技術 版權信息

  • ISBN:9787121484018
  • 條形碼:9787121484018 ; 978-7-121-48401-8
  • 裝幀:平塑勒
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

深度神經網絡高效計算 大模型輕量化原理與關鍵技術 內容簡介

近些年來,在深度學習的推動下,人工智能步入新的發展階段。然而,隨著深度學習模型性能的提升,其計算復雜度也在不斷增加,深度學習模型的運行效率面臨巨大挑戰。在這種情況下,深度學習高效計算成為在更大范圍內應用人工智能的重要環節。本書圍繞深度學習模型計算,重點從深度學習模型優化、算法軟件加速、硬件架構設計等方面展開介紹深度學習高效計算,主要包括低秩分解、剪枝、量化、知識蒸餾、精簡網絡設計與搜索、深度神經網絡高效訓練、卷積神經網絡高效計算、大模型高效計算、神經網絡加速器設計等內容。 本書既適合高校相關專業學生,也可作為從業者的案頭參考。

深度神經網絡高效計算 大模型輕量化原理與關鍵技術 目錄

1 概述1
1.1 深度學習與人工智能1
1.2 深度學習高效計算 2
1.2.1 深度學習計算面臨困難 2
1.2.2 主要研究方向3
1.3 本章小結 4

2 神經網絡與深度學習基礎5
2.1 神經網絡5
2.1.1 感知機 5
2.1.2 多層感知機 6
2.1.3 深度學習 7
2.2 神經網絡訓練10
2.2.1 梯度下降 10
2.2.2 損失函數 11
2.2.3 過擬合與正則化 13
2.3 典型深度神經網絡15
2.3.1 卷積神經網絡15
2.3.2 循環神經網絡16
2.3.3 圖神經網絡 16
2.3.4 自注意力神經網絡16
2.4 本章小結 17

3 深度學習框架介紹18
3.1 什么是深度學習框架18
3.2 深度學習框架的基本組成19
3.2.1 張量 19
3.2.2 算子 19
3.2.3 計算圖20
3.2.4 自動微分支持20
3.2.5 并行計算支持21
3.3 深度學習訓練框架21
3.3.1 TensorFlow 22
3.3.2 PyTorch22
3.3.3 Caffe 22
3.3.4 MXNet 23
3.3.5 PaddlePaddle23
3.3.6 MindSpore24
3.4 深度學習推理框架 24
3.4.1 TensorFlow Lite24
3.4.2 MNN 25
3.4.3 NCNN 25
3.4.4 MACE 25
3.4.5 SNPE26
3.4.6 華為HiAI 26
3.4.7 TensorRT.26
3.4.8 QNN 27
3.5 本章小結 27

4 低秩分解28
4.1 張量基礎 28
4.1.1 張量定義 28
4.1.2 張量運算 29
4.1.3 特殊類型張量32
4.2 矩陣SVD 分解 33
4.2.1 特征值與特征向量33
4.2.2 特征值分解 34
4.2.3 SVD 分解34
4.2.4 全連接層SVD 分解 35
4.2.5 卷積層SVD 分解 36
4.3 張量低秩分解38
4.3.1 Tucker 分解39
4.3.2 CP 分解 41
4.3.3 BTD 分解 44
4.4 本章小結46

5 深度神經網絡剪枝47
5.1 神經網絡剪枝簡介 47
5.1.1 剪枝的基本概念和定義47
5.1.2 剪枝的作用與意義48
5.1.3 神經網絡剪枝發展簡史 49
5.1.4 剪枝的基本類型 50
5.2 稀疏網絡存儲格式51
5.2.1 非結構化剪枝存儲格式51
5.2.2 結構化剪枝存儲格式53
5.3 神經網絡剪枝算法53
5.3.1 基于重要性度量的剪枝 53
5.3.2 基于稀疏正則化的剪枝方法58
5.3.3 基于逐層特征重構的剪枝61
5.3.4 運行時剪枝算法 62
5.3.5 基于初始化的剪枝算法 65
5.3.6 基于自動機器學習的剪枝算法 66
5.4 本章小結 71

6 量化72
6.1 量化基礎73
6.1.1 量化函數 73
6.1.2 量化計算 77
6.1.3 量化粒度 80
6.2 訓練后量化81
6.2.1 量化參數求解82
6.2.2 量化誤差校正86
6.2.3 訓練后量化經典方法88
6.2.4 訓練后量化流程 91
6.3 量化感知訓練91
6.3.1 QAT 基礎 92
6.3.2 QAT 經典方法 94
6.3.3 QAT 流程 98
6.4 進階課題 99
6.4.1 混合精度量化100
6.4.2 無數據量化 105
6.4.3 二值量化 108
6.5 本章小結 113

7 知識蒸餾114
7.1 何為知識 114
7.2 如何蒸餾 118
7.2.1 軟標簽蒸餾 118
7.2.2 隱層特征蒸餾124
7.3 相關應用 128
7.3.1 魯棒訓練 128
7.3.2 語義分割 130
7.3.3 目標檢測 131
7.4 本章小結 135

8 精簡網絡設計與搜索136
8.1 手工設計神經網絡架構136
8.1.1 Network In Network 136
8.1.2 ResNeXt138
8.1.3 SqueezeNet 140
8.1.4 MobileNet 141
8.1.5 ShuffleNet 144
8.2 神經網絡架構搜索144
8.2.1 基于權重共享的神經網絡架構搜索 147
8.2.2 基于預測器的神經網絡架構搜索154
8.2.3 基于先驗指標的神經網絡架構搜索 155
8.3 本章小結 156

9 深度神經網絡高效訓練方法 158
9.1 深度神經網絡高效訓練簡介158
9.1.1 什么是高效訓練方法158
9.1.2 高效訓練方法基本類型159
9.1.3 高效訓練算法的意義159
9.2 深度神經網絡訓練基本流程160
9.2.1 數據預處理 160
9.2.2 前向傳播 161
9.2.3 反向傳播 162
9.2.4 權重更新 163
9.3 深度神經網絡分布式訓練163
9.3.1 參數服務器模式 164
9.3.2 Ring All-Reduce 模式 165
9.4 面向數據預處理的高效訓練方法 167
9.4.1 基于GPU 的數據預處理167
9.4.2 基于數據重復的數據預處理168
9.5 基于梯度壓縮的高效分布式訓練 169
9.5.1 梯度剪枝方法170
9.5.2 梯度量化方法170
9.5.3 本地殘差梯度積累171
9.5.4 本地梯度截斷172
9.6 面向顯存優化的高效訓練算法173
9.6.1 網絡訓練內存構成173
9.6.2 梯度檢查點 174
9.6.3 內存下放 175
9.6.4 激活壓縮的訓練176
9.7 面向計算過程的網絡訓練加速177
9.7.1 FP16 混合精度訓練算法177
9.7.2 基于低比特量化的訓練加速算法 178
9.7.3 稠密和稀疏網絡交替訓練算法 179
9.7.4 基于稀疏反向傳播的訓練加速 180
9.8 本章小結 181

10 卷積神經網絡高效計算182
10.1 im2col 算法183
10.1.1 一維卷積的im2col 算法183
10.1.2 二維卷積的im2col 算法185
10.1.3 多輸入通道的二維卷積的im2col 算法188
10.1.4 多輸出通道的二維卷積的im2col 算法189
10.2 矩陣乘算法優化與實現191
10.2.1 基礎實現 191
10.2.2 矩陣重排 192
10.2.3 分塊矩陣乘算法 196
10.2.4 向量化計算198
10.3 內存高效的快速卷積算法 199
10.3.1 im2col 算法的問題200
10.3.2 單通道二維卷積的MEC 算法202
10.3.3 多通道二維卷積的MEC 算法204
10.3.4 空間復雜度分析 205
10.4 Winograd 快速卷積算法 206
10.4.1 Winograd 快速卷積206
10.4.2 多通道二維卷積的Winograd 算法 209
10.4.3 復雜度分析211
10.5 稀疏卷積高效計算213
10.5.1 模式剪枝213
10.5.2 動機及剪枝方式 213
10.5.3 塊剪枝216
10.5.4 2:4 剪枝 218
10.6 本章小結 220

11 大模型高效計算 222
11.1 大模型概述222
11.1.1 大模型發展歷程 222
11.1.2 Transformer 架構223
11.1.3 計算特性分析 225
11.2 大模型壓縮方法226
11.2.1 大模型量化226
11.2.2 大模型剪枝231
11.3 高效訓練與微調237
11.3.1 大模型高效訓練算法 237
11.3.2 大模型參數高效微調方法 244
11.4 系統優化 248
11.4.1 算子融合優化:FlashAttention248
11.4.2 存儲管理優化:Paged Attention 252
11.4.3 并行服務優化:Continuous Batching253
11.5 高效解碼 254
11.5.1 推測解碼255
11.5.2 思維導圖257
11.6 本章小結 258

12 神經網絡加速器設計基礎260
12.1 為什么要設計神經網絡加速器260
12.2 神經網絡加速器設計基礎 262
12.2.1 硬件描述語言基礎263
12.2.2 計算單元265
12.2.3 存儲結構及片上網絡 270
12.2.4 數據流272
12.2.5 分塊及映射275
12.3 深度學習算法架構協同設計279
12.3.1 結構化稀疏加速器279
12.3.2 可變位寬加速器 281
12.3.3 其他協同設計方案284
12.4 網絡-架構協同搜索 286
12.4.1 基于強化學習的網絡-架構協同搜索 287
12.4.2 基于梯度的網絡-架構協同搜索288
12.5 本章小結 289

13 實戰DNN 加速器設計291
13.1 加速器整體架構291
13.2 接口互聯 292
13.3 構成部件 293
13.3.1 協處理器293
13.3.2 處理單元陣列 296
13.3.3 存儲系統302
13.4 軟件設計 305
13.5 可配置參數與架構拓展·306
13.6 本章小結 307
參考文獻309
展開全部

深度神經網絡高效計算 大模型輕量化原理與關鍵技術 作者簡介

程健,中國科學院自動化研究所模式識別國家重點實驗室研究員、博士生導師。1998年和2001年在武漢大學分別獲理學學士和碩士學位,2004年在中國科學院自動化研究所獲模式識別與智能系統博士學位。研究興趣包括深度學習、芯片架構設計、圖像與視頻分析等。近幾年帶領團隊提出了系列基于量化學習的模型壓縮和加速算法,并研發了量化神經處理器(QNPU)芯片架構。相關成果曾先后獲得中科院盧嘉錫青年人才獎、中國電子學會科技一等獎、 中國圖象圖形學學會科技二等獎等。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 成人午夜在线观看 | 国产主播啪啪 | 无遮挡啪啪摇乳动态图gif | 青青草国产精品一区二区 | 99久久国内精品成人免费 | 欧美日韩不卡合集视频 | 日韩中文在线 | 亚洲精品无码永久在线观看 | 香蕉视频啊啊啊 | 日本一级淫片a的一级欧美 日本一级淫片a免费播放 | 嫩草伊人久久精品少妇av | 毛片基地免费观看 | 区二区三区玖玖玖 | 网站国产| 丰满妇女毛茸茸刮毛 | 久久精品免视看国产陈冠希 | 日本高清色本在线www | 美女自熨出白浆视频在线播放 | 久久国产劲暴∨内射 | 久久国产精品日本波多野结衣 | 野花社区视频www官网 | 久久这里只有精品免费视频 | 亚洲老熟女av一区二区在线播放 | 成人做爰69片免费看网站 | 久久久国产亚洲精品 | 午夜不卡久久精品无码免费 | 男人天堂影院www94 | 99久久精品国产一区二区 | 天美传媒精品1区2区3区 | 国产成人精品免费视频网页大全 | 国产成人久久蜜一区二区 | 久久久久人妻啪啪一区二区 | 久久久久久影视 | 国产精品永久久久久久久久久 | 久久成人亚洲香蕉草草 | 中国少妇初尝黑人巨高清 | 国产精品久久福利网站 | 亚洲人成无码网站 | 精品国模一区二区三区 | 少妇伦子伦精品无码styles | 国产精品视频公开费视频 |