-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
AI加速器架構設計與實現 版權信息
- ISBN:9787111729518
- 條形碼:9787111729518 ; 978-7-111-72951-8
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
AI加速器架構設計與實現 本書特色
(1)作者背景權威:作者是地平線的BPU首席架構師,英偉達的前高級架構師。
(2)作者經驗豐富:作者在CPU、GPU和NPU等3大領域積累了15年的工作經驗,是多款CPU、NPU、GPU的核心架構師,參與了Xburst、NVDLA、TensorCore的架構設計工作。
(3)NPU架構與設計指南:詳細講解NPU的算法以及硬件加速器的架構設計與實現過程,教讀者從零開始設計NPU。
(4)圖文并茂、化繁為簡:一圖勝千言,用100余幅圖片將復雜的邏輯、算法、表述等直觀地呈現出來,化繁為簡,降低學習難度。
(5)全彩印刷:為了便于讀者理解加速器的原理、架構與實現過程,本書采用了全彩印刷。
AI加速器架構設計與實現 內容簡介
這是一本講解NPU硬件架構設計與技術實現的著作。作者將自己在CPU、GPU和NPU領域15年的軟硬件工作經驗融會貫通,將四代NPU架構設計經驗融為一體,將端側和云側NPU架構合二為一,總結并提煉出本書內容。本書主要討論神經網絡硬件層面,尤其是芯片設計層面的內容,主要包含神經網絡的分析、神經網絡加速器的設計以及具體實現技術。通過閱讀本書,讀者可以深入了解主流的神經網絡結構,掌握如何從零開始設計一個能用、好用的產品級加速器。通過閱讀本書,你將:?透徹理解與深度學習相關的機器學習算法及其實現?學會主流圖像處理領域神經網絡的結構?掌握加速器運算子系統和存儲子系統的設計?摸清加速器設計中遇到的具體問題及其解決方法?了解NPU架構需要考慮的控制通路和數據通路
AI加速器架構設計與實現 目錄
目 錄
前言
第1章 卷積神經網絡 1
1.1 神經網絡的結構 2
1.2 GCN 4
1.3 網絡的基本塊 7
1.4 網絡的算子 17
1.5 網絡參數量與運算量 29
1.6 加速器編程模型 31
1.7 硬件加速器架構分類 33
第2章 運算子系統的設計 35
2.1 數據流設計 35
2.2 算力與帶寬 38
2.2.1 算力與輸入帶寬 38
2.2.2 算力與輸出帶寬 41
2.3 卷積乘法陣列 43
2.3.1 Conv算法詳解 43
2.3.2 NVDLA的乘法陣列 47
2.3.3 TPU的乘法陣列 59
2.3.4 GPU的乘法陣列 66
2.3.5 華為DaVinci的乘法陣列 74
2.4 卷積運算順序的選擇 80
2.5 池化模塊的設計 81
第3章 存儲子系統的設計 86
3.1 存儲子系統概述 86
3.1.1 存儲子系統的組成 86
3.1.2 內部緩存的設計 89
3.2 數據格式的定義 97
3.2.1 特征圖的格式 98
3.2.2 權重的格式 100
第4章 架構優化技術 106
4.1 運算精度的選擇 106
4.1.1 dynamic fixed point類型 109
4.1.2 bfloat16類型 110
4.2 硬件資源的復用 111
4.2.1 FC 112
4.2.2 de-Conv 115
4.2.3 dilate Conv 123
4.2.4 group Conv 123
4.2.5 3D Conv 127
4.2.6 TC Conv 130
4.2.7 3D Pool 132
4.2.8 Up Sample Pooling 136
4.2.9 多個加速器的級聯 136
4.3 Winograd算法和FFT算法 138
4.3.1 Winograd算法解析 138
4.3.2 FFT算法解析 148
4.4 除法變乘法 150
4.5 LUT的使用 150
4.6 宏塊并行技術 155
4.7 減少軟件配置時間 156
4.8 軟件優化技術 157
4.9 一些激進的優化技術 158
第5章 安全與防護 160
5.1 安全技術 160
5.2 安全性評估 162
5.3 防護 163
第6章 神經網絡加速器的實現 165
6.1 乘法器的設計 165
6.1.1 整型乘法器的設計 166
6.1.2 浮點運算器的設計 171
6.2 數字電路常見基本塊的設計 184
6.3 時序優化 203
6.4 低功耗設計 207
第7章 盤點與展望 211
7.1 AI加速器盤點 211
7.2 Training加速器 211
7.3 展望 218
后記 220
AI加速器架構設計與實現 相關資料
當前,ChatGPT和自動駕駛等技術正在為人類社會帶來巨大的生產力變革,其中基于深度學習和增強學習的AI計算扮演著至關重要的角色。新的計算范式需要創新的芯片架構設計,這正面臨新的挑戰。本書從神經網絡的分析出發,總結和提煉了AI加速器架構設計中常見的難點,以及解決這些難點的技術、方法和思想,是AI軟硬件架構師、設計師非常寶貴的參考資料。 —— 余 凱 地平線創始人兼CEO 本書詳細總結了卷積神經網絡的基本結構和算法實現,并且對卷積神經網絡加速器的各種架構、具體硬件實現和優化進行了細致的闡述。本書介紹了一些關鍵電路設計的寶貴經驗,以及對神經網絡和加速器的思考和見解,為有志于神經網絡加速器設計的學生和工程師提供了指引,相信讀完此書一定大有裨益。 —— 何 虎 清華大學集成電路學院副教授/上海清華國際創新中心集成電路研究平臺副主任 本書系統地介紹了基于CNN的AI加速器設計方法,使讀者能夠對該領域的架構設計有清晰的認識。本書結合作者在該領域的架構設計經驗,對設計中遇到的具體問題加以討論并引導讀者思考,是一本非常實用的技術書,推薦想要從事相關設計的學生和工程技術人員閱讀。 —— 梁曉峣 上海交通大學教授、博導、學科帶頭人 本書作者精于AI架構設計,書中對神經網絡、加速器的架構及設計實現圖文并茂地進行了闡述,從理論和實踐兩個方面深入探討人工智能加速器的設計、優化和實現,幫助讀者更好地理解人工智能加速器的本質和應用。本書非常適合AI硬件架構設計人員閱讀,也推薦給對神經網絡架構有興趣的科技工作者和AI愛好者。 —— 呂堅平 天數智芯CTO 人工智能技術的快速發展在大大提高社會生產效率的同時,對算力的要求也到了前所未有的高度。同時,登納德定律和摩爾定律的終結,更增加了算力提升的難度。在這種情況下,領域專用架構幾乎成了唯一的解決方案。本書正是在這樣的指引下,不僅給出了神經網絡加速器的架構參考,還總結提煉了架構設計方法與思想,實屬可貴,一定會對人工智能從業者大有裨益。 —— 焦李成 歐洲科學院外籍院士/俄羅斯自然科學院外籍院士
AI加速器架構設計與實現 作者簡介
甄建勇
資深CPU、GPU、NPU三棲架構師,從事相關軟硬件架構與設計工作超過15年。現就職于地平線,擔任BPU首席架構師。曾就職于英偉達,擔任高級架構師,作為多款CPU、NPU、GPU的核心架構師,參與了Xburst、NVDLA、TensorCore的架構設計工作。熟悉SIMT/RayTracing等模塊的架構設計與實現。擅長的領域還包括經濟學、法學、心理學以及Linux內核、計算機圖形加速和全同態加密。
王路業
優矽科技聯合創始人兼總經理,中國開放指令生態(RISC-V)聯盟(CRVA)軟件開源工作組副組長。曾就職于ARM安謀科技、Synopsys新思科技、ST意法半導體和中國長城計算機。
- >
姑媽的寶刀
- >
詩經-先民的歌唱
- >
小考拉的故事-套裝共3冊
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
羅庸西南聯大授課錄
- >
月亮虎
- >
【精裝繪本】畫給孩子的中國神話
- >
苦雨齋序跋文-周作人自編集