-
>
貨幣大歷史:金融霸權與大國興衰六百年
-
>
(精)方力鈞作品圖錄
-
>
《藏書報》2021合訂本
-
>
(精)中國當代書畫名家作品集·范碩:書法卷+繪畫卷(全2卷)
-
>
(噴繪樓閣版)女主臨朝:武則天的權力之路
-
>
書里掉出來一只狼+狼的故事-全2冊
-
>
奇思妙想創(chuàng)意玩具書(精裝4冊)
大模型輕量化 模型壓縮與訓練加速 版權信息
- ISBN:9787302686002
- 條形碼:9787302686002 ; 978-7-302-68600-2
- 裝幀:暫無
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:
大模型輕量化 模型壓縮與訓練加速 內容簡介
本書圍繞大模型輕量化這一主題,系統(tǒng)地闡述大模型輕量化的基本理論與實現(xiàn)方法,旨在提升模型的部署效率和計算性能。全書分為3部分,共10章。第1部分(第1~5章),介紹大模型的背景與面臨的問題,以及Transformer和MoE架構的基本原理;重點講解模型壓縮、訓練加速和推理優(yōu)化等核心技術,包括量化、蒸餾和剪枝等,并通過實際案例驗證其效果。第2部分(第6、7章),重點介紹端側學習與計算引擎優(yōu)化策略,尤其是動態(tài)Batch和異構執(zhí)行的工程實現(xiàn)。第3部分(第8~10章),針對高性能算子庫與手工算子開發(fā),分別以cuDNN、NEON、CUDA等為代表,揭示算子優(yōu)化的細節(jié),*后,以國產開源模型DeepSeek-V3為例,展現(xiàn)從訓練到推理的綜合優(yōu)化方案。
本書提供全面實用的輕量化方法論,結合豐富代碼示例與實踐案例,適合從事大模型開發(fā)與優(yōu)化的工程師,也為研究人員提供深入探討的素材與視角,助力解決大模型訓練與推理中的實際問題。
- >
史學評論
- >
苦雨齋序跋文-周作人自編集
- >
名家?guī)阕x魯迅:故事新編
- >
羅庸西南聯(lián)大授課錄
- >
有舍有得是人生
- >
小考拉的故事-套裝共3冊
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學概述