-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
強化學習的數學原理(英文版) 版權信息
- ISBN:9787302658528
- 條形碼:9787302658528 ; 978-7-302-65852-8
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
強化學習的數學原理(英文版) 本書特色
·從零開始到透徹理解,知其然并知其所以然; ·本書在GitHub收獲2000 星; ·課程視頻全網播放超過80萬; ·國內外讀者反饋口碑爆棚; ·教材、視頻、課件三位一體。
強化學習的數學原理(英文版) 內容簡介
本書從強化學習*基本的概念開始介紹, 將介紹基礎的分析工具, 包括貝爾曼公式和貝爾曼* 優公式, 然后推廣到基于模型的和無模型的強化學習算法, *后推廣到基于函數逼近的強化學習方 法。本書強調從數學的角度引入概念、分析問題、分析算法, 并不強調算法的編程實現。本書不要求 讀者具備任何關于強化學習的知識背景, 僅要求讀者具備一定的概率論和線性代數的知識。如果讀者 已經具備強化學習的學習基礎, 本書可以幫助讀者更深入地理解一些問題并提供新的視角。 本書面向對強化學習感興趣的本科生、研究生、研究人員和企業或研究所的從業者。
強化學習的數學原理(英文版) 目錄
強化學習的數學原理(英文版) 作者簡介
趙世鈺,西湖大學工學院AI分支特聘研究員,智能無人系統實驗室負責人,國家海外高層次人才引進計劃青年項目獲得者;本碩畢業于北京航空航天大學,博士畢業于新加坡國立大學,曾任英國謝菲爾德大學自動控制與系統工程系Lecturer;致力于研發有趣、有用、有挑戰性的下一代機器人系統,重點關注多機器人系統中的控制、決策與感知等問題。
- >
朝聞道
- >
莉莉和章魚
- >
名家帶你讀魯迅:朝花夕拾
- >
伊索寓言-世界文學名著典藏-全譯本
- >
巴金-再思錄
- >
李白與唐代文化
- >
苦雨齋序跋文-周作人自編集
- >
推拿