-
>
闖進數(shù)學世界――探秘歷史名題
-
>
中醫(yī)基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
數(shù)據(jù)科學基礎——基于R與PYTHON的實現(xiàn)(基于PYTHON的數(shù)據(jù)分析叢書) 版權(quán)信息
- ISBN:9787300334660
- 條形碼:9787300334660 ; 978-7-300-33466-0
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
數(shù)據(jù)科學基礎——基于R與PYTHON的實現(xiàn)(基于PYTHON的數(shù)據(jù)分析叢書) 內(nèi)容簡介
數(shù)據(jù)科學是在動態(tài)世界中不斷發(fā)展變化的。本書旨在讓讀者掌握數(shù)據(jù)科學基礎知識與技能,盡快進入理論與實踐,奠定進一步發(fā)展的基礎。
本書精選了5章內(nèi)容。第1章為數(shù)據(jù)初等描述;第2章介紹傳統(tǒng)統(tǒng)計基本思維方式,可作為參考;第3章系統(tǒng)深入地介紹有監(jiān)督學習基礎,包括回歸及分類概念方法,重點介紹決策樹;第4章介紹機器學習組合算法及模型;第5章詳細介紹神經(jīng)網(wǎng)絡的基本概念。內(nèi)容聚焦于決策樹、神經(jīng)網(wǎng)絡等既基礎又具擴展功能的方法,未羅列擴展性不強的方法。
本書支持R和Python兩種編程語言,R代碼穿插于正文,Python代碼及說明性R代碼附于每章之后。建議讀者在學習數(shù)據(jù)科學的過程中通過處理數(shù)據(jù)自學編程,培養(yǎng)自己的編程能力。
本書與教學契合度高,無論經(jīng)驗豐富的教師,還是沒有機器學習和數(shù)理統(tǒng)計教學經(jīng)驗的教師,都能輕松上手。其獨特的數(shù)據(jù)驅(qū)動教學方式,能夠極大地激發(fā)學生的學習興趣,促使學生快速吸收知識,提升學習效果。
數(shù)據(jù)科學基礎——基于R與PYTHON的實現(xiàn)(基于PYTHON的數(shù)據(jù)分析叢書) 目錄
第1章 體現(xiàn)真實世界的數(shù)據(jù)
1.1 數(shù)據(jù): 對真實世界的記錄
1.2 變量的逐個描述
1.3 變量關系的描述
1.4 數(shù)據(jù)的簡單描述可能很膚淺甚至誤導
1.5 習題
1.6 附錄: 正文中沒有的 R 代碼
1.7 附錄: 本章的Python代碼
第2章 傳統(tǒng)統(tǒng)計: 參數(shù)推斷簡介
2.1 關于總體均值 μ 的推斷
2.2 關于伯努利試驗概率的推斷
2.3 習 題
2.4 附錄: 本章的 Python 代碼
第3章 有監(jiān)督學習基礎
3.1 引 言
3.2 簡單回歸模型初識
3.3 *小二乘線性回歸模型
3.4 決策樹回歸
3.5 通過例子總結(jié)兩種回歸方法
3.6 簡單分類模型初識
3.7 Logistic回歸的數(shù)學背景
3.8 決策樹分類的更多說明
3.9 通過例子對兩種分類方法進行總結(jié)
3.10 多分類問題
3.11 習題
3.12 附錄: 正文中沒有的 R 代碼
3.13 附錄: 本章的 Python代碼
第4章 機器學習組合算法
4.1 什么是組合算法
4.2 bagging
4.3 隨機森林
4.4 梯度下降法及極端梯度增強回歸
4.5 AdaBoost 分類
4.6 組合算法對兩個數(shù)據(jù)的交叉驗證
4.7 習題
4.8 附錄: 正文中沒有的R代碼
4.9 附錄: 本章的Python代碼
第5章 神經(jīng)網(wǎng)絡
5.1 基本概念
5.2 通過基礎編程了解神經(jīng)網(wǎng)絡的細節(jié)
5.3 習題
5.4 附錄: 本章的Python代碼
數(shù)據(jù)科學基礎——基于R與PYTHON的實現(xiàn)(基于PYTHON的數(shù)據(jù)分析叢書) 相關資料
第 1 章是關于數(shù)據(jù)的初等描述,這是初識真實數(shù)據(jù)所必需的。第2章介紹了傳統(tǒng)統(tǒng)計的基本思維方式,這部分雖然和后續(xù)內(nèi)容關系不大, 但由于是歷史, 不應該回避, 可以僅作為參考或討論。第3章介紹了有監(jiān)督學習基礎,包括建模、模型解釋、模型預測、基于交叉驗證的模型比較等內(nèi)容, 系統(tǒng)深入地介紹了回歸及分類的概念及方法。對于有監(jiān)督學習載體的具體模型, 不但介紹了傳統(tǒng)統(tǒng)計中最常用的最小二乘線性回歸, 還從基本原理到編程全方位地介紹了作為機器學習中最重要的基礎學習器之一的決策樹, 為后面要引入的更精確的組合算法奠定了基礎。第4章介紹了機器學習組合算法及若干重要的組合算法模型, 包括 bagging、隨機森林、梯度增強回歸和 AdaBoost。第5章詳細地介紹了神經(jīng)網(wǎng)絡的基本概念, 神經(jīng)網(wǎng)絡是深度學習的基礎, 理解神經(jīng)網(wǎng)絡對今后學習深度學習有很大的益處。
本書是一本基礎教材, 因此在機器學習選題上選擇決策樹、神經(jīng)網(wǎng)絡等既基本又有擴展功能的方法, 而且從理論到編碼進行了詳盡的描述。為了使讀者在短時間內(nèi)集中精力牢固掌握最重要的有廣泛意義的知識, 本書沒有羅列一些常用但擴展性不強的方法, 比如支持向量機、貝葉斯網(wǎng)絡等, 感興趣的讀者可以從其他渠道獲得這些知識。
數(shù)據(jù)科學基礎——基于R與PYTHON的實現(xiàn)(基于PYTHON的數(shù)據(jù)分析叢書) 作者簡介
吳喜之 北京大學數(shù)學力學系本科畢業(yè),北卡羅來納大學統(tǒng)計學博士。中國人民大學統(tǒng)計學院教授,博士生導師.曾在南開大學、北京大學、加利福尼亞大學、北卡羅來納大學等多所著名學府執(zhí)教。
張 敏 重慶工商大學講師。作為第一作者發(fā)表CSSCI、CSCD、SCI文章多篇,主持或參與國家級及省部級課題多項,作為第二作者出版關于數(shù)據(jù)科學的教材多部。
- >
自卑與超越
- >
我從未如此眷戀人間
- >
伊索寓言-世界文學名著典藏-全譯本
- >
隨園食單
- >
名家?guī)阕x魯迅:故事新編
- >
苦雨齋序跋文-周作人自編集
- >
月亮與六便士
- >
山海經(jīng)