Python數據分析與挖掘實戰(第2版) 版權信息
- ISBN:9787111640028
- 條形碼:9787111640028 ; 978-7-111-64002-8
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
Python數據分析與挖掘實戰(第2版) 本書特色
適讀人群 :關注高級數據分析的人員;從事數據挖掘應用研究的科研人員;數據挖掘開發人員;需求分析及系統設計人員;開設數據挖掘課程的高校的教師和學生。為了幫助讀者更好地使用本書,本書提供配套的原始數據文件、Python程序代碼,讀者可以從“華章計算機”公眾號,回復64002免費獲取。為方便教師授課,本書還提供了PPT課件,教師可到網址http://www.tipdm.org/tj/840.jhtml咨詢獲取。 (1)暢銷書全新升級,第1版銷售超過10萬冊,被國內100余所高等院校采用為教材,同時被廣大數據科學工作者奉為經典,是該領域公認的事實標準。 (2)作者在大數據挖掘與分析等領域有10余年的工程實踐、教學和創辦企業的經驗,不僅掌握行業的z新技術和實踐方法,而且洞悉學生和老師的需求與痛點。 (3)本書提供豐富的配套資源,含上機環境、Python源代碼、案例建模數據、教學PPT。
Python數據分析與挖掘實戰(第2版) 內容簡介
內容簡介本書是Python數據分析與挖掘領域的認可的事實標準,第1版銷售超過10萬冊,銷售勢頭依然強勁,被國內100余所高等院校采用為教材,同時也被廣大數據科學工作者奉為經典。作者在大數據挖掘與分析等領域有10余年的工程實踐、教學和創辦企業的經驗,不僅掌握行業的近期新技術和實踐方法,而且洞悉學生和老師的需求與痛點,這為本書的內容和形式提供了強有力的保障,這是本書第1版能大獲成功的關鍵因素。全書共13章,分為三個部分,從技術理論、工程實踐和進階提升三個維度對數據分析與挖掘進行了詳細的講解。**部分 基礎篇(~5章)主要講解了Python數據分析與挖掘的工具和技術理論,包括數據挖掘的基礎知識、Python數據挖掘與建模工具、數據挖掘的建模過程,以及挖掘建模的常用算法和原理等內容。第二部分 實戰篇(第6~12章)通過工程實踐案例講解了數據挖掘技術在金融、航空、零售、能源、制造、電商等行業的應用。在案例組織結構上,本書按照“介紹案例背景與挖掘目標→闡述分析方法與過程→完成模型構建”的順序進行,在建模過程關鍵環節,穿插程序實現代碼。*后,通過上機實踐加深對案例應用中的數據挖掘技術的理解。第三部分 提高篇(第13章)重點講解了基于Python引擎的開源數據挖掘建模平臺(TipDM)的功能和使用方法,以航空公司客戶價值分析為案例,介紹了如何使用該平臺快速搭建數據分析與挖掘工程。本書不僅提供TipDM這樣的上機實踐環境,而且還提供配套的案例建模數據、Python源代碼、教學PPT。
Python數據分析與挖掘實戰(第2版) 目錄
前言基礎篇第1章 數據挖掘基礎 21.1 某知名連鎖餐飲企業的困惑 21.2 從餐飲服務到數據挖掘 41.3 數據挖掘的基本任務 51.4 數據挖掘建模過程 51.4.1 定義挖掘目標 61.4.2 數據取樣 61.4.3 數據探索 71.4.4 數據預處理 81.4.5 挖掘建模 81.4.6 模型評價 81.5 常用數據挖掘建模工具 91.6 小結 11第2章 Python數據分析簡介 122.1 搭建Python開發平臺 142.1.1 所要考慮的問題 142.1.2 基礎平臺的搭建 142.2 Python使用入門 162.2.1 運行方式 162.2.2 基本命令 172.2.3 數據結構 192.2.4 庫的導入與添加 242.3 Python數據分析工具 262.3.1 NumPy 272.3.2 SciPy 282.3.3 Matplotlib 292.3.4 pandas 312.3.5 StatsModels 332.3.6 scikit-learn 332.3.7 Keras 342.3.8 Gensim 362.4 配套附件使用設置 372.5 小結 38第3章 數據探索 393.1 數據質量分析 393.1.1 缺失值分析 403.1.2 異常值分析 403.1.3 一致性分析 443.2 數據特征分析 443.2.1 分布分析 443.2.2 對比分析 483.2.3 統計量分析 513.2.4 周期性分析 543.2.5 貢獻度分析 553.2.6 相關性分析 583.3 Python主要數據探索函數 623.3.1 基本統計特征函數 623.3.2 拓展統計特征函數 663.3.3 統計繪圖函數 673.4 小結 74第4章 數據預處理 754.1 數據清洗 754.1.1 缺失值處理 754.1.2 異常值處理 804.2 數據集成 804.2.1 實體識別 814.2.2 冗余屬性識別 814.2.3 數據變換 814.2.4 簡單函數變換 814.2.5 規范化 824.2.6 連續屬性離散化 844.2.7 屬性構造 874.2.8 小波變換 884.3 數據歸約 914.3.1 屬性歸約 914.3.2 數值歸約 954.4 Python主要數據預處理函數 984.5 小結 101第5章 挖掘建模 1025.1 分類與預測 1025.1.1 實現過程 1035.1.2 常用的分類與預測算法 1035.1.3 回歸分析 1045.1.4 決策樹 1085.1.5 人工神經網絡 1155.1.6 分類與預測算法評價 1205.1.7 Python分類預測模型特點 1255.2 聚類分析 1255.2.1 常用聚類分析算法 1265.2.2 K-Means聚類算法 1275.2.3 聚類分析算法評價 1325.2.4 Python主要聚類分析算法 1335.3 關聯規則 1355.3.1 常用關聯規則算法 1365.3.2 Apriori算法 1365.4 時序模式 1425.4.1 時間序列算法 1425.4.2 時間序列的預處理 1435.4.3 平穩時間序列分析 1455.4.4 非平穩時間序列分析 1485.4.5 Python主要時序模式算法 1565.5 離群點檢測 1595.5.1 離群點的成因及類型 1605.5.2 離群點檢測方法 1605.5.3 基于模型的離群點檢測方法 1615.5.4 基于聚類的離群點檢測方法 1645.6 小結 167實戰篇第6章 財政收入影響因素分析及預測 1706.1 背景與挖掘目標 1706.2 分析方法與過程 1716.2.1 分析步驟與流程 1726.2.2 數據探索分析 1726.2.3 數據預處理 1766.2.4 模型構建 1786.3 上機實驗 1846.4 拓展思考 1856.5 小結 186第7章 航空公司客戶價值分析 1877.1 背景與挖掘目標 1877.2 分析方法與過程 1887.2.1 分析步驟與流程 1897.2.2 數據探索分析 1897.2.3 數據預處理 2007.2.4 模型構建 2077.2.5 模型應用 2127.3 上機實驗 2147.4 拓展思考 2157.5 小結 216第8章 商品零售購物籃分析 2178.1 背景與挖掘目標 2178.2 分析方法與過程 2188.2.1 數據探索分析 2198.2.2 數據預處理 2248.2.3 模型構建 2268.3 上機實驗 2328.4 拓展思考 2338.5 小結 233第9章 基于水色圖像的水質評價 2349.1 背景與挖掘目標 2349.2 分析方法與過程 2359.2.1 分析步驟與流程 2369.2.2 數據預處理 2369.2.3 模型構建 2409.2.4 水質評價 2419.3 上機實驗 2429.4 拓展思考 2429.5 小結 243第10章 家用熱水器用戶行為分析與事件識別 24410.1 背景與挖掘目標 24410.2 分析方法與過程 24510.2.1 數據探索分析 24610.2.2 數據預處理 24910.2.3 模型構建 26010.2.4 模型檢驗 26110.3 上機實驗 26210.4 拓展思考 26410.5 小結 265第11章 電子商務網站
展開全部
Python數據分析與挖掘實戰(第2版) 作者簡介
張良均 資深大數據挖掘與分析專家、模式識別專家、AI技術專家。有10余年大數據挖掘與分析經驗,擅長Python、R、Hadoop、Matlab等技術實現的數據挖掘與分析,對機器學習等AI技術驅動的數據分析也有深入研究。 為電信、電力、政府、互聯網、生產制造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗非常豐富。 華南師范大學、中南財經政法大學、廣東工業大學、西安理工大學、廣西科技大學、重慶交通大學、桂林電子科技大學等校外碩導或兼職教授。 撰寫了《R語言數據分析與挖掘實戰》《數據挖掘:實用案例分析》《Hadoop大數據分析與挖掘實戰》等10余部暢銷書,累計銷售超過30萬冊。