-
>
以利為利:財政關系與地方政府行為
-
>
立足飯碗 藏糧于地——基于中國人均耕地警戒值的耕地保護視角
-
>
營銷管理
-
>
茶葉里的全球貿易史(精裝)
-
>
近代華商股票市場制度與實踐(1872—1937)
-
>
麥肯錫圖表工作法
-
>
海龜交易法則
大數據挖掘技術與應用 版權信息
- ISBN:9787502467807
- 條形碼:9787502467807 ; 978-7-5024-6780-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據挖掘技術與應用 本書特色
本書針對數據的海量性、復雜性、高維性、模糊性和不完整性,對數據挖掘技術中的聚類分析和關聯規則分析進行了系統的研究。設計與實現了基于密度和自適應密度可達聚類算法、基于簇特征的動態增量聚類算法、并行聚類算法、基于密度加權的模糊聚類算法、高唯復雜數據聚類算法、基于數據場的聚類算法、基于距離的量化關聯規則和基于數據場的量化關聯規則算法,給出了在礦產資源評價、遙感圖像分類、礦業經濟分析中的應用例證。全書共分11章,主要內容包括:緒論,基于密度和密度可達聚類分析,基于簇特征的動態增量聚類分析,并行聚類分析,基于密度加權的模糊聚類分析,高唯復雜數據聚類分析,基于數據場的聚類分析,基于距離的量化關聯規則,基于數據場的量化關聯規則,數據挖掘結果可視化和數據挖掘算法應用。
大數據挖掘技術與應用 內容簡介
《大數據挖掘技術與應用》針對大數據的海量性、高維性、異構性、動態性、多樣性、多源性、多尺度性、時空性和模糊性等特征,對數據挖掘技術中的聚類分析和關聯規則分析進行了系統的研究;研究與開發了基于密度和自適應密度可達聚類算法、動態增量聚類算法、并行聚類算法、高維多類型數據聚類算法、基于密度加權的模糊聚類算法、基于數據場的聚類和量化關聯規則算法、基于距離的量化關聯規則分析、基于云計算的大數據聚類算法,以及挖掘結果的可視化表達;給出了地球化學數據挖掘、基于數據挖掘的中國資源與區域經濟發展關系的分析應用實例。 《大數據挖掘技術與應用》可供從事數據挖掘技術研究、應用和軟件開發人員以及學習數據挖掘技術的本科生和研究生參考。
大數據挖掘技術與應用 目錄
1.1 大數據 1
1.1.1 大數據概念1
1.1.2 大數據特征4
1.2 云計算與大數據挖掘 5
1.2.1 云計算5
1.2.2 大數據挖掘6
1.3 傳統數據挖掘 6
1.3.1 數據源與挖掘任務7
1.3.2 數據挖掘方法7
1.3.3 數據挖掘面臨問題9
參考文獻 10
2 基于屬性加權和密度聚類分析11
2.1 聚類分析技術 11
2.1.1 數據基礎11
2.1.2 聚類分析方法16
2.1.3 簇的類型16
2.2 聚類算法 17
2.2.1 聚類算法分類17
2.2.2 聚類算法特性19
2.2.3 選用聚類算法參考因素20
2.2.4 聚類算法面臨的挑戰21
2.3 聚類算法改進 23
2.3.1 聚類算法分析23
2.3.2 數據對象屬性加權25
2.3.3 基于屬性加權k-means算法27
2.3.4 實例驗證算法28
2.4 基于密度與對象方向聚類算法 29
2.4.1 算法的提出29
2.4.2 denclue算法30
2.4.3 算法設計31
2.5 cabwad算法實現 36
2.5.1 數據結構建立36
2.5.2 數據結構上聚類38
2.5.3 時間和空間復雜度40
2.6 實驗分析 40
2.6.1 準確度分析41
2.6.2 可擴展性分析43
參考文獻 44
3 基于密度與密度可達聚類分析46
3.1 cabwad算法分析 46
3.1.1 算法過程分析46
3.1.2 兩個輸入參數的分析47
3.2 算法設計與分析 50
3.2.1 相關定義50
3.2.2 cadd算法設計53
3.2.3 算法執行過程分析53
3.3 實驗分析 55
3.3.1 不同分布形態的簇(纏繞簇)55
3.3.2 不同密度的簇56
3.3.3 分布在不同密度噪聲中的變密度簇57
3.3.4 復雜形態簇58
3.3.5 算法復雜度分析59
參考文獻 60
4 動態增量聚類分析62
4.1 算法提出 62
4.1.1 增量聚類算法62
4.1.2 cadd算法分析64
4.1.3 抽樣技術66
4.2 基于密度可達的動態增量聚類算法 67
4.2.1 算法設計67
4.2.2 算法實現69
4.2.3 算法復雜度分析69
4.3 基于子簇特征的增量聚類算法 70
4.3.1 相關定義70
4.3.2 算法設計72
4.3.3 算法實現72
4.4 實驗分析 73
4.4.1 仿真動態增量聚類73
4.4.2 算法對比分析77
參考文獻 78
5 并行聚類分析80
5.1 并行計算技術 80
5.1.1 并行計算定義81
5.1.2 并行計算分類81
5.1.3 并行計算模型和體系結構82
5.1.4 并行數據挖掘85
5.1.5 并行聚類分析86
5.2 并行聚類算法設計與實現 88
5.2.1 算法總體流程88
5.2.2 數據并行聚類算法89
5.2.3 數據并行和任務并行聚類算法90
5.3 實驗分析 92
5.3.1 算法有效性分析92
5.3.2 算法加速比分析92
5.3.3 算法時間復雜度分析93
5.3.4 pcadd與cadd算法執行時間對比93
參考文獻 94
6 高維多類型屬性數據對象聚類分析95
6.1 高維多類型屬性數據對象 95
6.1.1 高維數據處理95
6.1.2 多類型屬性處理96
6.1.3 高維數據對象聚類96
6.1.4 多類型屬性數據對象聚類98
6.2 維度對聚類算法精度影響 99
6.2.1 高維數據聚類99
6.2.2 數據集與相關定義99
6.2.3 實驗結果及分析100
6.3 多類型屬性數據聚類分析 103
6.3.1 處理多類型數據方法103
6.3.2 聚類效果度量標準103
6.3.3 實驗結果及分析104
6.4 基于屬性加權的高維數據聚類 108
6.4.1 屬性加權cadd算法108
6.4.2 實驗結果及分析109
參考文獻 113
7 基于密度加權模糊聚類分析115
7.1 模糊聚類分析 115
7.1.1 模糊聚類產生115
7.1.2 模糊聚類分類116
7.1.3 模糊聚類算法優化117
7.2 模糊聚類算法 118
7.2.1 模糊簇118
7.2.2 hc-means聚類算法118
7.2.3 fc-means聚類算法119
7.2.4 hcm和fcm的關系120
7.2.5 fcm算法存在問題分析121
7.3 基于密度函數加權的fcm 122
7.3.1 聚類算法提出122
7.3.2 聚類算法設計123
7.3.3 實驗結果及分析124
參考文獻 132
8 基于距離量化關聯規則挖掘135
8.1 關聯規則挖掘 135
8.1.1 關聯規則相關概念135
8.1.2 關聯規則度量137
8.1.3 關聯規則分類138
8.1.4 關聯規則挖掘模型與步驟139
8.2 量化關聯規則 140
8.2.1 量化關聯規則提出140
8.2.2 量化關聯規則定義143
8.2.3 算法描述145
8.2.4 算法分析146
8.3 基于距離算法設計與實現 148
8.3.1 算法設計148
8.3.2 數據預處理149
8.3.3 基于距離量化規則150
8.3.4 簇間關聯度的度量150
8.3.5 關聯度參數 d 0 限定151
8.3.6 規則的生成153
8.4 算法實驗分析 153
8.4.1 系統交互界面153
8.4.2 地球化學數據分析154
8.4.3 臨床醫學調查數據156
參考文獻 156
9 基于數據場的數據挖掘技術158
9.1 數據場 158
9.1.1 數據場的概念158
9.1.2 數據場主要特征159
9.1.3 數據場表達159
9.2 數據場聚類算法 161
9.2.1 數據場聚類算法設計161
9.2.2 測試數據集產生162
9.2.3 位場聚類實驗162
9.2.4 輻射場聚類實驗163
9.2.5 參數對數據場聚類效果影響164
9.3 聚類效果實驗分析 166
9.3.1 模擬數據分析166
9.3.2 uci數據集實驗168
9.4 基于數據場量化關聯規則挖掘 172
9.4.1 常用量化關聯規則挖掘方法172
9.4.2 算法相關定義173
9.4.3 算法設計與實現175
9.5 關聯規則挖掘實驗與分析 176
9.5.1 身體脂肪bodyfat數據集176
9.5.2 臨床醫學數據實驗測試178
參考文獻 179
10 基于mapreduce聚類分析181
10.1 hadoop開源云計算平臺 181
10.1.1 mapreduce181
10.1.2 hdfs文件系統183
10.1.3 基于mapreduce聚類算法184
10.2 基于mapreduce k-means算法改進 186
10.2.1 距離三角不等式聚類算法186
10.2.2 距離三角不等式算法設計187
10.2.3 聚類算法實驗結果分析189
10.3 基于mapreduce cadd聚類算法 191
10.3.1 算法設計191
10.3.2 mapreduce聚類模型192
10.3.3 聚類算法實驗結果分析193
參考文獻 195
11 數據挖掘結果可視化表達196
11.1 可視化數據挖掘 196
11.1.1 數據可視化197
11.1.2 數據挖掘過程可視化198
11.1.3 數據挖掘結果可視化198
11.1.4 交互式可視化數據挖掘199
11.2 數據可視化方法及分類 200
11.2.1 基于幾何的技術200
11.2.2 面向像素的技術202
11.2.3 基于圖標的技術202
11.2.4 基于層次的技術203
11.3 可視化數據挖掘系統設計與實現 204
11.3.1 可視化挖掘系統204
11.3.2 聚類結果可視化205
11.3.3 關聯規則結果可視化208
參考文獻 212
12 地球化學數據挖掘(ⅰ)214
12.1 地球化學數據處理方法 214
12.1.1 傳統處理方法214
12.1.2 數據挖掘方法215
12.2 地球化學數據聚類分析 217
12.2.1 地球化學數據來源217
12.2.2 區域地質概況217
12.2.3 聚類分析研究221
12.2.4 靶區地球化學特征222
12.3 區域礦產資源預測 225
12.3.1 地球化學異常靶區225
12.3.2 元素組合特征分析226
12.3.3 區域礦產資源預測232
參考文獻 234
13 地球化學數據挖掘(ⅱ)236
13.1 區域地質形貌 236
13.1.1 自然地理環境236
13.1.2 區域地質概況236
13.2 地球化學元素聚類分析 239
13.2.1 數據整理和建立數據庫239
13.2.2 地球化學數據聚類分析239
13.2.3 聚類結果mapgis成圖241
13.3 地球化學元素組合特征分析 243
13.3.1 靶區1~4元素組合特征243
13.3.2 靶區5元素組合特征243
13.3.3 礦產資源預測244
13.4 地球化學元素模糊c-means聚類 247
13.4.1 某金礦區模糊c-means聚類分析247
13.4.2 某錫礦區模糊c-means聚類分析248
13.4.3 某采樣地區模糊c-means聚類分析249
參考文獻 250
14 資源與經濟發展關系分析252
14.1 資源與經濟 252
14.1.1 礦產資源開發252
14.1.2 傳統研究方法253
14.2 數據源與數據預處理 256
14.2.1 數據的選取256
14.2.2 數據標準化257
14.3 聚類分析 258
14.3.1 資源儲量屬性258
14.3.2 環境指標屬性260
14.3.3 經濟指標屬性262
14.3.4 技術指標屬性275
14.3.5 結論與建議278
參考文獻 280
大數據挖掘技術與應用 作者簡介
孟海東(1958-),男,博士,教授,博士生導師。主要從事數據挖掘、數字礦山和計算機應用領域的教學和科研工作。內蒙古科技大學礦業工程學院教授委員會委員、學術副院長,礦業系統工程創新團隊學術帶頭人、礦業系統工程研究室主任。主持或承擔國家級和省部級項目10余項。發表論文60余篇,其中SCI、EI收錄20余篇。
- >
二體千字文
- >
煙與鏡
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
名家帶你讀魯迅:故事新編
- >
唐代進士錄
- >
名家帶你讀魯迅:朝花夕拾
- >
巴金-再思錄
- >
莉莉和章魚