-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
案例驅動的大數據原理技術及應用 版權信息
- ISBN:9787313201706
- 條形碼:9787313201706 ; 978-7-313-20170-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
案例驅動的大數據原理技術及應用 內容簡介
本書系統地論述了大數據的基本概念、大數據處理架構Hadoop、分布式文件系統HDFS、分布式數據庫HBase、NoSQL數據庫、云數據庫、分布式并行編程模型MapReduce、流計算、圖計算、數據可視化以及大數據在互聯網、生物醫學和物流等各個領域的應用。本書為“大數據與計算機科學系列”教材之一,本系列教材主要基于大數據環境所產生的對于傳統計算機科學帶來的深刻變革,從大數據時代的視角去對現有的計算機科學的教學內容進行重新定義。從而讓學生能夠更加貼近一線的前沿知識,而不是依舊停留在教學與實際脫節的教學環境中。
案例驅動的大數據原理技術及應用 目錄
1.1 大數據的定義與特征
1.2 大數據的關鍵技術
1.3 主流的大數據平臺
1.4 大數據的主要應用
1.5 本章小結
1.6 習題
第2章 Spark系統與編程簡介
2.1 Spark概述
2.2 Spark系統架構及運行模式
2.3 Spark系統安裝
2.4 Python編程基礎
2.5 Spark的編程方式
2.6 Spark的監控管理
2.7 Spark RDD
2.8 編程的基本步驟
2.9 本章小結
2.10 習題
第3章 大數據分析基礎算法與實例
3.1 大數據分析概述
3.2 Spark基礎算法
3.3 實例:詞頻統計
3.4 實例:圓周率的計算
3.5 本章小結
3.6 習題
附錄
第4章 面向大數據的機器學習算法與實例
4.1 機器學習簡介
4.2 Spark M Llib介紹
4.3 機器學習應用實例
4.4 本章小結
4.5 習題
第5章 面向大數據的流數據分析算法與實例
5.1 Spark Streaming簡介
5.2 spark streaming架構
5.3 Spark Streaming運行原理
5.4 spark streaming實例
5.5 容錯、持久化和性能優化
5.6 本章小結
5.7 習題
第6章 面向大數據的圖算法與實例
6.1 圖的基本概念
6.2 圖計算的同步機制
6.3 GraphFrames安裝和基礎使用
6.5 *短路徑算法及實例
6.6 網頁排名
6.7 本章小結
6.8 習題
第7章 大數據應用編程案例
7.1 基于遙感數據的海冰/雪檢測
7.2 基于時間序列數據的預測
7.3 本章小結
7.4 習題
參考文獻
案例驅動的大數據原理技術及應用 節選
《案例驅動的大數據原理技術及應用》: 4.電信行業 電信與媒體市場調研公司(Informa Telecoms & Media)在2013年的調查結果顯示,全球120家運營商中約有48%的運營商正在實施大數據業務。該調研公司表示,大數據業務成本平均占到運營商總IT預算的10%,并且在未來五年內將升至23%左右,成為運營商的一項戰略性優勢。可見,由流量經營進入大數據運營已成為大勢所趨。 電信運營商擁有多年的數據積累,擁有諸如財務收入、業務發展量等結構化數據,也會涉及圖片、文本、音頻、視頻等非結構化數據。從數據來源看,電信運營商的數據來自涉及移動語音、固定電話、固網接入和無線上網等所有業務,也會涉及公眾客戶、政企客戶和家庭客戶,同時也會收集到實體渠道、電子渠道、直銷渠道等所有類型渠道的接觸信息。整體來看,電信運營商大數據發展仍處在探索階段。 目前國內運營商運用大數據主要有五方面: (1)網絡管理和優化。此方向包括對基礎設施建設的優化和網絡運營管理及優化。利用大數據實現基站和熱點的選址以及資源的分配。運營商可以通過分析話單和信令中用戶的流量在時間周期和位置特征方面的分布,對2G、3G的高流量區域設計4G基站和WLAN熱點;同時,運營商還可以對建立評估模型對已有基站的效率和成本進行評估,發現基站建設的資源浪費問題,如某些地區為了完成基站建設指標將基站建設在人跡罕至的地方等。在網絡運營層面,運營商可以通過大數據分析網絡的流量、流向變化趨勢,及時調整資源配置,同時還可以分析網絡日志,進行全網絡優化,不斷提升網絡質量和網絡利用率。 利用大數據技術實時采集處理網絡信令數據,監控網絡狀況,識別價值小區和業務熱點小區,更精準的指導網絡優化,實現網絡、應用和用戶的智能指配。由于用戶群的不同,不同小區對運營商的貢獻也不同。運營商可以將小區的數據進行多維度數據綜合分析,通過對小區VIP用戶分布,收入分布,及相關的分布模型得到不同小區的價值,再和網絡質量分析結合起來,兩者疊加一起,就有可能發現某個小區價值高,但是網絡覆蓋需要進一步提升,進而先設定網絡優化的優先級,提高投資效率。 德國電信建立預測城市里面的各區域無線資源占用模型,根據預測結果,靈活的提前配置無線資源,如在白天給CBD地區多分配無線資源,在晚上,則給酒吧地區多分配無線資源,使得無線網絡的運行效率和利用率更高。法國電信通過分析發現某段網絡上的掉話率持續過高,借助大數據手段診斷出通話中斷產生的原因是網絡負荷過重造成,并根據分析結果優化網絡布局,為客戶提供了更好的體驗,獲得了更多的客戶以及業務增長。 (2)市場與精準營銷。客戶畫像:運營商可以基于客戶終端信息、位置信息、通話行為、手機上網行為軌跡等豐富的數據,為每個客戶打上人口統計學特征、消費行為、上網行為和興趣愛好標簽,并借助數據挖掘技術(如分類、聚類、RFM等)進行客戶分群,完善客戶的360度畫像,幫助運營商深入了解客戶行為偏好和需求特征。 關系鏈研究:運營商可以通過分析客戶通訊錄、通話行為、網絡社交行以及客戶資料等數據,開展交往圈分析。尤其是利用各種聯系記錄形成社交網絡來豐富對用戶的洞察,并進一步利用圖挖掘的方法來發現各種圈子,發現圈子中的關鍵人員,以及識別家庭和政企客戶;或者分析社交圈子尋找營銷機會。例如在一個行為同質化圈子里面,如果這個圈子大多數為高流量用戶,并在這個圈子中發現異網的用戶,我們可以推測該用戶也是高流量的情況,便可以通過營銷的活動把異網高流量的用戶引導到自己的網絡上,對其推廣4G套餐,提升營銷轉化率。總之,我們可以利用社交圈子提高營銷效率,改進服務,低成本擴大產品的影響力。 精準營銷和實時營銷:運營商在客戶畫像的基礎上對客戶特征的深入理解,建立客戶與業務、資費套餐、終端類型、在用網絡的精準匹配,并在推送渠道、推送時機、推送方式上滿足客戶的需求,實現精準營銷。如我們可以利用大數據分析用戶的終端偏好和消費能力,預測用戶的換機時間尤其是合約機到期時間,并捕捉用戶*近的特征事件,從而預測用戶購買終端的真正需求,通過短信、呼叫中心、營業廳等多種渠道推送相關的營銷信息到用戶手中。個性化推薦:利用客戶畫像信息、客戶終端信息、客戶行為習慣偏好等,運營商可以為客戶提供定制化的服務,優化產品、流量套餐和定價機制,實現個性化營銷和服務,提升客戶體驗與感知;或者在應用商城實現個性化推薦,在電商平臺實現個性化推薦,在社交網絡推薦感興趣的好友。 (3)客戶關系管理。客服中心優化:客服中心是運營商和客戶接觸較為頻繁的通道,因此客服中心擁有大量的客戶呼叫行為和需求數據。可以利用大數據技術可以深入分析客服熱線呼入客戶的行為特征、選擇路徑、等候時長,并關聯客戶歷史接觸信息、客戶套餐消費情況、客戶人口統計學特征、客戶機型等數據,建立客服熱線智能路徑模型,預測下次客戶呼入的需求、投訴風險以及相應的路徑和節點,這樣便可縮短客服呼入處理時間,識別投訴風險,有助于提升客服滿意度;另外,也可以通過語義分析,對客服熱線的問題進行分類,識別熱點問題和客戶情緒,對于發生量較大且嚴重的問題,要及時預警相關部門進行優化。 客戶關懷與客戶生命周期管理:包括新客戶獲取、客戶成長、客戶成熟、客戶衰退和客戶離開等五個階段的管理。在客戶獲取階段,我們可以通過算法挖掘和發現高潛客戶;在客戶成長階段,通過關聯規則等算法進行交叉銷售,提升客戶人均消費額;在客戶成熟期,可以通過大數據方法進行客戶分群(RFM、聚類等)并進行精準推薦,同時對不同客戶實時忠誠計劃;在客戶衰退期,需要進行流失預警,提前發現高流失風險客戶,并作相應的客戶關懷;在客戶離開階段,我們可以通過大數據挖掘高潛回流客戶。國內外運營商在客戶生命周期管理方面應用的案例都比較多。如SK電訊新成立一家公司SKPlanet,專門處理與大數據相關的業務,通過分析用戶的使用行為,在用戶做出離開決定之前,推出符合用戶興趣的業務,防止用戶流失;而T-Mobile通過集成數據綜合分析客戶流失的原因,在一個季度內將流失率減半。 ……
- >
詩經-先民的歌唱
- >
隨園食單
- >
龍榆生:詞曲概論/大家小書
- >
巴金-再思錄
- >
山海經
- >
經典常談
- >
苦雨齋序跋文-周作人自編集
- >
有舍有得是人生