-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
基于Apache Kylin構建大數據分析平臺 版權信息
- ISBN:9787302454526
- 條形碼:9787302454526 ; 978-7-302-45452-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
基于Apache Kylin構建大數據分析平臺 本書特色
Apache Kylin是一個開源的分布式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,*初由eBay公司開發并貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。本書分為21章,詳細講解Apache Kylin概念、安裝、配置、部署,讓讀者對Apache Kylin構建大數據分析平臺有一個感性認識。同時,本書從應用角度,結合Dome和實例介紹了用于多維分析的Cube算法的創建、配置與優化。*后還介紹了Kyligence公司發布KAP大數據分析平臺,對讀者有極大的參考價值。本書適合大數據技術初學者、大數據分析人員、大數據架構師等,也適合用于高等院校和培訓學校相關專業師生教學參考。
基于Apache Kylin構建大數據分析平臺 內容簡介
Apache Kylin將傳統的數據倉庫及商務智能分析能力帶入到了大數據時代,作為新興的技術已經被廣大用戶所使用。作為創始作者,我非常欣喜能看到關于Apache Kylin相關書籍的出版, 這無疑對中國用戶更好地使用Kylin,解決實際的大數據分析架構及業務問題有很大幫助。
韓卿
Kyligence 聯合創始人兼CEO,Apache Kylin項目管理委員會主席(PMC Chair)
伴隨著大數據發展的三條主線是大數據技術、大數據思維和大數據實踐。因為RDBMS很難處理單表10億行數據,所以大數據技術應需而生。大數據技術從*初的解決海量數據的快速存儲和讀取,到今天的海量數據的OLAP,當中衍生出眾多的技術產品,ApacheKylin就是其中的一個優秀產品,目標是解決大數據范疇中的OLAP。
Kyligence
聯合創始人兼CEO,Apache Kylin項目管理委員會主席(PMC Chair)韓卿武漢市云升科技發展有限公司董事長,《智慧城市—大數據、物聯網和云計算之應用》作者楊正洪萬達網絡科技集團大數據中心副總經理,《Spark高級數據分析》中文版譯者龔少成
數據架構師,IT脫口秀(清風那個吹)創始人,《開源大數據分析引擎Impala實戰》作者賈傳青
等等業內專家聯合推薦
Apache Kylin將傳統的數據倉庫及商務智能分析能力帶入到了大數據時代,作為新興的技術已經被廣大用戶所使用。作為創始作者,我非常欣喜能看到關于Apache Kylin相關書籍的出版, 這無疑對中國用戶更好地使用Kylin,解決實際的大數據分析架構及業務問題有很大幫助。韓卿Kyligence 聯合創始人兼CEO,Apache Kylin項目管理委員會主席(PMC Chair) 伴隨著大數據發展的三條主線是大數據技術、大數據思維和大數據實踐。因為RDBMS很難處理單表10億行數據,所以大數據技術應需而生。大數據技術從*初的解決海量數據的快速存儲和讀取,到今天的海量數據的OLAP,當中衍生出眾多的技術產品,Apache
Kylin就是其中的一個優秀產品,目標是解決大數據范疇中的OLAP。第二條主線是大數據思維。數據處理的*近幾十年都被RDBMS的思想所束縛,小表、多表、表的連接、過分注重冗余性的壞處,等等,這些都限制了海量數據上的處理與分析。大數據技術出來之后,隨著而來的大數據思維,給我們帶來了海量數據處理的新思維。這個新思維的核心就是突破表的概念,而采用面向對象的數據模型在數據層上實現。Apache Kylin的Cube模型就是在逐步體現大數據的思維。*后一條主線是大數據實踐。大數據實踐分為數據梳理、數據建模、數據采集、數據管控、數據服務、數據可視化和數據分析。這是一環套一環的步驟,不能跳過。Apache Kylin作為數據分析環節的技術產品,一定要同數據管理的《基于Apache Kylin構建大數據分析平臺》一書淺顯易懂,實操性強,是目前Apache Kylin界不可多得的技術資料,值得細讀和研究。 楊正洪武漢市云升科技發展有限公司董事長 Apache Kylin是基于MOLAP的實時大數據引擎,與Hadoop生態系統結合更加緊密,先天的優勢注定了其支持更大的數據規模,更好的擴展性,獨有的中國血統較其他開源軟件更具本地化優勢,更符合中國國情。本書包含了守壯多年的實踐經驗
,系統全面的介紹了Apache Kylin技術,值得推薦。 賈傳青數據架構師,IT脫口秀(清風那個吹)創始人
信息
基于Apache Kylin構建大數據分析平臺 目錄
**部分 Apache Kylin基礎部分
第1章 Apache Kylin前世今生 3
1.1 Apache Kylin的背景 3
1.2 Apache Kylin的應用場景 3
1.3 Apache Kylin的發展歷程 4
第2章 Apache Kylin前奏 7
2.1 事實表和維表 7
2.2 星型模型和雪花型模型 7
2.2.1 星型模型 7
2.2.2 雪花型模型 8
2.2.3 星型模型示例 8
2.3 OLAP 9
2.3.1 OLAP分類 9 **部分 Apache Kylin基礎部分 第1章 Apache Kylin前世今生 3 1.1 Apache Kylin的背景 3 1.2 Apache Kylin的應用場景 3 1.3 Apache Kylin的發展歷程 4 第2章 Apache Kylin前奏 7 2.1 事實表和維表 7 2.2 星型模型和雪花型模型 7 2.2.1 星型模型 7 2.2.2 雪花型模型 8 2.2.3 星型模型示例 8 2.3 OLAP 9 2.3.1 OLAP分類 9 2.3.2 OLAP的基本操作 10 2.4 數據立方體(Data Cube) 11 第3章 Apache Kylin 工作原理和體系架構 12 3.1 Kylin工作原理 12 3.2 Kylin體系架構 13 3.3 Kylin中的核心部分:Cube構建 15 3.4 Kylin的SQL查詢 16 3.5 Kylin的特性和生態圈 16 第4章 搭建CDH大數據平臺 18 4.1 系統環境和安裝包 19 4.1.1 系統環境 19 4.1.2 安裝包的下載 20 4.2 準備工作:系統環境搭建 21 4.2.1 網絡配置(CDH集群所有節點) 21 4.2.2 打通SSH,設置ssh無密碼登錄(所有節點) 21 4.3 正式安裝CDH:準備工作 29 4.4 正式安裝CDH5:安裝配置 30 4.4.1 CDH5的安裝配置 30 4.4.2 對Hive、HBase執行簡單操作 39 第5章 使用Kylin構建企業大數據分析平臺的4種部署方式 41 5.1 Kylin部署的架構 41 5.2 Kylin的四種典型部署方式 42 第6章 單獨為Kylin部署HBase集群 44 第7章 部署Kylin集群環境 58 7.1 部署Kylin的先決條件 58 7.2 部署Kylin集群環境 61 7.3 為Kylin集群搭建負載均衡器 70 7.3.1 搭建Nginx環境 70 7.3.2 配置Nginx實現Kylin的負載均衡 73 第二部分 Apache Kylin 進階部分 第8章 Demo案例實戰 77 8.1 Sample Cube案例描述 77 8.2 Sample Cube案例實戰 78 8.2.1 準備數據 78 8.2.2 構建Cube 81 第9章 多維分析的Cube創建實戰 89 9.1 Cube模型 89 9.2 創建Cube的流程 90 9.2.1 步驟一:Hive中事實表,以及多張維表的處理 90 9.2.2 步驟二:Kylin中建立項目(Project) 95 9.2.3 步驟三:Kylin中建立數據源(Data Source) 95 9.2.4 步驟四:Kylin中建立數據模型(Model) 98 9.2.5 步驟五:Kylin中建立Cube 104 9.2.6 步驟六:Build Cube 114 9.2.7 步驟七:查詢Cube 118 第10章 Build Cube的來龍去脈 120 10.1 流程分析 120 10.2 小結 134 第三部分 Apache Kylin 高級部分 第11章 Cube優化 137 第12章 備份Kylin的Metadata 142 12.1 Kylin的元數據 142 12.2 備份元數據 143 12.3 恢復元數據 146 第13章 使用Hive視圖 147 13.1 使用Hive視圖 147 13.2 使用視圖實戰 149 第14章 Kylin的垃圾清理 153 14.1 清理元數據 153 14.2 清理存儲器數據 154 第15章 JDBC訪問方式 157 第16章 通過RESTful訪問Kylin 161 第17章 Kylin版本之間升級 179 17.1 從1.5.2升級到*新版本1.5.3 179 17.2 從1.5.1升級到1.5.2版本 180 17.3 從Kylin 1.5.2.1升級到Kylin 1.5.3實戰 181 17.4 補充內容 187 第18章 大數據可視化實踐 189 18.1 可視化工具簡述 189 18.2 安裝Kylin ODBC驅動 190 18.3 通過Excel訪問Kylin 192 18.4 通過Power BI訪問Kylin 194 18.4.1 安裝配置Power BI 194 18.4.2 實戰操作 198 18.5 通過Tableau訪問Kylin 199 18.6 Kylin Mondrian Saiku 205 18.7 實戰演練:通過Saiku訪問Kylin 211 18.7.1 **個Schema例子:myproject_pvuv_cube的演示 211 18.7.2 第二個Schema例子:kylin_sales_cube的演示 219 18.7.3 Saiku使用的一些問題 223 18.8 通過Apache Zepplin訪問Kylin 229 18.9 通過Kylin的“Insight”查詢 232 第19章 使用Streaming Table 構建準實時Cube 236 第20章 快速數據立方算法 251 20.1 快速數據立方算法概述 251 20.2 快速數據立方算法優點和缺點 253 20.3 獲取Fast Cubing算法的優勢 254 第四部分 Apache Kylin的擴展部分 第21章 大數據智能分析平臺KAP 257 21.1 大數據智能分析平臺KAP概述 257 21.2 KAP的安裝部署 259信息
基于Apache Kylin構建大數據分析平臺 作者簡介
蔣守壯,現就職于萬達網絡科技集團有限公司,資深大數據工程師,大數據實踐者。曾任平安科技資深大數據分析師和架構師,CSDN社區專家,知識庫特邀編輯。目前專注于Docker、Kubernetes、Mesos、Hadoop、Spark和Kylin等技術領域。
- >
羅曼·羅蘭讀書隨筆-精裝
- >
小考拉的故事-套裝共3冊
- >
上帝之肋:男人的真實旅程
- >
莉莉和章魚
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
月亮與六便士
- >
煙與鏡
- >
伊索寓言-世界文學名著典藏-全譯本