中圖網

>

程序設計

>

其他

hive編程指南

包郵 hive編程指南

作者：(美)卡普廖洛等

出版社：人民郵電出版社出版時間：2013-12-01

開本： 16開 頁數： 318

本類榜單：計算機/網絡銷量榜

中圖價:¥27.2(3.9折) 定價 ~~¥69.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

溫馨提示：5折以下圖書主要為出版社尾貨，大部分為全新（有塑封/無塑封），個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

買過本商品的人還買了

CLOUDERA HADOOP大數據平臺實戰指南
宋立桓、陳建平
¥37.0~~¥59.0~~
以匠心,致設計:網易UEDC用戶體驗設計
網易用戶體驗設計中心
¥53.2~~¥95.0~~
可伸縮服務架構:框架與中間件
李艷鵬//楊彪//李海亮//賈博巖//劉
¥73.0~~¥109.0~~
SQL進階教程
(日)MICK著;吳炎昌譯
¥44.4~~¥79.0~~
Kafka技術內幕-圖文詳解Kafka源碼設計與實現
鄭奇煌著
¥85.7~~¥119.0~~

商品詳情
商品評論(0條)

中圖價:¥27.2 加入購物車

版權信息
本書特色
內容簡介
目錄
相關資料
作者簡介

hive編程指南版權信息

ISBN：9787115333834
條形碼：9787115333834 ; 978-7-115-33383-4
裝幀：一般膠版紙
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
程序設計
>
其他

hive編程指南本書特色

市場中**本hive圖書。　　hive在hadoop系統中的應用趨勢比較可觀。

hive編程指南內容簡介

　　《hive編程指南》是一本apache hive的編程指南，旨在介紹如何使用hive的sql方法hiveql來匯總、查詢和分析存儲在hadoop分布式文件系統上的大數據集合。全書通過大量的實例，首先介紹如何在用戶環境下安裝和配置hive，并對hadoop和mapreduce進行詳盡闡述，*終演示hive如何在hadoop生態系統進行工作。　　《hive編程指南》適合對大數據感興趣的愛好者以及正在使用hadoop系統的數據庫管理員閱讀使用。

hive編程指南目錄

第1章　基礎知識　
1.1　hadoop和mapreduce綜述　
1.2　hadoop生態系統中的hive　
1.2.1　pig　
1.2.2　hbase　
1.2.3　cascading、crunch及其他　
1.3　java和hive：詞頻統計算法　
1.4　后續事情　
第2章　基礎操作　
2.1　安裝預先配置好的虛擬機　
2.2　安裝詳細步驟　
2.2.1　裝java　
2.2.2　安裝hadoop　
2.2.3　本地模式、偽分布式模式和分布式模式　
2.2.4　測試hadoop　
2.2.5　安裝hive　
2.3　hive內部是什么　
2.4　啟動hive　
2.5　配置hadoop環境　
2.5.1　本地模式配置　
2.5.2　分布式模式和偽分布式模式配置　
2.5.3　使用jdbc連接元數據　
2.6　hive命令　
2.7　命令行界面　
2.7.1　cli 選項　
2.7.2　變量和屬性　
2.7.3　hive中“一次使用”命令　
2.7.4　從文件中執行hive查詢　
2.7.5　hiverc文件　
2.7.6　使用hive cli的更多介紹　
2.7.7　查看操作命令歷史　
2.7.8　執行shell命令　
2.7.9　在hive內使用hadoop的dfs命令　
2.7.10　hive腳本中如何進行注釋　
2.7.11　顯示字段名稱　
第3章　數據類型和文件格式　
3.1　基本數據類型　
3.2　集合數據類型　
3.3　文本文件數據編碼　
3.4　讀時模式　
第4章　hiveql：數據定義　
4.1　hive中的數據庫　
4.2　修改數據庫　
4.3　創建表　
4.3.1　管理表　
4.3.2　外部表　
4.4　分區表、管理表　
4.4.1　外部分區表　
4.4.2　自定義表的存儲格式　
4.5　刪除表　
4.6　修改表　
4.6.1　表重命名　
4.6.2　增加、修改和刪除表分區　
4.6.3　修改列信息　
4.6.4　增加列　
4.6.5　刪除或者替換列　
4.6.6　修改表屬性　
4.6.7　修改存儲屬性　
4.6.8　眾多的修改表語句　
第5章　hiveql：數據操作　
5.1　向管理表中裝載數據　
5.2　通過查詢語句向表中插入數據　
5.3　單個查詢語句中創建表并加載數據　
5.4　導出數據　
第6章　hiveql：查詢　
6.1　select…from語句　
6.1.1　使用正則表達式來指定列　
6.1.2　使用列值進行計算　
6.1.3　算術運算符　
6.1.4　使用函數　
6.1.5　limit語句　
6.1.6　列別名　
6.1.7　嵌套select語句　
6.1.8　case…when…then 句式　
6.1.9　什么情況下hive可以避免進行mapreduce　
6.2　where語句　
6.2.1　謂詞操作符　
6.2.2　關于浮點數比較　
6.2.3　like和rlike　
6.3　group by 語句　
6.4　join語句　
6.4.1　inner join　
6.4.2　join優化　
6.4.3　left outer join　
6.4.4　outer join　
6.4.5　right outer join　
6.4.6　full outer join　
6.4.7　left semi-join　
6.4.8　笛卡爾積join　
6.4.9　map-side join　
6.5　order by和sort by　
6.6　含有sort by 的distribute by　
6.7　cluster by　
6.8　類型轉換　
6.9　抽樣查詢　
6.9.1　數據塊抽樣　
6.9.2　分桶表的輸入裁剪　
6.10　union all　
第7章　hiveql：視圖　
7.1　使用視圖來降低查詢復雜度　
7.2　使用視圖來限制基于條件過濾的數據　
7.3　動態分區中的視圖和map類型　
7.4　視圖零零碎碎相關的事情　
第8章　hiveql：索引　
8.1　創建索引　
8.2　重建索引　
8.3　顯示索引　
8.4　刪除索引　
8.5　實現一個定制化的索引處理器　
第9章　模式設計　
9.1　按天劃分的表　
9.2　關于分區　
9.3　唯一鍵和標準化　
9.4　同一份數據多種處理　
9.5　對于每個表的分區　
9.6　分桶表數據存儲　
9.7　為表增加列　
9.8　使用列存儲表　
9.8.1　重復數據　
9.8.2　多列　
9.9　(幾乎)總是使用壓縮　
第10章　調優　
10.1　使用explain　
10.2　explain extended　
10.3　限制調整　
10.4　join優化　
10.5　本地模式　
10.6　并行執行　
10.7　嚴格模式　
10.8　調整mapper和reducer個數　
10.9　jvm重用　
10.10　索引　
10.11　動態分區調整　
10.12　推測執行　
10.13　單個mapreduce中多個group by　
10.14　虛擬列　
第11章　其他文件格式和壓縮方法　
11.1　確定安裝編解碼器　
11.2　選擇一種壓縮編/解碼器　
11.3　開啟中間壓縮　
11.4　*終輸出結果壓縮　
11.5　sequence file存儲格式　
11.6　使用壓縮實踐　
11.7　存檔分區　
11.8　壓縮：包扎　
第12章　開發　
12.1　修改log4j屬性　
12.2　連接java調試器到hive　
12.3　從源碼編譯hive　
12.3.1　執行hive測試用例　
12.3.2　執行hook　
12.4　配置hive和eclipse　
12.5　maven工程中使用hive　
12.6　hive中使用hive_test進行單元測試　
12.7　新增的插件開發工具箱(pdk)　
第13章　函數　
13.1　發現和描述函數　
13.2　調用函數　
13.3　標準函數　
13.4　聚合函數　
13.5　表生成函數　
13.6　一個通過日期計算其星座的udf　
13.7　udf與genericudf　
13.8　不變函數　
13.9　用戶自定義聚合函數　
13.10　用戶自定義表生成函數　
13.10.1　可以產生多行數據的udtf　
13.10.2　可以產生具有多個字段的單行數據的udtf　
13.10.3　可以模擬復雜數據類型的udtf　
13.11　在 udf中訪問分布式緩存　
13.12　以函數的方式使用注解　
13.12.1　定數性(deterministic)標注　
13.12.2　狀態性(stateful)標注　
13.12.3　唯一性　
13.13　宏命令　
第14章　streaming　
14.1　恒等變換　
14.2　改變類型　
14.3　投影變換　
14.4　操作轉換　
14.5　使用分布式內存　
14.6　由一行產生多行　
14.7　使用streaming進行聚合計算　
14.8　cluster by、distribute by、sort by　
14.9　genericmr tools for streaming to java　
14.10　計算cogroup　
第15章　自定義hive文件和記錄格式　
15.1　文件和記錄格式　
15.2　闡明create table句式　
15.3　文件格式　
15.3.1　sequencefile　
15.3.2　rcfile　
15.3.3　示例自定義輸入格式：dualinputformat　
15.4　記錄格式：serde　
15.5　csv和tsv serde　
15.6　objectinspector　
15.7　thing big hive reflection objectinspector　
15.8　xml udf　
15.9　xpath相關的函數　
15.10　json serde　
15.11　avro hive serde　
15.11.1　使用表屬性信息定義avro schema　
15.11.2　從指定url中定義schema　
15.11.3　進化的模式　
15.12　二進制輸出　
第16章　hive的thrift服務　
16.1　啟動thrift server　
16.2　配置groovy使用hiveserver　
16.3　連接到hiveserver　
16.4　獲取集群狀態信息　
16.5　結果集模式　
16.6　獲取結果　
16.7　獲取執行計劃　
16.8　元數據存儲方法　
16.9　管理hiveserver　
16.9.1　生產環境使用hiveserver　
16.9.2　清理　
16.10　hive thriftmetastore　
16.10.1　thriftmetastore 配置　
16.10.2　客戶端配置　
第17章　存儲處理程序和nosql　
17.1　storage handler background　
17.2　hivestoragehandler　
17.3　hbase　
17.4　cassandra　
17.4.1　靜態列映射(static column mapping)　
17.4.2 為動態列轉置列映射　
17.4.3　cassandra serde properties　
17.5　dynamodb　
第18章　安全　
18.1　和hadoop安全功能相結合　
18.2　使用hive進行驗證　
18.3　hive中的權限管理　
18.3.1　用戶、組和角色　
18.3.2　grant 和 revoke權限　
18.4　分區級別的權限　
18.5　自動授權　
第19章　鎖　
19.1　hive結合zookeeper支持鎖功能　
19.2　顯式鎖和獨占鎖　
第20章　hive和oozie整合　
20.1　oozie提供的多種動作(action)　
20.2　一個只包含兩個查詢過程的工作流示例　
20.3　oozie 網頁控制臺　
20.4　工作流中的變量　
20.5　獲取輸出　
20.6　獲取輸出到變量　
第21章　hive和亞馬遜網絡服務系統(aws)　
21.1　為什么要彈性mapreduce　
21.2　實例　
21.3　開始前的注意事項　
21.4　管理自有emr hive集群　
21.5　emr hive上的thrift server服務　
21.6　emr上的實例組　
21.7　配置emr集群　
21.7.1　部署hive-site.xml文件　
21.7.2　部署.hiverc腳本　
21.7.3　建立一個內存密集型配置　
21.8　emr上的持久層和元數據存儲　
21.9　emr集群上的hdfs和s3　
21.10　在s3上部署資源、配置和輔助程序腳本　
21.11　s3上的日志　
21.12　現買現賣　
21.13　安全組　
21.14　emr和ec2以及apache hive的比較　
21.15　包裝　
第22章　hcatalog　
22.1　介紹　
22.2　mapreduce　
22.2.1　讀數據　
22.2.2　寫數據　
22.3　命令行　
22.4　安全模型　
22.5　架構　
第23章　案例研究　
23.1　m6d.com(media6degrees)　
23.1.1　m 6d的數據科學，使用hive和r　
23.1.2　m6d udf偽隨機　
23.1.3　m6d如何管理多mapreduce集群間的hive數據訪問　
23.2　outbrain　
23.2.1　站內線上身份識別　
23.2.2　計算復雜度　
23.2.3　會話化　
23.3　nasa噴氣推進實驗室　
23.3.1　區域氣候模型評價系統　
23.3.2　我們的經驗：為什么使用hive　
23.3.3　解決這些問題我們所面臨的挑戰　
23.4　photobucket　
23.4.1　photobucket 公司的大數據應用情況　
23.4.2　hive所使用的硬件資源信息　
23.4.3　hive提供了什么　
23.4.4　hive支持的用戶有哪些　
23.5　simplereach　
23.6　experiences and needs from the customer trenches　
23.6.1　介紹　
23.6.2　customer trenches的用例　
術語詞匯表　

展開全部

hive編程指南相關資料

　　大數據的理論和價值逐漸得到了社會各界的認可，各種各樣的大數據應用系統應運而生，正在創造性地解決著不同使用場景下的問題。在大數據應用越來越多樣化的同時，對提供支撐的基礎技術平臺提出了更高的要求。hadoop是目前市場接受程度最高的大數據技術平臺之一，在大量有代表性的hadoop 1.x用戶使用體驗和反饋的基礎上，廣受關注的hadoop 2.x版本在平臺設計層面做出了重大改進，已于2013年10月正式發布。　　yarn是hadoop 2.x的核心部分。它作為新一代的資源管理系統，不僅支持mapreduce計算框架，還可以支持流式計算框架、圖計算框架、內存迭代計算框架等，極大地擴展了hadoop的使用場景，提高了hadoop集群的利用效率。董西成先生理論功底深厚，實踐經驗豐富，本書可以幫助大家快速了解和學習yarn。　　—— 謝磊　北京小象科技有限公司執行董事/chinahadoop技術社區負責人

hive編程指南作者簡介

Edward Capriolo：Media6degrees公司系統管理員，他是Apache軟件基金會成員，還是Hadoop-Hive項目成員。　　Dean Wampler：Think Big Analytics公司總顧問，對大數據問題以及Hadoop和機器學習有專門的研究。　　Jason Rutherglen：Think Big Analytics公司軟件架構師，對大數據、Hadoop、搜索和安全有專門的研究。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
羅曼·羅蘭讀書隨筆-精裝
羅曼·羅蘭讀書隨筆-精裝
[法]羅曼·羅蘭著,鄭克魯譯
¥32.9~~¥58.0~~
>
經典常談
經典常談
朱自清
¥16.7~~¥39.8~~
>
苦雨齋序跋文-周作人自編集
苦雨齋序跋文-周作人自編集
周作人著，止庵校訂
¥6.1~~¥16.0~~
>
【精裝繪本】畫給孩子的中國神話
【精裝繪本】畫給孩子的中國神話
施英巍
¥18.6~~¥55.0~~
>
大紅狗在馬戲團-大紅狗克里弗-助人
大紅狗在馬戲團-大紅狗克里弗-助人
[美] 諾爾曼·伯德韋爾著，杜可名譯
¥5.2~~¥10.0~~
>
朝聞道
朝聞道
劉慈欣
¥14.8~~¥23.8~~
>
自卑與超越
自卑與超越
[奧]阿爾弗雷德·阿德勒著，韓陽譯
¥13.7~~¥39.8~~
>
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
[英] 達爾文著，朱邦芊譯
¥6.3~~¥14.0~~

本類暢銷

編譯原理(第4版)/劉銘

劉銘

¥29.3~~¥45~~
從程序員到架構師大數據量、緩存、高并發、微服務、多團隊協同等核心場景實戰

王偉杰

¥58.9~~¥89~~
架構師的自我修煉:技術、架構和未來:technology, architecture and the future

李智慧著

¥58.9~~¥89~~
陪孩子玩Scratch:在游戲編程中培養計算思維(全三冊)

謝聲濤編著

¥45.8~~¥128~~
從零開始學架構:照著做你也能成為架構師

李運華

¥63.4~~¥99~~
Python極客項目編程

溫科特卡姆

¥25.8~~¥69~~

国产第1页_91在线亚洲_中文字幕成人_99久久久久久_五月宗合网_久久久久国产一区二区三区四区

包郵 hive編程指南

CLOUDERA HADOOP大數據平臺實戰指南

以匠心,致設計:網易UEDC用戶體驗設計

可伸縮服務架構:框架與中間件

SQL進階教程

Kafka技術內幕-圖文詳解Kafka源碼設計與實現

hive編程指南版權信息

hive編程指南本書特色

hive編程指南內容簡介

hive編程指南目錄

hive編程指南相關資料

hive編程指南作者簡介

羅曼·羅蘭讀書隨筆-精裝

經典常談

苦雨齋序跋文-周作人自編集

【精裝繪本】畫給孩子的中國神話

大紅狗在馬戲團-大紅狗克里弗-助人

朝聞道

自卑與超越

企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)

編譯原理(第4版)/劉銘

從程序員到架構師大數據量、緩存、高并發、微服務、多團隊協同等核心場景實戰

架構師的自我修煉:技術、架構和未來:technology, architecture and the future

陪孩子玩Scratch:在游戲編程中培養計算思維(全三冊)

從零開始學架構:照著做你也能成為架構師

Python極客項目編程

陶潛和櫻子

趙元任早年自傳

房思琪的初戀樂園

俄羅斯書簡

熊千佳昆蟲記

連科六短篇-短篇經典文庫

包郵 hive編程指南

hive編程指南 版權信息

hive編程指南 本書特色

hive編程指南 內容簡介

hive編程指南 目錄

hive編程指南 相關資料

hive編程指南 作者簡介

hive編程指南版權信息

hive編程指南本書特色

hive編程指南內容簡介

hive編程指南目錄

hive編程指南相關資料

hive編程指南作者簡介