国产第1页_91在线亚洲_中文字幕成人_99久久久久久_五月宗合网_久久久久国产一区二区三区四区

讀書月攻略拿走直接抄!
歡迎光臨中圖網 請 | 注冊

包郵 hive編程指南

出版社:人民郵電出版社出版時間:2013-12-01
開本: 16開 頁數: 318
中 圖 價:¥27.2(3.9折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>
買過本商品的人還買了

hive編程指南 版權信息

  • ISBN:9787115333834
  • 條形碼:9787115333834 ; 978-7-115-33383-4
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

hive編程指南 本書特色

市場中**本hive圖書。   hive在hadoop系統中的應用趨勢比較可觀。

hive編程指南 內容簡介

  《hive編程指南》是一本apache hive的編程指南,旨在介紹如何使用hive的sql方法hiveql來匯總、查詢和分析存儲在hadoop分布式文件系統上的大數據集合。全書通過大量的實例,首先介紹如何在用戶環境下安裝和配置hive,并對hadoop和mapreduce進行詳盡闡述,*終演示hive如何在hadoop生態系統進行工作。   《hive編程指南》適合對大數據感興趣的愛好者以及正在使用hadoop系統的數據庫管理員閱讀使用。

hive編程指南 目錄


第1章 基礎知識 
1.1 hadoop和mapreduce綜述 
1.2 hadoop生態系統中的hive 
1.2.1 pig 
1.2.2 hbase 
1.2.3 cascading、crunch及其他 
1.3 java和hive:詞頻統計算法 
1.4 后續事情 
第2章 基礎操作 
2.1 安裝預先配置好的虛擬機 
2.2 安裝詳細步驟 
2.2.1 裝java 
2.2.2 安裝hadoop 
2.2.3 本地模式、偽分布式模式和分布式模式 
2.2.4 測試hadoop 
2.2.5 安裝hive 
2.3 hive內部是什么 
2.4 啟動hive 
2.5 配置hadoop環境 
2.5.1 本地模式配置 
2.5.2 分布式模式和偽分布式模式配置 
2.5.3 使用jdbc連接元數據 
2.6 hive命令 
2.7 命令行界面 
2.7.1 cli 選項 
2.7.2 變量和屬性 
2.7.3 hive中“一次使用”命令 
2.7.4 從文件中執行hive查詢 
2.7.5 hiverc文件 
2.7.6 使用hive cli的更多介紹 
2.7.7 查看操作命令歷史 
2.7.8 執行shell命令 
2.7.9 在hive內使用hadoop的dfs命令 
2.7.10 hive腳本中如何進行注釋 
2.7.11 顯示字段名稱 
第3章 數據類型和文件格式 
3.1 基本數據類型 
3.2 集合數據類型 
3.3 文本文件數據編碼 
3.4 讀時模式 
第4章 hiveql:數據定義 
4.1 hive中的數據庫 
4.2 修改數據庫 
4.3 創建表 
4.3.1 管理表 
4.3.2 外部表 
4.4 分區表、管理表 
4.4.1 外部分區表 
4.4.2 自定義表的存儲格式 
4.5 刪除表 
4.6 修改表 
4.6.1 表重命名 
4.6.2 增加、修改和刪除表分區 
4.6.3 修改列信息 
4.6.4 增加列 
4.6.5 刪除或者替換列 
4.6.6 修改表屬性 
4.6.7 修改存儲屬性 
4.6.8 眾多的修改表語句 
第5章 hiveql:數據操作 
5.1 向管理表中裝載數據 
5.2 通過查詢語句向表中插入數據 
5.3 單個查詢語句中創建表并加載數據 
5.4 導出數據 
第6章 hiveql:查詢 
6.1 select…from語句 
6.1.1 使用正則表達式來指定列 
6.1.2 使用列值進行計算 
6.1.3 算術運算符 
6.1.4 使用函數 
6.1.5 limit語句 
6.1.6 列別名 
6.1.7 嵌套select語句 
6.1.8 case…when…then 句式 
6.1.9 什么情況下hive可以避免進行mapreduce 
6.2 where語句 
6.2.1 謂詞操作符 
6.2.2 關于浮點數比較 
6.2.3 like和rlike 
6.3 group by 語句 
6.4 join語句 
6.4.1 inner join 
6.4.2 join優化 
6.4.3 left outer join 
6.4.4 outer join 
6.4.5 right outer join 
6.4.6 full outer join 
6.4.7 left semi-join 
6.4.8 笛卡爾積join 
6.4.9 map-side join 
6.5 order by和sort by 
6.6 含有sort by 的distribute by 
6.7 cluster by 
6.8 類型轉換 
6.9 抽樣查詢 
6.9.1 數據塊抽樣 
6.9.2 分桶表的輸入裁剪 
6.10 union all 
第7章 hiveql:視圖 
7.1 使用視圖來降低查詢復雜度 
7.2 使用視圖來限制基于條件過濾的數據 
7.3 動態分區中的視圖和map類型 
7.4 視圖零零碎碎相關的事情 
第8章 hiveql:索引 
8.1 創建索引 
8.2 重建索引 
8.3 顯示索引 
8.4 刪除索引 
8.5 實現一個定制化的索引處理器 
第9章 模式設計 
9.1 按天劃分的表 
9.2 關于分區 
9.3 唯一鍵和標準化 
9.4 同一份數據多種處理 
9.5 對于每個表的分區 
9.6 分桶表數據存儲 
9.7 為表增加列 
9.8 使用列存儲表 
9.8.1 重復數據 
9.8.2 多列 
9.9 (幾乎)總是使用壓縮 
第10章 調優 
10.1 使用explain 
10.2 explain extended 
10.3 限制調整 
10.4 join優化 
10.5 本地模式 
10.6 并行執行 
10.7 嚴格模式 
10.8 調整mapper和reducer個數 
10.9 jvm重用 
10.10 索引 
10.11 動態分區調整 
10.12 推測執行 
10.13 單個mapreduce中多個group by 
10.14 虛擬列 
第11章 其他文件格式和壓縮方法 
11.1 確定安裝編解碼器 
11.2 選擇一種壓縮編/解碼器 
11.3 開啟中間壓縮 
11.4 *終輸出結果壓縮 
11.5 sequence file存儲格式 
11.6 使用壓縮實踐 
11.7 存檔分區 
11.8 壓縮:包扎 
第12章 開發 
12.1 修改log4j屬性 
12.2 連接java調試器到hive 
12.3 從源碼編譯hive 
12.3.1 執行hive測試用例 
12.3.2 執行hook 
12.4 配置hive和eclipse 
12.5 maven工程中使用hive 
12.6 hive中使用hive_test進行單元測試 
12.7 新增的插件開發工具箱(pdk) 
第13章 函數 
13.1 發現和描述函數 
13.2 調用函數 
13.3 標準函數 
13.4 聚合函數 
13.5 表生成函數 
13.6 一個通過日期計算其星座的udf 
13.7 udf與genericudf 
13.8 不變函數 
13.9 用戶自定義聚合函數 
13.10 用戶自定義表生成函數 
13.10.1 可以產生多行數據的udtf 
13.10.2 可以產生具有多個字段的單行數據的udtf 
13.10.3 可以模擬復雜數據類型的udtf 
13.11 在 udf中訪問分布式緩存 
13.12 以函數的方式使用注解 
13.12.1 定數性(deterministic)標注 
13.12.2 狀態性(stateful)標注 
13.12.3 唯一性 
13.13 宏命令 
第14章 streaming 
14.1 恒等變換 
14.2 改變類型 
14.3 投影變換 
14.4 操作轉換 
14.5 使用分布式內存 
14.6 由一行產生多行 
14.7 使用streaming進行聚合計算 
14.8 cluster by、distribute by、sort by 
14.9 genericmr tools for streaming to java 
14.10 計算cogroup 
第15章 自定義hive文件和記錄格式 
15.1 文件和記錄格式 
15.2 闡明create table句式 
15.3 文件格式 
15.3.1 sequencefile 
15.3.2 rcfile 
15.3.3 示例自定義輸入格式:dualinputformat 
15.4 記錄格式:serde 
15.5 csv和tsv serde 
15.6 objectinspector 
15.7 thing big hive reflection objectinspector 
15.8 xml udf 
15.9 xpath相關的函數 
15.10 json serde 
15.11 avro hive serde 
15.11.1 使用表屬性信息定義avro schema 
15.11.2 從指定url中定義schema 
15.11.3 進化的模式 
15.12 二進制輸出 
第16章 hive的thrift服務 
16.1 啟動thrift server 
16.2 配置groovy使用hiveserver 
16.3 連接到hiveserver 
16.4 獲取集群狀態信息 
16.5 結果集模式 
16.6 獲取結果 
16.7 獲取執行計劃 
16.8 元數據存儲方法 
16.9 管理hiveserver 
16.9.1 生產環境使用hiveserver 
16.9.2 清理 
16.10 hive thriftmetastore 
16.10.1 thriftmetastore 配置 
16.10.2 客戶端配置 
第17章 存儲處理程序和nosql 
17.1 storage handler background 
17.2 hivestoragehandler 
17.3 hbase 
17.4 cassandra 
17.4.1 靜態列映射(static column mapping) 
17.4.2 為動態列轉置列映射 
17.4.3 cassandra serde properties 
17.5 dynamodb 
第18章 安全 
18.1 和hadoop安全功能相結合 
18.2 使用hive進行驗證 
18.3 hive中的權限管理 
18.3.1 用戶、組和角色 
18.3.2 grant 和 revoke權限 
18.4 分區級別的權限 
18.5 自動授權 
第19章 鎖 
19.1 hive結合zookeeper支持鎖功能 
19.2 顯式鎖和獨占鎖 
第20章 hive和oozie整合 
20.1 oozie提供的多種動作(action) 
20.2 一個只包含兩個查詢過程的工作流示例 
20.3 oozie 網頁控制臺 
20.4 工作流中的變量 
20.5 獲取輸出 
20.6 獲取輸出到變量 
第21章 hive和亞馬遜網絡服務系統(aws) 
21.1 為什么要彈性mapreduce 
21.2 實例 
21.3 開始前的注意事項 
21.4 管理自有emr hive集群 
21.5 emr hive上的thrift server服務 
21.6 emr上的實例組 
21.7 配置emr集群 
21.7.1 部署hive-site.xml文件 
21.7.2 部署.hiverc腳本 
21.7.3 建立一個內存密集型配置 
21.8 emr上的持久層和元數據存儲 
21.9 emr集群上的hdfs和s3 
21.10 在s3上部署資源、配置和輔助程序腳本 
21.11 s3上的日志 
21.12 現買現賣 
21.13 安全組 
21.14 emr和ec2以及apache hive的比較 
21.15 包裝 
第22章 hcatalog 
22.1 介紹 
22.2 mapreduce 
22.2.1 讀數據 
22.2.2 寫數據 
22.3 命令行 
22.4 安全模型 
22.5 架構 
第23章 案例研究 
23.1 m6d.com(media6degrees) 
23.1.1 m 6d的數據科學,使用hive和r 
23.1.2 m6d udf偽隨機 
23.1.3 m6d如何管理多mapreduce集群間的hive數據訪問 
23.2 outbrain 
23.2.1 站內線上身份識別 
23.2.2 計算復雜度 
23.2.3 會話化 
23.3 nasa噴氣推進實驗室 
23.3.1 區域氣候模型評價系統 
23.3.2 我們的經驗:為什么使用hive 
23.3.3 解決這些問題我們所面臨的挑戰 
23.4 photobucket 
23.4.1 photobucket 公司的大數據應用情況 
23.4.2 hive所使用的硬件資源信息 
23.4.3 hive提供了什么 
23.4.4 hive支持的用戶有哪些 
23.5 simplereach 
23.6 experiences and needs from the customer trenches 
23.6.1 介紹 
23.6.2 customer trenches的用例 
術語詞匯表 
展開全部

hive編程指南 相關資料

  大數據的理論和價值逐漸得到了社會各界的認可,各種各樣的大數據應用系統應運而生,正在創造性地解決著不同使用場景下的問題。在大數據應用越來越多樣化的同時,對提供支撐的基礎技術平臺提出了更高的要求。hadoop是目前市場接受程度最高的大數據技術平臺之一,在大量有代表性的hadoop 1.x用戶使用體驗和反饋的基礎上,廣受關注的hadoop 2.x版本在平臺設計層面做出了重大改進,已于2013年10月正式發布。   yarn是hadoop 2.x的核心部分。它作為新一代的資源管理系統,不僅支持mapreduce計算框架,還可以支持流式計算框架、圖計算框架、內存迭代計算框架等,極大地擴展了hadoop的使用場景,提高了hadoop集群的利用效率。董西成先生理論功底深厚,實踐經驗豐富,本書可以幫助大家快速了解和學習yarn。   —— 謝磊 北京小象科技有限公司執行董事/chinahadoop技術社區負責人

hive編程指南 作者簡介

Edward Capriolo:Media6degrees公司系統管理員,他是Apache軟件基金會成員,還是Hadoop-Hive項目成員。   Dean Wampler:Think Big Analytics公司總顧問,對大數據問題以及Hadoop和機器學習有專門的研究。   Jason Rutherglen:Think Big Analytics公司軟件架構師,對大數據、Hadoop、搜索和安全有專門的研究。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 欧美在线精品一区二区三区 | 自偷自偷自亚洲永久 | 国产麻豆媒一区一区二区三区 | 99视频都是精品热在线播放 | 一级无遮挡理论片 | 国产成版人视频网站免费下 | 嫩草视频在线播放 | 亚洲色大成网站www尤物 | 久久99精品久久久久久hb无码 | 午夜影院普通用户体验区 | 色综合视频一区二区三区 | 日日操日日干 | 免费精品久久久视频 | 天码av无码一区二区三区四区 | 日本疯狂爆乳xxxx | 国模丽丽啪啪一区二区 | 一区二区三区日韩精品 | 91亚洲精品一区二区三区 | 日本视频www| 99精品国产成人a∨免费看 | 欧美成人猛交69 | 日韩精品亚洲一级在线观看 | 大地资源中文第3页 | 亚洲一区二区三区av在线观看 | 欧美粉嫩免费视频播放 | 亚洲国产成人手机在线观看 | 婷婷色吧 | 欧美性黑人极品hd | 国产精品一久久香蕉产线看 | 精品无码人妻一区二区三区 | 成人欧美一区二区三区视频xxx | 看全色黄大色大片免费久久 | 国产一级特黄一级毛片 | 国产小视频在线播放 | 国产熟女内射oooo | 成年午夜| 久草精品视频 | 58av国产精品 | 男女一级免费视频 | 亚洲变态另类天堂av手机版 | 五月狠狠亚洲小说专区 |