
0人評分過此書
本書側重於大數據的實踐性技術,系統地介紹了主流大數據平臺及工具的安裝部署、管理維護和應用開發。平臺和工具的選擇均為當前業界主流的開源產品,因此,對於讀者來說,有很強的可操作性。
本書涉及的開源技術包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和應用開發技術外,還特別注重案例實踐,重要的技術點以實際工作場景或案例為依託,使讀者能快速入門,參考案例動手實踐,透過具體深入的實踐,體會大數據的技術本質特徵,領略大數據技術帶來的創新理念,更好地理解和把握訊息技術的發展趨勢。
本書主要內容包括以下幾大部分。
大數據存儲篇:以HDFS為基礎,介紹分佈式文件系統的原理、安裝、fs命令的使用、編程,介紹如何用HDFS實現,並透過HTTP調用。
大數據計算篇:以MapReduce、YARN為基礎,介紹分佈式計算的原理、部署,以及編程案例。
非關係型數據庫篇:以HBase為基礎,重點介紹非關係型數據庫的優勢、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。
大數據倉庫篇:以Hive、數據倉庫等為基礎,重點介紹數據的抽取、原理、部署、分析與編程。
大數據實時計算篇:以Storm、Kafka為基礎,介紹實時計算的架構、組成、使用與開發。
本書非常適合從事大數據技術開發與使用的初學者,以及從事大數據技術研發的企事業單位工程師學習和參考,也適合高校計算機相關專業的專科生、本科生和研究生學習使用。
本書涉及的開源技術包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和應用開發技術外,還特別注重案例實踐,重要的技術點以實際工作場景或案例為依託,使讀者能快速入門,參考案例動手實踐,透過具體深入的實踐,體會大數據的技術本質特徵,領略大數據技術帶來的創新理念,更好地理解和把握訊息技術的發展趨勢。
本書主要內容包括以下幾大部分。
大數據存儲篇:以HDFS為基礎,介紹分佈式文件系統的原理、安裝、fs命令的使用、編程,介紹如何用HDFS實現,並透過HTTP調用。
大數據計算篇:以MapReduce、YARN為基礎,介紹分佈式計算的原理、部署,以及編程案例。
非關係型數據庫篇:以HBase為基礎,重點介紹非關係型數據庫的優勢、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。
大數據倉庫篇:以Hive、數據倉庫等為基礎,重點介紹數據的抽取、原理、部署、分析與編程。
大數據實時計算篇:以Storm、Kafka為基礎,介紹實時計算的架構、組成、使用與開發。
本書非常適合從事大數據技術開發與使用的初學者,以及從事大數據技術研發的企事業單位工程師學習和參考,也適合高校計算機相關專業的專科生、本科生和研究生學習使用。
- 版權訊息
- 內容簡介
-
前言
-
本書定位
-
本書特色
-
全書關鍵字
-
-
大數據存儲篇
-
第1章 概述
-
1.1 什麼是大數據
-
1.2 大數據的技術轉型
-
1.3 數據分片
-
1.4 數據一致性
-
1.5 主流大數據技術
-
1.6 大數據職業方向
-
1.7 大數據實踐平臺的搭建
-
1.8 小結
-
-
第2章 HDFS文件系統
-
2.1 HDFS概述
-
2.2 HDFS的運行機制
-
2.3 HDFS的數據存儲
-
2.4 HDFS的安裝和配置
-
2.5 小結
-
-
第3章 HDFS操作實踐
-
3.1 HDFS接口與編程
-
3.2 操作實踐
-
3.3 小結
-
-
-
大數據計算篇
-
第4章 YARN
-
4.1 YARN概述
-
4.2 YARN的主要組成模塊
-
4.3 YARN的整體設計
-
4.4 容量調度器
-
4.5 公平調度器(Fair Scheduler)
-
4.6 資源管理者(RM)重啟機制
-
4.7 資源管理器的高可用性(RM HA)
-
4.8 節點標籤
-
4.9 YARN編程
-
4.10 YARN服務注冊
-
4.11 小結
-
-
第5章 MapReduce
-
5.1 MapReduce概述
-
5.2 Key-Value結構的特點
-
5.3 MapReduce的部署
-
5.4 MapReduce的程序結構
-
5.5 MapReduce的編程接口
-
5.6 MapReduce的命令行
-
5.7 WordCount的實現
-
5.8 小結
-
-
-
非關係型數據庫篇
-
第6章 使用HBase
-
6.1 HBase基礎
-
6.2 HBase的架構原理
-
6.3 HBase的命令實踐
-
6.4 HBase的數據管理
-
6.5 HBase的集群管理
-
6.6 小結
-
-
第7章 HBase編程開發
-
7.1 HBase的編程接口
-
7.2 表與命名空間的編程
-
7.3 數據編程
-
7.4 集群與優化編程
-
7.5 小結
-
-
-
大數據倉庫篇
-
第8章 數據倉庫概論
-
8.1 初識數據倉庫
-
8.2 數據倉庫的核心概念
-
8.3 數據倉庫中的數據內容劃分
-
8.4 OLAP
-
8.5 ETL
-
8.6 調度和運行
-
8.7 數據倉庫的架構
-
8.8 數據倉庫的展望
-
8.9 小結
-
-
第9章 Hive
-
9.1 初識Hive
-
9.2 Hive命令行接口
-
9.3 Hive數據類型與常見的結構
-
9.4 HiveSQL
-
9.5 Hive的自定義函數
-
9.6 Hive的高級使用
-
9.7 使用Hive構建數據倉庫
-
9.8 小結
-
-
-
大數據實時計算篇
-
第10章 Storm實時系統
-
10.1 大數據實時系統概述
-
10.2 Kafka分佈式消息系統
-
10.3 Storm實時處理系統
-
10.4 小結
-
-
- 參考文獻
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分