0人評分過此書

大數據:從基礎理論到最佳實踐

作者
出版日期
2018
閱讀格式
EPUB
書籍分類
學科分類
ISBN
9789576811210

本館館藏

借閱規則
當前可使用人數 3
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館 國立臺北科技大學
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
本書側重於大數據的實踐性技術,系統地介紹了主流大數據平臺及工具的安裝部署、管理維護和應用開發。平臺和工具的選擇均為當前業界主流的開源產品,因此,對於讀者來說,有很強的可操作性。
本書涉及的開源技術包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和應用開發技術外,還特別注重案例實踐,重要的技術點以實際工作場景或案例為依託,使讀者能快速入門,參考案例動手實踐,透過具體深入的實踐,體會大數據的技術本質特徵,領略大數據技術帶來的創新理念,更好地理解和把握訊息技術的發展趨勢。
本書主要內容包括以下幾大部分。
大數據存儲篇:以HDFS為基礎,介紹分佈式文件系統的原理、安裝、fs命令的使用、編程,介紹如何用HDFS實現,並透過HTTP調用。
大數據計算篇:以MapReduce、YARN為基礎,介紹分佈式計算的原理、部署,以及編程案例。
非關係型數據庫篇:以HBase為基礎,重點介紹非關係型數據庫的優勢、原理、部署,以及命令行使用,編程案例,與Sqoop配合使用等。
大數據倉庫篇:以Hive、數據倉庫等為基礎,重點介紹數據的抽取、原理、部署、分析與編程。
大數據實時計算篇:以Storm、Kafka為基礎,介紹實時計算的架構、組成、使用與開發。
本書非常適合從事大數據技術開發與使用的初學者,以及從事大數據技術研發的企事業單位工程師學習和參考,也適合高校計算機相關專業的專科生、本科生和研究生學習使用。
  • 版權訊息
  • 內容簡介
  • 前言
    • 本書定位
    • 本書特色
    • 全書關鍵字
  • 大數據存儲篇
    • 第1章 概述
      • 1.1 什麼是大數據
      • 1.2 大數據的技術轉型
      • 1.3 數據分片
      • 1.4 數據一致性
      • 1.5 主流大數據技術
      • 1.6 大數據職業方向
      • 1.7 大數據實踐平臺的搭建
      • 1.8 小結
    • 第2章 HDFS文件系統
      • 2.1 HDFS概述
      • 2.2 HDFS的運行機制
      • 2.3 HDFS的數據存儲
      • 2.4 HDFS的安裝和配置
      • 2.5 小結
    • 第3章 HDFS操作實踐
      • 3.1 HDFS接口與編程
      • 3.2 操作實踐
      • 3.3 小結
  • 大數據計算篇
    • 第4章 YARN
      • 4.1 YARN概述
      • 4.2 YARN的主要組成模塊
      • 4.3 YARN的整體設計
      • 4.4 容量調度器
      • 4.5 公平調度器(Fair Scheduler)
      • 4.6 資源管理者(RM)重啟機制
      • 4.7 資源管理器的高可用性(RM HA)
      • 4.8 節點標籤
      • 4.9 YARN編程
      • 4.10 YARN服務注冊
      • 4.11 小結
    • 第5章 MapReduce
      • 5.1 MapReduce概述
      • 5.2 Key-Value結構的特點
      • 5.3 MapReduce的部署
      • 5.4 MapReduce的程序結構
      • 5.5 MapReduce的編程接口
      • 5.6 MapReduce的命令行
      • 5.7 WordCount的實現
      • 5.8 小結
  • 非關係型數據庫篇
    • 第6章 使用HBase
      • 6.1 HBase基礎
      • 6.2 HBase的架構原理
      • 6.3 HBase的命令實踐
      • 6.4 HBase的數據管理
      • 6.5 HBase的集群管理
      • 6.6 小結
    • 第7章 HBase編程開發
      • 7.1 HBase的編程接口
      • 7.2 表與命名空間的編程
      • 7.3 數據編程
      • 7.4 集群與優化編程
      • 7.5 小結
  • 大數據倉庫篇
    • 第8章 數據倉庫概論
      • 8.1 初識數據倉庫
      • 8.2 數據倉庫的核心概念
      • 8.3 數據倉庫中的數據內容劃分
      • 8.4 OLAP
      • 8.5 ETL
      • 8.6 調度和運行
      • 8.7 數據倉庫的架構
      • 8.8 數據倉庫的展望
      • 8.9 小結
    • 第9章 Hive
      • 9.1 初識Hive
      • 9.2 Hive命令行接口
      • 9.3 Hive數據類型與常見的結構
      • 9.4 HiveSQL
      • 9.5 Hive的自定義函數
      • 9.6 Hive的高級使用
      • 9.7 使用Hive構建數據倉庫
      • 9.8 小結
  • 大數據實時計算篇
    • 第10章 Storm實時系統
      • 10.1 大數據實時系統概述
      • 10.2 Kafka分佈式消息系統
      • 10.3 Storm實時處理系統
      • 10.4 小結
  • 參考文獻
  • 出版地 臺灣
  • 語言 繁體中文

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading