图书介绍

Hadoop+Spark生态系统操作与实战指南PDF|Epub|txt|kindle电子书版本下载

余辉著著
出版社：北京：清华大学出版社
ISBN：9787302479673
出版时间：2017
标注页数：337页
文件大小：51MB
文件页数：352页
主题词：数据处理软件－指南

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：4ae13e36b25a15c95027fb547eaa9f0a

下载说明

Hadoop+Spark生态系统操作与实战指南PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章 Hadoop概述1

1.1 Hadoop简介1

1.2 Hadoop版本和生态系统3

1.3 MapReduce简介7

1.4 HDFS简介8

1.5 Eclipse+Java开发环境搭建10

1.5.1 Java安装10

1.5.2 Maven安装11

1.5.3 Eclipse安装和配置12

1.5.4 Eclipse创建Maven项目16

1.5.5 Eclipse其余配置19

1.6 小结21

第2章 Hadoop集群搭建22

2.1 虚拟机简介22

2.2 虚拟机配置24

2.3 Linux系统设置31

2.4 Apache版本Hadoop集群搭建36

2.5 CDH版本Hadoop集群搭建44

2.5.1 安装前期准备44

2.5.2 Cloudera Manager安装45

2.5.3 CDH安装46

2.6 小结55

第3章 Hadoop基础与原理56

3.1 MapReduce原理介绍56

3.1.1 MapReduce的框架介绍56

3.1.2 MapReduce的执行步骤58

3.2 HDFS原理介绍59

3.2.1 HDFS是什么59

3.2.2 HDFS架构介绍59

3.3 HDFS实战62

3.3.1 HDFS客户端的操作62

3.3.2 Java操作HDFS65

3.4 YARN原理介绍69

3.5 小结71

第4章 ZooKeeper实战72

4.1 ZooKeeper原理介绍72

4.1.1 ZooKeeper基本概念72

4.1.2 ZooKeeper工作原理73

4.1.3 ZooKeeper工作流程76

4.2 ZooKeeper安装78

4.3 ZooKeeper实战80

4.3.1 ZooKeeper客户端的操作80

4.3.2 Java操作ZooKeeper81

4.3.3 Scala操作ZooKeeper85

4.4 小结87

第5章 MapReduce实战88

5.1 前期准备88

5.2 查看YARN上的任务95

5.3 加载配置文件95

5.4 MapReduce实战96

5.5 小结121

第6章 HBase实战122

6.1 HBase简介及架构122

6.2 HBase安装127

6.3 HBase实战129

6.3.1 HBase客户端的操作129

6.3.2 Java操作HBase132

6.3.3 Scala操作HBase136

6.4 小结140

第7章 Hive实战141

7.1 Hive介绍和架构141

7.2 Hive数据类型和表结构143

7.3 Hive分区、桶与倾斜144

7.4 Hive安装146

7.5 Hive实战148

7.5.1 Hive客户端的操作148

7.5.2 Hive常用命令154

7.5.3 Java操作Hive155

7.6 小结161

第8章 Scala实战162

8.1 Scala简介与安装162

8.2 IntelliJ IDEA开发环境搭建164

8.2.1 IntelliJ IDEA简介164

8.2.2 IntelliJ IDEA安装164

8.2.3 软件配置166

8.3 IntelliJ IDEA建立Maven项目171

8.4 基础语法176

8.5 函数179

8.6 控制语句181

8.7 函数式编程184

8.8 模式匹配189

8.9 类和对象191

8.10 Scala异常处理194

8.11 Trait（特征）195

8.12 Scala文件I/O196

8.13 作业198

8.13.1 九九乘法表198

8.13.2 冒泡排序199

8.13.3 设计模式Command200

8.13.4 集合对称判断202

8.13.5 综合题204

8.14 小结206

第9章 Flume实战207

9.1 Flume概述207

9.2 Flume的结构208

9.3 Flume安装211

9.4 Flume实战212

9.5 小结214

第10章 Kafka实战215

10.1 Kafka概述215

10.1.1 简介215

10.1.2 使用场景217

10.2 Kafka设计原理218

10.3 Kafka主要配置222

10.4 Kafka客户端操作224

10.5 Java操作Kafka226

10.5.1 生产者226

10.5.2 消费者228

10.6 Flume连接Kafka229

10.7 小结233

第11章 Spark实战234

11.1 Spark概述234

11.2 Spark基本概念234

11.3 Spark算子实战及功能描述238

11.3.1 Value型Transformation算子238

11.3.2 Key-Value型Transformation算子242

11.3.3 Actions算子245

11.4 Spark Streaming实战248

11.5 Spark SQL和DataFrame实战253

11.6 小结266

第12章大数据网站日志分析项目267

12.1 项目介绍267

12.2 网站离线项目267

12.2.1 业务框架图267

12.2.2 子服务“趋势分析”详解268

12.2.3 表格的设计272

12.2.4 提前准备274

12.2.5 项目步骤287

12.3 网站实时项目297

12.3.1 业务框架图297

12.3.2 子服务“当前在线”详解297

12.3.3 表格的设计302

12.3.4 提前准备304

12.3.5 项目步骤327

12.4 小结337