电子书:《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01

[复制链接]
查看160 | 回复1 | 2019-12-24 07:22:20 | 显示全部楼层 |阅读模式

《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01_1

《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01_1

《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01_2

《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01_2

《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01_3

《基于Hadoop与Spark的大数据开发实战》_肖睿等_2018-03-01_3


内容简介:

任务3HDFS运行原理
2.3.1HDFS读写流程
2.3.2HDFS副本机制
905
33HDFS负载均衡
2.34HDFS机架感知
任务4HDFS高级知识
241 Hadoop序列化机制
2.4.2 Sequence File
3386
2.4.3 Map File
本章总结
本章练习
任务1认识 MapReduce编程模型
3.11 MapReduce基础
3.1.2 MapReduce编程模型
88θ
3.13 MapReduce词频统计编程实例
任务2 MapReduce应用开发
321 MapReduce输入/输出类型
322 MapReduce输入格式
323 MapReduce输出格式
Combiner操作
3.2.5 Partitioner操作
89
3.2.6自定义 RecordReader
任务3 MapReduce高级应用
331使用 MapReduce实现join操作
3,3.2使用
uce实现排序
33.3使用 MapReduce实现二次排序
334使用 MapReduce合并小文件
本章总结
本章练习
任务1初识YARN
4.1.1YARN产生背景
116
4.1.2YARN简介

4.13YARN架构设计
任务2了解HDFS新特性
.2.1 HDFS NameNode高可用机制
4. 2.2 HDFS NameNode Federation
4. 2. 4 HDES REST API
任务3了解YARN新特性
43.1 ResourceManager自动重启
4.3,2 ResourceManager高可用机制
任务1认识 HBase
5.1.1 HBase简介
12 HBase体系结构
5.1.3 HBase数据模型
5.1.4 HBasc的安装
任务2 HBase Shell操作
521 HBase Shell简介
522 HBase Shell I的使用
任务3 HBase编程
53.1开发 HBasc应用程序
53.2 HBase数据存储管理API
本章总结
本章练习
6章 Hadoop综合实战—音乐排
任务1 MapReduce与 HBase的集成
6.11 MapReduce与 HBase的集成环境
6.1.2批量数据导入( Bulk Loading)
任务2 HBase MapReduce API
62.1 HBase MapReduce API简介
622 TableMapper的使用
6.2.3 Table Reducer的使用

非卖品,仅供非商业用途或交流学习使
任务3实现音乐排行榜
63.1程序的结构与实现
63,2 HBase数据库设计优化
633 MapReduce全局共享数据
本章总结…
本章练习
任务1Hive基础
人识Hive
7.1.2Hive架构设计
1.3Hive与 Hadoop
1.4Hive与传统关系型数据库
6Hive部署
任务2掌握Hive操作
7.2.2 Hive DML
7.2.3 Hive shell
任务3Hive高级应用
.3.1Hive函数
7.3.2Hive调优策略
本章总结
本章练习
第8章大数据离线处理.辅。助.系统
233
任务1认识并使用数据迁移框架 Scoop
8.1.2使用 Snoop导入 MySQL数据到HDFS
8.1.3使用 Scoop导出HDFS数据到 MySQL
14使用 Scoop导入 MySQL数据到Hive
任务2使用 Azkaban实现工作流调度
8.2.2 Azkaban环境部署
8.23 Azkaban应用实例

非卖品,仅供非商业用途或交菹学习使用
本章总结
本章练习
任务1 Spark入
911 Spark简介

913Spak生态图
任务2Scaa基础
921 Scala简介
9.2.2 Scala函数定义
92.3 Scala面向对象操作
9,24 Scala集合的使用
925 Scala高阶函数
任务3编译 Spark
93.1下载 Spark源码
9.32译 Spark源码
任务4 Spark初体验
Spark环境部署
9.4.2 spark-shell
本章总结
本章练习
286
任务1 Spark RDD
1.1RDD介绍
10.1.2RDD的创建
10.14RDD的动作算子
10.1.5RDD的依赖关系
任务2RDD高级应用
10.21RDD缓存机制
10.22共享变量
park架构设计
7023
任务3基于RDD的 Spark应用程序开发
10.31准备工作

非卖品,仅供非商业用途或交流学习使用
10.3.2词频计数实例
10.33年龄统计实例
本章总结
本章练习…
309
任务1认识 Spark SQL
312
11.1.1sQL
312
1.2 SQL on Hadoop框架
1l13 Spark SQL简介
任务2 Spark SQL编程基础
112.1 Spark SQL编程入口
315
11.2.2 DataFrame基础
11.2.3 Data frame编程实例
任务3 Spark SQL编程进阶
113.1 Spark SQL操作外部数据源
325
park SQL函数
33 Spark SQL调优
本章总结…………
本章练习
335
第12章 Spark Streaming
任务1流处理框架及 Spark Streaming
338
12.1.1流处理框架简介
12..2 Spark Streaming简介
任务2使用 Spark Streamin编程
1221 Spark Streaming核心
22.2 Spark Streaming编程实例…
任务3 Spark Streaming高级应用
12.3.1使用 Spark Streaming整合 Flume
12.3.2使用 Spark Streaming整合Kaka
123.3 Spark Streaming优化策
本章总结
本章练习


#############################################


回复

使用道具 举报

阳光依旧温暖 | 2019-12-24 07:22:25 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则