电子书 《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01

[复制链接]
查看352 | 回复1 | 2019-12-2 19:25:15 | 显示全部楼层 |阅读模式

《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01_1

《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01_1

《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01_2

《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01_2

《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01_3

《ClouderaHadoop大数据平台实战指南》_宋立桓等_2019-01-01_3


内容简介:

VIll Cloudera Hadoop大数据平台实战指南
第3章 Cloudera Manager及CDH离线安装部署
3.1安装前的准备工作
550
32 Cloudera Manager及CDH安装
第4章分布式文件系统HDFs
4. I HDFS简介
4.2HDFS体系结构
4.2.1HDFS架构概述…
42.2HDFS命名空间管理
4.23 Name Node
4.3HDFS20新特性
4.3.1 HDFS HA
44HDFS操作常用 shell命令
4.4.1HDFS目录操作和文件处理命令
42HDFS的Web管理界面
443 dfsadmin管理维护命令
44.4 namenode命令
4.5Java编程操作HDFS实践
4.6HDFS的参数配置和规划
4.7使用 Cloudera manager启用 HDES HA
4.7.1 HDES HA高可用配置
4.7,2 HDES HA高可用功能测试
第5章分布式计算框架 MapReduce
1 MapReduce概述
52.1工作流程概述
522 MapReduce框架的优势
523 MapReduce执行过程
53 MapReduce编程——单词示例解析
4 MapReduce应用开发
54.1配置 MapReduce开发环境
54.2编写和运行 MapReduce程序
第6章资源管理调度框架YARN
61YARN产生背景
62YARN框架介绍

目录Ⅸ
6.3Y
工作原理
4YARN框架和 MapReduce.0框架对比
6.5CDH集群的YARN参数调整
第7章数据仓库Hⅳve
Hive简介
72Hive体系架构和应用场景
60022334
7.2.1Hive体系架构
7.22Hive应用场景
73Hive的数据模型
7.3.1内部表
3.2外部表
.3分区表
7.3.4桶
74Hive实战操作
741Hive内部表操作
74.2Hive外部表操作
74,3Hive分区表操作
744桶表
5677982
7.4.5Hive应用实例 Wordcount
7.4.6 UDF
75基于Hive的应用案例
第8章数据迁移工具Sqop…
Sqop概述
Snoop工作原理
8.3Sqop版本和架构
84 Scoop实战操作
9章分布式数据库 HBase
9.1 HBase概述
92 HBase数据模型
93 HBase生态地位和系统架构
93.1 HBase的生态地位解析
Base系统架构
94 HBase运行机制
9. 4. 1 Region
942 Region Server工作原理
943 Store工作原理
0344
HBase操作实战

X| Cloudera Hadoop大数据平台实战指南
951 HBase常用shel命令
9.52 HBase编程实践
9.53 HBase参数调优的案例分享
109
10.1 ZooKeeper的特点
02 ZooKeeper的工作原理
10.2.1基本架构
022 ZooKeeper实现分布式 Leader节点选举
2.3 ZooKeeper配置文件重点参数详解
10.3Zo0 seeper典型应用场景
0.3.1 ZooKeeper实现HDFS的 Name Node高可用HA
ZooKeeper实现
10.3.3Z00 Keeper在Stom集群中的协调者作用
11章准实时分析系统mpaa
11 Impala概述
1.2mpla组件构成
14 Impala的查询处理流程
115 Impala和Hive的关系和对比
1.6 Impala安装
117 Impala入门实战操作
第12章日志采集工具Fume
121 Flume概述
122Fume体系结构
12.2.1 Flume外部结构
12.2.2 Flume的 Event事件概念
1223Fume的 Agent
123Fume安装和集成
13
23.1搭建 Flume环境
12.32 Kafka与 Flume集成
124Fume操作实例介绍
41例子概述
42第一步:配置数撂流向
43第二步:启动服务
12.4.4第三步:新建空数据文件
4.5第四步:运行 flume-ng命令
133
124.6第五步:运行命令脚本

目录X
24.7最后一步:测试结果
134
第13章分布式消息系统Kaka
13.1 Kafka架构设计
13.1.1基本架构
13.1.2基本概念
13.1.3 Kafka主要特点
13.2 Kafka原理解析
13,2.1主要的设计理念
13.2.2Z0 kEeper在Kaka的作用
13.23Kaka在 ZooKeeper的执行流程
33 Kafka安装和部署
33.1CDH5完美集成 Kafka
13.32Kaka部署模式和配置
34Java操作 Kafka消息处理实例
13.4.1例子概述
13.4.2第一步:新建工程
894444
34.3第二步:編写代码
13.4.4第三步:运行发送数据程序
13.4.5最后一步:运行接收数据程序
143
13.5 Kafka与HDFS的集成
13.5.1与HDFS集成介绍
,143
13.52与HDFS集成实例…
13.53第一步:编写代码—一发送数据
13.5.4第二步:编写代码——接收数据.
13.5.5第三步:导出文件
13.5.6第四步:上传文件
13.5.7第五步:运行程序——发送数据
146
13.5.8第六步:运行程序——接收数据
13.5.9最后一步:查看执行结果
第14章大数据ETL工具Kete
14.1ETL原理
141.1ETL简介
41.2ETL在数据仓库中的作用
14.2 Kettle简介
149
143 Kettle完整案例实战
43.1案例介绍
14.3.2最终效果
14.3.3表说明

<II Cloudera Hadoop大数据平台实战指南
14.3.4第一步:准备数据库数据
14.3.5第二步:新建转换
143.6笫三步:新建数据库连接
14.3.7第四步:拖动表输入组件
14.3.8第五步:设置属性— order表
143.9笫六步:设置属性
43.10第七步:拖动流查询并设置属性——流查询
14.3.11第八步:设置属性— product表
第九步:连接组件
43.13第十步:设置属性——文本输出
43.14最后一步:运行程序并查看结果
144 Kettle调度和命令
14.4.1通过页面调度
l58
144.2通过脚本调度
14.5 Kettle使用原则
第15章大规模数据处理计算引擎 Spark.
51 Spark简介
15.1.1使用背景
5.1.2 Spark特点
52 Spark架构设计
152.1 Spark整体架构
163
15.23RDD介绍
1524RDD操作
1525RDD依赖关系
15.2.6RDD源码详解
15.2.8 Storage
15.29 Shuffle
153 Spark编程实例
15.3.1实例概述
15.3.2第一步:鳊辑数据文件
第二步:鳊写程
153.4第三步:上传JAR文件
153.5第四步:.远.程.执行程序
153.6最后一步:查看结果
154 Spark SQL实战
173
154.1例子概述
15.4.2第一步:编辑数据文件


#############################################


回复

使用道具 举报

wutiwl | 2020-1-30 00:34:11 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则