电子书:《Hadoop大数据实战权威指南》

[复制链接]
查看166 | 回复1 | 2019-12-7 15:37:00 | 显示全部楼层 |阅读模式

《Hadoop大数据实战权威指南》_1

《Hadoop大数据实战权威指南》_1

《Hadoop大数据实战权威指南》_2

《Hadoop大数据实战权威指南》_2

《Hadoop大数据实战权威指南》_3

《Hadoop大数据实战权威指南》_3


内容简介:

数据科学与应用丛书
Hadoop
大数据实战权威指南
黄东军编著
電子工掌出版
Publishing House of Electronics Industry
北京 BEJING

内容简介
大数据贵在落实!
本书是一本讲解大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用
开发”编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数据的背景、发展及关键
技术:第二篇为 Hadoop大数据平台搭建与基本应用,内容涉及 Linux、HDFS、 MapReduce、YARN
Hive、 HBase、 Scoop、Kafk、 Spark等;第三篇为大数据处理与项目开发,包括交互式数据处理、协同
过滤推荐系统、销售数据分析系统,并就京东的部分销售数据应用大数据进行处理分析
本书适合初学者入门和进阶,也可供希望全面、系统地理解并掌握大数据实际应用的读者参考,对
从事大数据项目开发的专业人员也有参考价值
为了方便读者实践,本书配有开发资源包,读者可登.录华信教育资源网
注册后下载
hxedu. com. cn)免费
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容
版权所有,侵权必究
图书在版编目(C|P)数据
Hado0p大数据实战权威指南/黄东军编著,一北京:电子工业出版社,20177
(大数据科学与应用丛书)
ISBN9787-121-31821-4
1.①H…Ⅱ.①黄…Ⅲ.①数据处理软件一指南ⅣV.TP2746
中guo版本图书馆CP数据核字(2017)第129534号
责任编辑:田宏峰
印刷:三河市鑫金马印装有限公司
装订:三河市鑫金马印装有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100056
开本:787×980116印张:23.5字数:526千字
版次:2017年7月第1版
印次:2017年7月第1次印刷
定价:68.00
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系
联系及邮购电话010)88254888825888
质量投诉请发邮件至zt@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.cor
本书咨询联系方式:tianhe(@phei.com.cn


本书内容
本书分为
共有12章
第一篇大数据的基本概念和技术
第1章绪论,描述大数据的时代背景与guo家大数据战略,探讨大数据的概念和特
性,重点阐述大数据支撑体系,包括数据采集、存储、分布式计算和应用,并讨论大数据
人才特点与能力要求
第2章 Hadoop大数据关键技术,详细介绍大数据系统涉及的主流技术,主要包
括数据采集与生成、数据分布式存储、分布式计算框
数据分析与挖掘等方面的技
术和工具
第二篇 Hadoop大数据平台搭建与基本应用
第3章 Linux操作系统与集群搭建,介绍 Linux集群的安装、Java开发包JK的安
装,以及集群的配置方法
第4章HDFS安装与基本应用,介绍 Hadoop HDFS的架构、工作原理,以及
Hadoop安装、配置、启动和程序的运行
第5章 MapReduce与YARN,介绍 MapReduce的工作原理,描述 MapReduce2
(也就是YARN)的架构和执行流程。本章重点介绍如何设计 MapReduce程序,给出了在
Eclipse中实现Java语言 MapReduce程序的具体过程
第6章Hive和 HBase的安装与应用,主要介绍Hive和 HBase的安装配置和应用方
法,同时也介绍 MySQL和 ZooKeeper的安装与应用
第7章 Snoop和Kaka,介绍 Scoop和Kaka组件的安装及其基本应用方法
第8章 Spark集群安装与开发环境配置,介绍 Spark架构及其工作原理,详细介绍
Spark开发环境的安装与配置,包括热门的 IntelliJ IDEA集成开发环境的安装与基本

Hadoop大数据实战权威指南
第9章 Spark应用基础,介绍 Spark程序的运行模式和应用设计方法,通过编写计
算圆周率Pi、基于随机森林模型的贷款风险预測 Scala程序,展示了在集成开发环境
IDEA中编写 Spark程序的流程
第三篇大数据处理与项目开发一
第10章交互式数据处理,介绍如何利用Hive进行大数据处理和分析。Hive是建
立在 Hadoop MapReduce基础上的数据仓库工具,用户借助SsoL语句,可完成很多处理
和分析,因此,对实际工作者有很大帮助。
第11章协同过滤推荐系统,介绍推荐算法的基本概念和应用,展示基于 Spark的
机器学库MLib实现的协同推荐应用
第12章销售数据分析系统,通过一个完整的销售数据分析系统设计,展示如何利
用Hado的各种组件开发实际的大数据应用系统。本章运用到的组件包括HDFs
ySQL、 Eclipse、 Phoenix、 H Base、 Web Collector, Sevlet、 Tomcat等,所展示的数据和
应用均来自真实场景,对读者有较高参考价值。
本书特点
把原理、架构、运行流程分析与实际应用融合起来介绍,融合性阐述框架优于单纯的
原理分析,因为原理最终要付诸应用。
本书高度重视实践能力的培养,对系统安装、配置和应用过程给出了十分详细的描
述,所有实验都是基于实际完成的操作介绍的,并配有现场截图,为读者展示了真实、详
尽、可重现的场景,十分方便读者自学和钻研
与很多大数据技术书籍不同,本书突出了数据处理本身,深入介绍了如何运用技术进
实际的数据分析,所采用的数据样本来自生产一线,所展示的项目具有实用的参考价
值,读者掌握这些技术之后,就可以开始进行项目开发了
本书的读者群
本书十分适合初学者入门和进阶。
本书也可供那些已经学习过 Hadoop组件技术,但希望全面、系统地理解并掌握实际
应用的读者参考。
本书对从事大数据项目开发的专业人员也有参考价值,书中所描述的 Hadoop组件应
用中遇到的各种问题及其解决办法,十分实用

本书特别适合自学,读者完全可以利用本书给出的资源和示例
步一步地完成各项
操作和应用,体验一种登堂入室的成就感
致谢
感谢大数据时代,感谢开源社区,感谢 Apache基金会,感谢 Google,感谢所有关心
和热爱大数据的人们!
作者在创作本书中借鉴了中科普开(北京)科技公司的部分培训资源,在此谨表示衷
的感谢。特别感谢中南大学郑瑾副教授,本书的部分内容使用了她编撰的书稿。由衷地
感谢王建新教授、李建彬教授、张祖平教授,他们耐心地审阅了本书,提出了中肯的意见
和建议。非常感谢电子工业出版社田宏峰编辑,他细心专业的工作方式,给作者留下深刻
印象,并为本书的高质量印装提供了保障。
由于作者水平有限,本书的错误和疏漏在所难免,恳请广大读者提出宝贵意见和建
议。联系邮箱:dihuang@csu.edu.cn
2017年6月于长沙


#############################################


回复

使用道具 举报

活在当下 | 2019-12-21 20:04:20 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则