电子书:《Hadoop+Spark生态系统操作与实战指南》_余辉

[复制链接]
查看243 | 回复1 | 2019-12-7 15:16:45 | 显示全部楼层 |阅读模式

《Hadoop+Spark生态系统操作与实战指南》_余辉_1

《Hadoop+Spark生态系统操作与实战指南》_余辉_1

《Hadoop+Spark生态系统操作与实战指南》_余辉_2

《Hadoop+Spark生态系统操作与实战指南》_余辉_2

《Hadoop+Spark生态系统操作与实战指南》_余辉_3

《Hadoop+Spark生态系统操作与实战指南》_余辉_3


内容简介:

作者简介
余辉,中guo科学院大学硕士研究生
毕业,研究方向为云计算和大数据。现
供职于某上市公司担任技术经理,并在
Oracle OAEC人才产业集团大数据学院
担任大数据讲师。曾在清华大学电子工
程系 NGNLab研究室担任软件工程师。
已发表两篇大数据论文:《微博舆
情的 hadoop存储和管理平台设计与实
现》和《跨媒体多源网络舆情分析系统
设计与实现》

Hadoop+ Spark
生态系统操作与实战指南
余辉著
等大学出版社
北京
仅供非商业用途或交流学习使用

内容简介
本书用于 Hadoop+ Spark快速上手,全面解析 Hadoop和spk生态系统,通过原理解说和实例操作每一个组
件,让读者能够轻松跨入大数据分析与开发的大门
全书共12章,大致分为3个部分,第1部分(第1-7章)讲解 Hadoop的原生态组件,包括 Hadoop, ZooKeeper
HBse、Hve环境搭建与安装,以及介绍 MapReduce,HDFS、Zo0 Keeper、 HBase,Hve原理和 Apache本环境
下实战操作。第2部分(第8-11章)讲解 Spark
态组件,包括 Spark Core、 Spark SQL、 Spark Streaming
Dataframe,以及介绍 Scala、 Spark API、 Spark SQL、 Spark Streaming、 Dataframe原理和CDH版本环境下实战操
作,其中Fhme和Kaka属于 Apache顶级开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目
包络网 页日志离线项目和实时项目,在CDH版本环境下通过这两个项目将 Hadoop和 Spark原生态组件进行整合
一步步带领读者学习和实战操作。
本书适合想要快速掌握大数据技术的初学者,也适合作为高等院校和培训机构相关专业师生的教学参考书和
本书封面贴有清华大学出版社防伪标签,无标签者不得销售
版权所有,侵权必究。侵权举报电话:010-6278298913701121933
图书在版编目(c|P)数据
Hadoop+ Spark生态系统操作与实战指南/余辉著.一北京:清华大学出版社,201
ISBN9787-30247967-3
L.①H…Ⅱ.①余…Ⅲl①数据处理软件一指南ⅣV.①TP274
中guo版本图书馆CIP数据核字(2017)第207245号
责任绵辑:夏毓彦
封面设计:王翔
责任校对;闫秀华
出版发行:清华大学出版社
地址;北京清华大学学研大厦A座
邮编:100084
社总机:010-62770175
邮购:010-62786544
投稿与读者服务:010-62776969,e-service@up,tsinghua,edu.cn
质量反馈:010-62772015,zhiliang@tup.tsinghua.cdu.cn
印装者;三河市铭诚印务有限公司
经销:全guo新华书店
开本:190mmx260mm
字数:563千字
版次:2017年9月第1版
印次:2017年9月第1次印剧
印数:1~3500
定价:69.00元
产品编号:076840-0
仅供非商业用途或交流学习使用

推荐序
大数据是继石油之后,新兴的一种guo家战略资源。大数据研究、开发和应用已经成为全球
学术界、产业界的焦点。 Hadoop、Spak等开源项目是目前大数据领域应用最广泛的技术和平
台。熟练掌握Hado、 Spark等是从事大数据研发和应用等从业人员必备的基本技能
《 Hadoop+ Spark生态系统操作与实战指南》正是在这样的技术背景下应运而生,能极好
地满足广大大数据从业者的需求。本书以原理介绍为基础,以实战训练为目标,具体、深入地
阐述了 Hadoop及 Spark的原生态中每一个组件的基本原理和应用方法;选择 Apache和CDH
两个主流 Hadoop版本作为剖析实例,通过Java、 Scala、客.户.端等开发案例,采用主流的离线
项目和实时项目进行讲解
作者根据自己多年在大数据行业的研发经验和个人体会,并结合大数据实际研发中需求和
特点,认真整理其多年来编写的有关大数据研发的博文,精心组织和修订,最终编撰此著作
馈食读者。因此,该著作既是在大数据一线研发人员的知识结晶,而且还是有意进军大数据领
域的从业人员的“良师益友”,确实是一本难得的大数据研发的参考资料。
黄永峰
清华大学电子工程系教授、博士生导师
仅供非商业用途或交流学习使用

Hadoop+ Spark生态系统操作与实战指南
随着大数据时代的到来,大数据技术在各行各业的应用越来越多,大数据相关技术的学习
和使用者也越来越多。《 Hadoop-+ Spark生态系统操作与实战指南》从大数据爱好者和入门者
的角度出发,以原理兼实战为主体思路展现 Hadoop及 Spark的原生态中每一个组件的操作方
法,是一本有效的快速入门教程
本书首先讲解了 Apache和CDH两大 Hadoop版本的集群搭建,并以此作为后续的开发平
台;其次,讲解了 Hadoop+ Spark中原生态组件的原理,并使用Java、 Scala、客.户.端对组件进
行实例操作,作为案例:最后,通过两个网 页日志分析项目将 Hadoop和 Spark中的原生态组
件整合在一起,作为项目架构
余辉毕业于中guo科学院大学,其研究方向为大数据与云计算,目前已拥有多年一线大数据
开发经验。本书将理论与实践相结合,可作为相关技术教学和培训的参考资料。
肖俊
中guo科学院大学人工智能技术学院教授、副院长
本书系统介绍了大数据相关知识,全书共有12章,论述了大数据的基本概念、大数据处
理架构 Hadoop、分布式文件系统HDFS、分布式数据库 HBase、 NOSQL数据库、云数据库
分布式并行编程模型 MapReduce、基于_内.存_的分布式计算框架 Spark、最新的 ZooKeeper,Hive
Scala、 Flume、Kaka等技术。在 Hadoop、HDFS、 HBase、 MapReduce和 Spark等重要章节
都安排了实践操作,让读者更好地学习和掌握大数据关键技术
本文作者余辉工程师,在大数据领域的实验室及公司工作多年,积累了丰富的实战经验
这本书理论结合实践,手把手教读者一步一步入门,避免了“纸上谈兵”,是大数据研究爱好
者及从业人员的入门书籍
本书可以作为高等院校计算机专业、信息管理等相关专业的大数据课程教材,也可供相关
技术人员参考、学习、培训之用。
中guo科学院计算机网络信息中心( CNIC/CAS)百人计划研究员、
巴黎第13大学客座教授、里昂第1大学客座教授
仅供非商业用途或交流学习使用


#############################################


回复

使用道具 举报

几乎不开 | 2019-12-21 20:04:23 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则