电子书:《Flume日志收集与MapReduce模式》

[复制链接]
查看166 | 回复1 | 2019-12-20 08:06:12 | 显示全部楼层 |阅读模式

《Flume日志收集与MapReduce模式》_1

《Flume日志收集与MapReduce模式》_1

《Flume日志收集与MapReduce模式》_2

《Flume日志收集与MapReduce模式》_2

《Flume日志收集与MapReduce模式》_3

《Flume日志收集与MapReduce模式》_3


内容简介:

Flume日志收集与
Mapreduce模式
美1史特夫·霍夫曼( Steve Hoffman
斯里纳特?佩雷拉( Srinath Perera
张龙译
业出版社
图书在版编目(CIP)数据
Flume日志收集与 Mapreduce模式/(美)夫曼( Hoffman,S.),(美)假雷拉( Perera
S.)著:张龙译,一北京:机械工业出版社,2015.5(2015.11重印
大数据技术从书
书名原文: Apache Flume: Distri
Log Collection for Ha
1.F…,0…②根
张I.数据采集IV.TP274
中guo版本图书馆CP数据核字(2015)第098968号
本书版权登记号:图字
Steve Hoffman: Apache Flume: Distributed Log Collection for Hadoop (ISBN: 978-
a: Instant Mapreduce Patterns-hadoop Essentials How-to (ISBN
978-1-782-16770-9)
opyright O 2013 Packt Publishing. First published in the English language
under the title -Apache Flume
ifed language edition published by China Machine Press.
Copyright 0 2015 by China Machine Pre
本书中文简体字版由 Packt Publishing i授权机械工业出版社独家出版。未经出板者书面许
可,不得以任何方式复制或抄本书内容
Flume日志收集与 Mapreduce模式
出版发行:机械工业出版社(北京市四区百万庄大街22号部段码:1003
尚任:陈佳
印;三河市宏图印务有限公司
版次:2015年11月第1版第2次印同
开本:147mmx210mm1/32
书号:ISBN978-7-111-50207-4
定价:39.00元
如有缺,倒页、页,由本社发行部调数
投线
010)683262948837964968995259
读者信箱: hit (a hzboak,c
shies'wh译者序
今日之时代是大数据时代,大数据在各行各业中都发挥着巨
大的作用。这对于广大开发者们也提出了新的要求,如何追赶技术
脚步、如何在大数据时代走在技术的前列成为摆在每一个技术人
员面前的问题。提到大数据就不得不提到 Hadoop以及围绕 Hadoop
形成的大数据生态系统: Hbase、Hive、Pig、 Zookeeper、 Flume
stom等。这其中更是以 Hadoop为整个生态系统的核心和重中之重
虽然面临着后来者 Spark的挑战,但 Hadoop凭借成熟的工具库、完
善的生态系统、业界的广泛应用依旧深受各大互联网公司的青
目前市场上关于 Hadoop的技术图书已经汗牛充栋,那么,本书有
哪些特点值得各位读者阅读呢?本书共包含两篇内容:上篇是关于
Apache Flume的介绍;下篇是关于 Mapreduce模式的介绍。上篇针
对 Apache Flume进行了深入讲解。值得一提的是,目前市场上关于
Flume的技术图书非常少,本书的出现很好地填补了这一空白。该篇
首先从Fume的宏观架构谈起,接下来介绍如何安装与使用 Flume
然后对 Flume E的核心组件通道、接收器、源、拦截器等进行深入讲
解,最后介绍Fume监控方面的知识并总结了实时分布式数据收集
的现状。相信各位读者可以从中学到有关 Apache Flume方方面面的
知识并能灵活地运用到项目中。对于 Mapreduce1模式,下篇独辟蹊
径,针对一个个问题分别进行介绍,弃了传统的流水账讲解方式,
这样读者可以带着问题持续阅读,每一个案例最后都会给出相应的
解决方案。这些案例都是与 Hadoop相关的非常经典的案例,从最简
单的使用Java编写一个单词统计应用到复杂的使用 Mapreduce?实现
Kmeans,相信各位读者从中可以学到许多关于 Hadoop的知识。
总的来说,这本涵盖 Flume与 Hadoop两个重要主题的图书会
给各位读者带来耳目一新之感,同时这两个主题之间也存在着必然
的联系,对有志于在大数据领域深耕的广大技术从业人员来说是一
本上佳的领域专著
翻译技术图书是一项艰苦的工作,首先非常感谢机械工业
出版社华章公司的编辑们,感谢你们在图书翻译过程中给予我
的支持与鼓励;此外,我还要对妻子张明辉说声感谢,你无微
不至的关怀让我能够专心于翻译工作,同时也将本书献给我
岁多的孩子张梓轩,希望你在未来能够茁壮成长;最后,我要
感谢我的父母,没有你们的养育就不会有今天的我。
尽管在翻译过程中本人已经付出了巨大的努力,但错误与遗漏
之处在所难免,悬请广大读者将发现的错误及时告知于我以便在后
续版本中能够及时更正。我的邮箱是 zhanglong217@163com,新 浪
微博是@风中叶的思考,欢迎关注。
张龙
2015年4月
前言
Hadoop是个非常优秀的开源工具,可以将海量的非结构化数
据转换为易于管理的内容,从而更好地洞察客户需求。它很便宜
(几乎是免费的).只要数据中心有空间和电源,它就能够水平扩展
并且可以处理传统数据仓库难以解决的问题。需要注意的是,你得
将数据填入 Hadoop 3集群中,否则你所得到的只不过是昂费的热量
产生器而已。你很快就会发现,一且对 Hadoop的使用经过“试验
性”阶段后,你就需要工具来自动化地将数据填充到集群中。过去
你需要自己找到该问题的解决方案,但现在则不必如此! Flume
开始是 Cloudera的项目,当时它们的集成工程师需要一次又一次地
为客户编写工具来实现数据的自动化导入。时至今日,Fume已经
成为 Apache软件基金会的项目,并且处于活跃开发状态中,很多
用户已经将其用于产品环境多年
本书将会通过 Flume的架构概览与快速起步指南帮助你迅速
掌握 Flume。接下来将会深入介绍 Flume众多更加有用的组件的
细节信息,包括用于即时数据记录持久化的重要的文件通道、用

#############################################


回复

使用道具 举报

夏天蓝了海 | 2019-12-21 19:43:07 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则