电子书:《Spark:大数据集群计算的生产实践》

[复制链接]
查看143 | 回复1 | 2019-12-17 06:36:28 | 显示全部楼层 |阅读模式

《Spark:大数据集群计算的生产实践》_1

《Spark:大数据集群计算的生产实践》_1

《Spark:大数据集群计算的生产实践》_2

《Spark:大数据集群计算的生产实践》_2

《Spark:大数据集群计算的生产实践》_3

《Spark:大数据集群计算的生产实践》_3


内容简介:

Spark: Big Data Cluster Computing in Production
Spark
大数据集群计算的生产实践
[美] Ilya Ganelin[西] Ema Orhan[日] Kai sasaki[美] Brennon York著
李刚译周志湖审校
Publishing House of Electronics Industry
北京· BEIJING

内容简介
本书涵盖了开发及维护生产级 Spark应用的各种方法、组件与有用实践。全书分为6章,第1~2章
帮助读者深入理解 Spark的内部机制以及它们在生产流程中的含义:第3章和第5章阐述了针对配置参数
的法则和权衡方案,用来调优 Spark,改善性能,获得高可用性和容错性:第4章专门讨论 Spark应用中
的.安.全.问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件
同时对 Spark生态系统进行了梳理
本书不会讲述入门级内容,读者在阅读前应己具备 Spark基本原理的知识。本书适合 Spark开发人员、
park应用的项目经理,以及那些考虑将开发的spk应用程序迁移到生产环境的系统管理员(或者
Spark: Big Data Cluster Computing in Production, 978-1-119-25401-0, Ilya Ganelin, Ema Orhian, Kai Sasaki,
Brennon York
Copyright o 2016 by John Wiley Sons, Inc, Indianapolis, Indiana
All rights reserved. This translation published under license
No part of this book may be reproduced in any form without the
Copies of this book sold without a Wiley sticker on the back cover are unauthorized and illegal
本书简体中文字版专有翻译出版权由美guo John Wiley&sons,hne.公司授予电子工业出版社。未经许
可,不得以任何手段和形式复制或抄袭本书内容
本书封底贴有 John Wiley&sons,nc.防伪标签,无标签者不得销售
版权贸易合同登记号图字:01-2016-6363
图书在版编目(c|P)数据
Spak:大数据集群计算的生产实践/(美)伊利亚·甘列林( Ilya Ganelin)等著:李刚译.一北京:电子
工业出版社,20175
书名原文: Spark: Big Data Cluster Computing in Production
SBN9787-121-31364-6
①s…Ⅱ.①伊…②李…Ⅲ.①数据处理软件Ⅳ.①TP27
中guo版本图书馆CP数据核字(2017)第077641号
责任编辑:许艳
印刷:北京天宇星印刷厂
装订:北京天宇星印刷厂
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:787×9801/16印张:13.75字数:226.5千字
版次:2017年5月第1版
印次:2017年5月第1次印刷
定价:6500元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,
联系及邮购电话010)8825488
质量投诉请发邮件至zts@ph
phei. com. cn,
盗版侵权举报请发邮件至dbqq@phei.com.cn
本书咨询联系方式:0105
9, faq@phei

关于作者
Ilva ganelin从机器人专家成功跨界成为一名数据工程师。他
曾在密歇根大学花费数年时间硏究自发现机器人( self-discovering
robot),在波音公司从事手机及无线嵌入式DSP(数据信号处理)
软件开发项目,随后加入 Capital One的数据创新实验室,由此进
入大数据领域。Iya是 Apache Spark核心组件的活跃贡献者以及
Apache Apex的提交者( committer),他希望研究构建下一代分布
式计算平台。同时,Ia还是一个狂热的面包烘焙师、厨师、赛车
手和滑雪爱好者
Ema Rhian是一位对伸缩性算法充满激情的大数据工程师
她活跃于大数据社区,组织会议,在会上发表演讲,积极投身于
开源项目。她是 jaws-spark-sql-rest( SparkSQL数据仓库上的一种
资源管理器)的主要提交者。Ema一直致力于将大数据分析引入
医疗领域,开发一个对大型数据集计算统计指标的端到端的管道

Ⅳ Spark:大数据集群计算的生产实践
Kai Sasaki是一位日本软件工程师,对分布式计算和机器学
习很感兴趣。但是一开始他并未从事 Hadoop或 Spark相关的工作,
最初的兴趣是中间件以及提供这些服务的基础技术,是互联网
驱使他转向大数据技术领域。Kai-直是 Spark的贡献者,开发了
不少MLib和ML库。如今,他正尝试研究将机器学习和大数据
结合起来。他相信 Spark在大数据时代的人工智能领域也将扮演重要
角色。他的GHb地址为:htps://github.com/Lewuathe
Brennon york既是一名特技飞行员,也是一位计算机科学家
他的爱好是分布式计算、可扩展架构以及编程语言。自2014年以
来,他就是 Apache Spark的核心贡献者,目标是通过发展 GraphX
和核心编译环境,培育一个更强大的 Spark社区,激发更多合作
从为 Spark提交贡献开始,York就一直在用 Spark,而且从那个时
候开始,就使用 Spark将应用带入生产环境。

关于技术编辑
Ted Yu是 Horton works公司的资深工程师,也是 HBase PMC以及Spak的
献者。Yu在 Spark领域有不少经验
Dan Osipov是 Applicative,LLC的首席技术顾问,有两年的 Spark工作经验,四
年 Scala开发经验,主要从事数据工具及数据应用方面的工作。他曾参与移动开发及
内容管理系统项目
eff Thompson是从神经学跨界过来的数据科学家,获得加州大学伯克利分校视
觉科学(主要为神经系统科学及脑显像)博士学位,在波士顿大学生物医学影像中
心读完博士后。在工作的头几年,Jeff在美guoguo内一家.安.全.领域创业公司工作,职责
是作为算法工程师构建下一代货物检查系统。最近两年他一直在博世公司(一家全
球性的工程和制造公司)担任高级数据科学家
Anant Asthana是 Pythian公司的大数据顾问及科学家。他在设备驱动器及高可
用/临界负载的数据库系统领域有较深研究
① Hortonworks这个名字源自儿童书中一只叫 Horton的大象。2011年,雅虎剥离 Hadoop业务
由 Eric Bladeschweiler,雅虎主导 Hadoop开发的副总裁,带领二十几个核心成员成立
Hortonworks。成立伊始, Hortonworks即获雅虎和 Benchmark2300万美元的投资,可谓含着银
汤匙出生。此后 Hortonworks一直受到资本市场追捧,IPO前一共获得五轮共计248亿美元的
融资,并于2014年底登陆纳斯达克。—译者注


#############################################


回复

使用道具 举报

那年夏天的歌 | 2019-12-21 19:49:10 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则