电子书:《深度实践Spark机器学习》

[复制链接]
查看168 | 回复1 | 2019-12-31 06:36:59 | 显示全部楼层 |阅读模式

《深度实践Spark机器学习》_1

《深度实践Spark机器学习》_1

《深度实践Spark机器学习》_2

《深度实践Spark机器学习》_2

《深度实践Spark机器学习》_3

《深度实践Spark机器学习》_3


内容简介:

内容简介
本书系统讲解了 Spark机器学习的技术、原理、组
件、算法,以及构建 Spark机器学习系统的方法、
流程、标准和规范。此外,还介绍了Spak的深度
学习框架 TensorFlowOnSpark,以及如何借助它
实现卷积神经网络和循环神经网络
全书共14章,分为4个部分
第一部分(第1-7章)
主要讲解了Spak机器学习的技术、原理和核心组
件,包括 Spark ML、 Spark ML Pipeline、Spar
ML|b,以及如何构建一个 Spark机器学习系统
第二部分(第8-12章)
主要以实例为主,讲解了 Spark ML的各种机器学
习算法,包括推荐模型、分类模型、聚类模型、回
归模型,以及 PySpark决策树模型和 Spark R朴素
贝叶斯模型
第三部分(第13章)
与之前的批量处理不同,本章以在线数据或流式
数据为主,讲解了 Spark的流式计算框架 Spark
第四部分(第14章)
介绍了Spak深度学习,主要包括 TensorFlow
的基础知识及它与 Spark的整合框架
TensorFlowOn Spark

Inside Explore the Spark Machine Learning
深度实践
Spark机器学习
吴茂贵郁明敏朱凤元张磊杨本法著
Q想撼玉业出社

图书在版编目(CIP)数据
深度实践Spak机器学习/吴茂贵等著,一北京:机械工业出版社,2018.1
SBN978-7-111-58995-2
L.深…Ⅱ.吴…Ⅲ.数据处理软件-机器学习Ⅳ.TP274
中guo版本图书馆CP数据核字(2018)第015240号
深度实践 Spark机器学习
出版发行:机械工业出版社《北京市西城区百万庄大街22号邮政编码:100037
责任编:李艺
责任校对:殷虹
印刷:北京市兆成印刷有限责任公司
版次:2018年2月第1版第1次印刷
开本:186mm×240mm1/16
印张:15.25
书号:ISBN978-7-111
定价:69.00元
页、脱页,由本社发行部调换
服热线010)8837942688
投稿热线010)88379604
购书热线010)683262948837964968995259读者信箱:hzit@ abook,con
版权所有·侵权必
封底无防伪标均为盗版
本书法律顾问:北京大成律师事务所韩光/邻晓东

为什么写这本书
大数据、人工智能正在改变或颠覆各行各业,包括我们的生活。大数据、人工智能方面
的人才已经供不应求,但作为人工智能的核心—机器学习,因涉及的知识和技能比较多
除了需要具备一定的数学基础、相关业务知识外,还要求有比较全面的技术储备,如操作
数据库、开发语言、数据分析工具、大数据计算平台等,无形中提高了机器学习的门槛
如何降低机器学习的门槛,让更多有志于机器学习、人工智能的人能更方便或顺畅地使用
驾驭机器学习?
很多企业也正在考虑和处理这方面的问题,本书也希望借 Spark技术在这方面做一些介绍
或总结
如何使原本复杂、专业性强的工作或操作简单化?封装是一个有效方法。封装降低了我
们操作照相机的难度、降低了我们维护各种现代设备的成本,同时也提升了我们使用这些设
备的效率。除封装外,过程的标准化、流程化同样是目前现代企业用于提升生产效率,降低
成本,提高质量的有效方法
硬件如此,软件行业同样如此。目前很多机器学习的开发语言或平台,正在这些方面加
大力度,比如:对特征转换、特征选择、数据清理、数据划分、模型评估及优化等算法的封
装;对机器学习过程的进行流程化、标准化、规范化;给大家比较熟悉的语言或工具提供API
等方法或措施,以简化机器学习中间过程,缩短整个开发周期,使我们能更从容地应对市场
变化。 Spark在这方面可谓后来居上,尤其是最近发布的版本,明显加大了这方面的力度
我们可以从以下几个方面看出这种趋势
)Spk机器学习的API,正在由基于RDD过渡到基于 Dataset或 Data frame,基于
RDD的AP在 Spark22后处于维护阶段, Spark3.0后将停止使用(来自 Spark官网)
2)建议大家使用 Spark ML,尤其是它的 Pipeline;

3)增加大量特征选择、特征转换、模型选择和优化等算法
4)丰富、增强 Spark与Java、 Python、R的AP,使其更通
SKLcarn、 Spark等机器学习平台或工具在这方面都处于领先的地位,我们也希望借助本
书,把 Spark在这方面的有关内容介绍给大家,使大家可以少走些弯路
此外, Spark目前主要涉及常用机器学习算法,缺乏对一般神经网络的支持,更不用
说深度学习了,这好像也是目前 Spark的一个不足。不过好消息是:雅虎把深度学习框架
Tensor Flow与Spak整合在一起,而且开源了这些代码。为弥补广大 Spark爱好者的上述缺
憾,本书介绍了 TensorFlowOnSpark,其中包括深度学习框架 Tensor low的基础知识及使用
卷积神经网络、循环神经网络等的一些实际案例
另外,我们提供了与本书环境完全一致的免费云操作环境,这样一来是希望节约您的宝
二来是希望能通过真正的实战,给您不一样的体验和收获!总之,我们希望能使更
于大数据、人工智能的朋友加入这个充满生机、前景广阔的行业中来
本书特色
本书最大特点就是注重实战!或许有读者会问,能从哪几个方面体现出来?
1)介绍了目前关于机器学习的新趋势,并分析了如何使用 Pipeline使机器学习过程流
程化。
2)简介了机器学习的一般框架 Spark、深度学习框架 Tensorfilow及把两者整合在一起的
框架 TensorflowOn Spark
3)提供可操作、便执行及具有实战性的项目及其详细代码
4)提供与书完全一致的云操作环境,而且这个环境可以随时随地使用实操环境,登.录地
址为htp/www.feiguyun.com/spark/support
5)除了代码外,还附有一些必要的架构或原理说明,便于大家能从一个更高的角度来理
解把握相关问题
总之,希望你通过阅读本书,不但可以了解很多内容或代码,更可以亲自运行或调试这
代码,从而带来新的体验和收获
读者对象
口对大数据、机器学习感兴趣的广大在校、在职人员
口对 Spark机器学习有一定基础,欲进一步提高开发效率的人员。
口熟悉 Python、R等工具,希望进一步拓展到Spak机器学习的



回复

使用道具 举报

℡淺笑如夏 | 2019-12-31 06:37:03 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则