电子书:《ODPS权威指南-_阿.里_大数据平台应用开发实践》

[复制链接]
查看271 | 回复1 | 2019-12-13 09:17:53 | 显示全部楼层 |阅读模式

《ODPS权威指南-_阿.里_大数据平台应用开发实践》_1

《ODPS权威指南-_阿.里_大数据平台应用开发实践》_1

《ODPS权威指南-_阿.里_大数据平台应用开发实践》_2

《ODPS权威指南-_阿.里_大数据平台应用开发实践》_2

《ODPS权威指南-_阿.里_大数据平台应用开发实践》_3

《ODPS权威指南-_阿.里_大数据平台应用开发实践》_3


内容简介:

O
D S
DPS权威指南
_阿.里_大数据平台应用开发实践
李妹芳著
人民邮电出版社
图书在版编目(C1P)数据
ODPS权威指南:_阿.里_大数据平台应用开发实践/李
妹芳著
比京:人民邮电出版社,2015
D0…I,①李….①数据处理系统一指南
IN.①TP274-62
中guo版本图书馆CIP数据核字(2014)第243226号
内容提要
ODPS( Open Data Processing Service)是_阿.里_巴巴自主研发的海量数据处理和分析的服务平台,主要应用
于数据分析、海量数据统计、数携
挖掘、机器学习和商业智能等领域,目前,ODPS不仅在_阿.里_内部得到广泛
应用,享有很好的口碑,而且正逐步走向第三方开放市场
本书是学习和掌握ODPS的权威指南,作者来自_阿.里_ODPS团队。全书共13章,主要内容包括:ODPS
入门、整体架构、数据通道、 Mapreduce编程、SOL查询分析、.安.全.,以及基于真实数据的各种场景分析
实战,本书基于很多范例解析,通过在各种应用场景下的示例来说明如何通过ODPS完成各种需求,以期
引导读者从零开始轻松掌握和使用ODPS。同时,本书不局限于示例分析,还致力于提供更多关于大数据
处理的编程思想和经验分享。书中所有示例代码都可以在作者提供的网站上免费下载
本书适合想要了解和使用ODPS的读者阅读学习,对于从事大数据存储和应用以及分布式计算的专业
人士来说,也是很好的参考资料
李妹芳
责任编辑陈康
责任印制张佳莹彭志环
?人民部电出版社出版发行三北京市车台区成寿寺落1号
电子郎件31 (aptness.co
网址httpWwww.ptpress.com.cn
三河市海波印务有限公司印刷
开本:8
印张122.5
字数:418千字
2X015年1月第1反
印数:1-3500卅
2015年1月河北第1次印
定价:69.00
读者服务热线010)81055410印装质量热线010)81055316
反盗版热线010)81055315
推荐序一
_阿.里_巴巴的李妹芳最近写了一本书,《ODPS权威指南一_阿.里_大数据平台应用开发实
践》,我看了,觉得很好,因此欣然为这本书写个序
这本书是关于云计算大数据领域,这也正是我在美guo加州所关心和研究的领域。这个
领域正蓬勃发展,潜力很大,目前的应用有很多,如亚马逊云平台, Sales Force等,但可
以说这些应用仍然只是冰山之一角,云计算大数据的开发和应用才刚刚开始。
大数据的技术还有巨大潜力,而真正给大数据不断注.入生命力的是其广泛而深刻的应
用。比如,基于大数据的消费者行为、精准营销、品牌预测、开放式创新等将对企业管理
带来深刻变化。大数据也可以应用在更加广泛的领域,尤其是传统产业里,包括数字医疗
教育、交通、能源、智慧城市、应急联动、甚至抓述犯等意想不到的领域
在我看来,这本书提炼了对大数据处理的很多实践和思考,其实并不局限于ODPS平
台。该书很有前瞻性,很前卫,同时也很接地气,介绍了大量典型应用,如金融数据、广
告、影响力阳等,大多数是在_阿.里_验证过的。书里附有大量图表和实例,有的还提供了源
云计算大数据是非常宏大的主题,这本书通过示例和原理结合的方式,从读者角度
通过实践可以更容易理解。书中示例涉及网站日志分析、LBS和推荐,这些都是非常主流
的领域。我相信读者会喜欢这本书。
兄效guo( Kevin Zhu
美guo斯坦福大学博
加利福尼亚大学( UC San Diego)终身教授博导
推荐序二
上一次完整地看手稿是 Tom White的《 Hadoop: The Definitive Guide),那次完全是
托 Derek Gottfrid的福,因为当时Tom请 Derek写一篇纽约时报怎样在 Amazon EC2上
使用 Hadoop的章节(只是很遗憾最后没有包含)。这次又完整地读手稿竟然就是关于
ODPS了(一个可以媲美 Hadoop大数据处理生态体系但是以服务形式供用户使用的平
台),我有幸参与了ODPS从无到有的所有历程,因而很高兴看到第一本关于ODPS的书
初识这本书的作者李妹芳还是在2009年,当时她正在使用ODPS的最前身来参与
今天_阿.里_小贷业务的雏形,那是个非常考验人的项目,妹芳是少数几个坚持下来的。后
来另一位同事碰巧说起妹芳还翻译过书,还从书架上就手拿来她的译作,使得我对她的
佩服之情更是长了一分。
这次妹芳执笔来完成这本书,很大程度上也是接受了曾总负责ODPS产品的_阿.里_
巴巴研究员张东晖的建议,内容不仅包括ODpS的使用指南和独到的注解,也会对涉
及的数据处理相关的知识点与工具详加注释。需要指出这本权威指南与《 Hadoop权威
指南》不同, Hadoop那本对 Hadoop内核的细节、原理阐述的非常多,而这本书是以
用为导向,可以作为实用指南。如果整体跟随作者思路读完本书,也就基本有了数据
开发人员的必备素质,对上手ODPS更是很有裨益,能实际完成非常多的数据分析
运营工作。
另外,据作者计划,这本书也会有后继版本或者姊妹篇,给有兴趣深入了解ODPS
的朋友们提供更多渠道,但这本书对深入了解ODPS内核无疑也是很好的敲门砖
_阿.里_资深技术专家(ODPS技术负责人)
推荐序三
mT时代,在短短几十年间积累了多达数ZB的数据,这些数据散落在数千万家企业的
服.务.器以及上百亿的个人设备上,沉睡着。今天我们开始步入DT时代,大数据正在被激
活,将给电子商务、金融、健康等多个行业带来极大创新和变革
2010年至今,_阿.里_小货基于ODPS构建了一套完整的大数据应用系统,创造了1秒
钟放货的互联网金融奇迹。我有幸全程参与其中,并作为ODPS第一代用户见证了它的
整个成长历程。时至今日,ODPS在集群規模、计算性能、编程能力、.安.全.管控等方面
已经有了质的飞跃,_阿.里_巴巴内部有几千名工程师在使用ODPS,为_阿.里_的多个业务板
块构建大数据应用。妹芳写的这本书,立足于_阿.里_的实践,为读者全方位地展现ODP
的应用场景,对于ETL工程师、BI分析师、数据科学家乃至运维人员,是一本不可多得
的权威指南。
全书以应用视角来编排,作者采用循序渐进、以事带理的书写方式,从创建账号到搭
仓库、做数据挖掘,每一步都有详尽的指导,对于初学者而言可谓是最佳入门指引
已经接触过ODPS或者有一定大数据处理经验的读着,书中在SOL、MR编程框架
方面有深入的技术探讨,同时作者还提供了大量真实的应用场景说明和示例代码,从日志
分析到机器学习,将_阿.里_巴巴在大数据领域沉淀下来的实践经验和盘托出,对于读者构建
大数据应用极有参考意义
古语说得好,有容乃大!当“大”数据遇到ODPS这种体量的“容”器,数据变得触
手可得。愿这本书为你和ODPS、大数据之间建立起一座桥梁。
陈鹏宇(不老)
_阿.里_高级数据仓库专家(ODPS骨灰级用户

#############################################


回复

使用道具 举报

wutiwl | 2020-1-30 00:40:24 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则