电子书:《全栈数据之门》

[复制链接]
查看184 | 回复1 | 2019-12-22 10:22:19 | 显示全部楼层 |阅读模式

《全栈数据之门》_1

《全栈数据之门》_1

《全栈数据之门》_2

《全栈数据之门》_2

《全栈数据之门》_3

《全栈数据之门》_3


内容简介:

作者简介
任柳江,网名云戒。有近10年经验的 Linux
及 Emacs重度用户,熟悉 Python及其
Web开发、机器学习生态环境。曾在2008
年组织创建 Linux电子杂志《桃源》。做过
.安.全.测试和开发,同时具有开发的能力和
测试的思维。爱好易学与佛学,目前专攻
大数据与机器学习

全找数据之门
任柳江◎著
電子工紫出版
Publishing House of Electronics Industry
北京→ BEJING

内容简介
本书以数据分析领域最热的 Python语言为主要线索,介绍了数据分析库 numpy、 Pandas与
机器学习库 scikit-learm,使用了可视化环境 Orange3来理解算法的一些细节。对于机器学习
既有常用算法kN与 Kmeans的应用,决策树与随机森林的实战,还涉及常用特征工程与深度
学习中的自动编程器。在大数据 Hadoop与Hive环境的基础之上,使用Sptk的 ML/MLlib库集成
了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战的介绍将各部分融
合成一个全栈的数据科学内容
本书不是从入门到精通地介绍某一种技术,可以把本书当成一本技术文集,内容定位于
数据科学的全栈基础入门,全部内容来自当前业界最实用的技能,有非常基础的,也有比较
深人的,有些甚至需要深入领悟才能理解
本书适用于任何想在数据领域有所作为的人,包括学生、爱好者、在职人员与科研工作
者。无论想从事数据分析、数据工程、数据挖掘或者机器学习,或许都能在书中找到一些之
前没有接触过的内容
图书在版编目(C|P)数据
全栈数据之门任柳江著.一北京:电子工业出版社,2017
ISBN978-7-121-3090
1.①全…Ⅱ.①任…Ⅲ.①软件工具-程序设计Ⅳ.①TP31.561
中guo版本图书馆CIP数据核字(2017)第022361号
策划编辑:张春雨
责任编辑:刘舫
印刷:北京季蜂印刷有限公司
装订:北京季蜂印刷有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:720×100
印张:24.75
字数:445千字
版次:2017年4月第1版
印次:2017年4月第次印刷
定价:79.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社
发行部联系,联系及邮购电话010)8825488,882588
质量投诉请发邮件至zs@aphei.com.cn,盗版侵权举报请发邮件至dbq@phei.com.cn
本书咨询联系方式:010-51260888819 faq@phe

0x00自序
悲为怀大数据,云中仙游戒为师。
这是自己从几年前一直沿用到现在的签名,几年之后的今天,再来体会这句话
不一样的处境,不一样的心境,却依然有着同样的追求
曾想出世修行,渴望每日有高山流水相伴,能过着青灯古佛的生活。终因现
实残酷只得入世而求存,在多少次碌碌无为中坚定了技术这条路。
技术之路,注定会一波三折。在下也经历了从.安.全.测试、.安.全.分析,到大数
据分析,再到AP后端开发,直至数据分析、机器学习与深度学习之后,技术之
栈才得以完全确立。技术之路漫长而曲折,需要不断修行,目前我也仅仅是入得
门肉,自此方有机会窥探神秘数据世界之一二而已
少年不识愁滋味,为赋新词强说愁。而今识尽愁滋味,却道天凉好个秋。
学无止境。曾经以为学会 Linux便够了,殊不知,这仅仅是系统的基础;
来学了 Python,以为这便是编程的全部;殊不知, Python最强大的领域在数据科学
直到接触大数据与机器学习,才发现,原来种种际遇,都只是为数据科学而铺设
的“套路
本书并非从人门到精通的讲解,只是想通过浅显易懂的语言让读者了解全栈
据的全貌。阅读本书时,如果其中某个知识点,让你入了门,我甚感欣慰;如
果其中某节内容,让你得到了提高,我备受鼓舞。另外,人门之路千干万,用时
下流行的话来说,只希望本书不会导致你“从人门到放弃”。
全栈数据,主要想尽可能多地涉及数据科学中的主题。任何复杂的技术,都

Ⅳ全栈数据之门
是一点点积累起来的,数据科学也不例外。如果能将本书中涉及的全栈数据技
如 Linux、 Python、SQL、 Hadoop、Hive、 Spark、数据挖掘、机器学习与深度学
习进行系统性整合,则全栈数据之技可成也
诗词歌赋,是诗人与词人对人生的情感寄托;技术写作,也是技术人员对技
术的情感寄托。
然术业有专攻,每个人的知识都是有限的,写书的目的,并非要证明自己,
而是把自己所知所想记录下来,让读者能有哪怕一小点的收获即可。
全栈并非全能,钱都不是万能的,何况技术乎?在数据领域,都懂一点,生
活会更美好
全栈是一种修行,数据技术如此,人生亦如是
哲人的智慧,诗人的优雅,佛徒的慈悲;
开源的思想,.安.全.的思路,数据的思维
程序员的逻辑,测试员的严谨,分析员的远见
读本书,不能让你立刻走上人生巅峰、出任CEO…但至少可以达到以下
几点:
使用 Linux工具或者 MySQL进行数据统计分析
·使用 Orange进行机器学习实验
使用 Python或者 PySpark进行项目实战
使用 Hadoop环境,如HDP2的集成环境,进行大数据研究
使用 saiki-1earn,并且可以阅读 Spark的机器学习库文档
熟练构建自己的数据科学技能
从事数据领域相关的职位
本书是一本无固定主题的技术文集合体,围绕“数据”这个主线,进行了大
量的展开,从不同的侧面去靠近全栈数据技能,去靠近数据科学这个大主题。因
内容宽泛,且作者水平有限,不足之处甚多,若读者发现书中的问题,还望不吝
指正。可以通过我的微 信公众号 yunjie-talk反馈问题,我将不胜感激
最后,本书得以成册出版,必须要感谢电子工业出版社计算机出版分社的张
春雨老师,伯乐张老师于杂乱文字中,发现了闪光之处,促成了本书的问世。世
人皆说本书体裁太乱,无章法可言,唯张伯乐以无招胜有招接下,众皆信服
本书在写作过程中,得益于爱妻梁玉霞女士的大力支持,常于深夜端茶倒水



回复

使用道具 举报

有点呆的瓜 | 2019-12-22 10:22:26 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则