电子书:《实用机器学习》

[复制链接]
查看177 | 回复1 | 2019-12-25 12:27:09 | 显示全部楼层 |阅读模式

《实用机器学习》_1

《实用机器学习》_1

《实用机器学习》_2

《实用机器学习》_2

《实用机器学习》_3

《实用机器学习》_3


内容简介:

孙亮
_阿.里_巴巴数据科学与技术研究院高级
专家。曾任微软 Azure机器学习( Azure
Machine Learning)部门高级数据科学
家,先后毕业于南京大学计算机系
(1999-2003)、中guo科学院软件研究所
(2003-2006)、美guo亚利桑那州立大学
十算机系(2006-2011),研究兴趣包括
机器学习、数据挖掘及其实际应用等。近年
来参加了 KDD Cup、 Heritage Health
Prize等多项数据挖掘竞赛并多次取得优异
成绩。在EET-PAM、NPs、CML
s|GκDD等机器学习领域的顶尖guo际期刊
和guo际会议上发表论文近20篇,著有机器
学习英文专著1部
黄倩
可海大学副研究员,先后毕业于南京大
学计算机系(1999-2003)、中guo科学院
计算技术研究所(2003-2010),研究兴
趣包括多媒体大数据处理、机器学习、云计
算等。参加过多个973、863、guo家自然
科学基金项目的研究,参与过AVS
H.265HE∨C等guo内外视频压缩标准的制
订。现主持包括guo家自然科学基金在内的多
个guo家、省市级项目,并获南京市江宁区首
批高.层次创业人才“创聚工程”项目资助
在相关领域的知名guo际期刊和guo际会议上
发表论文逾20篇,出版译著4本,参编专著

★★
“十三五
guo家重点图书出版规划项目
实用机器学习
孙亮黄倩/著
人民邮电出版社
北京

图书在版编目(CIP)数据
实用机器学习/孙亮,黄倩著.一北京:人民邮
电出版社,2017.5
①实…Ⅱ.①孙…②黄…Ⅲ.①机器学习
Ⅳ.①TP181
中guo版本图书馆CIP数据核字(2017)第027041号
内容提要
大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器
学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算
法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学
习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为
方便读者学习各种算法,本书介绍了R语言中相应的软件包并给出了示例程序
本书的最大特色就是贴近工程实践。首先,本书仅侧重介绍当前工业界最常用的机器学习算法
而不追求知识内容的覆盖面:其次,本书在介绍每类机器学习算法时,力求通俗易懂地阐述算法思想
而不追求理论的深度,让读者借助代码获得直观的体验
本书适合需要应用机器学习算法解决实际问题的工程技术人员阅读,也可作为相关专业高年级本
科生或研究生的入门教材或课外读物

孙亮黄倩
责任编辑杨海玲
责任印制焦志炜
◆人民邮电出版社出版发行
京市丰台区成寿寺路11号
邦编100164电子邮件315@ptpress.com.cn
◆开本:800×10001/16
印张:
字数:490千字
017年5月第1版
4000册
2017年5月北京第1次印刷
定价:79.00元
虞者服务热线010)81055410印装质量热线010)81055316
反盗版热线010)
广告经营许可证:京东工商广字第8052号

序一
机器学习是人工智能领域最成功、发展最迅速的分支之一。然而多年来,除了人机对弈
之外,成功的机器学习应用对普通百姓来说似乎始终显得遥不可及。大数据时代的来临对机
器学习提出了新的挑战,同时也为机器学习打开了一扇通向实用化舞台的大门。近年来,源
于实际需求的海量数据集不断出现,一方面为技术交流和算法验证提供了有力的基础数据支
撑,另一方面也有助于促进相关科学研究更贴近我们的日常生活。例如,在滴滴,我们正致
力于结合机器学习技术和大数据技术来预测各地用户需求,并进行实时的运力调度和订单分
配,不断为广大司机和用户提供更满意的服务。可以说,机器学习技术和大数据技术的结合
正在显著地拉近科研人员和普通百姓的距离,正在显著地改变我们的生产方式和生活方式
016年8月,我在中guo人工智能大会上担任“机器学习的明天”专题论坛联席主席时曾
指出,人类很多难题的解决都离不开大数据和人工智能的结合。今天,我欣喜地看到,本书
两位作者的合作恰恰体现了实用机器学习的这一重要发展趋势。两位作者长期在学术界和工
业界工作,其中孙亮博士是我的学生,他从2006年开始就一直从事降维算法、稀疏学习、数
值最优化算法等方向的机器学习研究,其快速降维算法研究曾获得机器学习领域顶级会议
SIGKDD的最佳论文提名奖:黄倩博士是高文院士的学生,他从2004年开始就一直从事视频
大数据的压缩和增强显示研究,其研究成果曾在视频处理领域旗舰期刊 IEEE T-CSV发表并
在工业界获得实际应用。两位作者博士毕业后均有在万人以上规模企业的相关研发经历,接
触过各类实际问题和数据,对机器学习如何在实际中应用有着深刻的理解和成功的经验
这本书不厚,但却覆盖了用机器学习技术解决实际问题的主要步骤和常用算法。两位作
者从实际应用出发,介绍了数据探索、数据预处理、算法应用、性能评价等具体内容,并深
入浅出地介绍了模型复杂度、损失函数等机器学习领域的基本概念。由于集成学习在实际中
应用较为广泛,因此本书专列一章加以讨论。考虑到实践中大家更关注的是如何选择和使用
算法,两位作者还使用R语言软件包来引导读者实际操作。与市面上对机器学习作一般性介
绍的书籍相比,本书介绍的算法稍稍复杂一些,但也更加实用,书中讨论的内容正是实际应
用机器学习解决问题时所需要掌握的内容。对于广大业界爱好者和相关专业研究生来说,这
是一本理想的入门读物和参考书,因此我非常乐意向大家推荐本书
叶杰平
滴滴研究院副院长,密歇根大学终身教授
2016年12月

序二
016年10月3日,我从宿州匆匆赶回上海,试图从连日飨宴中恢复精力,等待5日凌晨
谷歌公司的Pixe发布会。业界预测这将是一个划时代的发布会,标志着“ Mobile First”向“Al
First”的转型。这一场发布会,让我难掩激动地在朋友圈中留下了洋洋洒洒但未必成熟的千
字技术点评
我为什么会如此期待这场盛会,要从十多年前说起。那时我还是一个学生,学着和T八
竿子打不着的天文学。在本科结束后,响应高中读《时间简史》时内心深处的召唤,我继续
学了天文学。经历短暂的欢愉之后,我终于意识到这条路的艰辛,我是不可能做这行了。我
开始思考,有没有一条路能让我既接近最前沿的理论,又有足够好的实践环境呢?我在看了
I》(《人工智能》)这部电影之后被震撼得天旋地转—人工智能可以创造出如此的美好
人工智能可以引发无穷的深思
我开始去选修《机器人》的课程,开始去听张学工老师的《模式识别》课,开始把自己
的知识往这个方向靠。所幸因为玻尔兹曼,这两个专业还是有些联系的。在一次选假期小班
课程的时候,我选了一个SWM的讲座,后来当孙亮和我说他也听过这堂课的时候,我才意识
到原来高人就在身边,只是我一直不曾留意。我曾看到过孙亮床位下一箱一箱的计算机书
大多与机器学习有关,只是人的神经系统是很奇妙的,当你不关注的时候,这些事情会自动
在你的世界被屏蔽;当你关注的时候,这个概念会在极短的时间以各种方式在你面前展现
不久后我认识了同样以机器学习见长的黄倩,那时在周末大家都会找时间一起聚聚,当然话
题大多是关于计算机的发展方向和算法的,然后我就作为旁听者被他们带进了门
孙亮硕士毕业后去美guo继续读机器学习的博士,最后到微软公司从事他擅长的机器学习
和数据科学的研究;黄倩在高文院士指导下硕博毕业,最终回到高校任教,带领学子探索最
前沿的算法。这些年他们一直躬耕一线,从未中断,我也在辗转中断断续续地做着数据相关
的工作,最终转到 Hadoop/Spark/Tensor Flow开源平台。这几年大数据如火如荼,机器学习热
浪汹涌, Alpha Go的成功进一步激励了业界, Tensor Flow的开源、“ AI First”的概念终于在坎
坎坷坷10年之后开始盛行,高校的学子和一线的工程师开始被这个全新的世界吸引。同事和
实习生不断地要我给他们推荐一些大数据和机器学习方面的书,我也曾给同事买过一些我看
过的书。遗憾的是,这些书大多要么是纯理论的“屠龙术”,离实际应用还有一段距离,要么
就是针对算法模块搞些例子,使学习者只知其然不知其所以然,还有的就是与目前业界普遍
应用的算法不吻合。
对于一线的IT从业者和想要实践算法的学生来说,一本理论与实践相结合、能展现目前
业界通用算法使用技巧的书,应该是大家最喜闻乐见的。这要求作者要有极深厚的理论功底



回复

使用道具 举报

月半小夜曲 | 2019-12-25 12:27:13 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则