电子书:《强化学习精要 核心算法与TensorFlow实现》_冯超

[复制链接]
查看265 | 回复1 | 2019-12-25 13:52:58 | 显示全部楼层 |阅读模式

《强化学习精要 核心算法与TensorFlow实现》_冯超_1

《强化学习精要 核心算法与TensorFlow实现》_冯超_1

《强化学习精要 核心算法与TensorFlow实现》_冯超_2

《强化学习精要 核心算法与TensorFlow实现》_冯超_2

《强化学习精要 核心算法与TensorFlow实现》_冯超_3

《强化学习精要 核心算法与TensorFlow实现》_冯超_3


内容简介:

强化学习精要
核心算法与 TensorFlow实现
马超◎著
书籍是人类进步的阶梯

内容简介
《强化学习精要:核心算法与 TensorFlow实现》用通俗幽默的语言深人浅出地介绍
了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同
时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程,到各种复杂的强化
学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了
算法之间的内在联系,可以帮助读者举一反三,掌握算法精髓。书中介绍的代码可以帮
助读者快速将算法应用到实践中。
《强化学习精要:核心算法与 Tensor Flow实现》内容翔实,语言简洁易懂,既适合
零基础的人员入门学习,也适合相关科研人员研究参考。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究。
图书在版编目(CIP)数据
强化学习精要:核心算法与 TensorFlow实现/冯超著一北京:电子工业出版社,20186
(博文视点AI系列)
ISBN 978-7
000-0
L.①强…Ⅱ.①冯…Ⅲl①机器学习一算法一研究ⅣTP181
中guo版本图书馆CIP数据核字(2018)第068910号
策划编辑:郑柳洁
印刷:天津嘉恒印务有限公司
装订:天津嘉恒印务有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:720×1000116印张:24字数:470千字
版次:2018年6月第1版
印次:2018年6月第1次印刷
定价:80.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与
本社发行部联系,联系及邮购电话010)882548888258888
质量投诉请发邮件至zs@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn
本书咨询联系方式010)5126088819faq@phei.com.cn.
书籍是人类进步的阶梯

前言
从你拿起本书的那一刻起,我们就一起踏上了这段有关强化学习的冒险之旅。本
书中有简单直白的叙述,也有复杂冗长的证明;有诙谐幽默,也有深刻的思考。所有的
切,都是为了帮助你更轻松地对强化学习有更多了解、更多感悟。
年之前,我在拙作《深度学习轻松学:核心算法与视觉实践》中,同样以这段话
作为开篇,唯一不同的是这一次书的主题换成了强化学习。近年来,强化学习领域有了
很大的发展,基于强化学习开发的智能体也被人们熟知。于是越来越多的人开始关注
匕学习,了解这个领域,并使用强化学习的方法解决问题。随着深度学习的发展,强
化学习也逐渐发挥出了自己的实力,凭借更灵活的问题定义方式,解决了很多其他方
法难以解决的问题。
虽然强化学习这个领域已经有了多年的积累与发展,但是与深度学习相比,guo内
外与此相关的书籍与课程偏少。同时,由于强化学习融合了很多领域的知识,本身的技
术难度较大,学习起来比较困难。两者叠加,使得强化学习仍然是一个令很多人感到困
惑的概念。
为了学习强化学习中的各种知识,作为本书的作者,我也花费了很多的精力。在阅
读了很多经典的书籍、论文和博客之后,我开始对强化学习有了自己的理解和体会。同
时也积累了不少关于强化学习的“学习笔记”,其中的一部分已经在一些公开场合
如我的知乎专栏《无痛的机器学习》(htps/ huanlan zhihu. com/hsmyy)中与读者分享
过。在交流的过程中,我能感受到读者对强
趣,同时自己也在分享中得
到了提高
经过长时间的积累,这些心得与体会最终凝结成了本书。在这个过程中我重新回
顾了自己所学的知识,也进一步思考了强化学习各部分知识点之间的联系。我希望可
以给大家呈现一个尽可能完整而丰富的强化学习世界,与大家共同探讨强化学习中的
无限可能。
为了使更多的人能够从本书中得到收获,我选择强化学习中比较经典的算法进行
了介绍,这些都是强化学习中十分重要的内容,对不了解强化学习的读者来说,可以帮
助你快速了解强化学习的知识体系,对这个领域有一个全面的认识;对正在学习强化
书籍是人类进步的阶

学习的读者来说,本书中的知识同样可以帮助你梳理强化学习的核心要点,加深对这
些基本问题的理解
在编写这本书的过程中,我又一次体会到求知的艰辛。获取知识的道路总是充满
荆棘,除了自身不断地努力,更少不了身边人对我的支持鼓励。感谢家人对我的理解与
支持,感谢编辑郑柳洁女土再次成为我的伯乐,为我提供了很多帮助,感谢刘晓鸣先
生为本书绘制了大量插图。我相信我们的努力付出会使更多的人享受获得知识的快乐
由于本人才疏学浅,行文间难免有所纰漏,望各位读者多多包涵,不吝赐教
读者服务
轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面
·下载资源:本书提供示例代码资源文件,可在【下载资源】处下载
提交勘误:您对书中内容的修改意见可在【提交勘误】处提交,若被采纳,将获
赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额
与读者交流:在页面下方【读者评论】处留下您的疑问或观点,与其他读者一同
学习交流。
页面入口:hp:/ww. broadview. com. cn34000

目录
第一部分强化学习入门与基础知识
1引言
1.1强化学习的概念
11.1巴浦洛夫的狗
1.1.2俄罗斯方块
12站在被实验者的角度看问题
1.3强化学习效果的评估
1.3.1不断试错
13.2看重长期回报
2234588899
4强化学习与监督学习
14.1强化学习与监督学习的本质
142模仿学习
10
1.5强化学习的实验环境
1.5.1 Arcade Learning Environment
FuOco
1.5.4 Gym
1.6本书的主要内容
1.7参考资料
2数学与机器学习基础
17
2.1线性代数基础
22对称矩阵的性质



回复

使用道具 举报

锁住烂漫@ | 2019-12-25 13:53:02 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则