电子书:《解析深度学习:语音识别实践》

[复制链接]
查看298 | 回复1 | 2020-1-2 12:56:00 | 显示全部楼层 |阅读模式

《解析深度学习:语音识别实践》_1

《解析深度学习:语音识别实践》_1

《解析深度学习:语音识别实践》_2

《解析深度学习:语音识别实践》_2

《解析深度学习:语音识别实践》_3

《解析深度学习:语音识别实践》_3


内容简介:

内容简介
本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统
语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在
语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征
表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。
本书适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读,所有
的算法及技术细节都提供了详尽的参考文献,给出了深度学习在语音识别中应用的
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容
版权所有,侵权必究
图书在版编目(CIP)数据
解析深度学习:语音识别实践/(美)俞栋,(美)邓力著;俞凯等译.一北京:电子工
业出版社,2016.7
ISBN978-7-121-28796-1
①解Ⅱ.①俞…②邓…①③俞…I.①人工智能一应用一语音识别一研究IV
①TN912.34
中guo版本图书馆CIP数据核字(2016)第099823号
策划编辑:刘皎
责任编辑:李利健
印刷:三河市华成印务有限公司
装订:三河市华成印务有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱
100036
开本:720x10001/16印张:20
378千字
版次:2016年7月第1版
印次:2016年7月第1次印刷
定价:79.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请
与本社发行部联系,联系及邮购电话010)88254888825888
质量投诉请发邮件至zltsaphei.com.cn,盗版侵权举报请发邮件至dbq(aphei.com.cn
本书咨询联系方式010)51260888-819faq(@phei.com.cn
献给我的妻子和父母
俞栋( Dong Yu)
献给Lh-Yuan、 Lloyd、 Craig、 Lyle、Aice和Axel
邓力( Li Deng)
作者及译者简介
俞栋
1998年加入微软公司,现任微软研究院首席研究员、浙江大学兼职教授和中科大客座
教授。他是语音识别和深度学习方向的资深专家,出版了两本专著,发表了150多篇
论文,是近60项专利的发明人及有广泛影响力的深度学习开源软件CNTK的发起人
和主要作者之一。他在基于深度学习的语音识别技术上的工作带来了语音识别研究方
向的转变,极大地推动了语音识别领域的发展,并获得2013年IE信号处理协会最
佳论文奖。俞栋博士现担任IEEE语音语言处理专业委员会委员,曾担任 IEEE/ACM
音频、语音及语言处理汇刊、IEEE信号处理杂志等期刊的编委
邓力
世界著名人工智能、机器学习和语音语言信号处理专家,现任微软首席人工智能科学
家和深度学习技术中心研究经理。他在美guo威斯康星大学先后获硕士和博士学位,然
后在加拿大滑铁卢大学任教获得终身正教授。其间,他还任麻省理工学院研究职位
999年加人微软研究院历任数职,并在2014年初创办深度学习技术中心,主持微软公
司和研究院的人工智能和深度学习领域的技术创新。邓立博士的研究方向包括自动
语音与说话者识别、口语识别与理解、语音-语音译、机器翻译、语言模式、统计方
法与机器学习、听觉和其他生物信息处理、深层结构学习、类脑机器智能、图像语言多
模态深度学习,商业大数据深度分析等。他在上述领域做出了重大贡献,是ASA(美
guo声学学会)会士、IEEE(美guo电气和电子工程师协会)会土和理事、ISCA(guo际语
音通信协会)会土,并凭借在深度学习与自动语音识别方向做出的杰出贡献荣获2015
作者及译者简介
年度IE信号处理技术成就奖。同时,他也曾在顶级杂志和会议上发表过与上述领
域相关的300余篇学术论文,出版过5部著作,发明及合作发明了超过70多项专利
邓立博土还担任过IEE信号处理杂志和《音频、语音与语言处理学报》( IEEE/ACM
Transactions on Audio. Speech& Language Processing)的主编。
俞凯
IEEE高级会员,上海交通大学计算机科学与工程系特别研究员。清华大学本科、硕
士,英guo剑桥大学工程系博土。长期从事智能语音及语言处理、人机交互、模式识别
及机器学习的研究和产业化工作。他是中组部“千人计划”(青年项目)获得者,guo家
自然科学基金委优秀青年科学基金获得者,上海市“东方学者”特聘教授;作为共同
创始人和首席科学家创立“苏州思必驰信息科技有限公司”。现任中guo声学学会语音
语言、听觉及音乐分会执委会委员,中guo计算机学会人机交互专委会委员,中guo语音
产业联盟技术工作组副组长。他的研究兴趣涉及语音识别、语音合成、口语理解、对
话系统、认知型人机交互等智能语音语言处理技术的多个核心技术领域,在本领域的
一流guo际期刊和会议上发表论文80余篇,申请专利10余项,取得了一系列研究、工
程和产业化成果。在 Interspeech及 IEEE Spoken Language Processing等guo际会议上获
得3簡guo际会议优秀论文奖,获得guo际语音通信联盟(ISCA)2013年颁发的2008
2012 Computer Speech and Language最优论文奖。受邀担任 Interspeech2009语音识别
领域主席、 EUSIPCO201 EUSIPCO2014语音处理领域主席、 Interspeech2014口语
对话系统领域主席等。他负责搭建或参与搭建的大规模连续语音识别系统,曾获得美
guoguo家标准局(NIST)和美guoguo防部内部评测冠军;作为核心技术人员,负责设计并
实现的认知型统计对话系统原型,在CMU组织的2010年对话系统guo际挑战赛上获得
了可控测试的冠军。作为项目负责人或Co-PI,他主持了欧盟第7框架 PARLANCE
guo家自然科学基金委、上海市教委、经信委,以及美guo通用公司、苏州思必驰信息科
技有限公司的一系列科研及产业化项目。2014年,因在智能语音技术产业化方面的贡
献,获得中guo人工智能学会颁发的“吴文俊人工智能科学技术奖
钱彦旻
上海交通大学计算机科学与工程系助理研究员,博士。分别在2007年6月和2013年
1月于华中科技大学和清华大学获得工学学土和工学博土学位。2013年4月起,任上
海交通大学计算机科学与工程系理研究员。同时从2015年1月至2015年12月,在
作者及译者简介
英guo剑桥大学工程系机器智能实验室语音组进行访问,作为项目研究员与语音识别
领域的著名科学家 Phil Woodland教授和 Mark Gales教授开展合作研究。现为IEEE、
ISCA会员,同时也是guo际开源项目 Kaldi语音识别工具包开发的项目组创始成员之
。此外,担任 TEEE Transactions on Audio, Speech, and Language Processing、 Speech
Communication、 ICASSP、 Interspeech、ASRU等guo际期刊和会议的审稿人。目前在guo
内外学术刊物和会议上发表学术论文50余篇, Google Scholar总引用数近1000次。
中包括在语音识别领域权威guo际会议 ICASSP、 Interspeech和ASRU上发表论文30余
篇,申请guo家专利共3项,已授权1项。2008年获科技奥运先进集体奖,2014年获中
guo人工智能学会颂发的“吴文俊人工智能科学技术奖进步奖”。曾作为负责人和主要
参与者参加了包括英guo EPSRC、guo家自然科学基金、guo家863等多个项目。目前的研
究领域包括:语音识别、说话人和语种识别、自然语言理解、深度学习建模、多媒体
信号处理等

#############################################


回复

使用道具 举报

锁住烂漫@ | 2020-1-2 12:56:04 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则