电子书:《自然语言处理技术入门与实战》

[复制链接]
查看263 | 回复1 | 2020-1-2 10:54:01 | 显示全部楼层 |阅读模式

《自然语言处理技术入门与实战》_1

《自然语言处理技术入门与实战》_1

《自然语言处理技术入门与实战》_2

《自然语言处理技术入门与实战》_2

《自然语言处理技术入门与实战》_3

《自然语言处理技术入门与实战》_3


内容简介:

作者简介
兰红云,湖北襄阳人。曾任职于猎豹移动,现
为_阿.里_影业数据挖掘专家,拥有多年算法和数
居挖掘的工作经验,申请多项算法专利。研究
的方向包括自然语言处理和机器学习

自然语言处理技术
入门与实战
红云◎编著
電子工業出版社
Publishing House of Electronics Industry
北京· BELJING

内容简介
本书主要从语义模型详解、自然语言处理系统基础算法和系统案例实战三个方面,介绍了自然语
言处理中相关的一些技术,对于每一个算法又分别从应用原理、数学原理、代码实现,以及对当前方
法的思考四个方面进行讲解
本书面向的读者为有志于从事自然语言处理相关工作的在校学生、企事业单位工作人员等人群。
本书的结构特点是由浅入深地进行相关内容的介绍,以满足不同层次读者的学习需求
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容
版权所有,侵权必究
图书在版编目(c|P)数据
自然语言处理技术入门与实战/兰红云编著.一北京:电子工业出版社,2017.10
SBN978-7-121-32763-6
I.①自…Ⅱ.①兰…Ⅲ.①自然语言处理一研究Ⅳ.①TP39
中guo版本图书馆CIP数据核字(2017)第233723号
策划编辑:张慧敏
责任编辑:牛勇
特约编辑:顾慧芳
印刷:三河市华成印务有限公司
装订:三河市华成印务有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:787×9801/16印张:12.5字数:280千字
版次:2017年10月第1版
印次:2017年10月第1次印刷
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系
联系及邮购电话010)88254888,88258888
质量投诉请发邮件至zts@phei.com.cn,盗版侵权举报请发邮件至dbqg@phei.com.cn
本书咨询联系方式:010-512608889,feg@phei.com.cn

随着移动互联网的飞速发展,特别是物联网( Internet of Thing,loT)的飞速发展,人
与设备的语言交互场景也越来越多,并且越来越成为核心。这种语言的交互既包括纯文字
的,也包括语音的。自然语言处理( Natural Language Processing,NLp)就是以电子计算
机、编程语言为工具对人类特有的书面和口头形式的自然语言信息进行各种类型处理和加
工的技术。当然,随着技术的不断发展,其处理领域也出现了跨形态的组合。比如通过与
图形图像处理技术的结合,可以实现看图说话、在线答题等应用。所以,自然语言处理是
勹涉及语言学、计算机科学,当然还有数学的交叉性科学
自然语言处理的目的是为了让计算机能够理解人的语言,然后做出相应的处理或者应
答。根据应用场景的不同,自然语言处理可以分为如下三点1)信息抽取,包括自动
摘要、自动检索、舆情分析等2)语言理解,包括机器翻译、人机对话、语义理解等;
(3)跨形态组合,包括看图说话、语音自动合成、.辅。助.教学等。这些应用都是利用自然语
言处理技术,对所需要处理的信息进行挖掘和分析,找出人们想要的东西,进而作出响应
而落实到具体的应用,又会衍生出很多不同的应用系统,由此衍生出来的应用系统包括但
不限于:信息自动抽取系统、信息自动检索系统、文本信息挖掘系统、机器翻译系统、人
机对话系统、图片描述自动生成系统、语音自动识别系统、语音自动合成系统、计算机辅
助教学系统,等等
因为自然语言自身的复杂性,比如:很多歧义、结构复杂多样、表达千变万化……导
致其处理方法纷繁复杂,要考虑非常多的情景。所以上述这些系统之间又存在交叉,或者
上下关联,或者前后依赖等复杂的关系。而这些复杂的应用对于一个初学者来说,是非常
庞杂和难以掌握的,在学习的过程中难免会因为其中某一个细节不能掌握,而影响整个进
程的进度:或者虽然理解了算法的数学原理,但是怎么在实际场景中应用,以及当前算法
能解决哪些实际问题,还是不了解。在笔者学习的过程中,发现目前出版的一些书籍,或

者是偏理论性的,会介绍很多自然语言处理技术发展的历史,比如符号逻辑的发展轨迹
语义网络的发展轨迹、语言学派和统计学派的“恩怨情仇”,会让初学者在学习的过程中抓
不住重点,有时候又感觉它们好像就是一回事;又或者介绍的内容过于偏技术,开篇就把
其中涉及的一些数学知识全都介绍一遍,因为这其中有很多数学知识是比较高阶的,比如
隐马尔科夫链、条件随机场、数理逻辑推理等,在介绍数学知识的过程中,又难免会涉及
相关的证明。本来其数学形式就比较复杂,再加上连环的证明就更难懂了,对于数学基础
稍微薄弱一点的读者,就感觉没有学习的欲望和必要了。但是在实际应用中,其实这些烦
琐的证明根本不需要,有时候只需要记住一个结论,然后根据自己数据的情况,优化模型
中的参数就可以了。所以笔者就想结合自己学习过程中和实际工作中的一些经验和教训,
从应用的角度来对自然语言处理中的一些技术进行介绍。在介绍的时候,为求尽量避免烦
琐和突兀的数学证明,从应用的角度尽可能简洁明了地对一个算法或者处理系统进行简要
的介绍,先让大家对这个方法有一个直观感性的认识,然后再深入了解其中的难点,进而
深入学习和攻克难点
本书采用以应用为主、算法和实现为辅的形式对自然语言处理中的一些技术进行介绍
对于算法数学原理的介绍,都是穿插在每一个应用的介绍中,对每一部分的数学知识进行
分别介绍和讲解,没有开篇便对所涉及的数学知识进行一个全面的介绍,这样大家就不会
因为某一个部分的数学知识不完备,或者掌握起来有困难而放弃整个知识体系的学习,这
样大家就可以独立学习和掌握。同时因为知识遗忘的必然性,笔者将数学知识融入应用中
进行介绍,就更容易让读者记住。否则前后脱节之后,就忘记了之前讲解的数学原理,即
使在应用中又要重新学习,也并不一定能够知道具体的应用原理。
因此,笔者完全从应用的角度来进行各个内容的组织,没有涉及太多的处理技术起源
变革、发展等历史信息。这一方面是因为各个技术都有自己的长处和缺点,这个是理论学
派争论的焦点,但不是应用层面应该关心或者需要表明立场的地方:另一方面作为主要介
绍应用实战的书,这里更多的是想让读者了解对于同一个问题目前的一些处理方法和这些
方法之间的优劣,以及相互的关联,以便找到解决问题更好的方法,这样也更有利于整个
事情的发展。所以从做事情的本身来说,我们需要关心的是事情怎么能够做起来,没有做
起来是因为什么,所以我们更多关心的是“术”的事情,而对于“道”的层面更多的是了
解,是取众家之长,来“集大成”,而不能剑走偏锋



回复

使用道具 举报

哈哈大笑 | 2020-1-2 10:54:05 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则