电子书:《Elasticsearch大数据搜索引擎》

[复制链接]
查看201 | 回复1 | 2019-12-6 17:40:38 | 显示全部楼层 |阅读模式

《Elasticsearch大数据搜索引擎》_1

《Elasticsearch大数据搜索引擎》_1

《Elasticsearch大数据搜索引擎》_2

《Elasticsearch大数据搜索引擎》_2

《Elasticsearch大数据搜索引擎》_3

《Elasticsearch大数据搜索引擎》_3


内容简介:

人工智能系列
Elasticsearch大数据
搜索引擎
罗刚编著
電子工業出版
Publishing House of Electronics Industry
北京· BELJING

内容简介
Elasticsearch搜索集群系统在生产和生活中发挥着越来越重要的作用。本书介绍了 Elasticsearch的使
用、原理、系统优化与扩展应用。本书用例子说明了Java、 Python、 Scala和PHP的编程AP,其中在Java
搜索界面实现上,介绍了使用 Spring实现微服务开发。为了扩展 Elasticsearch的功能,本书以中文分词和
英文文本分析为例介绍了插件开发方法。本书介绍了使用 Elasticsearch作为数据管理平台的日志监控与分
析方法,介绍了使用OCR从图像中提取文本以及问答式搜索的开发方法
本书适用于有程序设计基础的开发人员或者对IT运维技术感兴趣的从业人员
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容
版权所有,侵权必究
图书在版编目(cP)数据
Elasticsearch大数据搜索引擎/罗刚编著.一北京:电子工业出版社,20181
(人工智能系列)
ISBN978-7-121-33233-3
1.①E…Ⅱ.①罗…Ⅲ①搜索引擎一程序设计Ⅳ.①TP3913
中guo版本图书馆CIP数据核字(2017)第306154号
策划编辑:张迪
责任编辑:底波
印刷:三河市华成印务有限公司
装订:三河市华成印务有限么
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编10006
开本:787×10921/16印张:1425字数:3648千字
版次:2018年1月第1版
印次:2018年1月第1次印刷
定价:49.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系
联系及邮购电话010)88254888,88258888
质量投诉请发邮件至zlts(@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com
本书咨询联系方式010)88254469,zhangdi@phei.com.cn

前言
<<<< PREFACE
智慧生物的大规模协作造就了惊人的进化奇迹。大规模机器集群造就机器系统进化成
为强大的智能系统。 Elasticsearch作为大数据与搜索引擎技术的结合体,随着社会对大规模
开源分布式搜索引擎的需求迅速成长。
由于其良好的易用性, Elasticsearch早在1.0版本之前就加速了大规模搜索集群的普
及。本书从基本概念开始熟悉 Elasticsearch,接下来介绍了 Elasticsearch在 Windows和
Linux操作系统下的安装。除了CURL命令,本书还介绍了使用常用的编程工具和
Elasticsearch搜索服务交互,包括Java、 Python、 Scala和PHP,以及使用SQL语句查询
Elasticsearch索引的方法。自然语言文本理解往往以插件形式存在于 Elasticsearch集群中,
第2章介绍了如何开发与测试插件。因为 Elasticsearch经常用于实时搜索或分析,所以性能
优化很重要,第3章介绍了如何管理 Elasticsearch集群。为了更合理地使用和扩展
Elasticsearch,第4章简单分析了 github中托管的 Elasticsearch源代码。对于搜索引擎来
说,返回结果的相关性是一个重要的话题,第5章讨论了这个问题。第6章介绍了使用
Java开发搜索引擎web用户界面的几种方法
随着人工智能领域技术的发展,让搜索引擎智能加速变成现实。智能搜索引擎需要能
检.测到并识别出图像中的文字,第7章介绍了结合 OpenCV使用 Tesseract识别文字的方
法。第8章介绍了根据问题返回搜索结果的问答式搜索。
目前 Elasticsearch是实时系统监控的首选,第9章介绍了使用 Elasticsearch监控与分析
日志,也介绍了通过物联网监控系统的方案。
本书相关的参考软件和代码在读者.Q.Q.群.471033528的附件中可以找到。 Elasticsearch
及其底层依赖的软件,其复杂程已经超越了一个人所能掌握的程度。一些具体的细节也可
以在读者.Q.Q.群.中讨论。感谢早期合著者、合作伙伴、员工、学员、读者的支持,给我们提
供了良好的工作基础。就像玻瑞容器中的水培植物一样,这是一个持久可用的工作基础。技
术的融合与创新无止境,欢迎读者一起探索
本书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关领域的研究人员
也有一定的参考价值,同时猫兔搜索技术团队已经开发出以本书为基础的专门培训课程和商
业软件
参与本书编写的还有张子先、崔智杰、张晓斐、石天盈、张继红、张进威、刘宇、何
淑琴、任通通、高丹丹、徐友峰、孙宽,在此一并表示慼谢。

目录
第1章使用 Elasticsearch
1.1基本概念
2安装…
13搜索集群…
14创建索引
1.5使用Java客.户.端接口
1.5.1创建索引…
1.5.2增加、删除与修改数据…
1.53分析器……
1.5.4数据导入
5通过摄取快速导入数据…
1.5.6索引库结构
1.5.7查询…
1.58区间查询
22
5.9排序…
…23
5.10分布式搜索
1.5.1过滤器
15.12高亮显示…
1.5.13分页…
1.5.14通过聚合实现分组查询
.5.15文本列的聚合…
1.5.16遍历数据…
4456789
1.5.18 Percolates
1.6 RESTClient
1.6.1使用摄取
1.6.2代码实现摄取
1.8 Python客.户.端………
19 Scala客.户.端
1.10PHP客.户.端……………
337034
1.11SQL支持………

lasticsearc大数据搜索引
1.12本章小结
第2章开发插件
2.1搜索中文
2.1.1中文分词原理
2.1.2中文分词插件原理
2.1,3开发中文分词插件…
锅999135
214中文 Analyzer Provider
2.15字词混合索引
2.2搜索英文
221句子切分
22.2标注词性
23使用测试套件
24本章小结…
第3章管理搜索集群…
3.1节点类型
)32管理集群
33写入权限控制
34使用 X-Pack
3.5快照
3.6Zen发现机制
3.7联合搜索
3.8缓存
39本章小结
第4章源码分析
41 Lucene源码分析……
4.1.1Iwy管理依赖项
4.1.2源码结构介绍
86601234456677y0
4.2 Gradle…
4.3 Guice
4.4 Joda-Time
4.5 Transport\"
46线程池
4.7模块
4.8 Netty
4.10本章小结
第5章搜索相关性
5.1BM25检索模型
882886
5L.1使用BM25检索模型
5.1.2参数调优…


#############################################


回复

使用道具 举报

和风戏雨 | 2019-12-21 20:06:21 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则