电子书:《从Lucene到Elasticsearch 全文检索实战》

[复制链接]
查看223 | 回复1 | 2019-12-21 16:01:29 | 显示全部楼层 |阅读模式

《从Lucene到Elasticsearch 全文检索实战》_1

《从Lucene到Elasticsearch 全文检索实战》_1

《从Lucene到Elasticsearch 全文检索实战》_2

《从Lucene到Elasticsearch 全文检索实战》_2

《从Lucene到Elasticsearch 全文检索实战》_3

《从Lucene到Elasticsearch 全文检索实战》_3


内容简介:

lUcene●
Elasticsearch
全文检索实战
姚攀编著
等大学出版社
北京

内容简
本书循序渐进介绍了信息检索、布尔检索、向量空间模型、tf-idf、pME5排序算法、 Lucene架构、 Lucene
Lucene查询、 Lucene项目实战、 Elasticsearch安装与配置、 Elasticsearch插件安装、 REST AP
映射与模板、索引别名、 Elasticsearch基本和高级搜索、 Elasticsearch同步数据库、 Elasticsearch
集群管理、项目实战等内容。阅读本书,读者能够掌握信息检索的核心概念,应用 Lucene库处理全文检索业务
掌握 Elast insearch分布式搜索引擎的使用方法与技巧
本书基于 Lucene6.0和 Elasticsearch5.4.0进行讲解,技术先进,示例丰富,适合想学习信息检索技术
的初学者和相关专业的大学生、研究生学习,也很适合大数据及云计算平台构建人员以及有一定基础的IT开发
人员使用
本书封面贴有清华大学出版社防伪标签,无标签者不得销售
板权所有,侵权必究。侵权举报电话:0106278298913701121933
图书在版编目(|P)数据
从 Lucene到 Elasticsearch:全文检索实战/姚攀.一北京:清华大学出版社,2017
ISBN978-7-302-48306-9
1.①从…Ⅱ.①姚…Ⅲ①全文检索Ⅳ.①G254.923
中guo版本图书馆CIP数据核字(2017)第215137号
责任编辑:王金柱
封面设计:王翔
责任校对:闫秀华
责任印制:李红英
出版发行:清华大学出版社
att:http://www.tup,comcn,http://www.wabook.com
址:北京清华大学学研大厦A座
邮编:100084
社总机:010-6270175
邮购:01062786544
投稿与读者服务:010-62776969, c-serviceetup. tsinghua. edu. cn
质量反馈:010-62772015, zhiliangdtup. tsinghua,edu.cn
印装者:清华大学印刷厂
经销:全guo新华书店
本:190m×2
版次:2017年12月第1版
印次:2017年12月第1次印刷
数:1~3000
定价:79.00元
产品编号:07214401

前言
我们正处在一个大数据时代,大数据并不仅仅是指海量数据,而更多的是指这些数据都是非
结构化的、无法用传统的方法进行处理的数据。相信很多人听说过目前在云计算和大数据领域里
如日中天的 Hadoop, Hadoop的发起人之一是大名鼎鼎的 Doug Cutting。早在 Hadoop诞生之前,
Doug Cutting已经用Java实现了第一个提供全文文本搜索的开源函数库 Lucene. Lucene自2000
年发布第一个开源版本以来,在开源社区引起了很大的反响,为广大开发者提供了研发全文检索
系统的利器。 Lucene作为 Apache的顶级项目,有大量研发人员贡献源码,经过十几年的发展
目前 Lucene已经十分成熟,可以说 Lucene是当今最先进、最高效的全功能开源搜索引擎工具包
但 Lucene只是一个全文检索类库, Elasticsearch是一个建立在 Lucene基础上的实时的分布式搜
索引擎,2010年由 Shay Bano发布。相比于 Lucene, Elasticsearch功能更加强大,使用更加方便
站在巨人的肩膀上,入门搜索技术并不困难,本书为入门 Lucene、 Elasticsearch而生。本书
首先介绍信息检索领域中的一些基本理论,也就是 Lucene的数学模型,之后介绍如何使用 Lucene
库构建全文检索系统,最后介绍 Elasticsearch。本书按照从数学模型到入门基础再到项目实战的
思路来编写,数学模型让读者知其然也知其所以然,入门基础是理论到实际应用的必经之路,项
目实战则是为了学以致用。书中的每一部分都力图简明扼要,使用大量实例和代码,为读者能够
快速掌握全文检索技术扫除障碍。将全文检索领域中的一些知识和项目经验分享给大家,是笔者
写作本书的初衷
本书结构
本书从逻辑上可划分为三部分。
第一部分(第1章),主要介绍信息过载、信息检索、倒排索引、布尔模型、tidf、向量空
间模型、概率检索模型等信息检索领域的基础知识
第二部分(第2和3章),介绍如何使用 Lucene开发全文检索系统。
第2章主要介绍 Lucene的基础知识,内容包括 Lucene的特点、 Lucene架构、Luke的使用
IK分词器配置、扩展词库和.远.程.词库的配置、 Lucene的多种分词器、索引的构建方法、检索文
档以及实现检索关键词高亮的方法。
第3章是 Lucene项目实战部分,介绍如何使用 Lucene构建一个文件检索系统,内容包括项
目的整体设计、使用Tka做信息抽取、索引的构建、用户查询界面的设计与实现、用户查询处
理、搜索结果展示等内容

从 Lucene到 Elasticsearch:全文检索实战
三部分(第411章),主要介绍 Elasticsearch分布式搜索引擎的相关技术
第4章是 Elasticsearch简介,内容包括 Elasticsearch与 Lucene的关系、 Elasticsearch
架构、核心概念、在企业中的应用案例、流行度趋势、 Elasticsearch的安装、中文分词配
的数发
相关插件的安装与使用
第5章是 Elasticsearch集群入门,主要内容包括索引管理、文档管理和映射详解
第6章介绍 Elasticsearch的搜索功能,主要内容包括搜索机制的解读、全文查询、词项查询
复合查询、嵌套查询、位置查询、特殊查询、搜索高亮和排序
第7章介绍 Elasticsearch的聚合分析功能
第8章介绍如何使用 Elasticsearch Java API做二次开发
第9章介绍 lasticsearch集群管理的相关知识点,包括脑裂问题、集群规划、索引规划、分
布式集群的搭建方法以及如何查看集群的监控信息
第10章是 Elasticsearch整合 MySQL项目实战部分,通过实现对 MySQL中的数据进行全文
检索这一需求,贯穿了 MySQL、JDBC、 Elasticsearch Java API I以及 Java Web的相关知识,使读
者了解在实际的项目开发中使用 Elasticsearch做全文搜索的方法
第11章介绍 Elasticsearch和 Hadoop大数据平台交互的方法
学习本书的预备知识
Java基础
首先要配置好Java开发环境。不论是学习 Lucene还是 Elasticsearch都需要安装好Java环境,
Elasticsearch的运行要求JDK版本最低为1.7,建议使用DDK1.8及以上版本。鉴于Java的跨平
台特性,对操作系统没有要求,在 Windows、 Linux、 Mac Os x系统上都可以运行 Elasticsearch
除此之外,读者需要掌握Java基础知识
Java Web开发技术
在项目实战中需要用到 Java Web的相关技术,建议读者在阅读本书之前掌握HTML、Css、
JSP等基础知识,掌握 Java Web项目的部署和运行。
本书使用的软件版本
本书基于 Lucene60和 Elasticsearch54.0进行讲解,集成开发环境为 Eclipse46.l。
读者对象
在校学生
如果你是正在大学校园里修读计算机科学相关专业的大学生,也许你正在选修程序设计语
言,课程结束了你发现自己只能写出命令行下黑白屏显示的小程序,你也许很期待学到更多的技
术做出实际的项目,那么本书就是为你准备的。书中的项目使用的是Java语言,除了 Lucene和
Elasticsearch的使用之外,还穿插了 Java Se、 Java Web的相关技术。

录Ⅲl
Java程序开发者
如果你是已经参加工作的Java程序开发者,想要掌握全文检索相关技术却不知道从哪里入
手,需要处理企业中的全文检索业务却没有思路,你也许听说过 Lucene或 Elasticsearch,但是不
知道怎样快速入门,那么本书可以作为入门全文检索、学习 Lucene和 Elasticsearch开发技术的
参考书
搜索引擎研发人员
如果你是搜索引擎研发者,本书中的实际案例和相关知识点可以作为参考资料,比如信息检
索模型理论基础、文档信息抽取、 Lucene应用案例、 Elasticsearch Java APl、 Elasticsearch集群管
理等。希望能以本书为媒介和大家共同探讨和交流
源代码下载
源代码下载地址:http://pan.baiducom/s/1slhrm5f(注意区分数字和英文字母的大
小写)
勘误与交流
限于笔者水平和写作时间有限,不可避免地会有些疏漏之处,欢迎大家通过电子邮件等方式
批评指正
笔者的邮箱: ucasyp@l63com
笔者的博客: blog.csdn. net/napoay
致谢
本书能够顺利出版要感谢很多单位和个人。首先要感谢笔者的家人,他们对笔者学业的支持
和生活的照顾使笔者没有后顾之忧,全身心投入到本书的写作当中
感谢北京博瑞开源有限公司,公司给笔者提供了宝贵的实习机会,本书的很多知识点都来源
于实际项目,是在解决实际问题过程中的经验总结,感谢公司董事长李小翔先生、架构师黄超对
笔者的指导和帮助
感谢马玉鹏老师、郎睿师兄、张港红博士、CSDN博主周程( blog.csdn. net/fxsdbt520)、秦
雪箭、宗鹏、陆风光在本书写作过程中的帮助和支持
感谢清华大学出版社给了笔者一次和大家分享技术、交流学习的机会,感谢王金柱编辑在本
书出版过程的辛勤付出
姚攀
2017年10月9日


#############################################


回复

使用道具 举报

夏天蓝了海 | 2019-12-21 16:01:32 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则