电子书:《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01

[复制链接]
查看259 | 回复1 | 2019-12-24 13:31:58 | 显示全部楼层 |阅读模式

《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01_1

《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01_1

《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01_2

《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01_2

《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01_3

《大数据搜索引擎原理分析及编程实现》_刘凡平_2016-07-01_3


内容简介:

大数据搜索引擊原理分析及蝙程实现
2.2.5日志服务
2.3技术概要
2.3.1自然语言处理…
2.3.2知识图谱技术
2.3.3海量数据存储
234分布式计算
23.5搜索排序技术
24本章小结
第3章自然语言处理框架
3.1英文分词
32中文分词
3.2.1中文分词概述
8003
3.2.2基于词库的分词技术
323基于条件随机场的中文分词
3.24分词粒度
33词性标注
442
33.1隐马尔科夫模型概要
33.2隐马尔科夫模型与词性标注
4语义相似度
35依存句法分析
3.5.1依存句法分析概要
3.52依存句法分析实现

3.6情感倾向分析
3.7文档关键词抽取
3.7.1关键词抽取概述
162
3.7.2基于TF-IDF算法
3.7.3基于 TextRank算法
38文档句子相似度分析
381句子相似度
3.82文档相似度
39文档核心句抽取
3.10聚类分类
3.10.1文本分类
3.10.2文本聚类
3.1语种检.测
3.12本章小结
第4章构建大数据存储引擎
4.1架构体系
4.1.1结构概要
4.1.2服.务.器上线
4.1.3服.务.器下线
4.14数据读取
4.2数据模型
94
4.3数据压缩

数据搜索引擎原理分祈及编程实现
44负载均衡
4.5数据存储逻辑视图
46本章小结
第5章构建分布式实时计算
522基本框架
53运行模式
54负载均衡
5.5通信设计
112
55.1基本方式
552分布式.远.程.服务调用
56容灾恢复
5.7数据容错原理
58数据处理设计示例
59本章小结
第6章分布式可扩展爬虫
61爬虫体系架构
1.1主从分布式结构爬虫
612对等分布式结构爬虫

61.3基于分布式计算平台爬虫
62网 页解析
6.2.1状态码处理
6.2,2链接去重
6.23广告识别
624网站地图
62.5非网 页数据获取
6.2.6网 页去重
627链接提取
628爬虫协议
63网 页结构化
63.1网 页的编码信息
63.2网 页的正文信息
63.3网站的关键词信息
6.34网站的标题
63.5网 页的发布时间
6.3.6网站语言检.测
6,37其他结构化数据
64网 页抓取策略
65爬虫权限应对
6.6深网抓取
6.7抓取更新策略
555
8本章小结

大数据搜索引擎原理分析及编程实现
第7章大数据构建知识图谱
7.1概述
72搜索引擎与知识图谱
73可靠数据源选择
74实体抽耶
7.5关系抽取
7.5.1关系抽取概述
7.5.2隐藏关系抽取
7.5.3结构化确定关系抽取
7.54非结构化确定关系抽取
76知识图谱检.测
7.6.1实体关系修正
7.62实体对齐整合
7.6.3实体歧义分析
7.7知识推理与计算
7.7.1知识推理
7.7.2知识计算
7.8知识聚类
79智能搜索实现
79.1模式匹配
79,2知识拆解


#############################################


回复

使用道具 举报

活在当下 | 2019-12-24 13:32:02 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则