图书介绍

21世纪高等学校精品教材 搜索引擎与信息检索教程【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

21世纪高等学校精品教材 搜索引擎与信息检索教程
  • 袁津生,赵传刚等编著 著
  • 出版社: 北京:中国水利水电出版社
  • ISBN:9787508453941
  • 出版时间:2008
  • 标注页数:278页
  • 文件大小:27MB
  • 文件页数:289页
  • 主题词:互联网络-情报检索-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

21世纪高等学校精品教材 搜索引擎与信息检索教程PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 搜索引擎概述1

1.1 搜索引擎的概念1

1.2 搜索引擎的发展史2

1.3 搜索引擎的分类5

1.4 搜索引擎的信息检索模型7

1.5 建立搜索引擎的关键技术8

1.6 中文搜索引擎的发展趋势9

1.7 主要搜索引擎介绍10

1.7.1 谷歌(Google)搜索10

1.7.2 雅虎(Yahoo)搜索13

1.7.3 百度(Baidu)搜索15

1.7.4 天网搜索18

1.8 小结19

思考题21

第2章 搜索引擎的工作原理22

2.1 搜索引擎的基本结构及工作原理22

2.2 网页的搜集24

2.3 网页内容的提取25

2.4 查询服务26

2.5 小结28

思考题28

第3章 信息检索的模型29

3.1 经典模型29

3.1.1 布尔模型29

3.1.2 向量模型30

3.1.3 概率模型31

3.2 代数模型33

3.2.1 广义向量空间模型34

3.2.2 神经网络模型34

3.3 其他概率模型37

3.3.1 贝叶斯网络37

3.3.2 推理网络模型37

3.3.3 信任度网络模型38

3.4 小结40

思考题41

第4章 文本操作42

4.1 文本预处理42

4.1.1 文本的词法分析42

4.1.2 中文分词技术43

4.1.3 无用词汇的删除48

4.1.4 词干提取技术48

4.1.5 索引词条的选择56

4.1.6 词典56

4.2 文本聚类57

4.2.1 文本聚类算法57

4.2.2 文本聚类中的相关概念58

4.2.3 特征空间的降维处理59

4.3 文本压缩59

4.3.1 基本概念59

4.3.2 统计方法60

4.3.3 字典方法66

4.3.4 倒排文档压缩71

4.4 小结74

思考题75

第5章 文本信息检索技术77

5.1 顺排文档检索77

5.1.1 表展开法77

5.1.2 逻辑树展开法80

5.1.3 其他顺排文档检索算法86

5.2 倒排文档检索91

5.2.1 倒排文档的检索91

5.2.2 倒排文档的建立92

5.2.3 逆波兰表达式94

5.2.4 检索指令表的生成96

5.2.5 检索实施97

5.3 布尔检索97

5.4 加权检索98

5.4.1 检索词加权检索98

5.4.2 词频加权检索99

5.4.3 标引加权检索99

5.5 全文检索100

5.5.1 全文检索的技术指标100

5.5.2 全文检索的实现102

5.5.3 全文检索效率的提高104

5.6 超文本检索105

5.6.1 超文本技术概述105

5.6.2 超文本的功能及结构108

5.6.3 超文本检索的优缺点108

5.7 分布式信息检索110

5.7.1 分布式检索的查询协议110

5.7.2 分布式检索系统的结构112

5.7.3 分布式信息检索模式114

5.7.4 分布式检索资源选择119

5.8 分布式数据库查询技术122

5.8.1 分布式数据库的基本概念123

5.8.2 利用C#实现分布式数据库查询125

5.8.3 基于.NET Remoting的查询技术128

5.8.4 基于DCOM的分布式查询技术131

5.8.5 基于JDBC的查询技术133

5.8.6 基于Servlet的查询技术135

5.8.7 基于CORBA的查询技术137

5.8.8 基于Agent的查询技术139

5.9 小结142

思考题143

第6章 信息检索评价144

6.1 相关性144

6.1.1 相关性的特征144

6.1.2 相关性研究类别145

6.1.3 相关性模型146

6.2 信息检索性能评价149

6.2.1 信息检索系统的有效性149

6.2.2 评价指标150

6.2.3 Web检索系统性能评价152

6.3 信息检索领域的相关组织和会议153

6.4 小结154

思考题155

第7章 文本分类与聚类156

7.1 分类与聚类介绍156

7.1.1 文本分类156

7.1.2 文本聚类157

7.1.3 文本分类的算法158

7.1.4 文本聚类的算法159

7.1.5 自动分类与自动聚类161

7.1.6 文本分类的评测方法与指标161

7.1.7 文本聚类的评测方法与指标163

7.2 常用文本分类方法165

7.2.1 文本分类的问题165

7.2.2 kNN分类算法166

7.2.3 NB分类算法167

7.2.4 决策树分类算法167

7.2.5 Rocchio分类算法167

7.2.6 支持向量机分类算法168

7.2.7 特征选择分类算法169

7.2.8 文本分类系统的实现171

7.3 常用文本聚类方法174

7.3.1 层次聚类算法175

7.3.2 分割聚类算法177

7.3.3 基于密度的聚类算法178

7.3.4 基于网格的聚类算法179

7.3.5 基于模型的聚类算法181

7.4 小结182

思考题184

第8章 Web信息检索技术185

8.1 Web信息处理的基本技术185

8.1.1 Web信息的基本特点185

8.1.2 Web信息的表现方式186

8.1.3 Web信息系统结构186

8.1.4 网络信息资源的组织与管理188

8.2 Web数据挖掘191

8.2.1 Web挖掘流程191

8.2.2 Web挖掘的分类及现状192

8.2.3 Web数据挖掘和Web信息检索的区别194

8.3 Web信息检索的关键技术195

8.3.1 文档搜集195

8.3.2 文档预处理197

8.3.3 索引数据库的建立198

8.3.4 相似度计算与排序方法199

8.4 搜索引擎的基本结构203

8.4.1 搜索引擎的结构分类203

8.4.2 网页收集模块204

8.4.3 网页索引模块205

8.4.4 查询模块206

8.4.5 用户界面206

8.4.6 搜索引擎的主要指标及分析206

8.5 搜索引擎的数据结构207

8.5.1 存储结构207

8.5.2 信息库209

8.5.3 文本索引209

8.5.4 词典210

8.5.5 采样表210

8.5.6 前向索引210

8.5.7 后向索引211

8.6 搜索引擎爬虫212

8.6.1 网络爬虫212

8.6.2 深度优先策略213

8.6.3 广度优先策略214

8.6.4 不重复抓取策略215

8.6.5 网页抓取优先策略219

8.6.6 网页重访策略220

8.6.7 网页抓取提速策略220

8.6.8 Robots协议221

8.6.9 网页内容提取技术223

8.7 元搜索引擎224

8.7.1 元搜索引擎的基本构成225

8.7.2 常用元搜索引擎介绍及其分类226

8.7.3 与独立搜索引擎的比较229

8.7.4 主要技术指标及分析230

8.8 小结231

思考题233

第9章 搜索引擎开发技术234

9.1 实例简介234

9.1.1 搜索引擎的体系结构235

9.1.2 网页搜集236

9.1.3 网页预处理236

9.1.4 查询服务237

9.2 环境搭建与配置238

9.2.1 idk1.6的安装与配置239

9.2.2 eclipse的安装与配置240

9.2.3 Tomcat的安装与配置241

9.2.4 Heritrix的安装与配置244

9.3 网页搜集的实现255

9.3.1 扩展Heritrix255

9.3.2 抓取网页257

9.4 预处理的实现259

9.4.1 原始网页的处理259

9.4.2 建立索引——Lucene265

9.5 提供查询服务268

9.5.1 搜索引擎架构设计268

9.5.2 后台设计和实现269

9.5.3 页面设计和实现273

9.5.4 部署到Tomcat275

9.6 小结276

实验276

参考文献277

热门推荐