摘要6-7
Abstract7-8
目录8-10
1 绪论10-19
1.1 探讨背景及作用10-13
1.1.1 探讨背景10-12
1.1.2 探讨作用12-13
1.2 国内外探讨近况13-17
1.2.1 信息检索13-15
1.2.2 统计语言模型15-17
1.3 探讨内容和组织结构17-19
1.3.1 本论文探讨内容17-18
1.3.2 本论文组织结构18-19
2 基于统计语言模型信息检索原理19-25
2.1 信息检索术语及检索流程19-22
2.1.1 相关术语与概念19-20
2.1.2 信息检索流程20-22
2.2 基于统计语言模型的信息检索基本原理22-23
2.3 统计语言模型运用于信息检索的优势23-24
2.4 本章小结24-25
3 数据平滑技术25-30
3.1 数据稀疏不足25-27
3.2 几种常见数据平滑技术27-28
3.3 数据平滑技术对信息检索效果的影响28-29
3.4 本章小结29-30
4 中文分词和中文文本索引30-38
4.1 中文分词30-33
4.1.1 基于词典的分词30-32
4.1.2 基于统计的分词32-33
4.2 中文文本索引33-34
4.3 中文分词和中文文本索引在信息检索中影响34-37
4.3.1 中文分词对信息检索的影响34-36
4.3.2 中文文本索引对信息检索的影响36-37
4.4 本章小结37-38
5 基于统计语言模型的中文网页信息检索评测38-53
5.1 实验环境和数据来源38-44
5.1.1 Lemur工具箱38-42
5.1.2 CWT200G语料库42-44
5.2 信息检索系统ChWebIR44-46
5.2.1 系统实现44-45
5.2.2 系统运转环境45-46
5.3 实验策略46-49
5.3.1 数据处理46-48
5.3.2 评测指标48-49
5.4 实验结果浅析49-52
5.4.1 统计语言与传统检索模型对中文检索性能的比较浅析49-51
5.4.2 平滑技术对统计语言模型中文检索性能的比较浅析51-52
5.5 本章小结52-53
6 总结和展望53-55
6.1 总结53-54
6.2 展望54-55