您的位置: turnitin查重官网> 计算机 >> 计算机毕业题目 >简论选取面向用户意图博文重排序技术学年

简论选取面向用户意图博文重排序技术学年

收藏本文 2024-01-26 点赞:9322 浏览:34363 作者:网友投稿原创标记本站原创

摘要:随着Web2.0的迅速进展,博客作为其中一个典型的运用开始被越来越多的人所关注和利用。博文不同于普通web页面,它包含更加丰富的人工标注信息,而这些信息可以随时被博主重新编辑,使得博文的个性化程度很高。博客这种由用户自己自由管理的特点以及博客数量的迅速增加给博客信息的处理带来了非常大的挑战。如何帮助用户在众多的博文中找到符合自己目标的页面成为了当前的一个探讨热点。已有的博客搜索的相关探讨已经开始着眼于博客的特点来进行博文重排序,但是却很少以用户的角度出发来进行博文重排序,所以得到的重排序结果往往不能够满足用户兴趣,由此带来了面向用户意图的博文重排序技术的探讨。本论文提出的面向用户意图的博文重排序的探讨策略是以用户行为和博文自身的特点出发,以一种特定的聚类和样本选取方式引导用户表达自己的搜索目标,并根据已明确的用户意图迭代地为用户返回结果集页面。本论文首先浅析博文的主要语义属性,在此基础上详细阐述面向用意图的博文重排序模型,并以整体上描述重排序的历程以及框架。然后,针对重排序历程中的关键算法,分别展开详细阐述。基于语义扩展的博文聚类算法的目标是将符合当前关键字的所有相关结果集进行类别划分,使得划分后的每个类别能够自成一个主题,整体类别划分的效果能够满足“平均”用户的兴趣。在对基于语义扩展的博文聚类算法的阐述中,首先给出整体的聚类历程,然后对聚类历程中的各个细节进行语言以及形式化的描述,并在最后给出基于此算法的实验比较结果和结论。面向用户意图的博文选取算法建立在聚类基础上,它的目标是以聚类划分好的类别中选取出一定数量符合当前用户兴趣的结果页面。该算法依据一些原则实现,首先根据启发式规则构建样本空间,然后以度量函数为标准进行择优选取,整个历程是一个贪婪选取的历程。本论文在最后对面向用户意图的博文重排序技术的运用与测试细节进行阐述,并由此证明本论文提出的算法的有效性。关键词:博客论文用户意图论文重排序论文聚类论文样本选取论文

    摘要5-6

    Abstract6-9

    第1章 引言9-13

    1.1 课题的背景和作用9-10

    1.2 探讨目标和探讨内容10-11

    1.3 论文的组织结构11-13

    第2章 探讨基础13-23

    2.1 博客搜索13-18

    2.1.1 博客的概念13

    2.1.2 博客的特点13-14

    2.1.3 博文的组织结构14-15

    2.1.4 博文与普通网页的区别和联系15

    2.1.5 博客搜索15-16

    2.1.6 博客搜索的探讨热点16-18

    2.2 文档聚类18-20

    2.3 数据挖掘中的样本选取策略20-21

    2.4 用户意图21-22

    2.5 本章小结22-23

    第3章 面向用户意图的博文重排序机制23-33

    3.1 博文重排序技术浅析23-24

    3.1.1 面向用户意图的博客搜索不足提出23

    3.1.2 博文的主要语义属性浅析23-24

    3.2 博文重排序的探讨思路24-26

    3.3 面向用户意图的博文重排序模型26-29

    3.4 面向用户意图的博文重排序历程29-31

    3.5 面向用户意图的博文重排序框架31-32

    3.6 本章小结32-33

    第4章 基于语义扩展的博文聚类算法33-45

    4.1 基于语义扩展的博文聚类思路33-34

    4.2 基于语义扩展的博文聚类算法34-39

    4.2.1 基于语义扩展的博文聚类历程34-35

    4.2.2 语义扩展算法35-36

    4.2.3 基于标签共现的博文相似度计算策略36-38

    4.2.4 AGNES聚类算法38-39

    4.3 实验比较39-44

    4.3.1 数据集39-40

    4.3.2 评价标准40-41

    4.3.3 实验结果41-44

    4.4 本章小结44-45

    第5章 面向用户意图的博文样本选取算法45-51

    5.1 面向用户意图的博文样本选取要解决的不足45-46

    5.2 面向用户意图的博文样本选取机制46-50

    5.2.1 博文样本选取原则46-47

    5.2.2 度量函数47-48

    5.2.3 博文选取样本空间构造的启发式规则48-49

    5.2.4 博文贪婪选取算法49-50

    5.3 面向用户意图的博文样本选取算法50

    5.4 本章小结50-51

    第6章 面向用户意图的博文重排序技术运用与测试51-69

    6.1 面向用户意图的博文重排序技术运用总体设计51-54

    6.1.1 系统结构图51-52

    6.1.2 流程设计52-53

    6.1.3 功能模块及接口联系设计53-54

    6.2 数据库设计54-56

    6.3 面向用户意图的博文重排序技术实现56-62

    6.3.1 主要数据结构56-57

    6.3.2 算法流程图57-60

    6.3.3 关键算法60-62

    6.4 面向用户意图的博文重排序技术运用结果测试62-68

    6.4.1 测试数据62-63

    6.4.2 测试案例63-64

    6.4.3 测试结果64-68

    6.5 本章小结68-69

    第7章 结束语69-71

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号