您的位置: turnitin查重官网> 计算机 >> 计算机软件 >论财经基于领域本体中文财经Blog搜索引擎设计和实现学年

论财经基于领域本体中文财经Blog搜索引擎设计和实现学年

收藏本文 2024-02-18 点赞:23039 浏览:98442 作者:网友投稿原创标记本站原创

摘要:随着博客(Blog)的迅猛进展,Blog网页数量成几何级数增加,如何在海量的Blog页面中找到自己感兴趣的Blog网页显得尤为重要。于是针对Blog页面的专业搜索引擎(Blog搜索引擎)诞生了。本论文主要就是针对基于本体的财经Blog搜索引擎展开探讨。经过探讨发现,Blog搜索引擎有着一些不足之处可以归纳到三个方面:一是Blog网页相似度计算,不能支持文档级别查询。其理由是现有的Blog搜索引擎没有有效的计算Blog网页相似的策略;二是搜索结果不能满足用户的查询意图,其理由是相似是否为语义相似或者相似值不准确;三是检索结果排序方面,如何让内容相关的结果排在前,这与检索结果的排序算法相关。本论文针对这些不足之处进行了深入探讨,并归纳到以下二方面:1.针对Blog网页相似度计算方面,本论文在现有的Blog网页相似计算策略的探讨基础上提出了基于本体的财经Blog网页相似计算策略(CBO策略)。该策略提出了财经关键词表示Blog网页信息,把Blog网页相似计算转化成财经关键词间的相似计算。这样关键词提取的好坏尤为重要。在传统的TF*IDF算法的基础上,根据Blog网页的特点对网页不同部分赋予不同的权值,以而改善了财经关键词的提取算法,提升了相似计算的精确度。2.针对Blog搜索结果排序方面,本论文浅析了BlogRank算法和B2Rank算法,结合了财经Blog的特点,根据财经Blog排序算法的影响因子和对现有的排序算法的不足之处,提出了针对财经领域的Blog搜索结果排序算法(BS算法)。本论文构建了财经领域本体,运用了上面陈述的改善算法,实现了基于领域本体的财经Blog搜索引擎,采集了大量网络数据进行测试,通过对该系统的实现验证了改善算法的有效性,在实际运用中具有较高的实用价值。关键词:财经Blog论文Blog搜索引擎论文财经本体论文语义相似论文BlogRank算法论文

    摘要3-4

    Abstract4-7

    第1章 绪论7-11

    1.1 探讨背景和作用7-8

    1.2 Blog搜索引擎探讨近况及浅析8-10

    1.3 本论文主要探讨内容10-11

    第2章 相关论述和技术11-24

    2.1 本体论及其运用11-16

    2.1.1 本体概述11

    2.1.2 本体分类11-12

    2.1.3 本体描述语言12-13

    2.1.4 本体构建工具13-14

    2.1.5 常见本体构建策略构建14-16

    2.2 基于本体的语义相似度计算策略16-19

    2.2.1 语义相似度概述16-17

    2.2.2 基于知网的语义相似度计算策略17-18

    2.2.3 基于领域本体的相似度计算策略18-19

    2.3 Blog搜索排序算法19-22

    2.3.1 PageRank算法19-20

    2.3.2 BlogRank算法20-21

    2.3.3 B2Rank算法21-22

    2.4 Nutch平台介绍22-23

    2.5 本章小结23-24

    第3章 基于本体的财经Blog网页相似比较策略24-31

    3.1 引言24

    3.2 CBO策略24-29

    3.2.1 构建财经本体概念树25-26

    3.2.2 财经关键词提取对策26-27

    3.2.3 关键词间的相似度计算27-29

    3.3 实验浅析29-30

    3.3.1 实验设计29-30

    3.3.2 实验结果浅析30

    3.4 本章小结30-31

    第4章 财经Blog搜索结果排序算法探讨31-40

    4.1 引言31

    4.2 财经Blog特点31-32

    4.3 BS算法的影响因子32-36

    4.3.1 发表时间32-33

    4.3.2 链接33-35

    4.3.3 文章内容35

    4.3.4 分类和标签35-36

    4.4 BS算法36-38

    4.4.1 基于Blog链接的算法36-37

    4.4.2 基于Blog文章链接的算法37-38

    4.4.3 算法合并38

    4.5 实验浅析38-39

    4.5.1 实验设计38-39

    4.5.2 实验结果浅析39

    4.6 本章小结39-40

    第5章 基于领域本体的财经Blog搜索引擎系统的设计与实现40-51

    5.1 系统架构设计40-41

    5.2 构建财经本体41-47

    5.2.1 本体构建目标41

    5.2.2 本体构建策略41-43

    5.2.3 领域本体构建实现43-47

    5.3 查询模块设计与实现47-49

    5.3.1 查询模块框架设计47-48

    5.3.2 查询模块实现48-49

    5.4 性能浅析49-50

    5.5 本章小结50-51

    第6章 总结与展望51-52

    6.1 本论文工作总结51

    6.2 不足之处及未来工作51-52

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号