您的位置: turnitin查重官网> 计算机 >> 计算机软件 >分类面向信息检索文本自动分类技术大专

分类面向信息检索文本自动分类技术大专

收藏本文 2024-01-09 点赞:24234 浏览:108336 作者:网友投稿原创标记本站原创

摘要:信息科技技术的快速进展给我们日常生活带来了诸多便利同时各个领域的相关数据文件也在不断增加。在越来越多的信息数据堆积的情况下,为了能够更快更准地获取自己想要的信息就必须对文本信息进行分类,文本分类可以有效地查询到数据信息同时还可以对现有的数据进行自动化管理与分类,这样既方便了数据存储也方便了数据查询。本论文主要是在设计科研项目中全文检索模块基础上对文档自动分类技术的学习与探讨,并结合实际运用提出了一个优化的文本分类策略。文档自动分类的探讨是对全文检索技术学习的一个拓展探讨,由于平台可能会在未来利用中产生大量的文档数据,查询的时候也可能会由于数据量的增大会带来一定程度的数据过剩,包含同一关键字可能有多类别的文档,本论文通过实现全文检索的基础上探讨现阶段一些主流的机器学习分类算法KNN、SVM、朴素贝叶斯以及决策树等,然后针对KNN分类算法的时间效率不足上面提出利用决策树进行初步分类当分类阈值达到一定范围时再利用KNN对未分类的节点进行分类,在分类准确率得到保障的前提下提升了文本分类的效率。关键词:查询论文全文检索论文文本分类论文分类效率论文

    摘要5-6

    Abstract6-9

    第1章 绪论9-14

    1.1 课题探讨背景及作用9-11

    1.2 国内外探讨近况11-12

    1.3 探讨内容及本论文组织结构12-14

    1.3.1 主要探讨内容12

    1.3.2 本论文结构安排12-14

    第2章 文本分类技术14-28

    2.1 文本分类概述14-17

    2.1.1 文本分类基本概念14-16

    2.1.2 文本特点选择与提取16-17

    2.1.3 文本分类器17

    2.1.4 分类评价指标17

    2.2 分类模型探讨17-28

    2.2.1 SVM模型18-21

    2.2.2 KNN模型21-24

    2.2.3 贝叶斯模型24-25

    2.2.4 决策树模型25-28

    第3章 面向信息检索的文本分类技术28-48

    3.1 基于分类的检索系统28-37

    3.1.1 检索基本概念28-30

    3.1.2 检索原理30-34

    3.1.3 基于分类检索系统设计与改善34-37

    3.2 文本分类在检索系统中的运用37-39

    3.3 基于决策树的KNN再分类模型39-48

    3.3.1 KNN及决策树模型浅析39-42

    3.3.2 分类预处理与特点选择42-44

    3.3.3 分类器设计44-46

    3.3.4 分类器性能评估46-48

    第4章 分类模型实验评估48-57

    4.1 分类模型实验验证48-55

    4.1.1 基于MyEcppse平台的实验验证48-52

    4.1.2 基于Orange Canvas平台的实验验证52-55

    4.2 分类结果浅析55-57

    第5章 结束语57-59

    5.1 全文总结57

    5.2 探讨展望57-59

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号