您的位置: turnitin查重官网> 计算机 >> 计算机毕业题目 >试议舆情基于确定话题网络舆情系统设计和构建

试议舆情基于确定话题网络舆情系统设计和构建

收藏本文 2024-01-30 点赞:9728 浏览:35388 作者:网友投稿原创标记本站原创

摘要:伴随互联网的飞速进展,网络为越来越多的民众表达自己的情绪和意见提供了广阔的平台,网络逐渐进展成为民意的聚集地。在这种现实背景下,负面的、消极的网络舆情可能会欺骗和误导广大民众,对社会的公共安全造成了越来越大的威胁,由此有必要对网络上的话题和言论进行有效地浅析,及时捕捉舆情动态,对于维护社会稳定、构建和谐社会具有重要的现实作用。由此,对网络舆情浅析技术的探讨已成为一项十分紧迫的重要课题。本论文重点探讨并浅析了网络舆情浅析系统中的关键技术信息采集、信息预处理、热点发现与跟踪技术:1、信息采集与信息预处理指通过网络爬虫抓取指定范围的网页并通过网页净化、中文分词生成权值向量的历程。2、话题发现技术的任务是实现对某一事件的相关新闻报道聚合到同一个集合中,同时在新的新闻报道来时,发现新的事件,并形成话题。热点发现的本质是一个文本聚类历程,通过对目前现有的几种聚类策略的综合比较,最终,确定在本系统中采取Single-pass的聚类算法。3、话题跟踪技术能够帮助用户获得其感兴趣的话题新闻,并能及时追踪这些话题,由此,话题跟踪的任务就是系统根据少数样本确定一个话题,要求其在以后获取的信息中识别出与此话题相关的报道。话题跟踪的本质是一个文本分类的不足,基于对目前现有的几种文本分类策略的综合比较以及SVM算法的性能改善,确定了在本系统中采取改善的SVM分类器-PCA-GA-SVM模型实现话题跟踪。本论文最后介绍了网络舆情浅析系统的具体功能实现。在设计了系统的整体框架后,分别对各模块的功能实现进行了具体说明。在本系统中,实现了在Windows操作系统下基于MyEcppse6.0开发环境和Mysql4.1.20数据库管理系统下的网络舆情浅析系统的原型构建。该系统实现了对热点话题的检测与追踪,能够为相关部门制定决策提供辅助支持。关键词:网络舆情论文网络爬虫论文Single-pass聚类算法论文PCA-GA-SVM分类器论文

    摘要4-5

    Abstract5-8

    第一章 绪论8-11

    1.1 探讨背景及作用8-9

    1.2 国内外探讨近况9-10

    1.2.1 国外探讨近况9

    1.2.2 国内探讨近况9-10

    1.3 本论文的主要工作和内容安排10-11

    第二章 网络舆情浅析相关论述11-27

    2.1 网络舆情基本概念及特点11-14

    2.1.1 网络舆情的基本概念11

    2.1.2 网络舆情的主要特点11-14

    2.2 网络舆情发现技术14-26

    2.2.1 网页获取技术14

    2.2.2 网页剖析技术14-16

    2.2.3 中文分词16-20

    2.2.4 文本分类20-23

    2.2.5 文本聚类23-26

    2.3 本章小结26-27

    第三章 舆情信息获取处理技术27-41

    3.1 信息采集技术27-35

    3.1.1 网页重要度评定标准27-32

    3.1.2 网络爬虫原理及功能32-34

    3.1.3 爬虫抓取对策浅析34-35

    3.2 信息预处理技术35-40

    3.2.1 HTML 文本预处理36-39

    3.2.2 中文分词系统39-40

    3.3 本章小结40-41

    第四章 热点信息发现与跟踪技术41-58

    4.1 热点话题发现技术41-48

    4.1.1 话题发现的文本聚类算法42-46

    4.1.2 各聚类算法的比较与选取46-48

    4.2 热点话题跟踪技术48-52

    4.2.1 话题跟踪的文本分类算法48-51

    4.2.2 各分类算法的比较与选取51-52

    4.3 SVM 算法的改善52-57

    4.3.1 基于遗传算法的 SVM 算法参数优化52-54

    4.3.2 基于 PCA 算法改善遗传算法的 SVM 算法参数优化54-56

    4.3.3 实验结果56-57

    4.4 本章小结57-58

    第五章 基于确定话题的网络舆情浅析系统的设计与实现58-73

    5.1 系统总体结构58-59

    5.2 系统功能模块设计59-63

    5.2.1 系统总控模块59-61

    5.2.2 信息采集模块61-62

    5.2.3 信息预处理模块62

    5.2.4 舆情识别与浅析模块62-63

    5.3 网络舆情浅析系统平台实现63-71

    5.3.1 信息管理63-65

    5.3.2 信息采集65-68

    5.3.3 舆情浅析68

    5.3.4 浅析展现68-70

    5.3.5 话题追踪验证70-71

    5.4 性能测试71-72

    5.5 本章小结72-73

    第六章 总结与展望73-74

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号