摘要4-5
Abstract5-8
第一章 绪论8-11
1.1 探讨背景及作用8-9
1.2 国内外探讨近况9-10
1.2.1 国外探讨近况9
1.2.2 国内探讨近况9-10
1.3 本论文的主要工作和内容安排10-11
第二章 网络舆情浅析相关论述11-27
2.1 网络舆情基本概念及特点11-14
2.1.1 网络舆情的基本概念11
2.1.2 网络舆情的主要特点11-14
2.2 网络舆情发现技术14-26
2.2.1 网页获取技术14
2.2.2 网页剖析技术14-16
2.2.3 中文分词16-20
2.2.4 文本分类20-23
2.2.5 文本聚类23-26
2.3 本章小结26-27
第三章 舆情信息获取处理技术27-41
3.1 信息采集技术27-35
3.1.1 网页重要度评定标准27-32
3.1.2 网络爬虫原理及功能32-34
3.1.3 爬虫抓取对策浅析34-35
3.2 信息预处理技术35-40
3.2.1 HTML 文本预处理36-39
3.2.2 中文分词系统39-40
3.3 本章小结40-41
第四章 热点信息发现与跟踪技术41-58
4.1 热点话题发现技术41-48
4.1.1 话题发现的文本聚类算法42-46
4.1.2 各聚类算法的比较与选取46-48
4.2 热点话题跟踪技术48-52
4.2.1 话题跟踪的文本分类算法48-51
4.2.2 各分类算法的比较与选取51-52
4.3 SVM 算法的改善52-57
4.3.1 基于遗传算法的 SVM 算法参数优化52-54
4.3.2 基于 PCA 算法改善遗传算法的 SVM 算法参数优化54-56
4.3.3 实验结果56-57
4.4 本章小结57-58
第五章 基于确定话题的网络舆情浅析系统的设计与实现58-73
5.1 系统总体结构58-59
5.2 系统功能模块设计59-63
5.2.1 系统总控模块59-61
5.2.2 信息采集模块61-62
5.2.3 信息预处理模块62
5.2.4 舆情识别与浅析模块62-63
5.3 网络舆情浅析系统平台实现63-71
5.3.1 信息管理63-65
5.3.2 信息采集65-68
5.3.3 舆情浅析68
5.3.4 浅析展现68-70
5.3.5 话题追踪验证70-71
5.4 性能测试71-72
5.5 本章小结72-73
第六章 总结与展望73-74