您的位置: turnitin查重官网> 计算机 >> 计算机软件 >试议挖掘基于条件随机场网络短评论挖掘系统和实现

试议挖掘基于条件随机场网络短评论挖掘系统和实现

收藏本文 2024-01-20 点赞:7327 浏览:22405 作者:网友投稿原创标记本站原创

摘要:伴随着WEB2.0时代的进展,互联网上的信息内容不断增加,人们获得准确信息的难度也随着增大。互联网的信息主要是两种:事实信息和观点信息,我们可以通过搜索引擎去获得事实信息却难以有途径去获得互联网上人们对某一事物的观点。由此对评论的挖掘能够为互联网用户提供发现观点信息的途径。评论挖掘是当前自然语言处理领域探讨的热点,主要任务是对评论进行主客观识别和褒贬义浅析。当前在评论挖掘领域的探讨主要是针对通用领域的,效果不佳,对于特定领域的评论挖掘探讨则是过多依赖于人工构建的领域词典。相对于评论文章来说,短评论文本的主要特点是文本短小、内容稀疏、主观性强、构词不规律、领域依赖性强,本论文针对短评论的特点采取条件随机场模型和自动构建的领域词典来进行短评论评价对象和情感词信息的提取。本论文探讨并实现了基于条件随机场的网络短评论挖掘系统,主要工作如下:第一、提取出短评论中的特点对象组合词,然后结合半自动化构建的情感词集构建自定义领域词典;第二、设计符合评论内容结构特点的条件随机场模型,针对评论的内容规律设计了条件随机场的特点函数,使得条件随机场能够准确地挖掘出评论的特点对象和情感词;第三、探讨了特点对象和情感词的匹配算法,提取出评论中的评价对象与情感词对;第四、识别出情感词的情感倾向性。本论文将基于条件随机场的网络短评论挖掘系统运用到挖掘点评网站的餐饮评论的怎么写作评价信息,实验结果证明基于条件随机场模型确实可以有效提取出短评论的特点对象和情感词信息,在加入自动构建的领域词典的情况下能够将模型扩展到其它领域的评论中,用户可以通过挖掘的结果了解到该主题的所有评论的有价值观点信息。关键词:评论挖掘论文情感浅析论文条件随机场论文

    摘要5-6

    Abstract6-7

    目录7-10

    第1章 绪论10-20

    1.1 探讨背景与作用10-12

    1.2 国内外探讨近况12-18

    1.2.1 评论的情感浅析探讨近况12-13

    1.2.2 评论特点对象抽取探讨近况13-14

    1.2.3 条件随机场的探讨近况14-15

    1.2.4 评论挖掘系统构建探讨近况15-16

    1.2.5 国内外技术进展近况浅析与总结16-18

    1.3 论文的探讨内容18

    1.4 论文的组织结构18-20

    第2章 评论挖掘相关技术综述20-26

    2.1 中文分词20

    2.2 组合词识别20-21

    2.3 情感词典构建21-24

    2.3.1 基于语料的情感词典构建21-22

    2.3.2 基于语义知识库的情感词典构建22

    2.3.3 同义词词林22-24

    2.4 短评论特点对象与情感词信息的抽取24-25

    2.5 本章小结25-26

    第3章 条件随机场相关技术26-33

    3.1 条件随机场26-28

    3.1.1 条件随机场概述26

    3.1.2 最大熵模型26-27

    3.1.3 条件随机场模型27-28

    3.2 条件随机场的三个关键不足28-30

    3.2.1 特点函数选择28-29

    3.2.2 参数估计29

    3.2.3 模型推断29-30

    3.3 条件随机场的主要算法30-32

    3.3.1 Viterbi 算法30

    3.3.2 GIS 算法30-31

    3.3.3 IIS 算法31

    3.3.4 L-BFGS 算法31-32

    3.4 本章小结32-33

    第4章 网络短评论挖掘系统的设计33-51

    4.1 网络爬虫设计33

    4.2 页面评论内容提取设计33-34

    4.3 条件随机场挖掘模型设计34-50

    4.3.1 组合特点词提取设计34-42

    4.3.2 情感词典构建设计42-43

    4.3.3 短评论的分词设计43

    4.3.4 网络短评论断句设计43-44

    4.3.5 条件随机场模型设计44-48

    4.3.6 特点与情感词信息提取设计48-50

    4.4 本章小结50-51

    第5章 网络短评论挖掘系统的实现51-69

    5.1 系统实现的总体框架51-53

    5.1.1 系统框架图51

    5.1.2 系统功能组件介绍51-53

    5.2 评论数据收集与预处理53-56

    5.2.1 网络爬虫实现53-54

    5.2.2 短评论内容的提取54-55

    5.2.3 短评论组合特点词提取55-56

    5.3 短评论挖掘56-59

    5.3.1 条件随机场模型结构和算法的实现56-57

    5.3.2 特点对象和情感词的提取57-58

    5.3.3 匹配特点对象与情感词58-59

    5.3.4 对情感词语义倾向性判定59

    5.4 短评论挖掘结果展示59-62

    5.5 主要算法验证实验设计62-63

    5.6 实验结果与浅析63-68

    5.6.1 实验结果评价指标63-64

    5.6.2 实验结果64-67

    5.6.3 实验浅析67-68

    5.7 本章小结68-69

    结论69-70

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号