您的位置: turnitin查重官网> 计算机 >> 计算机软件 >文档算法和运用

文档算法和运用

收藏本文 2024-02-21 点赞:24688 浏览:116773 作者:网友投稿原创标记本站原创

摘要:文档摘要是解决“信息爆炸”和信息过载不足的一种可行途径,而且可以为广泛利用的手持便携设备生成简洁的文本,缓解其屏幕小、阅读大量信息不方便的不足。本论文针对文档摘要中的文本单元排序与抽取不足、结构化摘要生成、句子压缩以及基因文本摘要等关键不足展开探讨,取得了具有一定论述和实用价值的成果。本论文的工作包括:1.对抽取式文档摘要的两个关键不足——文本单元的排序与抽取进行了系统的比较探讨与深入浅析。在标准评测数据集上的实验结果表明了pairwise和pstwise排序学习策略以及基于整数线性规划的句子抽取策略的优势。进而,本论文提出了一种广义感知器学习和整数规划摘要生成相结合的联合学习摘要框架,取得了较好的效果。然后本论文对抽取式摘要系统的性能上限进行了探讨。2.探讨结构化文档摘要中的冗余去除和内容多样化不足,提出了一种基于预定义aspects生成结构化摘要的框架,生成摘要时该框架以最大化所有aspects所描述信息需求的期望满意度为目标。对给定的aspects和文档集采取Labeled LDA模型进行建模,并基于概率推理计算各个aspect的重要量以及句子与aspect的相关性,生成结构化摘要。3.提出了一种基于马尔科夫逻辑网,通过删除单词进行英文句子压缩的策略。该策略用一阶逻辑公式表示单词的局部特点以及单词之间的相互依赖联系,判断单词是否应该删除。该策略既融合了丰富的句子特点,又以逻辑公式方便地表示全局约束。在书面和口语两个新闻数据集上的实验结果表明该策略的压缩结果好于两个最新的系统。4.探讨基因文本自动摘要,实现了一个以生物学文献中自动抽取代表性句子生成基因文本摘要的系统GeneSum。该系统利用ListNet排序学习算法,融合了多种文本特点和生物学数据资源,对生物文献中的句子进行排序,然后基于整数线性规划选取代表性句子生成摘要。我们在包含7294个基因的数据集上对系统进行了评测,并对测试结果进行了深入浅析。关键词:文档摘要论文排序学习论文结构化摘要论文句子压缩论文基因文本摘要论文

    摘要4-5

    Abstract5-10

    主要符号对照表10-11

    第1章 引言11-24

    1.1 探讨背景及作用11-12

    1.2 文档摘要概述12-14

    1.3 文档摘要相关探讨14-19

    1.3.1 文本单元的排序与抽取14-17

    1.3.2 结构化文档摘要17-18

    1.3.3 句子压缩18-19

    1.3.4 基因文本摘要19

    1.4 文档摘要系统性能评价系统19-22

    1.5 探讨重点与内容安排22-24

    第2章 文本单元的排序与抽取探讨24-44

    2.1 本章引论24-26

    2.2 基于排序学习的文本单元打分26-28

    2.2.1 支持向量回归26-27

    2.2.2 RankNet 排序27

    2.2.3 ListNet 排序27-28

    2.3 文本单元的抽取与摘要生成28-31

    2.3.1 基于整数规划的摘要生成28-30

    2.3.2 基于最大边际相关性的摘要生成30

    2.3.3 基于多样性惩罚的摘要生成30-31

    2.4 基于广义感知器的联合学习框架31-34

    2.4.1 摘要模型31-32

    2.4.2 联合学习框架32-34

    2.5 实验与结果浅析34-43

    2.5.1 数据集34-36

    2.5.2 排序算法比较与浅析36-38

    2.5.3 摘要生成算法的比较与浅析38-39

    2.5.4 联合学习实验结果与浅析39-42

    2.5.5 自动摘要性能上限探讨42-43

    2.6 本章小结43-44

    第3章 基于预定义 aspects 的结构化摘要生成策略44-60

    3.1 本章引论44-45

    3.2 基于预定义 aspects 的结构化摘要生成45-51

    3.2.1 摘要生成框架46-48

    3.2.2 基于 Labeled LDA 的 aspects 建模48-50

    3.2.3 句子与 aspect 的相关性度量50-51

    3.3 实验与结果浅析51-58

    3.3.1 数据集51-52

    3.3.2 Aspect 特点词的抽取52-53

    3.3.3 文档集建模结果53-54

    3.3.4 摘要质量评估54-58

    3.4 本章小结58-60

    第4章 基于马尔可夫逻辑网的句子压缩策略60-72

    4.1 本章引论60-61

    4.2 马尔可夫逻辑网61-62

    4.3 基于马尔可夫逻辑网的句子压缩模型62-66

    4.3.1 局部公式63-65

    4.3.2 全局公式65-66

    4.4 实验与结果浅析66-71

    4.4.1 数据集66-67

    4.4.2 实验结果67-70

    4.4.3 错误浅析70-71

    4.5 本章小结71-72

    第5章 基因文本自动摘要72-86

    5.1 本章引论72-73

    5.2 相关探讨概述73-75

    5.3 基因文本摘要系统75-79

    5.3.1 系统结构75-76

    5.3.2 句子排序76-78

    5.3.3 摘要生成78-79

    5.4 实验与结果浅析79-85

    5.4.1 评测数据集79-80

    5.4.2 参数调整80-82

    5.4.3 评测结果82-84

    5.4.4 系统展示84-85

    5.5 本章小结85-86

    第6章 总结与展望86-88

    6.1 论文的主要贡献86-87

    6.2 进一步工作展望87-88

    插图索引88-89

    表格索引89-90

    公式索引90-92

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号