您的位置: turnitin查重官网> 汉语言文学 >> 古代文学 >分析蒙古语基于蒙古语影视剧语料库话语标记网

分析蒙古语基于蒙古语影视剧语料库话语标记网

收藏本文 2024-04-12 点赞:5120 浏览:12810 作者:网友投稿原创标记本站原创

摘要:蒙古语话语标记是处于句子之外表达程序作用,能对话语的理解起到引导作用的词、短语和习惯表达式。它们形式多样,功能复杂,以而影响句法浅析的效果。由此,对蒙古语话语标记进行探讨有着重要的论述作用和实践价值。本论文主要探讨的内容有:1)蒙古语话语标记的界定和分类蒙古语话语标记是一个复杂的语言现象,对它的界定和分类不足需要多层次、多角度的探讨和浅析。本论文根据句法的可分离性、语义的程序性、功能的元语用性,总结出蒙古语话语标记的特点,把蒙古语话语标记分为14类,并对每一类话语标记的语用功能进行了说明。2)蒙古语影视剧语料库的构建如何构建蒙古语影视剧语料库直接影响到话语标记的探讨价值,它反映了在其基础上开展的探讨是否具有合理性和可靠性。在这方面,本论文围绕与语料库构建密切相关的语料库设计、语料收集、语料的组织结构等不足进行了探讨。蒙古语影视剧语料库的设计方面介绍了建库的目的和思路;语料的收集方面,围绕语料的代表性和平衡性不足,对语料的分类和比例、分布和样本的选取、语料的流通度等进行了探讨;语料组织方面,对语料的存储格式、数据信息和软件工具进行了介绍。3)蒙古语话语标记的自动标注和实验浅析本探讨旨在提升句法浅析的准确率以及为篇章浅析提供连贯性显化信息,对蒙古语影视剧语料库中出现的话语标记进行语用功能的自动标注。本论文在蒙古语话语标记语用功能分类基础上,制定了蒙古语话语标记自动识别规则,开发了蒙古语话语标记标注系统。第一,根据话语标记的形式特点,经过运算和推导获得话语标记的词法结构信息。第二,以语料库中人工筛选出话语标记,将它们存入基本词表,对其语用功能给出相应的代码,建立符合每一类话语标记特点的标注规则。第三,根据规则开发话语标记自动标注系统,对影视剧语料库中的话语标记进行自动标注。实验结果表明,该系统对30万词级影视剧语料库进行标注后,召回率为54.26%,准确率为85.58%。4)有着的不足和解决案例就测试结果来看,召回率和准确率都不是很高,究其理由,主要有以下几方面。第一,规则对兼类话语标记的识别率不高。第二,由于受语料内容、题材、规模等方面的限制,话语标记的出现频率影响了话语标记的召回率。第三,不符合语言事实的垃圾字串,影响话语标记的召回率。第四,蒙古语影视剧语料库的加工程度严重制约了蒙古语话语标记自动标注的准确率。针对上面陈述的不足,我们在后续工作中,准备以以下几方面对系统进行改善和改善。首先,扩充训练集的语料规模,使语料库更为贴近语言事实。其次,改善机器词典,增加信息含量。最后,在基于规则的算法上加入统计模型。综上所述,本论文在话语标记相关论述和实践方面的探讨成果上,以蒙古语影视剧语料库中的话语标记为探讨对象,对蒙古语话语标记的界定和分类、蒙古语话语标记的自动标注和实验浅析以及有着的不足和解决案例等不足进行了探讨。全文共分为五章。第一章介绍了国内外话语标记的相关论述和实践方面的探讨成果,以及本探讨的策略、作用以及革新点。第二章主要对蒙古语话语标记的涵义、有着动因和形成条件、蒙古语话语标记的语用功能分类系统等相关不足进行了探讨。第三章针对蒙古语影视剧语料库的设计、代表性和平衡性、语料库的组织结构等不足进行了探讨。第四章在蒙古语话语标记语用功能分类基础上,开发了蒙古语话语标记标注系统并提取了实验数据。第五章对全文进行了概括总结后指出了本探讨的不足,同时对今后的工作指明了方向。关键词:蒙古语话语标记论文蒙古语影视剧语料库论文语用功能论文自动标注论文

    摘要4-6

    ABSTRACT6-9

    目录9-12

    表目12-13

    图目13-14

    第一章 话语标记探讨综述14-29

    1.1 国外话语标记探讨概况14-23

    1.1.1 句法—语用角度的探讨16-17

    1.1.2 语义—语用角度的探讨17-19

    1.1.3 认知—语用角度的探讨19-21

    1.1.4 基于语料库的探讨21-23

    1.2 国内话语标记探讨概况23-25

    1.3 有着的不足25

    1.4 本论文探讨的内容25-26

    1.5 本论文探讨的作用26-27

    1.5.1 论述作用26-27

    1.5.2 运用价值27

    1.6 论文章节安排27-29

    第二章 蒙古语话语标记的剖析和分类29-54

    2.1 蒙古语话语标记的涵义29-33

    2.1.1 蒙古语话语标记与相关概念的区分29-31

    2.1.2 蒙古语话语标记的界定31-33

    2.1.2.1 句法的可分离性31-32

    2.1.2.2 作用的程序性32

    2.1.2.3 元语用意识32-33

    2.2 蒙古语话语标记的有着动因和形成条件33-34

    2.2.1 蒙古语话语标记的有着动因33-34

    2.2.2 蒙古语话语标记的语法化条件34

    2.3 蒙古语话语标记的语用功能及分类系统34-54

    2.3.1 蒙古语话语标记的语用功能34-42

    2.3.1.1 蒙古语话语标记的人际交互功能36-38

    2.3.1.2 蒙古语话语标记的语篇组织功能38-42

    2.3.2 蒙古语话语标记的语用功能分类42-54

    2.3.2.1 议题标记42-43

    2.3.2.2 求证性标记43-44

    2.3.2.3 回应性标记44

    2.3.2.4 评价性标记44-45

    2.3.2.5 言语方式标记45-46

    2.3.2.6 信息来源标记46-47

    2.3.2.7 换言标记47-48

    2.3.2.8 话语制约标记48-49

    2.3.2.9 推理性标记49-50

    2.3.2.10 比较性标记50

    2.3.2.11 阐明性标记50-51

    2.3.2.12 溯因性标记51-52

    2.3.2.13 延缓标记52-53

    2.3.2.14 感情标记53-54

    第三章 蒙古语影视剧语料库的构建54-71

    3.1 蒙古语影视剧语料库设计思想54-55

    3.1.1 建库的目的54-55

    3.1.2 建库的思路55

    3.2 代表性和平衡性不足55-65

    3.2.1语料的分类和各种类型的比例56-59

    3.2.2 探讨对象的分布及语料样本的选取59-62

    3.2.3 语料的流通度62-65

    3.3 语料库的组织结构65-71

    3.3.1 存储格式65-66

    3.3.2 数据信息66

    3.3.3 软件工具66-71

    第四章 蒙古语话语标记的标注和实验浅析71-105

    4.1 蒙古语话语标记的词法浅析71-73

    4.1.1 词典组织结构72

    4.1.2 算法描述和流程图72-73

    4.2 蒙古语话语标记内部结构的规则描述73-99

    4.2.1 算法描述及流程图73-77

    4.2.1.1 算法描述73-76

    4.2.1.2 流程图76-77

    4.2.2 形式规则的符号说明77-78

    4.2.2.1 符号77

    4.2.2.2 话语标记功能代码和基本词表77-78

    4.2.3 蒙古语话语标记规则集78-99

    4.2.3.1 议题标记规则78-84

    4.2.3.2 求证标记规则84-89

    4.2.3.3 回应性标记规则89-91

    4.2.3.4 评价性标记规则91-92

    4.2.3.5 言语方式标记规则92-93

    4.2.3.6 信息来源标记规则93-94

    4.2.3.7 换言标记规则94

    4.2.3.8 话语制约标记规则94-95

    4.2.3.9 推理性标记规则95-96

    4.2.3.10 比较性标记规则96

    4.2.3.11 阐明性标记规则96-97

    4.2.3.12 溯因性标记规则97-98

    4.2.3.13 延缓标记规则98

    4.2.3.14 感情标记规则98-99

    4.3 蒙古语话语标记自动标注系统99-105

    4.3.1 系统实现99

    4.3.2 测试结果浅析99-105

    4.3.2.1 对错误标注结果的浅析99-101

    4.3.2.2 改善的策略和方向101-105

    结语105-107

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号