摘要:方言数据库是基于计算机基础之上,以方言字音、词汇、句篇、俗语等为主要内容,集数据库设计、语料采集、标注和索引为一体的语料库。本论文结合语料库语言学、方言学和数据库的建设实践,尝试以方言数据库建设的系统工程,方言语料的采集和标注三个方面探讨方言数据库建设的策略和论述,希望能为方言数据库的探讨尽点微薄之力。本论文所举方言语料多为第一手调查所得,调查工具主要有TFW和bybly软件等。论文包括绪论,方言数据库研制的系统工程,方言语料的采集,方言数据库语料的标注,方言数据库的建设构想和相关不足讨论,结语共六个部分。第一部分:绪论主要介绍了论文选题背景,方言数据库的探讨综述、策略、思路、价值和作用。第二部分:方言数据库研制的系统工程系统工程是方言数据库建设的基本框架,本论文以数据库规划、设计、标注、语料采集和数据库实现,数据库利用和维护五个方面讨论了方言数据库在不同研制阶段需注意的不足,并提出了一些解决策略。第三部分:方言语料的采集语料是方言数据库的根本,这一部分先讨论了方言田野调查的相关论述,然后以这些论述为基础,分别以语音、词汇和特点句三个方面详细讨论了方言语料的采集历程及需注意的不足,并结合数据库的建库实践,提出了一些解决措施。第四部分:方言数据库的标注标注是方言数据库的保障,这一部分以汉语语料库的标注为论述背景,以标注范围、原则和具体历程三个方面讨论了方言文本、口语资源和数据库元数据的标注策略,并对标注的价值做了一些设想和探讨。第五部分:方言数据库的建设构想和相关不足探讨方言数据库建设起步较晚,还有许多不足和困难亟需解决,笔者以语料平衡性、方言录音工具、语料标注、语料索引四个方面详细讨论了当前方言数据库建设有着的不足,并提出了一些设想。第六部分:结语归纳全文,同时指出方言数据库的研制是一个系统、复杂的历程,目前在缺少综合型方言数据库建设经验和论述指导的情况下,本论文只是一孔之见,深知还很稚嫩。关键词:数据库论文方言论文建设论文
摘要2-3
Abstract3-6
1 绪论6-11
1.1 方言数据库探讨综述6-8
1.2 论文选题背景8-9
1.3 论文的探讨策略和作用9-11
2 方言数据库研制的系统工程11-15
2.1 数据库规划阶段12
2.2 数据库设计阶段12-13
2.3 方言语料采集和数据库实现阶段13-14
2.4 方言数据库标注阶段14
2.5 数据库利用和维护阶段14-15
3 方言语料的采集15-27
3.1 方言语音语料的调查和采集17-21
3.1.1 方言语音语料的采集17-19
3.1.2 方言语音语料采集需注意不足及解决策略19-21
3.2 方言词汇语料的调查和采集21-25
3.2.1 方言词汇语料的采集21-24
3.2.2 方言词汇语料采集需注意不足及解决策略24-25
3.3 方言特点句语料的调查和采集25-27
3.3.1 方言特点句语料的采集25-26
3.3.2 方言特点句语料采集需注意的不足及解决策略26-27
4 方言数据库的标注27-36
4.1 汉语语料库的标注27-28
4.2 方言数据库的语料标注范围28-29
4.3 方言数据库的标注原则29-30
4.4 方言数据库的标注历程30-34
4.5 方言数据库标注价值探讨34-36
5 方言数据库的建设构想和相关不足探讨36-42
5.1 方言数据库语料平衡性的探讨36-37
5.2 方言录音工具的讨论37-38
5.3 方言数据库语料标注的讨论和构想38-40
5.4 方言数据库索引方面的构想40-42
6 结语42-43