您的位置: turnitin查重官网> 工程 >> 电气工程 >> 电气工程及自动化 >算法基于遗传算法优化中文分词

算法基于遗传算法优化中文分词

收藏本文 2024-04-16 点赞:4391 浏览:12893 作者:网友投稿原创标记本站原创

摘要:遗传算法是智能优化算法之一,它具有搜索速度快、通用性好以及全局搜索能力强等优点,但有着局部搜索能力差的不足,容易出现把局部最优解误认为全局最优解的“早熟不足”。单一算法在解决实际不足中暴露出各种各样的不足,所以不少学者提出了结合两种算法或者多种算法的混合算法思想,以求扬长避短。本论文主要探讨遗传算法(GA)分别与粒子群优化算法(PSO)和生物免疫机制相结合的新算法并把新算法运用到中文分词的歧义处理方面,主要探讨成果及革新如下:1、在遗传算法的基础上,针对粒子群算法容易陷入局部极值的缺点,提出了新的基于遗传思想改善的粒子群优化算法(GA-PSO)。该算法在PSO迭代中对粒子可能陷入局部极值的情况进行判断,以便引入GA算子,对陷入局部极值的粒子进行交叉和变异操作,帮助其能尽快地跳出局部最优而进行全局寻优。将新的GA-PSO算法作为学习算法对BP神经网络进行训练。通过实验证明新算法训练的神经网络在处理异或分类不足时较基于经典的PSO算法训练的神经网络具有求解精度高、迭代次数少、运转时间短等优点。此外,基于新的GA-PSO的BP算法能避开经典的BP算法容易陷入局部极值、学习时间长、收敛速度慢等不足,又比基于粒子群的BP算法收敛速度快、搜索时间短且更不易陷入局部极值。最后将新算法通过运用到中文分词领域的歧义处理部分,对算法的有效性进行了验证。2、在经典PSO算法的基础上,针对仍然可能有着的粒子数的增加将加大算法的计算复杂度,而减弱粒子对全局最优点的追逐又使算法不易收敛的不足,提出了基于模糊C-均值聚类算法(FCM)的粒子群优化算法(FPSO)。该算法在迭代历程中先由FCM算法把粒子群分成多个子群体,然后子群中的粒子据其个体极值及子群中的最优粒子更新其速度和位置值。当PSO算法实施历程中遇到陷入局部极值的情况再按带有判断功能的GA-PSO算法进行处理。FPSO算法通过对粒子群的模糊聚类,充分交换了粒子间的信息,还在迭代寻优历程中利用更多粒子包含的信息,大大加强了算法的全局收敛性。通过实验和运用到中文分词的歧义处理中验证了该算法可以显著地减少迭代次数,收敛精度也得到了很大的提升,与传统的BP算法相比,其泛化性能也更优越。3、在基本遗传算法的基础上,针对免疫机制进行了探讨,主要对象是基于疫苗接种的免疫遗传算法(IGA),探讨如何对疫苗进行合理的提取和适时的接种。本论文提出了一种新的疫苗提取算法,利用模糊聚类算法来提取优秀抗体的相似基因作为疫苗,在疫苗接种历程中采取的免疫选择机制,这就保证了抗体群不因接种疫苗而发生退化。然后,在抗体群更新历程采取聚类选择算法,在优秀抗体得到保留的前提下,使得抗体群中各抗体间的差别也尽可能地大,以避开算法早熟收敛。针对BP神经网络的训练,设计了一种新的精英抗体培养对策,将适应度高、相互差别大的抗体定义为精英抗体。改善的免疫遗传算法在每次迭代后期利用该对策提取精英,对精英采取最速下降法进行强化训练,使其向极值点更靠近一步。最后在浅析了进化神经网络及神经网络分词法优势的基础上,将改善的免疫遗传算法运用到了基于神经网络的中文分词模型中对歧义进行处理。关键词:遗传算法论文粒子群优化算法论文免疫遗传算法论文神经网络论文中文分词论文

    摘要5-7

    Abstract7-14

    第一章 绪论14-20

    1.1 探讨背景14-17

    1.1.1 优化14-15

    1.1.2 遗传算法(GA)15-16

    1.1.3 中文分词16-17

    1.2 本论文主要探讨内容及革新17-18

    1.3 本论文结构18-20

    第二章 探讨基础20-32

    2.1 引言20-21

    2.2 人工神经网络(ANN)21-24

    2.2.1 基本原理21-23

    2.2.2 神经网络学习和泛化23-24

    2.3 BP神经网络24-26

    2.3.1 BP神经网络介绍24-25

    2.3.2 BP算法的缺陷25-26

    2.4 基于神经网络(ANN)的中文分词模型26-31

    2.4.1 中文分词的形式化描述26-27

    2.4.2 基于神经网络(ANN)的中文分词模型27-31

    2.5 本章小结31-32

    第三章 改善的基于遗传算法的粒子群优化算法32-60

    3.1 引言32-33

    3.2 粒子群优化算法的基本原理33-38

    3.2.1 算法概述33-35

    3.2.2 算法流程35

    3.2.3 算法参数35-38

    3.3 粒子群算法在神经网络中的运用38-39

    3.4 粒子群算法与遗传算法39-43

    3.4.1 两种算法的比较39-41

    3.4.2 两种算法的结合41-43

    3.5 改善的GA-PSO算法43-53

    3.5.1 算法描述43-45

    3.5.2 在神经网络中的运用45-49

    3.5.3 实验及结果浅析49-53

    3.6 基于GA-PSO算法优化的神经网络在中文分词中的运用53-59

    3.7 本章小结59-60

    第四章 基于模糊 C-均值聚类算法的 PSO 算法(FPSO)60-80

    4.1 引言60

    4.2 模糊聚类60-62

    4.2.1 模糊 C-均值聚类61-62

    4.3 FPSO 算法62-71

    4.3.1 算法描述62-64

    4.3.2 算法收敛性浅析64-65

    4.3.3 算法性能测试65-71

    4.4 FPSO 算法在神经网络中的运用71-74

    4.4.1 FPSO算法训练 BP 神经网络71

    4.4.2 实验及结果浅析71-74

    4.5 FPSO算法在中文分词中的运用74-78

    4.6 本章小结78-80

    第五章 免疫遗传算法80-87

    5.1 引言80

    5.2 遗传算法80-83

    5.2.1 标准遗传算法80-81

    5.2.2 遗传算法的数学原理81-82

    5.2.3 实数编码的遗传算法82-83

    5.3 免疫遗传算法83-84

    5.4 基于疫苗接种的免疫遗传算法84-85

    5.5 免疫遗传算法的运用85-86

    5.6 本章小结86-87

    第六章 改善的免疫遗传算法87-100

    6.1 引言87

    6.2 免疫疫苗提取算法87-89

    6.2.1 基于聚类的疫苗提取87-89

    6.3 疫苗接种及免疫选择89-90

    6.4 精英抗体培养对策90-91

    6.5 改善的基于疫苗接种的免疫遗传算法91-95

    6.5.1 算法描述91-94

    6.5.2 实验及结果浅析94-95

    6.6 改善的免疫遗传算法在中文分词中的运用95-99

    6.7 本章小结99-100

    第七章 结束语100-103

    致谢103-104

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号