您的位置: turnitin查重官网> 下载中心 >支持向量回归在化学农药定量构效关系中应用

支持向量回归在化学农药定量构效关系中应用

收藏本文 2024-01-20 点赞:6299 浏览:19203 作者:网友投稿原创标记本站原创

摘要:化学农药的中心研究问题之一就是新农药的开发——开发对不利于农业生产的植物虫害、病害、杂草等具有期望活性的化合物。农业生产有害物对传统农药的抗性增强以及人们对绿色食品的要求,使新化学农药的创制难度加大,传统方法大量盲目合成再筛选,显然费时、费力、费钱,且对环境带来污染,因此将定量构效关系(QSAR)应用于农药的创制起到了极其的作用。QSAR研究涉及三大问题:表征化合物分子结构的描述符、筛选描述符及选择建模方法。描述符的可查阅文献低维描述符(描述符的个数一般不多于10个,仅能表征化合物的信息),其次可E-Dragon 1.0等软件计算高维描述符(描述符的个数成千上万,能表征绝大化合物信息)。低维描述符的筛选可前期建立的非线性多轮末尾淘汰法,而高维描述符的筛选问题一直未获根本性解决:非线性多轮末尾淘汰法用于高维描述符筛选时计算速度慢、时间耗费巨大;逐步线性回归仅适用于线性问题;主成分分析是用主成分来代替多个描述符的线性加权组合,因此基于主成分建立的模型解释性差。常用于QSAR建模方法有多元线性回归(MLR)、逐步线性回归(SLR)、偏最小二乘回归(PLS)、二次多项式回归(QPR)等线性或拟线性模型,这些传统模型解释性较好,但对高维、非线性、小样本问题的解析能力有限,人工神经网络(ANN)具有很好的非线性逼近能力,但存在模型结构确定、可解释性差、易出现过度训练、训练不足或易陷入局部最小等诸多缺陷,基于统计学习理论的支持向量回归(SVR)较好地解决了小样本、非线性、过拟合、维数灾、局部极小等问题,且泛化推广能力优异。为解决化学农药QSAR研究中合理选择描述符的问题,ChemDrawE-Dragon 1.0对3个化学农药数据集了描述符的计算,均了超过1000个描述符,描述符的类型多达24类,如:结构描述符、拓扑描述符、2D自描述符、3D-MoRSE描述符等,为从中与化合物活性的描述符,基于SVR建立了高维描述符非线性筛选法,杀虫剂、杀菌剂、除草剂等3类化学农药化合物验证,与文献常用描述符了比较分析,结果:1、基于SVR及文献中的描述符对三类化学农药了QSAR研究,包括三元不对称有机磷酸酯类杀虫剂(22个样本)、新型含噻唑和环的亚胺类杀菌剂(17样本)和2-羟基-3-烷基-1,4-萘醌类除草剂(23样本)等。对文献的描述符了分析,发现描述符中大多数描述符间的系数均达到了极,是2-羟基-3-烷基-1,4-萘醌类化合物的描述符HE与ClogP、Polar与ClogP的系数分别达到了0.99和1.00;除了线性关系外,描述符间可能还存在非线性关系,因此实验室前期建立的基于SVR非线性多轮末尾淘汰法筛选描述符。结果发现,对描述符筛选前、后的数据集留一法预测发现,经筛选描述符后的模型性能值(MSE、R2、F值)均提升,证实了该方法能剔除与化合物活性值无关或可被其他参数替代的描述符,且对线性的描述符HE、ClogP和Polar也能的筛选。基于描述符性分析对保留描述符了性排序,给出了描述符对化合物活性值影响的大小排序,增强了模型的可解释性。2、以上描述符选择结果,常用描述符所包涵的信息有限且可能与特定化合物活性并无性,因此所建模型性能一般,建立的高维描述符非线性筛选法,对3个化合农药数据集软件计算的高维描述符筛选,均了明确的、不多于8个的保留描述符。留一法预测结果,经非线性筛选描述符后模型的留一法预测性能均了大幅提升,与原文献的描述符相比优势,充分了新的描述符筛选方法能地从大量描述符中准确地找出与化合物活性的且明确的描述符。SVR回归性测验对所建QSAR模型可用了分析,以及单因子性分析对保留描述符了性排序,增强了所建QSAR模型的可解释性。综上,基于支持向量回归建立了高维描述符非线性筛选法,为化学农药QSAR研究中描述符的选择了理论基础,在化合物的QSAR中具有广泛应用前景。关键词:定量构效关系论文筛选描述符论文支持向量回归论文化学农药论文杀虫剂论文杀菌剂论文除草剂论文

    摘要4-6

    Abstract6-9

    目录9-13

    章 绪论13-36

    1 QSAR的发展历史14-16

    2 QSAR的研究方法16-24

    2.1 二维定量构效关系研究(2D-QSAR)16-18

    2.1.1 Hansch方程16-17

    2.1.2 Free-Wilson模型17-18

    2.1.3 分子连接性法18

    2.2 三维定量构效关系研究(3D-QSAR)18-22

    2.2.1 比较分子力场分析法19-20

    2.2.2 比较分子性法20-21

    2.2.3 虚拟受体法21

    2.2.4 分子形状分析法21-22

    2.2.5 距离几何法22

    2.2.6 比较能分析法22

    2.2.7 其他3D-QSAR方法22

    2.3 多维定量构效关系研究22-24

    3 QSAR的基本研究24-34

    3.1 数据的和整理24-25

    3.2 生成及优化分子结构式25-27

    3.2.1 ChemOffice25-26

    3.2.2 ChemWindow26-27

    3.3 计算及选择分子结构描述符27-30

    3.3.1 经验性描述符27-28

    3.3.2 组成描述符28-29

    3.3.3 拓扑描述符29

    3.3.4 几何描述符29

    3.3.5 电荷描述符29

    3.3.6 量子化学描述符29-30

    3.3.7 其他描述符30

    3.4 选择合适的QSAR建模方法并建立QSAR模型30-34

    3.4.1 偏最小二乘法31

    3.4.2 遗传算法31-32

    3.4.3 人工神经网络32-33

    3.4.4 支持向量回归33-34

    3.5 检验QSAR模型34

    4 本论文研究内容34-36

    章 基于常用描述符的化学农药QSAR研究36-65

    1 引言36-38

    2 与方法38-54

    2.1 数据集38-51

    2.1.1 数据集1:三元不对称有机磷酸酯类杀虫剂38-42

    2.1.2 数据集2:新型含噻唑和环的亚胺类杀菌剂42-46

    2.1.3 数据集3:2-羟基-3-烷基-1,4-萘醌类除草剂46-51

    2.2 分析51-52

    2.3 基于均方误差的非线性多轮末尾淘汰法筛选描述符52

    2.4 回归模型性检验52-53

    2.5 描述符性分析53

    2.6 评价指标53-54

    3 结果与讨论54-63

    3.1 三元不对称有机磷酸酯类杀虫剂的QSAR研究54-56

    3.1.1 分析结果54-55

    3.1.2 非线性多轮末尾淘汰法筛选描述符结果分析55-56

    3.1.3 描述符性分析结果56

    3.2 新型含噻唑和环的亚胺类杀菌剂QSAR研究56-60

    3.2.1 分析结果56-57

    3.2.2 非线性多轮末尾淘汰法筛选描述符结果分析57-59

    3.2.3 描述符性分析结果59-60

    3.3 2-羟基-3-烷基-1,4-萘醌类除草剂QSAR研究60-63

    3.3.1 分析结果60-61

    3.3.2 非线性多轮末尾淘汰法筛选描述符结果分析61-63

    3.3.3 描述符性分析结果63

    4 小结63-65

    章 高维描述符非线性筛选法的建立及用于化学农药QSAR研究65-86

    1 引言65-66

    2 数据与方法66-71

    2.1 分子描述符的计算和特征选取66-70

    2.1.1 ChemDraw绘制化合物分子结构并分子式66-67

    2.1.2 E-Dragon 1.0计算描述符67-70

    2.2 基于SVR的高维描述符非线性筛选70-71

    3 结果与分析71-84

    3.1 三元不对称有机磷酸酯类杀虫剂的QSAR研究71-74

    3.1.1 高维描述符非线性筛选结果与分析72-74

    3.1.2 描述符性分析结果74

    3.2 新型含噻唑和环的亚胺类杀菌剂QSAR研究74-80

    3.2.1 高维描述符非线性筛选结果与分析75-79

    3.2.2 描述符性分析结果79-80

    3.3 2-羟基-3-烷基-1,4-萘醌类除草剂QSAR研究80-84

    3.3.1 高维描述符非线性筛选结果与分析81-84

    3.3.2 描述符性分析结果84

    4 小结84-86

    章 与展望86-88

    1 86-87

    2 展望87-88

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号