您的位置: turnitin查重官网> 下载中心 >若干有机小分子生物活性和毒性识别与预测

若干有机小分子生物活性和毒性识别与预测

收藏本文 2024-02-06 点赞:11980 浏览:47485 作者:网友投稿原创标记本站原创

摘要:近些年来,伴人类等生物物种基因组学、信息技术和生物检测手段的不断发展,生物信息资源日渐丰富,生物信息学作为新兴的交叉学科应运而生。理论研究者可以在实验的数据基础上加工、存储等,利用机器学习方法分析,从中找出隐含的规律和模式,从而加深对事物的认识,揭示数据所蕴含的生物学。就是这一研究方法着手若干有机小分子生物活性和毒性的识别及预测。的主体工作分为三个::基于集成学习算法的小分子生物功能预测如何准确并地确定小分子生物功能是一个挑战,小分子生物功能预报研究具有。本内容中运用集成学习算法来解决问题。尝试用AdaBoost-.5算法建模,用官能团组成来实现小分子编码,完成小分子代谢途径类型预测等研究。小分子生物功能的研究可以帮助认识疾病机理、理解生命现象。本研究所建立的模型出较好的预测性能,其交叉验证预报准确率为73.71%,对独立测试集的预报准确率达73.8%。建立的预测模型,开发了相应的小分子代谢途径类型预报的在线怎么写作系统,有关WEB界面见chemdata.shu.edu.cn/pathway/。:基于集成学习算法的代谢中酶和小分子作用的预测酶和小分子之间作用的信息对于理解酶和小分子的新陈代谢作用和其它生物非常。中应用AdaBoost,Bagging and KNN等不同的分类器组合,多分类器系统来预测酶和小分子在代谢中的作用。研究:多分类器系统的预报结果优于任何单个分类器预报的结果。的训练数据集和独立测试集的预报准确率分别为82.8%和84.8%。其中对于酶和小分子作用对(即正样本)独立测试集的预报准确率为75.5%,比之前文献报道的准确率高出4个百分点。本工作的预报方法的内容已建立在WEB怎么写作器上,地址为chemdata.shu.edu.cn/all-enz/。:基于支持向量机回归的麻醉药毒性构效关系研究本工作中,支持向量机回归方法、多元线性回归、偏最小二乘法及逆传播人工神经网络研究了39个麻醉药毒性的定量构效关系。从若干量子化学计算参数中筛选出能建模的分子描述符。所得SVR,MLR,PLS,BP-ANN模型的均方根差分别为0.283,0.385,0.392和0.466。结果,所建支持向量机回归模型的预报精度高于MLR、PLS和BP-ANN方法所得的结果。支持向量机方法有望结构毒性关系研究领域中的化学计量学工具。关键词:生物信息学论文机器学习论文集成学习算法论文支持向量机(SVM)论文酶论文小分子论文代谢途径论文官能团组成论文多分类器论文麻醉药毒性论文定量结构-性能关系论文

    摘要8-10

    ABSTRACT10-13

    目录13-16

    章 前言16-22

    1.1 生物信息学简介16-17

    1.2 机器学习算法在蛋白质组研究中的应用17-18

    1.3 构效关系简介18-20

    1.4 在线Web 预报系统简介20-21

    1.5 小结21-22

    章 机器学习算法22-51

    2.1 基本学习算法22-31

    2.1.1 多元线性回归22-23

    2.1.2 模式识别方法23-25

    2.1.2.1 偏最小二乘法23-25

    2.1.2.2 最近邻算法25

    2.1.3 决策树算法25-30

    2.1.3.1 .526-28

    2.1.3.2 随机决策树算法28-29

    2.1.3.3 随机森林算法29-30

    2.1.4 人工神经网络30-31

    2.2 支持向量机算法31-43

    2.2.1 统计学习理论简介32-34

    2.2.2 支持向量分类算法34-39

    2.2.2.1 线性可分情形34-36

    2.2.2.2 非线性可分情形36-37

    2.2.2.3 支持向量机的核函数37-39

    2.2.3 支持向量回归方法39-41

    2.2.3.1 线性回归情形39-40

    2.2.3.2 非线性回归情形40-41

    2.2.4 支持向量机分类与回归算法的实现41-42

    2.2.5 应用前景42-43

    2.3 集成学习算法43-47

    2.3.1 算法Voting43-44

    2.3.2 Boosting 算法44-45

    2.3.3 AdaBoost 算法45-46

    2.3.4 Bagging 算法46-47

    2.4 特征筛选47-50

    2.4.1 mRMR 变量筛选方法47-48

    2.4.2 CFS 变量筛选方法48-50

    2.5 小结50-51

    章 基于集成学习算法的小分子生物功能预测51-66

    3.1 前言51-52

    3.2 及方法52-56

    3.2.1 数据集52-53

    3.2.2 化合物编码53-56

    3.3 结果与讨论56-63

    3.3.1 模型的优化56-60

    3.3.2 预报模型评估60-61

    3.3.3 AdaBoost 算法与其它算法预测性能比较61-63

    3.4 Web 怎么写作开发63-65

    3.5 小结65-66

    章 基于集成学习算法的代谢中酶和小分子作用的预测66-76

    4.1 前言66-67

    4.2 方法67-68

    4.2.1 多分类器67

    4.2.2 分类器系统的建立67-68

    4.3 数据集和编码方法68-72

    4.3.1 数据集68

    4.3.2 编码方法68-69

    4.3.3 小分子的表征69

    4.3.4 酶的表征69-72

    4.4 结果和讨论72-75

    4.4.1 预报准确率72

    4.4.2 系统的选择72-73

    4.4.3 单个分类器和系统的比较73-75

    4.4.4 系统分析75

    4.5 小结75-76

    第五章 基于支持向量机回归的麻醉药毒性构效关系研究76-88

    5.1 前言76-77

    5.2 及方法77-79

    5.2.1 数据集77-78

    5.2.2 计算机硬件和软件78-79

    5.2.3 量子化学描述符79

    5.3 结果与讨论79-87

    5.3.1 描述符选择79-81

    5.3.2 SVR 模型参数选择81-84

    5.3.3 SVR 模型84-85

    5.3.4 SVR 模型验证85

    5.3.5 SVR 模型的留一法预报结果85-86

    5.3.6 与其他数据挖掘方法比较86-87

    5.4 小结87-88

    第六章 与展望88-91

    6.1 88-89

    6.2 展望89-91

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号