您的位置: turnitin查重官网> 工程 >> 电气工程 >> 电气工程及自动化 >试议神经网络基于计算智能算法蛋白质温热性识别

试议神经网络基于计算智能算法蛋白质温热性识别

收藏本文 2024-04-22 点赞:5740 浏览:15295 作者:网友投稿原创标记本站原创

摘要:因为蛋白质在高温或极端PH值的环境下非常容易失去活性,这就造成了在一些极端环境中进行蛋白质的大规模的生产运用困难的局面,为此,蛋白质在极端条件下的热稳定表象成为了生物物理和生物技术领域的热点探讨论题,那么如何高效的区分酶的热稳定差别并提升其热稳定性一直是各方科研力量尤其是生物科学探讨者和化学化工探讨者所积极以事的重要探讨课题之一。尤其是我们积极探明的蛋白质的热稳定性是否可以在一级氨基酸序列水平上进行高效快速的检测变得尤为迫切。因为蛋白质的氨基酸序列决定其应有的结构,而其结构决定了其体现出的性质,所以蛋白质一级序列中含有的信息已经足够用来预测蛋白质的热稳定性了,并且这种策略也运用到蛋白质探讨的其他运用领域,具有较好的通用性。以分子生物学、结构生物学的角度出发,氨基酸组成(AA)、二肽组成以及类似于氢键,疏水性等蛋白质的物理化学性质都是影响蛋白质热稳定性的因素。本论文试图以蛋白质一级序列出发,利用这些影响耐热的因素并结合计算智能算法对嗜热和常温蛋白进行识别。如果蛋白质的热稳定性能通过其一级序列进行识别,就可以设计一种基于计算机的筛选策略。借助计算机的高速运算能力,显著提升寻找热稳定性很好的蛋白质的几率,并预测未知来源的蛋白质序列的热稳定性。蛋白质温热性识别不足以本质上来说是机器学习领域经典的监督学习两分类不足,即判断未知蛋白是嗜热蛋白或常温蛋白两类中的哪一类,由此蛋白质温热性识别不足需要集中解决以下两个方面的不足:如何有效地以蛋白质原始的氨基酸序列中提取特点并进行必要的特点选择。这就是通常所说的蛋白质特点提取。之所以要进行特点提取,是因为以数据库中获取的蛋白质是由20个字母组成的长短不一的氨基酸序列,把序列直接作为预测模型的输入进行计算是不现实的,这就需要将氨基酸的字母序列转换成能够被计算机识别的数字序列,也就是进行特点提取,由此特点提取策略的合适与否在很大程度上影响着课题的预测精度。在本论文中,首先尝试了多特点融合实验,因为氨基酸组成是影响酶耐热性的主要因素之一,故在氨基酸组成特点提取算法的基础上融入理化性质(chemcomposition)进而进行蛋白质特点提取,并利用神经网络进行分类识别,较之单一的特点提取方式取得了不错的结果。另一方面,本论文将改善的伪氨基酸特点提取策略引入到蛋白质温热性识别探讨中,因为蛋白质的热稳定性与其诸多的物理化学性质有关,而伪氨基酸组成这一特点提取策略仅仅融入了氨基酸的疏水性、亲水性和侧链原子量三种物理化学性质,故将Z标度引入到伪氨基酸组成中取代原有的氨基酸的疏水性、亲水性和侧链原子量。Z标度(z-scales)是Hellberg等对氨基酸的29个物理化学性质进行主成分浅析,得到的3个显著主成分,并将相应主成分得分矢量作为新的氨基酸描述子。如何根据提取的特点建立有效的分类预测模型。在本论文中选用粒子群算法优化的神经网络(PSO-NN)作为分类器,并尝试运用基于遗传算法的选择性集成对策(GASEN)进行集成探讨,都取得了不错的结果。另外首次将柔性神经树(FNT)作为分类器并结合改善的伪氨基酸特点提取策略进行蛋白质温热性识别。关键词:蛋白质温热性识别论文伪氨基酸组成论文神经网络论文柔性神经树论文集成论文

    摘要7-9

    Abstract9-11

    第一章 绪论11-19

    1.1 引言11

    1.2 蛋白质温热性识别的探讨背景和作用11-12

    1.3 蛋白质温热性识别的生物基础知识12-17

    1.3.1 常温嗜热蛋白的概念及特性12-14

    1.3.2 嗜热蛋白的耐热机制14-17

    1.4 计算智能技术综述17

    1.5 探讨案例和主要工作17-19

    第二章 数据集及分类系统的性能评价19-27

    2.1 数据集的建立、划分19-23

    2.1.1 蛋白质序列数据库介绍19-22

    2.1.2 实验所用数据集的创立及划分22-23

    2.2 分类系统性能度量指标23-27

    2.2.1 评价策略23

    2.2.2 性能评价指标23-27

    第三章 基于神经网络的蛋白质温热性识别27-39

    3.1 实验采取的特点提取策略27-29

    3.2 分类模型-人工神经网络29-36

    3.2.1 神经网络综述29-30

    3.2.2 神经网络的设计30-32

    3.2.3 神经网络的参数优化算法32-36

    3.3 基于粒子群算法优化的神经网络的蛋白质温热性识别36-38

    3.4 结果与讨论38-39

    第四章 基于集成神经网络的蛋白质温热性识别39-45

    4.1 集成学习概述39-41

    4.2 一种基于集成神经网络的蛋白质温热性识别41-43

    4.3 结果与讨论43-45

    第五章 基于改善的伪氨基酸特点提取策略和柔性神经树的蛋白质温热性识别45-59

    5.1 改善的伪氨基酸特点提取策略45-50

    5.2 柔性神经树50-56

    5.2.1 编码规则51-52

    5.2.2 适应值函数52-53

    5.2.3 参数优化算法53-56

    5.3 实验设计和结果56-59

    第六章 总结与展望59-61

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号