您的位置: turnitin查重官网> 工程 >> 电气工程 >> 电气工程及自动化 >序列蛋白质序列特点表达与其在亚细胞定位预测中运用

序列蛋白质序列特点表达与其在亚细胞定位预测中运用

收藏本文 2024-03-08 点赞:17770 浏览:73230 作者:网友投稿原创标记本站原创

摘要:分子药物设计是利用蛋白质的结构和功能信息来造福人类的有力工具,对蛋白质的序列—结构—功能之间的联系进行诠释是后基因组时代的一项重要任务。随着探讨的深入,探讨者发现蛋白质的结构类和亚细胞位置都与20种常见氨基酸在序列中的组成密切相关。在根据氨基酸序列预测蛋白质的结构类或亚细胞位置等不足中,氨基酸序列的特点描述会直接影响到预测质量。本论文主要围绕蛋白质序列的特点表达这一主题,针对蛋白质序列的图形表示策略及其在亚细胞定位预测不足,做了深入的探讨。主要工作包括:首先,本论文完全基于蛋白质序列进行探讨,数字特点提取所依据的信息直接来源于序列本身。论文提出了一种新的三维蛋白质序列图形表示策略,为20种常见氨基酸构建了映射坐标,再由映射坐标构造蛋白质序列的坐标。蛋白质对位排列表BLOSUM62计分矩阵体现了20种常见氨基酸与其它氨基酸配对的统计信息,并支持亲缘联系较远的蛋白质序列相似性浅析,本论文以该矩阵中提取20种常见氨基酸的计分信息作为其映射坐标Y值;以大量的序列中统计出20种氨基酸的出现频率值,作为X映射坐标;用蛋白质序列的序号值作为氨基酸的Z映射坐标值。蛋白质序列坐标则根据映射坐标演化得来。将2条长度为30的经典的酿酒酵母氨酸蛋白质序列段刻画在该坐标系中,能以中浅析出2条序列的4个不同点,该实验结果表明该图形表示策略对蛋白质序列的相似性浅析具有可行性。其次,以序列的3维图形中提取X-Y平面信息,基于欧几里得距离公式,提出了一个距离计算策略,浅析了9个物种的线粒体NADH脱氢酶(ND5)两两之间的相似性。实验结果表明,距离计算策略能够很好地满足蛋白质序列相似性浅析的要求,同时,该特点提取策略能够体现生物的进化联系。最后,对蛋白质亚细胞定位预测进行了探讨。利用刀切法在凋亡蛋白数据集ZD98和CL317上进行了测试,整体预测率分别为90.82%和85.17%。该实验结果表明,该策略实现简单,计算成本小,预测结果较好,具有显著的优势。关键词:分子的药物设计论文蛋白质序列的特点表达论文蛋白质序列图形表示论文亚细胞定位预测论文序列相似性浅析论文刀切法测试论文

    摘要4-5

    Abstract5-9

    插图索引9-10

    附表索引10-11

    第1章 绪论11-18

    1.1 探讨目的11

    1.2 探讨背景和作用11-12

    1.3 探讨近况12-16

    1.3.1 蛋白质序列表达12-14

    1.3.2 蛋白质亚细胞定位预测14-16

    1.4 论文主要工作及结构安排16-17

    1.5 小结17-18

    第2章 蛋白质亚基定位的生物信息学探讨18-36

    2.1 引言18

    2.2 蛋白质介绍18-22

    2.2.1 生命中心法则18-19

    2.2.2 细胞的基本组成19

    2.2.3 亚细胞结构及功能19-21

    2.2.4 20 种天然常见氨基酸21-22

    2.3 蛋白质序列的特点表达22-25

    2.3.1 氨基酸组成23

    2.3.2 伪氨基酸组成23

    2.3.3 二肽组成23-24

    2.3.4 AAindex 策略24

    2.3.5 自相关函数24-25

    2.4 蛋白质序列编码及相似性浅析25-30

    2.4.1 基于物化特性的图形表示25-27

    2.4.2 未基于物化特性的图形表示27-29

    2.4.3 基于图形的序列相似性浅析策略29-30

    2.5 蛋白质亚细胞定位分类预测策略30-35

    2.5.1 基于机器学习的分类预测策略31-34

    2.5.2 基于统计的分类预测策略34-35

    2.6 小结35-36

    第3章 基于 BLOSUM62 矩阵的特点提取策略36-46

    3.1 引言36

    3.2 实验平台36

    3.3 基于 BLOSUM62 矩阵的蛋白质序列编码36-43

    3.3.1 提取氨基酸的统计频率36-37

    3.3.2 蛋白质比较表37-40

    3.3.3 坐标系的构建40-41

    3.3.4 坐标系可行性浅析41-43

    3.4 蛋白质序列特点提取43-45

    3.4.1 特点提取43

    3.4.2 距离公式43-44

    3.4.3 实验数据44

    3.4.4 实验结果浅析44-45

    3.5 小结45-46

    第4章 基于蛋白质序列的亚细胞定位预测46-55

    4.1 引言46-47

    4.2 算法预测性能评估策略47-48

    4.3 数据集48-51

    4.3.1 数据来源48-51

    4.3.2 测试集与训练集的组成51

    4.4 蛋白质亚基定位预测实验与讨论51-54

    4.4.1 实验结果51-52

    4.4.2 算法比较结果52-54

    4.5 小结54-55

    结论55-57

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号