摘要8-10
ABSTRACT10-13
目录13-16
章 前言16-22
1.1 生物信息学简介16-17
1.2 机器学习算法在蛋白质组研究中的应用17-18
1.3 构效关系简介18-20
1.4 在线Web 预报系统简介20-21
1.5 小结21-22
章 机器学习算法22-51
2.1 基本学习算法22-31
2.1.1 多元线性回归22-23
2.1.2 模式识别方法23-25
2.1.2.1 偏最小二乘法23-25
2.1.2.2 最近邻算法25
2.1.3 决策树算法25-30
2.1.3.1 .526-28
2.1.3.2 随机决策树算法28-29
2.1.3.3 随机森林算法29-30
2.1.4 人工神经网络30-31
2.2 支持向量机算法31-43
2.2.1 统计学习理论简介32-34
2.2.2 支持向量分类算法34-39
2.2.2.1 线性可分情形34-36
2.2.2.2 非线性可分情形36-37
2.2.2.3 支持向量机的核函数37-39
2.2.3 支持向量回归方法39-41
2.2.3.1 线性回归情形39-40
2.2.3.2 非线性回归情形40-41
2.2.4 支持向量机分类与回归算法的实现41-42
2.2.5 应用前景42-43
2.3 集成学习算法43-47
2.3.1 算法Voting43-44
2.3.2 Boosting 算法44-45
2.3.3 AdaBoost 算法45-46
2.3.4 Bagging 算法46-47
2.4 特征筛选47-50
2.4.1 mRMR 变量筛选方法47-48
2.4.2 CFS 变量筛选方法48-50
2.5 小结50-51
章 基于集成学习算法的小分子生物功能预测51-66
3.1 前言51-52
3.2 及方法52-56
3.2.1 数据集52-53
3.2.2 化合物编码53-56
3.3 结果与讨论56-63
3.3.1 模型的优化56-60
3.3.2 预报模型评估60-61
3.3.3 AdaBoost 算法与其它算法预测性能比较61-63
3.4 Web 怎么写作开发63-65
3.5 小结65-66
章 基于集成学习算法的代谢中酶和小分子作用的预测66-76
4.1 前言66-67
4.2 方法67-68
4.2.1 多分类器67
4.2.2 分类器系统的建立67-68
4.3 数据集和编码方法68-72
4.3.1 数据集68
4.3.2 编码方法68-69
4.3.3 小分子的表征69
4.3.4 酶的表征69-72
4.4 结果和讨论72-75
4.4.1 预报准确率72
4.4.2 系统的选择72-73
4.4.3 单个分类器和系统的比较73-75
4.4.4 系统分析75
4.5 小结75-76
第五章 基于支持向量机回归的麻醉药毒性构效关系研究76-88
5.1 前言76-77
5.2 及方法77-79
5.2.1 数据集77-78
5.2.2 计算机硬件和软件78-79
5.2.3 量子化学描述符79
5.3 结果与讨论79-87
5.3.1 描述符选择79-81
5.3.2 SVR 模型参数选择81-84
5.3.3 SVR 模型84-85
5.3.4 SVR 模型验证85
5.3.5 SVR 模型的留一法预报结果85-86
5.3.6 与其他数据挖掘方法比较86-87
5.4 小结87-88
第六章 与展望88-91
6.1 88-89
6.2 展望89-91