更新时间:05-12 上传会员:翩翩起舞
分类:理工论文 论文字数:9957 需要金币:1000个
摘要:蛋白质是基因功能的主要执行者,每种亚细胞为蛋白质行使特定功能提供场所,蛋白质只有在相应的亚细胞中才能正确的发挥作用,生命活动才得以顺利的进行。否则,机体功能紊乱,甚至威胁到生命健康。因此,研究蛋白质功能的基础是对蛋白质的亚细胞定位的研究,同时对于研究某些疾病发病机理和研制针对疾病的新药物以及探索生命规律和奥秘有重大意义。
本文采用ZD98,CL317和ZW225共三组亚细胞数据集检验方法的有效性。我们将特异性打分矩阵提取的信息与伪氨基酸方法结合,即提取了氨基酸的进化信息,也反映了氨基酸的顺序信息。通过主成分分析方法将所提取的特征信息降维,去除冗余信息。最后,通过支持向量机分类算法,通过杰克刀检验分别计算出三组数据的精确度,特异度及相关系数来反映我们所提方法的有效性。
关键词:特异性打分矩阵;亚细胞定位;机器学习方法;主成分分析
目录
摘要
Abstract
1 绪论- 1 -
1.1 研究背景及意义- 1 -
1.2 国内外研究概况- 1 -
1.3蛋白质亚细胞定位概述- 2 -
1.4章节安排- 2 -
2 蛋白质亚细胞定位研究- 3 -
2.1数据集- 3 -
2.2研究步骤- 4 -
2.2.1 信息提取与选择- 4 -
2.2.2分类算法- 6 -
2.3已有结果介绍- 7 -
3 一种新的蛋白质亚细胞定位信息提取方法研究- 9 -
3.1材料和方法- 9 -
3.1.1特征提取- 9 -
3.1.2 特异性打分矩阵(PSSM)- 10 -
3.1.3特征表示- 10 -
3.2特征选择- 11 -
3.3结果分析- 12 -
3.4结论- 13 -
致 谢- 15 -