更新时间:01-20 上传会员:螺蛳粉50g
分类:精选论文 论文字数:8984 需要金币:1000个
摘要:乳腺肿瘤是一种常见的乳腺疾病, 有良性与恶性之分, 针对不同的类型治疗方法和强度不同, 使用的药物不同, 因此研究乳腺肿瘤的类别并对乳腺肿瘤进行正确的分类具有现实意义. 本文首先依次介绍了KNN(K Nearest Neighbors)算法、逻辑斯谛回归模型、决策树、随机森林这四种分类算法, 接着采用这四类方法对UCI数据库上关于乳腺肿瘤的数据进行分析, 得出分类结果, 最后将这四种方法在乳腺肿瘤数据集上的分类效果做了对比, 结果表明逻辑斯谛回归是针对此乳腺肿瘤数据集分类效果最好的算法.
关键词: 乳腺肿瘤 KNN 逻辑斯谛回归 决策树 随机森林
目录
摘要
Abstract
1.引言-1
1.1研究背景及研究现状-1
1.2实施思路-2
2.分类算法-2
2.1KNN-2
2.1.1基本含义-2
2.1.2优缺点-4
2.2逻辑斯谛回归-4
2.2.1基本含义-4
2.2.2优缺点-5
2.3决策树-6
2.3.1基本含义-6
2.2.2优缺点-7
2.4随机森林-8
2.4.1基本含义-8
2.4.2优缺点-10
2.5模型评估准则-10
3. 实证-11
3.1数据描述-11
3.2乳腺肿瘤数据基于KNN算法的数据分析结果-13
3.2.1分析过程-13
3.2.2预测结果-13
3.3乳腺肿瘤数据基于逻辑斯谛回归的数据分析结果-14
3.3.1分析过程-14
3.3.2预测结果-15
3.4乳腺肿瘤数据基于决策树的数据分析结果-16
3.4.1分析过程-16
3.4.2预测结果-17
3.5乳腺肿瘤数据基于随机森林的数据分析结果-19
3.5.1分析过程-19
3.5.2预测结果-19
3.6四种算法结果对比分析-20
4.总结与展望-21
参考文献-22
附录-23
致谢-27
