更新时间:01-24 上传会员:螺蛳粉50g
分类:精选论文 论文字数:9045 需要金币:1000个
内容摘要:随着电子商务市场的蓬勃发展,商品数据准确有效的分类就变得迫在眉睫。本论文将基于贝叶斯算法对商品分类开展研究。我们将结合贝叶斯算法的理论知识和Python编程语言,对商品进行分类。首先进行商品数据处理,然后建立起贝叶斯模型,接着通过贝叶斯模型对数据的处理,得到商品的分类。通过本次研究,得出贝叶斯算法是适用于商品分类的结论。并且通过结果的对比分析可以得出,通过CountVectorizer取特征值比Tf-idf 取特征值更适用于商品分类。本文为基于贝叶斯算法的商品分类的研究提供了实验参考。因此本项目的研究既有理论价值也有实用价值。
关键词:人工智能化;贝叶斯算法;商品分类;Python
目录
内容摘要
Abstract
1 引言-1
2 基本理论知识介绍-1
2.1贝叶斯分类器-1
2.2 Tf-idf:关键词提取-3
2.3 CountVectorizer 特征值计算-3
2.4 交叉检验-3
3 商品分类的流程-4
4 数据预处-4
5 提取特征量和构建模型-6
5.1 特征量的提取-6
5.2 构建模型-7
6 实验结果及检验分析-8
6.1实验结果及模型评估-8
6.1.1方法一:用CountVectorizer提取特征值-8
6.1.2方法二:用TfidfVectorizer提取特征值-10
6.2 实验分析-12
7 主要结论和展望-12
7.1主要结论-12
7.1.1 实验存在的不足-12
7.1.2 实验的结果及意义-13
7.2展望-13
参考文献-14
附录
致谢