更新时间:03-27 上传会员:菲菲小宝贝
分类:本科论文 论文字数:9889 需要金币:1000个
摘要:本文希望根据探析评论内容的有效性特征,来识别高质量的用户评论,从而更好地帮助用户进行信息获取。针对用户评论的情感倾向、内容、形式特点构建评价评论有效性的指标体系,运用深度文本分析提取词量、句量、反应语言风格的平均句长、主观度均值、主观度标准差等文本特征变量,运用计量法构建解释模型,探究影响用户评论有效性的文本因素。采集豆瓣读书上的用户的评论数据,研究发现评论中主客观、信息量、主题关联度是与评论有效性相关联的文本特征。
关键词:用户评论,文本挖掘,内容分析,回归分析
目录
摘要
ABSTRACT
1 引言-1
1.1 研究背景-1
1.2 研究目的和意义-1
2 相关研究-1
2.1 元数据特征和语言特征研究-2
2.3 内容特征研究-2
3 研究设计-3
3.1 评论内容的有效性评价指标体系-3
3.2 文本特征的提取和计算-4
3.2.1 主客观特征的提取与计算-5
3.2.3 主题关联度特征的提取与计算-7
3.3 基于回归分析的解释模型-8
4 实验分析-9
4.1 数据采集与文本的预处理-9
4.2 实验与结果分析-11
5 结论与展望-14
参考文献-15
致谢.-17
