随机森林—-评论情感分析系统

文章目录

    • 京东评论情感分析—-随机森林
      • Step1: 读取数据集
      • Step2: 分词、去停用词、生成词典
      • Step3: 将评论 转化为 向量
      • Step4: 拆分数据集为训练集、测试集
      • Step5: 训练模型、评估模型
      • Step6: 预测评论情感,输出分类结果
      • 小结

京东评论情感分析—-随机森林

上次实现了朴素贝叶斯算法实现的评论情感分析,这次使用随机森林模型来对京东评论内容进行分析

Step1: 读取数据集

从文件中读取京东网评论的10000条评论,其中好评6000条,差评4000条(数据来源请见此)

Step2: 分词、去停用词、生成词典

从文本文件中读取停用词信息,以列表的方式返回

对所有评论信息进行分词,并去除停用词

遍历所有评论信息,统计词典

Step3: 将评论 转化为 向量

词袋模型,将所有评论信息通过字典映射,转化为向量,最后返回向量列表

Step4: 拆分数据集为训练集、测试集

评估随机森林模型的执行效率与预测准确度

Step5: 训练模型、评估模型

评估随机森林模型的预测准确度与效率

可见,随机森林模型对于训练集的预测准确度为100%,对于测试集的预测准确度为97.12%,也较为不错

但是随机森林模型的训练时间较长,效率有待提高

Step6: 预测评论情感,输出分类结果

以下代码预测100条评论的情绪类别,并输出预测准确率

来源:Gaolw1102

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年8月8日
下一篇 2022年8月8日

相关推荐