标签:sentiment-analysis

  • 文本分类的特征选择和归约 - python

    时间:2020-7-6

    我目前正在研究一个项目,一个简单的情感分析器,因此在单独的情况下将有2个和3个类。我使用的语料库在独特词方面非常丰富(大约200.000)。我使用词袋法进行特征选择,并减少了唯一特征的数量,由于出现频率的阈值而将其消除。最后一组功能包括大约20.000个功能,实际上减少了90%,但不足以达到预期的测试预测准确性。我依次使用LibSVM和SVM-light进行 […]