标签:lemmatization

  • 如何使用Stemmer或Lemmatizer阻止特定单词 - java

    时间:2020-8-8

    我目前正在尝试阻止一个大型语料库(大约80万个句子)。我已经设法阻止了最基本的一个。现在的问题是,我只想词干一个特定的单词,例如,仅当引理是原始单词的子字符串时,此方法才适用。例如,单词apples的后缀是apple和's'。但是,如果不是子字符串,它将不会像牙齿一词一样将其拆分为牙齿。 我还阅读了lemmatizer WordNet,我们可以在其中添加po […]