标签:nltk

  • NLTK情绪维德:用得分建立饼图 - python

    时间:2020-9-3

    我试图了解如何根据获得的分数构建甜甜圈图或饼图。下面是我的代码 from nltk.sentiment.vader import SentimentIntensityAnalyzer paragraph = "I loved the movie" sid = SentimentIntensityAnalyzer() ss = sid.po […]

  • 使用NLTK和WordNet;如何将简单的时态动词转换为现在,过去或过去分词形式? - python

    时间:2020-8-25

    使用NLTK和WordNet,如何将简单时态动词转换为现在,过去或过去分词形式? 例如: 我想编写一个函数,该函数以预期的形式给我动词,如下所示。 v = 'go' present = present_tense(v) print present # prints "going" past = past_tense(v […]

  • 使用NLTK WordNet查找专有名词 - python

    时间:2020-8-22

    是否可以使用NLTK WordNet查找专有名词?即可以使用nltk Wordnet标记所有名词吗? 参考方案 我认为您不需要WordNet来查找专有名词,我建议使用词性标记器pos_tag。 要查找专有名词,请查找NNP标记: from nltk.tag import pos_tag sentence = "Michael Jackson lik […]

  • 使用nltk改进对人名的提取 - python

    时间:2020-8-21

    Improve this question 我正在尝试从文本中提取人名。 有人有推荐的方法吗? 这是我尝试过的(下面的代码):我正在使用nltk查找标记为人的所有东西,然后生成该人所有NNP部分的列表。我正在跳过只有一个NNP可以避免抓住一个姓氏的人。 我得到了不错的结果,但想知道是否有更好的方法来解决这个问题。 码: import nltk from na […]

  • NLTK python错误:“TypeError:'dict_keys'对象不可下标” - python

    时间:2020-8-19

    我正在按照课堂作业的说明进行操作,并且应该在文本文件中查找前200个最常用的单词。 这是代码的最后一部分: fdist1 = FreqDist(NSmyText) vocab=fdist1.keys() vocab[:200] 但是,当我在vocab 200行之后按Enter键时,它将返回: Traceback (most recent call last) […]

  • 使用NLTK中的Stanford NER Tagger提取人员和组织列表 - python

    时间:2020-8-18

    我正在尝试使用Python NLTK中的斯坦福命名实体识别器(NER)提取人员和组织的列表。当我跑步时: from nltk.tag.stanford import NERTagger st = NERTagger('/usr/share/stanford-ner/classifiers/all.3class.distsim.crf.ser.gz& […]

  • 使用NLTK标记阿拉伯语单词 - python

    时间:2020-8-17

    我正在使用 NLTK word_tokenizer将句子拆分为单词。 我想标记这句话: في_بيتنا كل شي لما تحتاجه يضيع ...ادور على شاحن فجأة يختفي ..لدرجة اني اسوي نفسي ادور شيء 我正在编写的代码是: import re import nltk lex = u" […]

  • Javascript + Python:将数组发送到Python脚本,将结果返回给Javascript - javascript

    时间:2020-7-10

    我想建立一个网页,该网页通过Javascript API进行许多Facebook状态更新,并将它们分类到一个数组中。然后,我想将此数组发送到Python脚本,该脚本可以专门使用NLTK.进行语言分析。在Python中获得合适的结果后,我想将结果从该脚本返回到Javascript,以显示给用户等。听起来可能吗? javascript大神给出的解决方案 是的,完 […]

  • NLTK从CSV移除停用词 - python

    时间:2020-6-20

    尽管这是一个常见的问题,但我找不到适合我的情况的解决方案。我有数据,如下所示以逗号分隔。 ['my scientific','data']['is comma-separated','frequency'] 我正在尝试使用以下方式删除停用词 from nltk.corpus import sto […]

  • UnicodeDecodeError超出数据集时,数据意外结束 - python

    时间:2020-6-19

    我是python的新手,我正尝试在Yelp的一小部分上工作!数据集是JSON,但我使用熊猫库和NLTK转换为CSV。 在进行数据预处理时,我首先尝试删除所有标点符号以及最常见的停用词。完成此操作后,我想应用nltk.stem中易于使用的Porter Stemming算法。 这是我的代码: """A method for removin […]