标签:spacy
-
spaCy 2.0:保存和加载自定义NER模型 - python
我已经使用自定义标记器在spaCy中训练了自定义NER模型。我想保存不带分词器的NER模型。我在spaCy支持论坛中尝试了以下代码: import spacy nlp = spacy.load("en") nlp.tokenizer = some_custom_tokenizer # Train the NER model... nlp. […]
-
与joblib库的空余会生成_pickle.PicklingError:无法腌制任务以将其发送给工作人员 - python
我有很多句子(约700万个),我想从中提取名词。 我使用了joblib库来并行化提取过程,如下所示: import spacy from tqdm import tqdm from joblib import Parallel, delayed nlp = spacy.load('en_core_web_sm') class nouns: […]
-
使用spaCy查找单词是否在两个实体的依赖路径上 - python
我正在研究一个nlp问题,给定一个带有两个实体的句子,我需要为每个单词生成一个布尔值,指示每个单词是否位于这些实体之间的依赖路径上。 例如: '有雾的山脊从浪涌升起' 我想对每个单词进行迭代,并确定它是否在e1和e2之间的依赖路径上 两个重要注意事项: -如果您想帮助我(首先感谢),请不要考虑使用和进行xml标记,我真的很感兴趣如何找到一个单词是否在任意两个 […]
-
Spacy如何将标记标签整体化? - python
在包含#标签(例如tweet)的句子中,spacy的令牌生成器将标签分为两个令牌: import spacy nlp = spacy.load('en') doc = nlp(u'This is a #sentence.') [t for t in doc] 输出: [This, is, a, #, sentence, […]