spaCy 2.0:保存和加载自定义NER模型 - python

我已经使用自定义标记器在spaCy中训练了自定义NER模型。我想保存不带分词器的NER模型。我在spaCy支持论坛中尝试了以下代码:

import spacy

nlp = spacy.load("en")
nlp.tokenizer = some_custom_tokenizer
# Train the NER model...
nlp.tokenizer = None
nlp.to_disk('/tmp/my_model', disable=['tokenizer'])

当我尝试加载它时,管道是空的,而且令人惊讶的是,它具有默认的spaCy标记器。

nlp = spacy.blank('en').from_disk('/tmp/model', disable=['tokenizer'])

知道如何在没有标记器的情况下加载模型,但获得完整的管道吗?谢谢

参考方案

将模型保存到磁盘后,可以使用nlp = spacy.load('/tmp/model')加载模型。显然,根据Spacy文档(https://spacy.io/usage/training#section-saving-loading)进行操作只能加载二进制数据。

使用spaCy查找单词是否在两个实体的依赖路径上 - python

我正在研究一个nlp问题,给定一个带有两个实体的句子,我需要为每个单词生成一个布尔值,指示每个单词是否位于这些实体之间的依赖路径上。例如: '有雾的山脊从浪涌升起'我想对每个单词进行迭代,并确定它是否在e1和e2之间的依赖路径上两个重要注意事项:-如果您想帮助我(首先感谢),请不要考虑使用和进行xml标记,我真的很感兴趣如何找到一个单词是否在任意两个给定单词…

在返回'Response'(Python)中传递多个参数 - python

我在Angular工作,正在使用Http请求和响应。是否可以在“响应”中发送多个参数。角度文件:this.http.get("api/agent/applicationaware").subscribe((data:any)... python文件:def get(request): ... return Response(seriali…

Spacy如何将标记标签整体化? - python

在包含#标签(例如tweet)的句子中,spacy的令牌生成器将标签分为两个令牌:import spacy nlp = spacy.load('en') doc = nlp(u'This is a #sentence.') [t for t in doc] 输出:[This, is, a, #, sentence, .…

Python exchangelib在子文件夹中读取邮件 - python

我想从Outlook邮箱的子文件夹中读取邮件。Inbox ├──myfolder 我可以使用account.inbox.all()阅读收件箱,但我想阅读myfolder中的邮件我尝试了此页面folder部分中的内容,但无法正确完成https://pypi.python.org/pypi/exchangelib/ 参考方案 您需要首先掌握Folder的myfo…

Python GPU资源利用 - python

我有一个Python脚本在某些深度学习模型上运行推理。有什么办法可以找出GPU资源的利用率水平?例如,使用着色器,float16乘法器等。我似乎在网上找不到太多有关这些GPU资源的文档。谢谢! 参考方案 您可以尝试在像Renderdoc这样的GPU分析器中运行pyxthon应用程序。它将分析您的跑步情况。您将能够获得有关已使用资源,已用缓冲区,不同渲染状态上…