tokenize - 45码

标签：tokenize

使用NLTK标记阿拉伯语单词 - python

时间：2020-8-17

我正在使用 NLTK word_tokenizer将句子拆分为单词。我想标记这句话: في_بيتنا كل شي لما تحتاجه يضيع ...ادور على شاحن فجأة يختفي ..لدرجة اني اسوي نفسي ادور شيء 我正在编写的代码是: import re import nltk lex = u" […]

标签：nltk, python, tokenize
在Java中使用分隔符“标记问题”。 ” - java

时间：2020-8-1

我需要使用分隔符". "分割文本。例如我想要这个字符串： Washington is the U.S Capital. Barack is living there. 分为两部分： Washington is the U.S Capital. Barack is living there. 这是我的代码： // Initialize th […]

标签：java, string, stringtokenizer, tokenize
SQLite代码分析C＃ - c#

时间：2020-8-1

我想知道，如何解析SQLIte查询并对其进行标记化，以便将来在执行查询后获得受影响的条目，从而能够在单个SQLite数据库上设置策略？到目前为止，我已经创建了一个接受模块的项目。并且只有一个SQLite数据库。我的目标是创建一个控制器，该控制器将接收每个模块的查询，并从本质上检查是否允许该模块更改数据库中的特定内容。关于如何实现此目标的任何想法？是否有为 […]

标签：c, code-analysis, parsing, sqlite, tokenize
tokenizer.texts_to_sequences Keras令牌生成器几乎提供所有零 - python

时间：2020-7-9

我正在创建一个文本分类代码，但是在使用标记器对文档进行编码时遇到了问题。 1）我首先在文档中安装一个标记器，如下所示： vocabulary_size = 20000 tokenizer = Tokenizer(num_words= vocabulary_size, filters='') tokenizer.fit_on_texts(d […]

标签：deep-learning, keras, nlp, python, tokenize
Spacy如何将标记标签整体化？ - python

时间：2020-7-6

在包含＃标签（例如tweet）的句子中，spacy的令牌生成器将标签分为两个令牌： import spacy nlp = spacy.load('en') doc = nlp(u'This is a #sentence.') [t for t in doc] 输出： [This, is, a, #, sentence, […]

标签：hashtag, python, spacy, tokenize

标签：tokenize

使用NLTK标记阿拉伯语单词 - python

在Java中使用分隔符“标记问题”。 ” - java

SQLite代码分析C＃ - c#

tokenizer.texts_to_sequences Keras令牌生成器几乎提供所有零 - python

Spacy如何将标记标签整体化？ - python