标签:levenshtein-distance
-
更好的模糊匹配性能? - python
我目前正在使用difflib中的get_close_matches方法来遍历15,000个字符串的列表,以与另一个大约15,000个字符串的列表最匹配: a=['blah','pie','apple'...] b=['jimbo','zomg','p […]
-
Excel模糊查找中使用的算法 - python
我正在匹配两个公司的公司名称。我试图用Levenstien的距离在Python中进行编码。我遇到公司简称以及诸如Pvt,Ltd之类的尾随问题。我已经使用Excel Fuzzy查找运行了相同的集合,并获得了良好的结果。我有一种方法可以查看excel模糊查找的编码方式,并在python中使用相同的实现。 参考方案 据我了解,模糊查找使用Jaccard相似性。查看 […]