为什么与完全指定通配符相比,lucene单字符通配符查询查找的文档更少? - java

我有一个索引,在分析器的默认字段中包含值abcdef,它们属于两个不同的文档。当我执行查询abc OR def时,我得到了索引中两个文档的命中率。但是,当我使用abc OR d?f时,只会获得包含abc的文档的匹配。当我用d?f查询索引时,会找到包含def的文档。
查看abc OR d?f的已解析查询时,我看到了正确的结果。这意味着将解析以BooleanQuery作为第二子句的WildcardQuery
难道我做错了什么?
在我的应用程序中,除了上面指定的语句之外,我还有另一个布尔语句。这与上面指定的字段不同。因此,对我而言,完整的查询为:user:john AND (abc OR d?f)。但是索引中的所有文档在john字段中都包含user。所以那不应该是问题。
我正在使用Lucene 3.0.3。
编辑:
我使用luke查看了索引。在那里,我看到在重写的查询中,术语d?f被替换为()。知道查询将仅匹配abc是显而易见的。但是,为什么在重写查询时替换通配符呢?

参考方案

这只是我的错测试场景中使用的数据要复杂一些。因此,术语abc在索引中多次出现。但是我只从索引中获取了10个得分最高的文档。由于查询将abc之前的d?f与最高得分相匹配,因此这些结果是第一位的。因此,该查询未找到包含def的文档。

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…

java:继承 - java

有哪些替代继承的方法? java大神给出的解决方案 有效的Java:偏重于继承而不是继承。 (这实际上也来自“四人帮”)。他提出的理由是,如果扩展类未明确设计为继承,则继承会引起很多不正常的副作用。例如,对super.someMethod()的任何调用都可以引导您通过未知代码的意外路径。取而代之的是,持有对本来应该扩展的类的引用,然后委托给它。这是与Eric…

Java:BigInteger,如何通过OutputStream编写它 - java

我想将BigInteger写入文件。做这个的最好方式是什么。当然,我想从输入流中读取(使用程序,而不是人工)。我必须使用ObjectOutputStream还是有更好的方法?目的是使用尽可能少的字节。谢谢马丁 参考方案 Java序列化(ObjectOutputStream / ObjectInputStream)是将对象序列化为八位字节序列的一种通用方法。但…

Java DefaultSslContextFactory密钥库动态更新 - java

我有一个使用org.restlet.engine.ssl.DefaultSslContextFactory的现有应用程序和一个在服务器启动时加载的密钥库文件。我有另一个应用程序,该应用程序创建必须添加的证书服务器运行时动态地更新到密钥库文件。为此,我在代码中创建了证书和私钥,然后将其写入到目录。该目录由bash脚本监视,该脚本检查是否有新文件,如果出现,它将…