标签:solr

  • 在solr和java中为文档中的单词计算TF-IDF - java

    时间:2020-9-2

    我可以通过计算文档中术语的数量来轻松获得TF我想知道如何计算文件频率即包含该术语的文档数量 到目前为止,我已经实现了查询大量行的solr并将结果计数回去,但这非常耗时且占用大量内存。我只想计算条件 SolrQuery q = new SolrQuery(); q.setQuery("tweet_text:"+kw); q.addField […]

  • 使用Lucene作为存储 - java

    时间:2020-8-30

    我想知道是否建议使用Lucene作为数据存储。我之所以说“推荐”,是因为我已经知道这是可能的。 我之所以要问这个问题,是因为我在SO上可以找到的唯一问答是这样的:Lucene as data store(尽管几乎是同一问题)已经过时了(从2010年开始)。 我对仅在Lucene中拥有数据的主要关注是存储可靠性。自2011年以来,我一直在使用Lucene,那时 […]

  • Solr抛出SocketException:连接重置 - java

    时间:2020-7-24

    我有与外部zookeeper连接的8节点Solr云集群。每个节点:30 Gb,4核。我已经创建了大约100个收藏,每个收藏都有。 30个碎片。 (为什么我需要它,让我们换个说法,业务隔离,业务需求可以是任何东西)。 现在,我正在同时将数据摄取到30个集合的群集中。我看到对少数几个集合的提取失败了。在solr日志中,我可以看到此“连接重置”异常发生。摄入的总时 […]

  • 使用正则表达式获取网址的最后一部分 - java

    时间:2020-7-17

    如何使用正则表达式获取URL的最后部分,这是我的URL,我希望最后一个斜杠和#之间有一段句号 http://mycompany.com/test/id/1234#this 所以我只想获取1234。 我有以下内容,但并未删除“ #this” ".*/(.*)(#|$)", 在为数据建立索引时,我需要这样做,所以不想使用URL类。 参考方案 […]

  • 为什么要返回数组的副本? - java

    时间:2020-7-15

    我正在阅读solr的dataimporthandler组件的源代码。我遇到一个问题 private List<String> readBySplit(String splitBy, String value) { String[] vals = value.split(splitBy); List<String> l = new Ar […]

  • 使用SolrIndexSearcher进行ID查询 - java

    时间:2020-7-15

    我想对SolrIndexSearcher进行id查询(使用其id从solr中获取多个文档)-类似于对SolrServer q =:&ids = ID1,ID2&fl = *的ID查询。 我试图以几种方式调用search(Query,int)均未成功即 TopDocs results = this.indexSearcher.search(QueryParsi […]

  • 在Heroku上进行休眠搜索 - java

    时间:2020-7-12

    我有一个在Heorku上运行的使用Spring + JPA + Hibernate构建的应用程序,并且我使用Hibernate-Search进行FullTextSearch。在本地计算机上,我将索引存储在文件系统上。我在persistence.xml中的配置。 <property name="hibernate.search.default. […]