使用巨大的地图(putIfAbsent) - java

我有这个地图定义:

TreeMap <String, Set<Integer>>

它可能包含数百万个条目,并且我还需要一个“自然顺序”(这就是为什么我选择TreeMap的原因,尽管我可以根据需要编写Comparator)。

因此,为了将元素添加到地图中,我要做的是:

检查密钥是否已经存在。
如果不是,请创建一个新的Set并添加值。
如果存在,我必须将值添加到Set中

我有很好的实现此实现:

private void addToMap (String key, Integer value){
    Set<Integer> vs = dataMap.get(key);
    if (vs == null){
        vs = new TreeSet<Integer>();
        dataMap.put(key,vs);
    }
    vs.add(value);
}

但我想避免搜索键,然后将其放置(如果不存在)(它将在巨大的地图上执行新搜索)。

我想我可以使用ConcurrentHashMap.putIfAbsent方法,但是然后:

我将没有按键的自然顺序(并且我将需要对数百万个按键进行排序)
由于通过ConcurrentHashMap进行同步,我可能有(我不知道)额外的开销,在我的情况下,我的进程是单线程的,可能会影响性能。

阅读这篇文章:Java map.get(key) - automatically do put(key) and return if key doesn't exist?
有一个谈论番石榴MapMaker.makeComputingMap的答案,但看起来该方法不再存在。

在这种情况下,性能至关重要(一如既往:D),所以请告诉我您的建议。

提前致谢。

注意 :
非常感谢您在短短几分钟内提供了如此多的帮助性答案。
(我不知道选择哪个是最好的)。

我将对建议(TreeMultiMap,ConcurrentSkipListMap,TreeSet + HashMap)进行一些性能测试,并更新结果。然后,我将选择性能最好的一个,因为我想选择所有三个,但我不能。

笔记2

因此,我对150万个条目进行了性能测试,结果如下:

ConcurrentSkipListMap,它没有按我预期的那样工作,因为它将现有值替换为我提供的新空集。我以为只有在键不存在时才设置值,所以我不能使用它。 (我的错)。
TreeSet + HashMap可以正常工作,但不能提供最佳性能。它比单独的TreeMap或TreeMultiMap慢1.5倍。
TreeMultiMap提供了最佳性能,但几乎与单独的TreeMap相同。我将检查这一答案。

再次感谢您的贡献和帮助。

参考方案

并发映射不会产生魔力,它会检查是否存在,然后插入(如果不存在)。
番石榴有MultiMaps,例如TreeMultiMap可能是您需要的。

Java:线程池如何将线程映射到可运行对象 - java

试图绕过Java并发问题,并且很难理解线程池,线程以及它们正在执行的可运行“任务”之间的关系。如果我创建一个有10个线程的线程池,那么我是否必须将相同的任务传递给池中的每个线程,或者池化的线程实际上只是与任务无关的“工人无人机”可用于执行任何任务?无论哪种方式,Executor / ExecutorService如何将正确的任务分配给正确的线程? 参考方案 …

JAVA:字节码和二进制有什么区别? - java

java字节代码(已编译的语言,也称为目标代码)与机器代码(当前计算机的本机代码)之间有什么区别?我读过一些书,他们将字节码称为二进制指令,但我不知道为什么。 参考方案 字节码是独立于平台的,在Windows中运行的编译器编译的字节码仍将在linux / unix / mac中运行。机器代码是特定于平台的,如果在Windows x86中编译,则它将仅在Win…

java:继承 - java

有哪些替代继承的方法? java大神给出的解决方案 有效的Java:偏重于继承而不是继承。 (这实际上也来自“四人帮”)。他提出的理由是,如果扩展类未明确设计为继承,则继承会引起很多不正常的副作用。例如,对super.someMethod()的任何调用都可以引导您通过未知代码的意外路径。取而代之的是,持有对本来应该扩展的类的引用,然后委托给它。这是与Eric…

Java:BigInteger,如何通过OutputStream编写它 - java

我想将BigInteger写入文件。做这个的最好方式是什么。当然,我想从输入流中读取(使用程序,而不是人工)。我必须使用ObjectOutputStream还是有更好的方法?目的是使用尽可能少的字节。谢谢马丁 参考方案 Java序列化(ObjectOutputStream / ObjectInputStream)是将对象序列化为八位字节序列的一种通用方法。但…

Java DefaultSslContextFactory密钥库动态更新 - java

我有一个使用org.restlet.engine.ssl.DefaultSslContextFactory的现有应用程序和一个在服务器启动时加载的密钥库文件。我有另一个应用程序,该应用程序创建必须添加的证书服务器运行时动态地更新到密钥库文件。为此,我在代码中创建了证书和私钥,然后将其写入到目录。该目录由bash脚本监视,该脚本检查是否有新文件,如果出现,它将…