Java8下Collectors.toMap方法当key重复时报错信息错误

现象:

在Java 8下,使用Collectors.toMap聚合流数据,如果key重复时,会报错如下:
在这里插入图片描述在这里插入图片描述明明是key重复,并且错误信息前缀是Duplicate key,后边却是value1。

分析:

查看Collectors.toMap源码如下
在这里插入图片描述
在这里插入图片描述

toMap最终是调用了Map.merge方法,传入的mergeFunctionthrowingMerger直接抛出异常,日志信息使用的是第一个参数u。传入的mapSupplierHashMap对象(HashMap::new)。所以最终会调用到HashMap.merge

而在HashMap.merge中,对于mergeFunction的应用如下:
在这里插入图片描述
HashMap.merge的语义中,mergeFunction用于合并value,比如对于key的计数,可以使用map.merge(key, 1, Integer::sum)。若不存在则置1,存在则+1。这里的入参是oldValuenewValue

所以最终传递给throwingMerger的两个参数就不是k-v了。所以报错的所谓Duplicate key其实是oldValue

解决:

  • 保证toMap的key不重复
  • 调用重载方法,主动指定当key重复时,需要做的合并操作。
    在这里插入图片描述

高版本JDK的修复措施

这个问题在后续版本中得到修复,比如在JDK 11中的处理。
在这里插入图片描述
在这里插入图片描述
https://bugs.java.com/bugdatabase/view_bug.do?bug_id=8178142
https://bugs.openjdk.java.net/browse/JDK-8040892l

参考资料:
https://stackoverflow.com/questions/32312876/ignore-duplicates-when-producing-map-using-streams
https://stackoverflow.com/questions/57311435/java-8-collectors-tomap-duplicate-key