Java8下Collectors.toMap方法当key重复时报错信息错误
现象:
在Java 8下,使用Collectors.toMap
聚合流数据,如果key重复时,会报错如下:
明明是key重复,并且错误信息前缀是Duplicate key,后边却是value1。
分析:
查看Collectors.toMap
源码如下
toMap
最终是调用了Map.merge
方法,传入的mergeFunction
是throwingMerger
直接抛出异常,日志信息使用的是第一个参数u
。传入的mapSupplier
是HashMap
对象(HashMap::new)。所以最终会调用到HashMap.merge
。
而在HashMap.merge
中,对于mergeFunction
的应用如下:
在HashMap.merge
的语义中,mergeFunction
用于合并value
,比如对于key
的计数,可以使用map.merge(key, 1, Integer::sum)
。若不存在则置1,存在则+1。这里的入参是oldValue
和newValue
。
所以最终传递给throwingMerger
的两个参数就不是k-v了。所以报错的所谓Duplicate key其实是oldValue
。
解决:
- 保证
toMap
的key不重复 - 调用重载方法,主动指定当key重复时,需要做的合并操作。
高版本JDK的修复措施
这个问题在后续版本中得到修复,比如在JDK 11中的处理。
https://bugs.java.com/bugdatabase/view_bug.do?bug_id=8178142
https://bugs.openjdk.java.net/browse/JDK-8040892l
参考资料:
https://stackoverflow.com/questions/32312876/ignore-duplicates-when-producing-map-using-streams
https://stackoverflow.com/questions/57311435/java-8-collectors-tomap-duplicate-key