HashMap是Java中一个非常重要的数据结构,它基于哈希表实现,可以在常数时间内完成查找、插入和删除操作
- 哈希函数:哈希函数是将输入的键值转换为哈希码(一个整数)的算法。在HashMap中,哈希函数的主要目标是将输入的键值均匀地分布在整个哈希表中,以减少碰撞的概率。HashMap中的哈希函数如下:
static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
这个哈希函数首先判断键值是否为null,如果是null则返回0。如果不是null,则调用键值的hashCode()方法获取其哈希码,然后将哈希码与其无符号右移16位后的值进行异或操作,得到最终的哈希码。
- 哈希值与数组索引的映射:将哈希码映射到哈希表的数组索引上,需要考虑哈希表的大小。在HashMap中,哈希表的大小是2的整数次幂,这样可以保证哈希表的大小与数组的长度相同。将哈希码映射到数组索引的方法如下:
static int indexFor(int h, int length) { return h & (length-1); }
这个方法使用按位与操作将哈希码与数组长度减1进行与操作,得到的结果就是数组索引。由于数组长度是2的整数次幂,所以这个操作等价于对哈希码取模,但是效率更高。
-
碰撞解决:当两个不同的键值经过哈希函数计算得到相同的哈希码时,就会发生碰撞。在HashMap中,采用链地址法来解决碰撞问题。每个数组元素都是一个链表,当发生碰撞时,新的键值对会被添加到对应索引的链表中。在查找、插入和删除操作时,需要遍历链表来处理碰撞。
-
负载因子和动态扩容:HashMap中有一个负载因子(load factor)参数,用于控制哈希表的装载程度。当哈希表中的元素数量超过负载因子与哈希表大小的乘积时,哈希表会自动扩容。扩容时,哈希表的大小会翻倍,然后重新计算每个元素的哈希码并映射到新的数组索引上。
总之,HashMap的hash算法原理主要包括哈希函数、哈希值与数组索引的映射、碰撞解决和负载因子与动态扩容等方面。通过这些技术,HashMap能够在常数时间内完成查找、插入和删除操作,从而提高了程序的性能。