媒介
Java的基类Object提供了一些要领,个中equals()要领用于判定两个工具是否相等,hashCode()要领用于计较工具的哈希码。equals()和hashCode()都不是final要领,都可以被重写(overwrite)。
本文先容了2种要领在利用和重写时,一些需要留意的问题。
一、equal()要领
Object类中equals()要领实现如下:
public boolean equals(Object obj) { return (this == obj); }
通过该实现可以看出,Object类的实现回收了区分度最高的算法,即只要两个工具不是同一个工具,那么equals()必然返回false。
固然我们在界说类时,可以重写equals()要领,可是有一些留意事项;JDK中说明白实现equals()要领应该遵守的约定:
(1)自反性:x.equals(x)必需返回true。
(2)对称性:x.equals(y)与y.equals(x)的返回值必需相等。
(3)通报性:x.equals(y)为true,y.equals(z)也为true,那么x.equals(z)必需为true。
(4)一致性:假如工具x和y在equals()中利用的信息都没有改变,那么x.equals(y)值始终稳定。
(5)非null:x不是null,y为null,则x.equals(y)必需为false。
二、hashCode()要领
1、Object的hashCode()
Object类中hashCode()要领的声明如下:
public native int hashCode();
可以看出,hashCode()是一个native要领,并且返回值范例是整形;实际上,该native要领将工具在内存中的地点作为哈希码返回,可以担保差异工具的返回值差异。
与equals()要领雷同,hashCode()要领可以被重写。JDK中对hashCode()要领的浸染,以及实现时的留意事项做了说明:
(1)hashCode()在哈希表中起浸染,如java.util.HashMap。
(2)假如工具在equals()中利用的信息都没有改变,那么hashCode()值始终稳定。
(3)假如两个工具利用equals()要领判定为相等,则hashCode()要领也应该相等。
(4)假如两个工具利用equals()要领判定为不相等,则不要求hashCode()也必需不相等;可是开拓人员应该认识到,不相等的工具发生不沟通的hashCode可以提高哈希表的机能。
2、hashCode()的浸染
总的来说,hashCode()在哈希表中起浸染,如HashSet、HashMap等。
当我们向哈希表(如HashSet、HashMap等)中添加工具object时,首先挪用hashCode()要领计较object的哈希码,通过哈希码可以直接定位object在哈希表中的位置(一般是哈希码对哈希表巨细取余)。假如该位置没有工具,可以直接将object插入该位置;假如该位置有工具(大概有多个,通过链表实现),则挪用equals()要领较量这些工具与object是否相等,假如相等,则不需要生存object;假如不相等,则将该工具插手到链表中。
这也就表明白为什么equals()相等,则hashCode()必需相等。假如两个工具equals()相等,则它们在哈希表(如HashSet、HashMap等)中只应该呈现一次;假如hashCode()不相等,那么它们会被散列到哈希表的差异位置,哈希表中呈现了不止一次。
实际上,在JVM中,加载的工具在内存中包罗三部门:工具头、实例数据、填充。个中,工具头包罗指向工具所属范例的指针和MarkWord,而MarkWord中除了包括工具的GC分代年数信息、加锁状态信息外,还包罗了工具的hashcode;工具实例数据是工具真正存储的有效信息;填充部门仅起到占位符的浸染, 原因是HotSpot要求工具起始地点必需是8字节的整数倍。
三、String中equals()和hashCode()的实现
String类中相关实现代码如下:
private final char value[]; private int hash; // Default to 0 public boolean equals(Object anObject) { if (this == anObject) { return true; } if (anObject instanceof String) { String anotherString = (String)anObject; int n = value.length; if (n == anotherString.value.length) { char v1[] = value; char v2[] = anotherString.value; int i = 0; while (n-- != 0) { if (v1[i] != v2[i]) return false; i++; } return true; } } return false; } public int hashCode() { int h = hash; if (h == 0 && value.length > 0) { char val[] = value; for (int i = 0; i < value.length; i++) { h = 31 * h + val[i]; } hash = h; } return h; }
通过代码可以看出以下几点:
1、String的数据是final的,即一个String工具一旦建设,便不能修改;形如String s = “hello”; s = “world”;的语句,当s = “world”执行时,并不是字符串工具的值变为了”world”,而是新建了一个String工具,s引用指向了新工具。
2、String类将hashCode()的功效缓存为hash值,提高机能。
3、String工具equals()相等的条件是二者同为String工具,长度沟通,且字符串值完全沟通;不要求二者是同一个工具。
4、String的hashCode()计较公式为:s[0]*31^(n-1) + s[1]*31^(n-2) + … + s[n-1]
关于hashCode()计较进程中,为什么利用了数字31,主要有以下原因:
1、利用质数计较哈希码,由于质数的特性,它与其他数字相乘之后,计较功效独一的概率更大,哈希斗嘴的概率更小。
2、利用的质数越大,哈希斗嘴的概率越小,可是计较的速度也越慢;31是哈希斗嘴和机能的折中,实际上是尝试视察的功效。
3、JVM会自动对31举办优化:31 * i == (i << 5) – i
四、如何重写hashCode()
本节先先容重写hashCode()要领应该遵守的原则,再先容通用的hashCode()重写要领。
1、重写hashcode()的原则
通过前面的描写我们知道,重写hashCode需要遵守以下原则: