定义hashcode时使用31系数的原因

网友投稿 267 2023-02-28


定义hashcode时使用31系数的原因

散列计算就是计算元素应该放在数组的哪个元素里。准确的说是放到哪个链表里面。按照java的规则,如果你要想将一个对象放入HashMap中,你的对象的类必须提供hashcode方法,返回一个整数值。比如String类就有如下方法:

public int hashCode() {

int h = hasheskEW;

int len = count;

if (h == 0 && len > eskEW0) {

int off = offset;

char val[] = value;

for (int i = 0; i < len; i++) {

h = 31*h + val[off++];

http://}

hash = h;

}

return h;

}

注意上面的for循环,有点搞吧?我来举个例子,让你很容易明白它在搞什么名堂http://。比如有一个字符串“abcde”,采用31进制的计算方法来计算这个字符串的总和,你会写出下面的计算式子:

a*31^4+b*31^3+c*31^2+d*31^1+e*31^0.注意,这里的a,b,c,d或者e指的是它们的ASCII值。很有趣的循环,居然可以用来算N进制。这个循环可以抽出来单独作为计算进制的好工具:

public static void main(String[] args) {

int[] a={1,0};http://

System.out.println(calculate(2,a));

}

private static int calculate(int radix,int[] a){

int sum = 0;

for(int i=0;i

sum = sum*radix+a[i];

}

return sum;

}

静态方法caculate接受radix作为进制基数,数组a模拟要计算的进制的数字,只是注意表面顺序需要一致。比如 01 二进制串,在数组中要按照{0,1}排列。上面的输出结果是1,符合01的真实值。

那么为什么选用31作为基数呢?先要明白为什么需要HashCode.每个对象根据值计算HashCode,这个code大小虽然不奢求必须唯一(因为这样通常计算会非常慢),但是要尽可能的不要重复,因此基数要尽量的大。另外,31*N可以被编译器优化为

左移5位后减1,有较高的性能。其实选用31还是有争议,参考这里。

认为这个东西还是会导致较多的重复,应该用更大的数字。所以,或许将来Java的实现中会有所变化。下面这篇文章介绍了两个结论:

1.基数要用质数

质数的特性(只有1和自己是因子)能够使得它和其他数相乘后得到的结果比其他方式更容易产成唯一性,也就是hash code值的冲突概率最小。

2.选择31是观测分布结果后的一个选择,不清楚原因,但的确有利。

另外,String.hashCode内部会缓存第一次计算的值,因为这是一个final(不可变)类,也就是String对象的内容是不会变的。这能够在多次put到HashMap的场合提高性能,不过似乎用处不多。

总结

以上就是本文关于定义hashcode时使用31系数的原因的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:

《重写hashCode()和equals()方法详细介绍》

《详解hashCode()和equals()的本质区别和联系》

《Java源码角度分析HashMap用法》

如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

sum = sum*radix+a[i];

}

return sum;

}

静态方法caculate接受radix作为进制基数,数组a模拟要计算的进制的数字,只是注意表面顺序需要一致。比如 01 二进制串,在数组中要按照{0,1}排列。上面的输出结果是1,符合01的真实值。

那么为什么选用31作为基数呢?先要明白为什么需要HashCode.每个对象根据值计算HashCode,这个code大小虽然不奢求必须唯一(因为这样通常计算会非常慢),但是要尽可能的不要重复,因此基数要尽量的大。另外,31*N可以被编译器优化为

左移5位后减1,有较高的性能。其实选用31还是有争议,参考这里。

认为这个东西还是会导致较多的重复,应该用更大的数字。所以,或许将来Java的实现中会有所变化。下面这篇文章介绍了两个结论:

1.基数要用质数

质数的特性(只有1和自己是因子)能够使得它和其他数相乘后得到的结果比其他方式更容易产成唯一性,也就是hash code值的冲突概率最小。

2.选择31是观测分布结果后的一个选择,不清楚原因,但的确有利。

另外,String.hashCode内部会缓存第一次计算的值,因为这是一个final(不可变)类,也就是String对象的内容是不会变的。这能够在多次put到HashMap的场合提高性能,不过似乎用处不多。

总结

以上就是本文关于定义hashcode时使用31系数的原因的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:

《重写hashCode()和equals()方法详细介绍》

《详解hashCode()和equals()的本质区别和联系》

《Java源码角度分析HashMap用法》

如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:集成接口 测试用例(集成测试是为了发现接口错误)
下一篇:使用IntelliJ IDEA 2017.2.5 x64中的Spring Initializr插件快速创建Spring Boot/Cloud工程(图解)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~