Hash算法简介

如题所述

第1个回答  2022-06-08
哈希算法(Hash Algorithm),又称散列算法,是一种从任意数据中提取小的数字的方法。散列算法就是一种以较短的信息来保数据唯一性的标志,这种标志与数据的每一个字节都相关,而且难以找到逆向规律。因此,当原数据发生改变时,其标志值也会发生改变。

一个优秀的 hash 算法,将能实现:

但在不同的使用场景中,如数据结构和安全领域里,其中对某一些特点会有所侧重。

以HashMap为例,key(hash值)对应一个(或多个数据),key的作用是,对于抗碰撞的要求没有那么高。换句话说,hash出来的key,只要保证value大致均匀的放在不同的桶里就可以了。但整个算法的set性能,直接与hash值产生的速度有关,所以这时候的hash值的产生速度就尤为重要,如JDK中的String.hashCode():

在密码学中,hash算法的作用主要是用于消息摘要和签名,对整个消息的完整性进行校验。这对于抗碰撞和抗篡改能力要求极高,对速度的要求在其次。以MD5为例,其输出长度为128位,设计预期碰撞概率为1/(2^128),这是一个极小极小的数字.

目前流行的 Hash 算法包括 MD5、SHA-1 和 SHA-2。

可以看出,上面这几种流行的算法,它们最重要的一点区别就是”强抗碰撞性”。