HashMap源码阅读官方澳门新永利下载:

HashMap源码阅读,hashmap源码

HashMap是Map家族中使用频度最高的贰个,下文首要构刘震理码来说解HashMap的办事规律。

4. 扩容

扩大体积(resize)正是重复计算体量。向HashMap对象里不停的添比索素,而HashMap对象内部的数组不可能装载越来越多的元素时,就供给扩充数组的长度,以便能装入越多的要素。方法是利用二个新的数组替代已有的体积小的数组。

resize()
扩大体积时,会新建三个更加大的Entry数组,将原先Entry数组中的成分通过transfer()方法转移到新数组上。通过遍历数组+链表的措施来遍历旧Entry数组中的各类成分,通过上文提到的
indexFor()方法分明在新Entry数组中的下标地点,然后使用链表头插法插入到新Entry数组中。扩大体积会拉动一文山会海的演算,新建数组,对本来成分重新hash,那是很开销财富的。

JDK1.7 resize的源码如下:

void resize(int newCapacity) {   // newCapacity为新的数组长度
   // 获取扩容前旧的Entry数组和数组长度
   Entry[] oldTable = table;    
   int oldCapacity = oldTable.length;     
   // 扩容前的数组长度已经达到最大值了(2^30)  
   if (oldCapacity == MAXIMUM_CAPACITY) { 
       threshold = Integer.MAX_VALUE;   // 修改最大容量阈值为int的最大值(2^31-1),这样以后就不会扩容了
       return;
   }

   Entry[] newTable = new Entry[newCapacity];   // 初始化一个新的Entry数组
   transfer(newTable);                          // 将数据转移到新的Entry数组里
   table = newTable;                            // HashMap的table属性引用新的Entry数组
   threshold = (int)(newCapacity * loadFactor); // 修改阈值
}

void transfer(Entry[] newTable) {
     Entry[] src = table;                   // src引用了旧的Entry数组
     int newCapacity = newTable.length;
     for (int j = 0; j < src.length; j++) {
         Entry<K,V> e = src[j];             // 遍历取得旧Entry数组的每个元素
         if (e != null) {
             src[j] = null;                 // 释放旧Entry数组的对象引用(for循环后,旧的Entry数组不再引用任何对象)
             do {
                 Entry<K,V> next = e.next;
                 int i = indexFor(e.hash, newCapacity);  // 重新计算每个元素在数组中的下标位置
                 e.next = newTable[i]; // 使用单链表的头插方式,将旧Entry数组中元素添加到新Entry数组中
                 newTable[i] = e;     
                 e = next;             // 访问下一个Entry链上的元素
             } while (e != null);
         }
     }
}

JDK1.8 resize的源码如下:

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        // 容量超过最大值就不再扩充了
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 容量没有超过最大值,就扩充为原来的2倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 计算新的resize容量上限
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        // 把每个bucket都移动到新的bucket中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // 链表优化重hash
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        // 原索引
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        // 原索引+oldCap
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 原索引放到bucket中
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 原索引+oldCap放到bucket中
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

HashMap长度扩充为原来的2倍,那样使得成分的职位要不在原职责,要不在移动2次幂的地方。

旧table数组的长度为n,元素原位为(n – 1) &
hash,扩大体量后数高管度为本来的2倍,则成分的新职务为 (n * 2 – 1) &
hash。比方,原本table数老董度 n=16,图a
表示key1和key2明确索引的地点,图 b表示扩大体量后
key1和key2分明索引的岗位,hash1和hash2分别为key1和key2通过Hash算法求得的hash值。如下图所示:

官方澳门新永利下载 1

key1的原岗位为00101=5,扩容后的职位仍为00101=5;而key2原职分为00101=5,扩容后的岗位为10101=5+16(原岗位+oldCap)

与上述同类设计的平价在于:既省去了再一次总括hash值的年华;同有的时候候,新添1bit是0或1是轻松的,由此resize扩大体量的进度,将事先争辨的同一链表上的节点均匀的分流到新的bucket上

6. 参考

HashMap是Map家族中采纳频度最高的贰个,下文重要结合源码来讲授HashMap的行事原理。
1.数据结构 HashMap的数据结构…

HashMap是Map家族中央银行使频度最高的二个,下文首要结合源码来说解HashMap的行事规律。

2. Hash算法

在找寻、扩展、删除 key-value
键值对时,都须要先在HashMap中定位哈希桶数组的目录地方。不常三个key的下标会同样,此时就发生了Hash碰撞,当Hash算法计算结果越分散均匀,Hash碰撞的票房价值就越小,map的存取功效就越高。

恒定数组索引地点的源码完结如下:

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

// jdk1.7的源码
static int indexFor(int h, int length) { 
     return h & (length-1);
}

//jdk1.8没有 indexFor() 方法,但实现原理一样的,定位数组索引下标一般按如下方式:tab[(n - 1) & hash]
/**
 * Implements Map.get and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @return the node, or null if none
 */
final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        ...
    }
}

Hash算法本质上分三步:

  • 取key的hashCode值:h = key.hashCode()
  • 高位运算:h ^ (h >>> 16)
  • 取模运算:table[(table.length – 1) & hash]

hash值通过hashCode()的高十六位异或低十三位来测算,能够在tabl.length十分小时,能将高低bit都踏足到Hash总括中。

在HashMap中,哈希桶数组table的长度length大小必得为2的n次方,那样设计,主借使为着在取模和扩大体量时做优化。假设将hash值直接对数老板度举办取模运算,那样成分布满也正如均匀,不过模运算的消耗是相当大的。当length总是2的n次方时,(table.length

  • 1) & hash = hash % length,如此来计量成分在table数组的索引处,& 比 %
    具备越来越好的频率。

举个例子如下:

 官方澳门新永利下载 2

6. 参考

4. 扩容

扩大体量(resize)正是重新总计容积。向HashMap对象里不停的添欧元素,而HashMap对象内部的数组不恐怕装载越多的要素时,就须要扩展数组的长短,以便能装入越来越多的因素。方法是选用二个新的数组替代已有些容积小的数组。

resize()
扩大体量时,会新建几个更加大的Entry数组,将原先Entry数组中的元素通过transfer()方法转移到新数组上。通过遍历数组+链表的议程来遍历旧Entry数组中的每一个成分,通过上文提到的
indexFor()方法鲜明在新Entry数组中的下标地点,然后使用链表头插法插入到新Entry数组中。扩大容积会拉动一文山会海的运算,新建数组,对本来成分重新hash,那是很耗费能源的。

JDK1.7 resize的源码如下:

void resize(int newCapacity) {   // newCapacity为新的数组长度
   // 获取扩容前旧的Entry数组和数组长度
   Entry[] oldTable = table;    
   int oldCapacity = oldTable.length;     
   // 扩容前的数组长度已经达到最大值了(2^30)  
   if (oldCapacity == MAXIMUM_CAPACITY) { 
       threshold = Integer.MAX_VALUE;   // 修改最大容量阈值为int的最大值(2^31-1),这样以后就不会扩容了
       return;
   }

   Entry[] newTable = new Entry[newCapacity];   // 初始化一个新的Entry数组
   transfer(newTable);                          // 将数据转移到新的Entry数组里
   table = newTable;                            // HashMap的table属性引用新的Entry数组
   threshold = (int)(newCapacity * loadFactor); // 修改阈值
}

void transfer(Entry[] newTable) {
     Entry[] src = table;                   // src引用了旧的Entry数组
     int newCapacity = newTable.length;
     for (int j = 0; j < src.length; j++) {
         Entry<K,V> e = src[j];             // 遍历取得旧Entry数组的每个元素
         if (e != null) {
             src[j] = null;                 // 释放旧Entry数组的对象引用(for循环后,旧的Entry数组不再引用任何对象)
             do {
                 Entry<K,V> next = e.next;
                 int i = indexFor(e.hash, newCapacity);  // 重新计算每个元素在数组中的下标位置
                 e.next = newTable[i]; // 使用单链表的头插方式,将旧Entry数组中元素添加到新Entry数组中
                 newTable[i] = e;     
                 e = next;             // 访问下一个Entry链上的元素
             } while (e != null);
         }
     }
}

JDK1.8 resize的源码如下:

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        // 容量超过最大值就不再扩充了
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 容量没有超过最大值,就扩充为原来的2倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 计算新的resize容量上限
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        // 把每个bucket都移动到新的bucket中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // 链表优化重hash
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        // 原索引
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        // 原索引+oldCap
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 原索引放到bucket中
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 原索引+oldCap放到bucket中
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

HashMap长度扩充为原来的2倍,那样使得成分的职位要不在原来的地点置,要不在移动2次幂的地点。

旧table数组的尺寸为n,成分原位为(n – 1) &
hash,扩大容积后数COO度为原来的2倍,则成分的新任务为 (n * 2 – 1) &
hash。比方,原本table数高管度 n=16,图a
表示key1和key2鲜明索引的位置,图 b表示扩大体量后
key1和key2明确索引的任务,hash1和hash2分别为key1和key2通过Hash算法求得的hash值。如下图所示:

官方澳门新永利下载 3

key1的原岗位为00101=5,扩大体量后的职位仍为00101=5;而key2原任务为00101=5,扩大体量后的岗位为10101=5+16(原来的地点置+oldCap)

与此相类似设计的功利在于:既省去了再也总结hash值的时光;同期,新添1bit是0或1是即兴的,由此resize扩大体积的进度,将事先冲突的同一链表上的节点均匀的分流到新的bucket上

1. 数据结构

HashMap的数据结构首要由数组+链表+红黑树(JDK1.8后新添)组成,如下图所示:

左臂数组是哈希表,数组的每种成分都以叁个单链表的头节点,当不一样的key映射到数组的一样职位,就将其纳入单链表中来消除key的hash值的顶牛。

当链表的长短>8时,JDK1.8做了数据结构的优化,会将链表转化为红黑树,利用红黑树快速增加和删除改查的天性提高HashMap的性子,查询效能链表O(N),红黑树是O(lgN)。

官方澳门新永利下载 4

哈希表中当key的哈希值顶牛时,可利用 怒放地址法 和 链地址法 来缓和。Java中的HashMap使用了链地址法:在各类数组元素后都有三个链表,对key通过Hash算法定位到数组下标,将键值对数码放在对应下标成分的链表上。

先领会下HaspMap的多少个字段:

/* ---------------- Fields -------------- */

/**
 * The table, initialized on first use, and resized as
 * necessary. When allocated, length is always a power of two.
 * (We also tolerate length zero in some operations to allow
 * bootstrapping mechanics that are currently not needed.)
 */
transient Node<K,V>[] table;

/**
 * Holds cached entrySet(). Note that AbstractMap fields are used
 * for keySet() and values().
 */
transient Set<Map.Entry<K,V>> entrySet;

/**
 * The number of key-value mappings contained in this map.
 */
transient int size;

/**
 * The number of times this HashMap has been structurally modified
 * Structural modifications are those that change the number of mappings in
 * the HashMap or otherwise modify its internal structure (e.g.,
 * rehash).  This field is used to make iterators on Collection-views of
 * the HashMap fail-fast.  (See ConcurrentModificationException).
 */
transient int modCount;

/**
 * The next size value at which to resize (capacity * load factor).
 */
int threshold;     

/**
 * The load factor for the hash table.
 */
final float loadFactor;    
  • size:HashMap中实际存在的 Node(key-value对)数量。
  • modCount:记录HashMap内部结构发生变化的次数,主要用来迭代器的Fail-法斯特(迭代高速退步)。当
    put 新的 key-value
    键值对时,要是新添了Node节点,属于结构变化,而有些key对应的value被隐讳则不属于结构调换。
  • threshold:threshold = capacity *
    loadFactor,允许数组容纳的最多元素数量,借使凌驾这一个数额就重新resize(扩大体积),扩容后HashMap的体积是前面包车型客车两倍。负载因子越大,所能容纳的键值对个数更多。
  • loadFactor:负载因子,暗中认可是0.75。是对空间和岁月效能的多少个平衡选拔,提出不用涂改。
  • Node[] table:是 HashMap 的哈希桶数组,是贰个 HashMap
    类中的相当的重大的字段。

HashMap暗中认可的起头体积是
16,负载因子是 loadFactor=0.75,也便是说:使用HashMap暗中同意构造函数新建了叁个HashMap对象,数组最多容纳成分个数 threshold
= 16 * 0.75 = 12。当扩张数量时,size 和 modCount
会随着扩充,数据实际上体量抢先12时,HashMap就博览会开扩大体量。

Node的源码如下:

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;     // 用来定位数组索引位置
    final K key;
    V value;
    Node<K,V> next;       // 链表的下一个node

    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }

    public final K getKey()        { return key; }
    public final V getValue()      { return value; }
    public final String toString() { return key + "=" + value; }

    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }

    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }

    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<?,?> e = (Map.Entry<?,?>)o;
            if (Objects.equals(key, e.getKey()) &&
                Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}

Node 是 HashMap 的一个之中类,实现了 Map.Entry
接口,存款和储蓄着键值对。上航海用教室中的每二个浅绿节点正是二个 Node 对象。

发表评论

电子邮件地址不会被公开。 必填项已用*标注