如何選擇HashMap的默認(rèn)容量,針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
創(chuàng)新互聯(lián)是一家專業(yè)提供壽光企業(yè)網(wǎng)站建設(shè),專注與網(wǎng)站設(shè)計(jì)、成都網(wǎng)站設(shè)計(jì)、H5場(chǎng)景定制、小程序制作等業(yè)務(wù)。10年已為壽光眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站設(shè)計(jì)公司優(yōu)惠進(jìn)行中。集合是Java開(kāi)發(fā)日常開(kāi)發(fā)中經(jīng)常會(huì)使用到的,而作為一種典型的K-V結(jié)構(gòu)的數(shù)據(jù)結(jié)構(gòu),HashMap對(duì)于Java開(kāi)發(fā)者一定不陌生。在日常開(kāi)發(fā)中,我們經(jīng)常會(huì)像如下方式以下創(chuàng)建一個(gè)HashMap:Map<String, String> map = new HashMap<String, String>();但是,大家有沒(méi)有想過(guò),上面的代碼中,我們并沒(méi)有給HashMap指定容量,那么,這時(shí)候一個(gè)新創(chuàng)建的HashMap的默認(rèn)容量是多少呢?為什么呢?本文就來(lái)分析下這個(gè)問(wèn)題。

Map<String, String> map = new HashMap<String, String>();輸出結(jié)果:
map.put("hollis", "hollischuang");
Class<?> mapType = map.getClass();
Method capacity = mapType.getDeclaredMethod("capacity");
capacity.setAccessible(true);
System.out.println("capacity : " + capacity.invoke(map));
Field size = mapType.getDeclaredField("size");
size.setAccessible(true);
System.out.println("size : " + size.get(map));
capacity : 16、size : 1上面我們定義了一個(gè)新的HashMap,并向其中put了一個(gè)元素,然后通過(guò)反射的方式打印capacity和size,其容量是16,已經(jīng)存放的元素個(gè)數(shù)是1。通過(guò)前面的例子,我們發(fā)現(xiàn)了,當(dāng)我們創(chuàng)建一個(gè)HashMap的時(shí)候,如果沒(méi)有指定其容量,那么會(huì)得到一個(gè)默認(rèn)容量為16的Map,那么,這個(gè)容量是怎么來(lái)的呢?又為什么是這個(gè)數(shù)字呢?

hash :該方法主要是將Object轉(zhuǎn)換成一個(gè)整型。indexFor :該方法主要是將hash生成的整型轉(zhuǎn)換成鏈表數(shù)組中的下標(biāo)。為了聚焦本文的重點(diǎn),我們只來(lái)看一下indexFor方法。我們先來(lái)看下Java 7(Java8中雖然沒(méi)有這樣一個(gè)單獨(dú)的方法,但是查詢下標(biāo)的算法也是和Java 7一樣的)中該實(shí)現(xiàn)細(xì)節(jié):
static int indexFor(int h, int length) {
return h & (length-1);
}
indexFor方法其實(shí)主要是將hashcode換成鏈表數(shù)組中的下標(biāo)。其中的兩個(gè)參數(shù)h表示元素的hashcode值,length表示HashMap的容量。那么return h & (length-1) 是什么意思呢?其實(shí),他就是取模。Java之所有使用位運(yùn)算(&)來(lái)代替取模運(yùn)算(%),最主要的考慮就是效率。位運(yùn)算(&)效率要比代替取模運(yùn)算(%)高很多,主要原因是位運(yùn)算直接對(duì)內(nèi)存數(shù)據(jù)進(jìn)行操作,不需要轉(zhuǎn)成十進(jìn)制,因此處理速度非常快。那么,為什么可以使用位運(yùn)算(&)來(lái)實(shí)現(xiàn)取模運(yùn)算(%)呢?這實(shí)現(xiàn)的原理如下:
X % 2^n = X & (2^n – 1)假設(shè)n為3,則2^3 = 8,表示成2進(jìn)制就是1000。2^3 -1 = 7 ,即0111。此時(shí)X & (2^3 – 1) 就相當(dāng)于取X的2進(jìn)制的最后三位數(shù)。從2進(jìn)制角度來(lái)看,X / 8相當(dāng)于 X >> 3,即把X右移3位,此時(shí)得到了X / 8的商,而被移掉的部分(后三位),則是X % 8,也就是余數(shù)。上面的解釋不知道你有沒(méi)有看懂,沒(méi)看懂的話其實(shí)也沒(méi)關(guān)系,你只需要記住這個(gè)技巧就可以了。或者你可以找?guī)讉€(gè)例子試一下。
6 % 8 = 6 ,6 & 7 = 6
10 & 8 = 2 ,10 & 7 = 2
運(yùn)算過(guò)程如下如:

所以,return h & (length-1);只要保證length的長(zhǎng)度是2^n 的話,就可以實(shí)現(xiàn)取模運(yùn)算了。
所以,因?yàn)槲贿\(yùn)算直接對(duì)內(nèi)存數(shù)據(jù)進(jìn)行操作,不需要轉(zhuǎn)成十進(jìn)制,所以位運(yùn)算要比取模運(yùn)算的效率更高,所以HashMap在計(jì)算元素要存放在數(shù)組中的index的時(shí)候,使用位運(yùn)算代替了取模運(yùn)算。之所以可以做等價(jià)代替,前提是要求HashMap的容量一定要是2^n 。那么,既然是2^n ,為啥一定要是16呢?為什么不能是4、8或者32呢?關(guān)于這個(gè)默認(rèn)容量的選擇,JDK并沒(méi)有給出官方解釋,筆者也沒(méi)有在網(wǎng)上找到關(guān)于這個(gè)任何有價(jià)值的資料。(如果哪位有相關(guān)的權(quán)威資料或者想法,可以留言交流)根據(jù)作者的推斷,這應(yīng)該就是個(gè)經(jīng)驗(yàn)值(Experience Value),既然一定要設(shè)置一個(gè)默認(rèn)的2^n 作為初始值,那么就需要在效率和內(nèi)存使用上做一個(gè)權(quán)衡。這個(gè)值既不能太小,也不能太大。太小了就有可能頻繁發(fā)生擴(kuò)容,影響效率。太大了又浪費(fèi)空間,不劃算。所以,16就作為一個(gè)經(jīng)驗(yàn)值被采用了。在JDK 8中,關(guān)于默認(rèn)容量的定義為:static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 ,其故意把16寫成1<<4,就是提醒開(kāi)發(fā)者,這個(gè)地方要是2的冪。值得玩味的是:注釋中的 aka 16 也是1.8中新增的,那么,接下來(lái)我們?cè)賮?lái)談?wù)劊琀ashMap是如何保證其容量一定可以是2^n 的呢?如果用戶自己設(shè)置了的話又會(huì)怎么樣呢?關(guān)于這部分,HashMap在兩個(gè)可能改變其容量的地方都做了兼容處理,分別是指定容量初始化時(shí)以及擴(kuò)容時(shí)。
在JDK 1.7和JDK 1.8中,HashMap初始化這個(gè)容量的時(shí)機(jī)不同。JDK 1.8中,在調(diào)用HashMap的構(gòu)造函數(shù)定義HashMap的時(shí)候,就會(huì)進(jìn)行容量的設(shè)定。而在JDK 1.7中,要等到第一次put操作時(shí)才進(jìn)行這一操作。看一下JDK是如何找到比傳入的指定值大的第一個(gè)2的冪的:
int n = cap - 1;上面的算法目的挺簡(jiǎn)單,就是:根據(jù)用戶傳入的容量值(代碼中的cap),通過(guò)計(jì)算,得到第一個(gè)比他大的2的冪并返回。
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;

Step 1,5->7Step 2,7->8Step 1,9->15Step 2,15->16Step 1,19->31Step 2,31->32對(duì)應(yīng)到以上代碼中,Step1:
n |= n >>> 1;對(duì)應(yīng)到以上代碼中,Step2:
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;Step 2 比較簡(jiǎn)單,就是做一下極限值的判斷,然后把Step 1得到的數(shù)值+1。Step 1 怎么理解呢?其實(shí)是對(duì)一個(gè)二進(jìn)制數(shù)依次向右移位,然后與原值取或。其目的對(duì)于一個(gè)數(shù)字的二進(jìn)制,從第一個(gè)不為0的位開(kāi)始,把后面的所有位都設(shè)置成1。隨便拿一個(gè)二進(jìn)制數(shù),套一遍上面的公式就發(fā)現(xiàn)其目的了:
1100 1100 1100 >>>1 = 0110 0110 0110通過(guò)幾次無(wú)符號(hào)右移和按位或運(yùn)算,我們把1100 1100 1100轉(zhuǎn)換成了1111 1111 1111 ,再把1111 1111 1111加1,就得到了1 0000 0000 0000,這就是大于1100 1100 1100的第一個(gè)2的冪。好了,我們現(xiàn)在解釋清楚了Step 1和Step 2的代碼。就是可以把一個(gè)數(shù)轉(zhuǎn)化成第一個(gè)比他自身大的2的冪。但是還有一種特殊情況套用以上公式不行,這些數(shù)字就是2的冪自身。如果數(shù)字4套用公式的話。得到的會(huì)是 8,不過(guò)其實(shí)這個(gè)問(wèn)題也被解決了,具體驗(yàn)證辦法及JDK的解決方案見(jiàn)全網(wǎng)把Map中的hash()分析的最透徹的文章,別無(wú)二家。這里就不再展開(kāi)了。總之,HashMap根據(jù)用戶傳入的初始化容量,利用無(wú)符號(hào)右移和按位或運(yùn)算等方式計(jì)算出第一個(gè)大于該數(shù)的2的冪。
1100 1100 1100 | 0110 0110 0110 = 1110 1110 1110
1110 1110 1110 >>>2 = 0011 1011 1011
1110 1110 1110 | 0011 1011 1011 = 1111 1111 1111
1111 1111 1111 >>>4 = 1111 1111 1111
1111 1111 1111 | 1111 1111 1111 = 1111 1111 1111
if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&從上面代碼可以看出,擴(kuò)容后的table大小變?yōu)樵瓉?lái)的兩倍,這一步執(zhí)行之后,就會(huì)進(jìn)行擴(kuò)容后table的調(diào)整,這部分非本文重點(diǎn),省略。可見(jiàn),當(dāng)HashMap中的元素個(gè)數(shù)(size)超過(guò)臨界值(threshold)時(shí)就會(huì)自動(dòng)擴(kuò)容,擴(kuò)容成原容量的2倍,即從16擴(kuò)容到32、64、128 …所以,通過(guò)保證初始化容量均為2的冪,并且擴(kuò)容時(shí)也是擴(kuò)容到之前容量的2倍,所以,保證了HashMap的容量永遠(yuǎn)都是2的冪。
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
分享題目:如何選擇HashMap的默認(rèn)容量-創(chuàng)新互聯(lián)
轉(zhuǎn)載注明:http://chinadenli.net/article48/ccgdep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營(yíng)銷、標(biāo)簽優(yōu)化、虛擬主機(jī)、網(wǎng)站導(dǎo)航、網(wǎng)站內(nèi)鏈、移動(dòng)網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容