sync.Map是1.9才推薦的并發(fā)安全的map,除了互斥量以外,還運用了原子操作,所以在這之前,有必要了解下 Go語言——原子操作

成都創(chuàng)新互聯(lián)公司是專業(yè)的南江網(wǎng)站建設(shè)公司,南江接單;提供成都做網(wǎng)站、成都網(wǎng)站設(shè)計,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進行南江網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
go1.10\src\sync\map.go
entry分為三種情況:
從read中讀取key,如果key存在就tryStore。
注意這里開始需要加鎖,因為需要操作dirty。
條目在read中,首先取消標(biāo)記,然后將條目保存到dirty里。(因為標(biāo)記的數(shù)據(jù)不在dirty里)
最后原子保存value到條目里面,這里注意read和dirty都有條目。
總結(jié)一下Store:
這里可以看到dirty保存了數(shù)據(jù)的修改,除非可以直接原子更新read,繼續(xù)保持read clean。
有了之前的經(jīng)驗,可以猜測下load流程:
與猜測的 區(qū)別 :
由于數(shù)據(jù)保存兩份,所以刪除考慮:
先看第二種情況。加鎖直接刪除dirty數(shù)據(jù)。思考下貌似沒什么問題,本身就是臟數(shù)據(jù)。
第一種和第三種情況唯一的區(qū)別就是條目是否被標(biāo)記。標(biāo)記代表刪除,所以直接返回。否則CAS操作置為nil。這里總感覺少點什么,因為條目其實還是存在的,雖然指針nil。
看了一圈貌似沒找到標(biāo)記的邏輯,因為刪除只是將他變成nil。
之前以為這個邏輯就是簡單的將為標(biāo)記的條目拷貝給dirty,現(xiàn)在看來大有文章。
p == nil,說明條目已經(jīng)被delete了,CAS將他置為標(biāo)記刪除。然后這個條目就不會保存在dirty里面。
這里其實就跟miss邏輯串起來了,因為miss達到閾值之后,dirty會全量變成read,也就是說標(biāo)記刪除在這一步最終刪除。這個還是很巧妙的。
真正的刪除邏輯:
很繞。。。。
golang 中 map的實現(xiàn)結(jié)構(gòu)為: 哈希表 + 鏈表。 其中鏈表,作用是當(dāng)發(fā)生hash沖突時,拉鏈法生成的結(jié)點。
可以看到, []bmap 是一個hash table, 每一個 bmap是我們常說的“桶”。 經(jīng)過hash 函數(shù)計算出來相同的hash值, 放到相同的桶中。 一個 bmap中可以存放 8個 元素, 如果多出8個,則生成新的結(jié)點,尾接到隊尾。
以上是只是靜態(tài)文件 src/runtime/map.go 中的定義。 實際上編譯期間會給它加料 ,動態(tài)地創(chuàng)建一個新的結(jié)構(gòu):
上圖就是 bmap的內(nèi)存模型, HOB Hash 指的就是 top hash。 注意到 key 和 value 是各自放在一起的,并不是 key/value/key/value/... 這樣的形式。源碼里說明這樣的好處是在某些情況下可以省略掉 padding 字段,節(jié)省內(nèi)存空間。
每個 bmap設(shè)計成 最多只能放 8 個 key-value 對 ,如果有第 9 個 key-value 落入當(dāng)前的 bmap,那就需要再構(gòu)建一個 bmap,通過 overflow 指針連接起來。
map創(chuàng)建方法:
我們實際上是通過調(diào)用的 makemap ,來創(chuàng)建map的。實際工作只是初始化了hmap中的各種字段,如:設(shè)置B的大小, 設(shè)置hash 種子 hash 0.
注意 :
makemap 返回是*hmap 指針, 即 map 是引用對象, 對map的操作會影響到結(jié)構(gòu)體內(nèi)部 。
使用方式
對應(yīng)的是下面兩種方法
map的key的類型,實現(xiàn)了自己的hash 方式。每種類型實現(xiàn)hash函數(shù)方式不一樣。
key 經(jīng)過哈希計算后得到hash值,共 64 個 bit 位。 其中后B 個bit位置, 用來定位當(dāng)前元素落在哪一個桶里, 高8個bit 為當(dāng)前 hash 值的top hash。 實際上定位key的過程是一個雙重循環(huán)的過程, 外層循環(huán)遍歷 所有的overflow, 內(nèi)層循環(huán)遍歷 當(dāng)前bmap 中的 8個元素 。
舉例說明: 如果當(dāng)前 B 的值為 5, 那么buckets 的長度 為 2^5 = 32。假設(shè)有個key 經(jīng)過hash函數(shù)計算后,得到的hash結(jié)果為:
外層遍歷bucket 中的鏈表
內(nèi)層循環(huán)遍歷 bmap中的8個 cell
建議先不看此部分內(nèi)容,看完后續(xù) 修改 map中元素 - 擴容 操作后 再回頭看此部分內(nèi)容。
擴容前的數(shù)據(jù):
等量擴容后的數(shù)據(jù):
等量擴容后,查找方式和原本相同, 不多做贅述。
兩倍擴容后的數(shù)據(jù)
兩倍擴容后,oldbuckets 的元素,可能被分配成了兩部分。查找順序如下:
此處只分析 mapaccess1 ,。 mapaccess2 相比 mapaccess1 多添加了是否找到的bool值, 有興趣可自行看一下。
使用方式:
步驟如下:
擴容條件 :
擴容的標(biāo)識 : h.oldbuckets != nil
假設(shè)當(dāng)前定位到了新的buckets的3號桶中,首先會判斷oldbuckets中的對應(yīng)的桶有沒有被搬遷過。 如果搬遷過了,不需要看原來的桶了,直接遍歷新的buckets的3號桶。
擴容前:
等量擴容結(jié)果
雙倍擴容會將old buckets上的元素分配到x, y兩個部key 1 B == 0 分配到x部分,key 1 B == 1 分配到y(tǒng)部分
注意: 當(dāng)前只對雙倍擴容描述, 等量擴容只是重新填充了一下元素, 相對位置沒有改變。
假設(shè)當(dāng)前map 的B == 5,原本元素經(jīng)過hash函數(shù)計算的 hash 值為:
因為雙倍擴容之后 B = B + 1,此時B == 6。key 1 B == 1, 即 當(dāng)前元素rehash到高位,新buckets中 y 部分. 否則 key 1 B == 0 則rehash到低位,即x 部分。
使用方式:
可以看到,每一遍歷生成迭代器的時候,會隨機選取一個bucket 以及 一個cell開始。 從前往后遍歷,再次遍歷到起始位置時,遍歷完成。
由于go語言是一個強類型的語言,因此hashmap也是有類型的,具體體現(xiàn)在key和value都必須指定類型,比如聲明一個key為string,value也是string的map,
需要這樣做
大部分類型都能做key,某些類型是不能的,共同的特點是: 不能使用== 來比較,包括: slice, map, function
在迭代的過程中是可以對map進行刪除和更新操作的,規(guī)則如下:
golang的map是hash結(jié)構(gòu)的,意味著平均訪問時間是O(1)的。同傳統(tǒng)的hashmap一樣,由一個個bucket組成:
那我們怎么訪問到對應(yīng)的bucket呢,我們需要得到對應(yīng)key的hash值
各個參數(shù)的意思:
目前采用的是這一行:
| 6.50 | 20.90 | 10.79 | 4.25 | 6.50 |
不知道你有沒有聽過這么一句:在使用 map 時盡量不要在 big map 中保存指針。好吧,你現(xiàn)在已經(jīng)聽過了:)為什么呢?原因在于 Go 語言的垃圾回收器會掃描標(biāo)記 map 中的所有元素,GC 開銷相當(dāng)大,直接GG。
這兩天在《Mastering Go》中看到 GC 這一章節(jié)里面對比 map 和 slice 在垃圾回收中的效率對比,書中只給出結(jié)論沒有說明理由,這我是不能忍的,于是有了這篇學(xué)習(xí)筆記。扯那么多,Show Your Code
這是一個簡單的測試程序,保存字符串的 map 和 保存整形的 map GC 的效率相差幾十倍,是不是有同學(xué)會說明明保存的是 string 哪有指針?這個要說到 Go 語言中 string 的底層實現(xiàn)了,源碼在 src/runtime/string.go里,可以看到 string 其實包含一個指向數(shù)據(jù)的指針和一個長度字段。注意這里的是否包含指針,包括底層的實現(xiàn)。
Go 語言的 GC 會遞歸遍歷并標(biāo)記所有可觸達的對象,標(biāo)記完成之后將所有沒有引用的對象進行清理。掃描到指針就會往下接著尋找,一直到結(jié)束。
Go 語言中 map 是基于 數(shù)組和鏈表 的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)的,通過 優(yōu)化的拉鏈法 解決哈希沖突,每個 bucket 可以保存 8 對鍵值,在 8 個鍵值對數(shù)據(jù)后面有一個 overflow 指針,因為桶中最多只能裝 8 個鍵值對,如果有多余的鍵值對落到了當(dāng)前桶,那么就需要再構(gòu)建一個桶(稱為溢出桶),通過 overflow 指針鏈接起來。
因為 overflow 指針的緣故,所以無論 map 保存的是什么,GC 的時候就會把所有的 bmap 掃描一遍,帶來巨大的 GC 開銷。官方 issues 就有關(guān)于這個問題的討論, runtime: Large maps cause significant GC pauses #9477
無腦機翻如下:
如果我們有一個map [k] v,其中k和v都不包含指針,并且我們想提高掃描性能,則可以執(zhí)行以下操作。
將“ allOverflow [] unsafe.Pointer”添加到 hmap 并將所有溢出存儲桶存儲在其中。 然后將 bmap 標(biāo)記為noScan。 這將使掃描非常快,因為我們不會掃描任何用戶數(shù)據(jù)。
實際上,它將有些復(fù)雜,因為我們需要從allOverflow中刪除舊的溢出桶。 而且它還會增加 hmap 的大小,因此也可能需要重新整理數(shù)據(jù)。
最終官方在 hmap 中增加了 overflow 相關(guān)字段完成了上面的優(yōu)化,這是具體的 commit 地址。
下面看下具體是如何實現(xiàn)的,源碼基于 go1.15,src/cmd/compile/internal/gc/reflect.go 中
通過注釋可以看出,如果 map 中保存的鍵值都不包含指針(通過 Haspointers 判斷),就使用一個 uintptr 類型代替 bucket 的指針用于溢出桶 overflow 字段,uintptr 類型在 GO 語言中就是個大小可以保存得下指針的整數(shù),不是指針,就相當(dāng)于實現(xiàn)了 將 bmap 標(biāo)記為 noScan, GC 的時候就不會遍歷完整個 map 了。隨著不斷的學(xué)習(xí),愈發(fā)感慨 GO 語言中很多模塊設(shè)計得太精妙了。
差不多說清楚了,能力有限,有不對的地方歡迎留言討論,源碼位置還是問的群里大佬 _
map 是Go語言中基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu),在日常的使用中經(jīng)常被用到。但是它底層是如何實現(xiàn)的呢?
總體來說golang的map是hashmap,是使用數(shù)組+鏈表的形式實現(xiàn)的,使用拉鏈法消除hash沖突。
golang的map由兩種重要的結(jié)構(gòu),hmap和bmap(下文中都有解釋),主要就是hmap中包含一個指向bmap數(shù)組的指針,key經(jīng)過hash函數(shù)之后得到一個數(shù),這個數(shù)低位用于選擇bmap(當(dāng)作bmap數(shù)組指針的下表),高位用于放在bmap的[8]uint8數(shù)組中,用于快速試錯。然后一個bmap可以指向下一個bmap(拉鏈)。
Golang中map的底層實現(xiàn)是一個散列表,因此實現(xiàn)map的過程實際上就是實現(xiàn)散表的過程。在這個散列表中,主要出現(xiàn)的結(jié)構(gòu)體有兩個,一個叫 hmap (a header for a go map),一個叫 bmap (a bucket for a Go map,通常叫其bucket)。這兩種結(jié)構(gòu)的樣子分別如下所示:
hmap :
圖中有很多字段,但是便于理解map的架構(gòu),你只需要關(guān)心的只有一個,就是標(biāo)紅的字段: buckets數(shù)組 。Golang的map中用于存儲的結(jié)構(gòu)是bucket數(shù)組。而bucket(即bmap)的結(jié)構(gòu)是怎樣的呢?
bucket :
相比于hmap,bucket的結(jié)構(gòu)顯得簡單一些,標(biāo)紅的字段依然是“核心”,我們使用的map中的key和value就存儲在這里。“高位哈希值”數(shù)組記錄的是當(dāng)前bucket中key相關(guān)的“索引”,稍后會詳細敘述。還有一個字段是一個指向擴容后的bucket的指針,使得bucket會形成一個鏈表結(jié)構(gòu)。例如下圖:
由此看出hmap和bucket的關(guān)系是這樣的:
而bucket又是一個鏈表,所以,整體的結(jié)構(gòu)應(yīng)該是這樣的:
哈希表的特點是會有一個哈希函數(shù),對你傳來的key進行哈希運算,得到唯一的值,一般情況下都是一個數(shù)值。Golang的map中也有這么一個哈希函數(shù),也會算出唯一的值,對于這個值的使用,Golang也是很有意思。
Golang把求得的值按照用途一分為二:高位和低位。
如圖所示,藍色為高位,紅色為低位。 然后低位用于尋找當(dāng)前key屬于hmap中的哪個bucket,而高位用于尋找bucket中的哪個key。上文中提到:bucket中有個屬性字段是“高位哈希值”數(shù)組,這里存的就是藍色的高位值,用來聲明當(dāng)前bucket中有哪些“key”,便于搜索查找。 需要特別指出的一點是:我們map中的key/value值都是存到同一個數(shù)組中的。數(shù)組中的順序是這樣的:
并不是key0/value0/key1/value1的形式,這樣做的好處是:在key和value的長度不同的時候,可 以消除padding(內(nèi)存對齊)帶來的空間浪費 。
現(xiàn)在,我們可以得到Go語言map的整個的結(jié)構(gòu)圖了:(hash結(jié)果的低位用于選擇把KV放在bmap數(shù)組中的哪一個bmap中,高位用于key的快速預(yù)覽,用于快速試錯)
map的擴容
當(dāng)以上的哈希表增長的時候,Go語言會將bucket數(shù)組的數(shù)量擴充一倍,產(chǎn)生一個新的bucket數(shù)組,并將舊數(shù)組的數(shù)據(jù)遷移至新數(shù)組。
加載因子
判斷擴充的條件,就是哈希表中的加載因子(即loadFactor)。
加載因子是一個閾值,一般表示為:散列包含的元素數(shù) 除以 位置總數(shù)。是一種“產(chǎn)生沖突機會”和“空間使用”的平衡與折中:加載因子越小,說明空間空置率高,空間使用率小,但是加載因子越大,說明空間利用率上去了,但是“產(chǎn)生沖突機會”高了。
每種哈希表的都會有一個加載因子,數(shù)值超過加載因子就會為哈希表擴容。
Golang的map的加載因子的公式是:map長度 / 2^B(這是代表bmap數(shù)組的長度,B是取的低位的位數(shù))閾值是6.5。其中B可以理解為已擴容的次數(shù)。
當(dāng)Go的map長度增長到大于加載因子所需的map長度時,Go語言就會將產(chǎn)生一個新的bucket數(shù)組,然后把舊的bucket數(shù)組移到一個屬性字段oldbucket中。注意:并不是立刻把舊的數(shù)組中的元素轉(zhuǎn)義到新的bucket當(dāng)中,而是,只有當(dāng)訪問到具體的某個bucket的時候,會把bucket中的數(shù)據(jù)轉(zhuǎn)移到新的bucket中。
如下圖所示:當(dāng)擴容的時候,Go的map結(jié)構(gòu)體中,會保存舊的數(shù)據(jù),和新生成的數(shù)組
上面部分代表舊的有數(shù)據(jù)的bucket,下面部分代表新生成的新的bucket。藍色代表存有數(shù)據(jù)的bucket,橘黃色代表空的bucket。
擴容時map并不會立即把新數(shù)據(jù)做遷移,而是當(dāng)訪問原來舊bucket的數(shù)據(jù)的時候,才把舊數(shù)據(jù)做遷移,如下圖:
注意:這里并不會直接刪除舊的bucket,而是把原來的引用去掉,利用GC清除內(nèi)存。
map中數(shù)據(jù)的刪除
如果理解了map的整體結(jié)構(gòu),那么查找、更新、刪除的基本步驟應(yīng)該都很清楚了。這里不再贅述。
值得注意的是,找到了map中的數(shù)據(jù)之后,針對key和value分別做如下操作:
1
2
3
4
1、如果``key``是一個指針類型的,則直接將其置為空,等待GC清除;
2、如果是值類型的,則清除相關(guān)內(nèi)存。
3、同理,對``value``做相同的操作。
4、最后把key對應(yīng)的高位值對應(yīng)的數(shù)組index置為空。
衍生類型,interface{} , map, [] ,struct等
map類似于java的hashmap,python的dict,php的hash array。
常規(guī)的for循環(huán),可以用for k,v :=range m {}. 但在下面清空有一個坑注意:
著名的map[string]*struct 副本問題
結(jié)果:
Go 中不存在引用傳遞,所有的參數(shù)傳遞都是值傳遞,而map是等同于指針類型的,所以在把map變量傳遞給函數(shù)時,函數(shù)對map的修改,也會實質(zhì)改變map的值。
slice類似于其他語言的數(shù)組(list,array),slice初始化和map一樣,這里不在重復(fù)
除了Pointer數(shù)組外,len表示使用長度,cap是總?cè)萘浚琺ake([]int, len, cap)可以預(yù)申請 比較大的容量,這樣可以減少容量拓展的消耗,前提是要用到。
cap是計算切片容量,len是計算變量長度的,兩者不一樣。具體例子如下:
結(jié)果:
分析:cap是計算當(dāng)前slice已分配的容量大小,采用的是預(yù)分配的伙伴算法(當(dāng)容量滿時,拓展分配一倍的容量)。
append是slice非常常用的函數(shù),用于添加數(shù)據(jù)到slice中,但如果使用不好,會有下面的問題:
預(yù)期是[1 2 3 4 5 6 7 8 9 10], [1 2 3 4 5 6 7 8 9 10 11 12],但實際結(jié)果是:
注意slice是值傳遞,修改一下:
輸出如下:
== 只能用于判斷常規(guī)數(shù)據(jù)類型,無法使用用于slice和map判斷,用于判斷map和slice可以使用reflect.DeepEqual,這個函數(shù)用了遞歸來判斷每層的k,v是否一致。
當(dāng)然還有其他方式,比如轉(zhuǎn)換成json,但小心有一些異常的bug,比如html編碼,具體這個json問題,待后面在分析。
標(biāo)題名稱:go語言中的map使用,go語言 map
當(dāng)前URL:http://chinadenli.net/article25/dsejgci.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、標(biāo)簽優(yōu)化、網(wǎng)站收錄、企業(yè)網(wǎng)站制作、外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)