作者:andruzhang,騰訊 IEG 后臺(tái)開發(fā)工程師

在撫遠(yuǎn)等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場(chǎng)前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都做網(wǎng)站、網(wǎng)站設(shè)計(jì)、外貿(mào)營(yíng)銷網(wǎng)站建設(shè) 網(wǎng)站設(shè)計(jì)制作定制制作,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),成都營(yíng)銷網(wǎng)站建設(shè),成都外貿(mào)網(wǎng)站制作,撫遠(yuǎn)網(wǎng)站建設(shè)費(fèi)用合理。
在后臺(tái)開發(fā)中,針對(duì)錯(cuò)誤處理,有三個(gè)維度的問(wèn)題需要解決:
一個(gè)面向過(guò)程的函數(shù),在不同的處理過(guò)程中需要 handle 不同的錯(cuò)誤信息;一個(gè)面向?qū)ο蟮暮瘮?shù),針對(duì)一個(gè)操作所返回的不同類型的錯(cuò)誤,有可能需要進(jìn)行不同的處理。此外,在遇到錯(cuò)誤時(shí),也可以使用斷言的方式,快速中止函數(shù)流程,大大提高代碼的可讀性。
在許多高級(jí)語(yǔ)言中都提供了 try ... catch 的語(yǔ)法,函數(shù)內(nèi)部可以通過(guò)這種方案,實(shí)現(xiàn)一個(gè)統(tǒng)一的錯(cuò)誤處理邏輯。而即便是 C 這種 “中級(jí)語(yǔ)言” 雖然沒(méi)有,但是程序員也可以使用宏定義的方式,來(lái)實(shí)現(xiàn)某種程度上的錯(cuò)誤斷言。
但是,對(duì)于 Go 的情況就比較尷尬了。
我們先來(lái)看斷言,我們的目的是,僅使用一行代碼就能夠檢查錯(cuò)誤并終止當(dāng)前函數(shù)。由于沒(méi)有 throw,沒(méi)有宏,如果要實(shí)現(xiàn)一行斷言,有兩種方法。
第一種是把 if 的錯(cuò)誤判斷寫在一行內(nèi),比如:
第二種方法是借用 panic 函數(shù),結(jié)合 recover 來(lái)實(shí)現(xiàn):
這兩種方法都值得商榷。
首先,將 if 寫在同一行內(nèi)的問(wèn)題有:
至于第二種方法,我們要分情況看;
不過(guò)使用 panic 來(lái)斷言的方案,雖然在業(yè)務(wù)邏輯中基本上不用,但在測(cè)試場(chǎng)景下則是非常常見(jiàn)的。測(cè)試嘛,用牛刀有何不可?稍微大一點(diǎn)的系統(tǒng)開銷也沒(méi)啥問(wèn)題。對(duì)于 Go 來(lái)說(shuō),非常熱門的單元測(cè)試框架 goconvey 就是使用 panic 機(jī)制來(lái)實(shí)現(xiàn)單元測(cè)試中的斷言,用的人都說(shuō)好。
綜上,在 Go 中,對(duì)于業(yè)務(wù)代碼,筆者不建議采用斷言,遇到錯(cuò)誤的時(shí)候建議還是老老實(shí)實(shí)采用這種格式:
而在單測(cè)代碼中,則完全可以大大方方地采用類似于 goconvey 之類基于 panic 機(jī)制的斷言。
眾所周知 Go 是沒(méi)有 try ... catch 的,而且從官方的態(tài)度來(lái)看,短時(shí)間內(nèi)也沒(méi)有考慮的計(jì)劃。但程序員有這個(gè)需求呀。筆者采用的方法,是將需要返回的 err 變量在函數(shù)內(nèi)部全局化,然后結(jié)合 defer 統(tǒng)一處理:
這種方案要特別注意變量作用域問(wèn)題.比如前面的 if err = DoSomething(); err != nil { 行,如果我們將 err = ... 改為 err := ...,那么這一行中的 err 變量和函數(shù)最前面定義的 (err error) 不是同一個(gè)變量,因此即便在此處發(fā)生了錯(cuò)誤,但是在 defer 函數(shù)中無(wú)法捕獲到 err 變量了。
在 try ... catch 方面,筆者其實(shí)沒(méi)有特別好的方法來(lái)模擬,即便是上面的方法也有一個(gè)很讓人頭疼的問(wèn)題:defer 寫法導(dǎo)致錯(cuò)誤處理前置,而正常邏輯后置了,從可讀性的角度來(lái)說(shuō)非常不友好。因此也希望讀者能夠指教。同時(shí)還是希望 Go 官方能夠繼續(xù)迭代,支持這種語(yǔ)法。
這一點(diǎn)在 Go 里面,一開始看起來(lái)還是比較統(tǒng)一的,這就是 Go 最開始就定義的 error 類型,以系統(tǒng)標(biāo)準(zhǔn)的方式,統(tǒng)一了進(jìn)程內(nèi)函數(shù)級(jí)的錯(cuò)誤返回模式。調(diào)用方使用 if err != nil 的統(tǒng)一模式,來(lái)判斷一個(gè)調(diào)用是不是成功了。
但是隨著 Go 的逐步推廣,由于 error 接口的高自由度,程序員們對(duì)于 “如何判斷該錯(cuò)誤是什么錯(cuò)誤” 的時(shí)候,出現(xiàn)了分歧。
在 Go 1.13 之前,對(duì)于 error 類型的傳遞,有三種常見(jiàn)的模式:
這個(gè)流派很簡(jiǎn)單,就是將各種錯(cuò)誤信息直接定義為一個(gè)類枚舉值的模式,比如:
當(dāng)遇到相應(yīng)的錯(cuò)誤信息時(shí),直接返回對(duì)應(yīng)的 error 類枚舉值就行了。對(duì)于調(diào)用方也非常方便,可以采用 switch - case 來(lái)判斷錯(cuò)誤類型:
個(gè)人覺(jué)得這種設(shè)計(jì)模式本質(zhì)上還是 C error code 模式。
這種流派則是充分使用了 “error 是一個(gè) interface” 的特性,重新自定義一個(gè) error 類型。一方面是用不同的類型來(lái)表示不同的錯(cuò)誤分類,另一方面則能夠?qū)崿F(xiàn)對(duì)于同一錯(cuò)誤類型,能夠給調(diào)用方提供更佳詳盡的信息。舉個(gè)例子,我們可以定義多個(gè)不同的錯(cuò)誤類型如下:
對(duì)于調(diào)用方,則通過(guò)以下代碼來(lái)判斷不同的錯(cuò)誤:
這種模式,一方面可以透?jìng)鞯讓渝e(cuò)誤,另一方面又可以添加自定義的信息。但對(duì)于調(diào)用方而言,災(zāi)難在于如果要判斷某一個(gè)錯(cuò)誤的具體類型,只能用 strings.Contains() 來(lái)實(shí)現(xiàn),而錯(cuò)誤的具體描述文字是不可靠的,同一類型的信息可能會(huì)有不同的表達(dá);而在 fmt.Errorf 的過(guò)程中,各個(gè)業(yè)務(wù)添加的額外信息也可能會(huì)有不同的文字,這帶來(lái)了極大的不可靠性,提高了模塊之間的耦合度。
在 go 1.13 版本發(fā)布之后,針對(duì) fmt.Errorf 增加了 wraping 功能,并在 errors 包中添加了 Is() 和 As() 函數(shù)。關(guān)于這個(gè)模式的原理和使用已經(jīng)有很多文章了,本文就不再贅述。
這個(gè)功能,合并并改造了前文的所謂 “== 流派” 和 “fmt.Errorf” 流派,統(tǒng)一使用 errors.Is() 函數(shù);此外,也算是官方對(duì)類型斷言流派的認(rèn)可(專門用 As() 函數(shù)來(lái)支持)。
在實(shí)際應(yīng)用中,函數(shù)/模塊透?jìng)麇e(cuò)誤時(shí),應(yīng)該采用 Go 的 error wrapping 模式,也就是 fmt.Errorf() 配合 %w 使用,業(yè)務(wù)方可以放心地添加自己的錯(cuò)誤信息,只要調(diào)用方統(tǒng)一采用 errors.Is() 和 errors.As() 即可。
服務(wù)/系統(tǒng)層面的錯(cuò)誤信息返回,大部分協(xié)議都可以看成是 code - message 模式或者是其變體:
這種模式的特點(diǎn)是:code 是給程序代碼使用的,代碼判斷這是一個(gè)什么類型的錯(cuò)誤,進(jìn)入相應(yīng)的分支處理;而 message 是給人看的,程序可以以某種形式拋出或者記錄這個(gè)錯(cuò)誤信息,供用戶查看。
在這一層面有什么問(wèn)題呢?code for computer,message for user,好像挺好的。
但有時(shí)候,我們可能會(huì)收到用戶/客戶反饋一個(gè)問(wèn)題:“XXX 報(bào)錯(cuò)了,幫忙看看什么問(wèn)題?”。用戶看不懂我們的錯(cuò)誤提示嗎?
在筆者的經(jīng)驗(yàn)中,我們?cè)谑褂?code - message 機(jī)制的時(shí)候,特別是業(yè)務(wù)初期,難以避免的是前后端的設(shè)計(jì)文案沒(méi)能完整地覆蓋所有的錯(cuò)誤用例,或者是錯(cuò)誤極其罕見(jiàn)。因此當(dāng)出現(xiàn)錯(cuò)誤時(shí),提示曖昧不清(甚至是直接提示錯(cuò)誤信息),導(dǎo)致用戶從錯(cuò)誤信息中找到解決方案
在這種情況下,盡量覆蓋所有錯(cuò)誤路徑肯定是最完美的方法。不過(guò)在做到這一點(diǎn)之前,碼農(nóng)們往往有下面的解決方案:
既要隱藏信息,又要暴露信息,我可以摔盤子嗎……
這里,筆者從日益普及的短信驗(yàn)證碼有了個(gè)靈感——人的短期記憶對(duì) 4 個(gè)字符還是比較強(qiáng)的,因此我們可以考慮把錯(cuò)誤代碼縮短到 4 個(gè)字符——不區(qū)分大小寫,因?yàn)槿绻嗽谟洃洉r(shí)還要記錄大小寫的話,難度會(huì)增加不少。
怎么用 4 個(gè)字符表示盡量多的數(shù)據(jù)呢?數(shù)字+字母總共有 36 個(gè)字符,理論上使用 4 位 36 進(jìn)制可以表示 36x36x36x36 = 1679616 個(gè)值。因此我們只要找到一個(gè)針對(duì)錯(cuò)誤信息字符串的哈希算法,把輸出值限制在 1679616 范圍內(nèi)就行了。
這里我采用的是 MD5 作為例子。MD5 的輸出是 128 位,理論上我可以取 MD5 的輸出,模 1679616 就可以得到一個(gè)簡(jiǎn)易的結(jié)果。實(shí)際上為了減少除法運(yùn)算,我采用的是取高 20 位(0xFFFFF)的簡(jiǎn)易方式(20 位二進(jìn)制的最大值為 1048575),然后將這個(gè)數(shù)字轉(zhuǎn)成 36 進(jìn)制的字符串輸出。
當(dāng)出現(xiàn)異常錯(cuò)誤時(shí),我們可以將 message 的提示信息如下展示:“未知錯(cuò)誤,錯(cuò)誤代碼 30EV,如需協(xié)助,請(qǐng)聯(lián)系 XXX”。順帶一提,30EV 是 "Access denied for user 'db_user'@'127.0.0.1'" 的計(jì)算結(jié)果,這樣一來(lái),我就對(duì)調(diào)用方隱藏了敏感信息。
至于后臺(tái)側(cè),還是需要實(shí)實(shí)在在地將這個(gè)哈希值和具體的錯(cuò)誤信息記錄在日志或者其他支持搜索的渠道里。當(dāng)用戶提供該代碼時(shí),可以快速定位。
這種方案的優(yōu)點(diǎn)很明顯:
簡(jiǎn)易的錯(cuò)誤碼生成代碼如下:
當(dāng)然這種方案也有局限性,筆者能想到的是需要注意以下兩點(diǎn):
此外,筆者需要再?gòu)?qiáng)調(diào)的是:在開發(fā)中,針對(duì)各種不同的、正式的錯(cuò)誤用例依然需要完整覆蓋,盡可能通過(guò)已有的 code - message 機(jī)制將足夠清晰的信息告知主調(diào)方。這種 hashcode 的錯(cuò)誤代碼生成方法,僅適用于錯(cuò)誤用例遺漏、或者是快速迭代過(guò)程中,用于發(fā)現(xiàn)和調(diào)試遺漏的錯(cuò)誤用例的臨時(shí)方案。
Goroutine調(diào)度是一個(gè)很復(fù)雜的機(jī)制,下面嘗試用簡(jiǎn)單的語(yǔ)言描述一下Goroutine調(diào)度機(jī)制,想要對(duì)其有更深入的了解可以去研讀一下源碼。
首先介紹一下GMP什么意思:
G ----------- goroutine: 即Go協(xié)程,每個(gè)go關(guān)鍵字都會(huì)創(chuàng)建一個(gè)協(xié)程。
M ---------- thread內(nèi)核級(jí)線程,所有的G都要放在M上才能運(yùn)行。
P ----------- processor處理器,調(diào)度G到M上,其維護(hù)了一個(gè)隊(duì)列,存儲(chǔ)了所有需要它來(lái)調(diào)度的G。
Goroutine 調(diào)度器P和 OS 調(diào)度器是通過(guò) M 結(jié)合起來(lái)的,每個(gè) M 都代表了 1 個(gè)內(nèi)核線程,OS 調(diào)度器負(fù)責(zé)把內(nèi)核線程分配到 CPU 的核上執(zhí)行
模型圖:
避免頻繁的創(chuàng)建、銷毀線程,而是對(duì)線程的復(fù)用。
1)work stealing機(jī)制
當(dāng)本線程無(wú)可運(yùn)行的G時(shí),嘗試從其他線程綁定的P偷取G,而不是銷毀線程。
2)hand off機(jī)制
當(dāng)本線程M0因?yàn)镚0進(jìn)行系統(tǒng)調(diào)用阻塞時(shí),線程釋放綁定的P,把P轉(zhuǎn)移給其他空閑的線程執(zhí)行。進(jìn)而某個(gè)空閑的M1獲取P,繼續(xù)執(zhí)行P隊(duì)列中剩下的G。而M0由于陷入系統(tǒng)調(diào)用而進(jìn)被阻塞,M1接替M0的工作,只要P不空閑,就可以保證充分利用CPU。M1的來(lái)源有可能是M的緩存池,也可能是新建的。當(dāng)G0系統(tǒng)調(diào)用結(jié)束后,根據(jù)M0是否能獲取到P,將會(huì)將G0做不同的處理:
如果有空閑的P,則獲取一個(gè)P,繼續(xù)執(zhí)行G0。
如果沒(méi)有空閑的P,則將G0放入全局隊(duì)列,等待被其他的P調(diào)度。然后M0將進(jìn)入緩存池睡眠。
如下圖
GOMAXPROCS設(shè)置P的數(shù)量,最多有GOMAXPROCS個(gè)線程分布在多個(gè)CPU上同時(shí)運(yùn)行
在Go中一個(gè)goroutine最多占用CPU 10ms,防止其他goroutine被餓死。
具體可以去看另一篇文章
【Golang詳解】go語(yǔ)言調(diào)度機(jī)制 搶占式調(diào)度
當(dāng)創(chuàng)建一個(gè)新的G之后優(yōu)先加入本地隊(duì)列,如果本地隊(duì)列滿了,會(huì)將本地隊(duì)列的G移動(dòng)到全局隊(duì)列里面,當(dāng)M執(zhí)行work stealing從其他P偷不到G時(shí),它可以從全局G隊(duì)列獲取G。
協(xié)程經(jīng)歷過(guò)程
我們創(chuàng)建一個(gè)協(xié)程 go func()經(jīng)歷過(guò)程如下圖:
說(shuō)明:
這里有兩個(gè)存儲(chǔ)G的隊(duì)列,一個(gè)是局部調(diào)度器P的本地隊(duì)列、一個(gè)是全局G隊(duì)列。新創(chuàng)建的G會(huì)先保存在P的本地隊(duì)列中,如果P的本地隊(duì)列已經(jīng)滿了就會(huì)保存在全局的隊(duì)列中;處理器本地隊(duì)列是一個(gè)使用數(shù)組構(gòu)成的環(huán)形鏈表,它最多可以存儲(chǔ) 256 個(gè)待執(zhí)行任務(wù)。
G只能運(yùn)行在M中,一個(gè)M必須持有一個(gè)P,M與P是1:1的關(guān)系。M會(huì)從P的本地隊(duì)列彈出一個(gè)可執(zhí)行狀態(tài)的G來(lái)執(zhí)行,如果P的本地隊(duì)列為空,就會(huì)想其他的MP組合偷取一個(gè)可執(zhí)行的G來(lái)執(zhí)行;
一個(gè)M調(diào)度G執(zhí)行的過(guò)程是一個(gè)循環(huán)機(jī)制;會(huì)一直從本地隊(duì)列或全局隊(duì)列中獲取G
上面說(shuō)到P的個(gè)數(shù)默認(rèn)等于CPU核數(shù),每個(gè)M必須持有一個(gè)P才可以執(zhí)行G,一般情況下M的個(gè)數(shù)會(huì)略大于P的個(gè)數(shù),這多出來(lái)的M將會(huì)在G產(chǎn)生系統(tǒng)調(diào)用時(shí)發(fā)揮作用。類似線程池,Go也提供一個(gè)M的池子,需要時(shí)從池子中獲取,用完放回池子,不夠用時(shí)就再創(chuàng)建一個(gè)。
work-stealing調(diào)度算法:當(dāng)M執(zhí)行完了當(dāng)前P的本地隊(duì)列隊(duì)列里的所有G后,P也不會(huì)就這么在那躺尸啥都不干,它會(huì)先嘗試從全局隊(duì)列隊(duì)列尋找G來(lái)執(zhí)行,如果全局隊(duì)列為空,它會(huì)隨機(jī)挑選另外一個(gè)P,從它的隊(duì)列里中拿走一半的G到自己的隊(duì)列中執(zhí)行。
如果一切正常,調(diào)度器會(huì)以上述的那種方式順暢地運(yùn)行,但這個(gè)世界沒(méi)這么美好,總有意外發(fā)生,以下分析goroutine在兩種例外情況下的行為。
Go runtime會(huì)在下面的goroutine被阻塞的情況下運(yùn)行另外一個(gè)goroutine:
用戶態(tài)阻塞/喚醒
當(dāng)goroutine因?yàn)閏hannel操作或者network I/O而阻塞時(shí)(實(shí)際上golang已經(jīng)用netpoller實(shí)現(xiàn)了goroutine網(wǎng)絡(luò)I/O阻塞不會(huì)導(dǎo)致M被阻塞,僅阻塞G,這里僅僅是舉個(gè)栗子),對(duì)應(yīng)的G會(huì)被放置到某個(gè)wait隊(duì)列(如channel的waitq),該G的狀態(tài)由_Gruning變?yōu)開Gwaitting,而M會(huì)跳過(guò)該G嘗試獲取并執(zhí)行下一個(gè)G,如果此時(shí)沒(méi)有可運(yùn)行的G供M運(yùn)行,那么M將解綁P,并進(jìn)入sleep狀態(tài);當(dāng)阻塞的G被另一端的G2喚醒時(shí)(比如channel的可讀/寫通知),G被標(biāo)記為,嘗試加入G2所在P的runnext(runnext是線程下一個(gè)需要執(zhí)行的 Goroutine。), 然后再是P的本地隊(duì)列和全局隊(duì)列。
系統(tǒng)調(diào)用阻塞
當(dāng)M執(zhí)行某一個(gè)G時(shí)候如果發(fā)生了阻塞操作,M會(huì)阻塞,如果當(dāng)前有一些G在執(zhí)行,調(diào)度器會(huì)把這個(gè)線程M從P中摘除,然后再創(chuàng)建一個(gè)新的操作系統(tǒng)的線程(如果有空閑的線程可用就復(fù)用空閑線程)來(lái)服務(wù)于這個(gè)P。當(dāng)M系統(tǒng)調(diào)用結(jié)束時(shí)候,這個(gè)G會(huì)嘗試獲取一個(gè)空閑的P執(zhí)行,并放入到這個(gè)P的本地隊(duì)列。如果獲取不到P,那么這個(gè)線程M變成休眠狀態(tài), 加入到空閑線程中,然后這個(gè)G會(huì)被放入全局隊(duì)列中。
隊(duì)列輪轉(zhuǎn)
可見(jiàn)每個(gè)P維護(hù)著一個(gè)包含G的隊(duì)列,不考慮G進(jìn)入系統(tǒng)調(diào)用或IO操作的情況下,P周期性的將G調(diào)度到M中執(zhí)行,執(zhí)行一小段時(shí)間,將上下文保存下來(lái),然后將G放到隊(duì)列尾部,然后從隊(duì)列中重新取出一個(gè)G進(jìn)行調(diào)度。
除了每個(gè)P維護(hù)的G隊(duì)列以外,還有一個(gè)全局的隊(duì)列,每個(gè)P會(huì)周期性地查看全局隊(duì)列中是否有G待運(yùn)行并將其調(diào)度到M中執(zhí)行,全局隊(duì)列中G的來(lái)源,主要有從系統(tǒng)調(diào)用中恢復(fù)的G。之所以P會(huì)周期性地查看全局隊(duì)列,也是為了防止全局隊(duì)列中的G被餓死。
除了每個(gè)P維護(hù)的G隊(duì)列以外,還有一個(gè)全局的隊(duì)列,每個(gè)P會(huì)周期性地查看全局隊(duì)列中是否有G待運(yùn)行并將其調(diào)度到M中執(zhí)行,全局隊(duì)列中G的來(lái)源,主要有從系統(tǒng)調(diào)用中恢復(fù)的G。之所以P會(huì)周期性地查看全局隊(duì)列,也是為了防止全局隊(duì)列中的G被餓死。
M0
M0是啟動(dòng)程序后的編號(hào)為0的主線程,這個(gè)M對(duì)應(yīng)的實(shí)例會(huì)在全局變量rutime.m0中,不需要在heap上分配,M0負(fù)責(zé)執(zhí)行初始化操作和啟動(dòng)第一個(gè)G,在之后M0就和其他的M一樣了
G0
G0是每次啟動(dòng)一個(gè)M都會(huì)第一個(gè)創(chuàng)建的goroutine,G0僅用于負(fù)責(zé)調(diào)度G,G0不指向任何可執(zhí)行的函數(shù),每個(gè)M都會(huì)有一個(gè)自己的G0,在調(diào)度或系統(tǒng)調(diào)用時(shí)會(huì)使用G0的棧空間,全局變量的G0是M0的G0
一個(gè)G由于調(diào)度被中斷,此后如何恢復(fù)?
中斷的時(shí)候?qū)⒓拇嫫骼锏臈P畔ⅲ4娴阶约旱腉對(duì)象里面。當(dāng)再次輪到自己執(zhí)行時(shí),將自己保存的棧信息復(fù)制到寄存器里面,這樣就接著上次之后運(yùn)行了。
我這里只是根據(jù)自己的理解進(jìn)行了簡(jiǎn)單的介紹,想要詳細(xì)了解有關(guān)GMP的底層原理可以去看Go調(diào)度器 G-P-M 模型的設(shè)計(jì)者的文檔或直接看源碼
參考: ()
()
Go語(yǔ)言也稱 Golang,兼具效率、性能、安全、健壯等特性。這套Go語(yǔ)言教程(Golang教程)通俗易懂,深入淺出,既適合沒(méi)有基礎(chǔ)的讀者快速入門,也適合工作多年的程序員查閱知識(shí)點(diǎn)。
Go 語(yǔ)言
這套教程在講解一些知識(shí)點(diǎn)時(shí),將 Go 語(yǔ)言和其他多種語(yǔ)言進(jìn)行對(duì)比,讓掌握其它編程語(yǔ)言的讀者能迅速理解 Go 語(yǔ)言的特性。Go語(yǔ)言從底層原生支持并發(fā),無(wú)須第三方庫(kù)、開發(fā)者的編程技巧和開發(fā)經(jīng)驗(yàn)就可以輕松搞定。
Go語(yǔ)言(或 Golang)起源于 2007 年,并在 2009 年正式對(duì)外發(fā)布。Go 是非常年輕的一門語(yǔ)言,它的主要目標(biāo)是“兼具 Python 等動(dòng)態(tài)語(yǔ)言的開發(fā)速度和 C/C++ 等編譯型語(yǔ)言的性能與安全性”。
Go語(yǔ)言是編程語(yǔ)言設(shè)計(jì)的又一次嘗試,是對(duì)類C語(yǔ)言的重大改進(jìn),它不但能讓你訪問(wèn)底層操作系統(tǒng),還提供了強(qiáng)大的網(wǎng)絡(luò)編程和并發(fā)編程支持。Go語(yǔ)言的用途眾多,可以進(jìn)行網(wǎng)絡(luò)編程、系統(tǒng)編程、并發(fā)編程、分布式編程。
Go語(yǔ)言的推出,旨在不損失應(yīng)用程序性能的情況下降低代碼的復(fù)雜性,具有“部署簡(jiǎn)單、并發(fā)性好、語(yǔ)言設(shè)計(jì)良好、執(zhí)行性能好”等優(yōu)勢(shì),目前國(guó)內(nèi)諸多 IT 公司均已采用Go語(yǔ)言開發(fā)項(xiàng)目。Go語(yǔ)言有時(shí)候被描述為“C 類似語(yǔ)言”,或者是“21 世紀(jì)的C語(yǔ)言”。Go 從C語(yǔ)言繼承了相似的表達(dá)式語(yǔ)法、控制流結(jié)構(gòu)、基礎(chǔ)數(shù)據(jù)類型、調(diào)用參數(shù)傳值、指針等很多思想,還有C語(yǔ)言一直所看中的編譯后機(jī)器碼的運(yùn)行效率以及和現(xiàn)有操作系統(tǒng)的無(wú)縫適配。
因?yàn)镚o語(yǔ)言沒(méi)有類和繼承的概念,所以它和 Java 或 C++ 看起來(lái)并不相同。但是它通過(guò)接口(interface)的概念來(lái)實(shí)現(xiàn)多態(tài)性。Go語(yǔ)言有一個(gè)清晰易懂的輕量級(jí)類型系統(tǒng),在類型之間也沒(méi)有層級(jí)之說(shuō)。因此可以說(shuō)Go語(yǔ)言是一門混合型的語(yǔ)言。
此外,很多重要的開源項(xiàng)目都是使用Go語(yǔ)言開發(fā)的,其中包括 Docker、Go-Ethereum、Thrraform 和 Kubernetes。Go 是編譯型語(yǔ)言,Go 使用編譯器來(lái)編譯代碼。編譯器將源代碼編譯成二進(jìn)制(或字節(jié)碼)格式;在編譯代碼時(shí),編譯器檢查錯(cuò)誤、優(yōu)化性能并輸出可在不同平臺(tái)上運(yùn)行的二進(jìn)制文件。要?jiǎng)?chuàng)建并運(yùn)行 Go 程序,程序員必須執(zhí)行如下步驟。
使用文本編輯器創(chuàng)建 Go 程序;
保存文件;編譯程序;運(yùn)行編譯得到的可執(zhí)行文件。
這不同于 Python、Ruby 和 JavaScript 等語(yǔ)言,它們不包含編譯步驟。Go 自帶了編譯器,因此無(wú)須單獨(dú)安裝編譯器。
鏈喬教育在線旗下學(xué)碩創(chuàng)新區(qū)塊鏈技術(shù)工作站是中國(guó)教育部學(xué)校規(guī)劃建設(shè)發(fā)展中心開展的“智慧學(xué)習(xí)工場(chǎng)2020-學(xué)碩創(chuàng)新工作站 ”唯一獲準(zhǔn)的“區(qū)塊鏈技術(shù)專業(yè)”試點(diǎn)工作站。專業(yè)站立足為學(xué)生提供多樣化成長(zhǎng)路徑,推進(jìn)專業(yè)學(xué)位研究生產(chǎn)學(xué)研結(jié)合培養(yǎng)模式改革,構(gòu)建應(yīng)用型、復(fù)合型人才培養(yǎng)體系。
1、 string的定義
Golang中的string的定義在reflect包下的value.go中,定義如下:
StringHeader 是字符串的運(yùn)行時(shí)表示,其中包含了兩個(gè)字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長(zhǎng)度。
// StringHeader is the runtime representation of a string.
// It cannot be used safely or portably and its representation may
// change in a later release.
// Moreover, the Data field is not sufficient to guarantee the data
// it references will not be garbage collected, so programs must keep
// a separate, correctly typed pointer to the underlying data.
type StringHeader struct {
Data uintptr
Len int
}
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
2、string不可變
Golang中的字符串是不可變的,不能通過(guò)索引下標(biāo)的方式修改字符串中的數(shù)據(jù):
在這里插入圖片描述
運(yùn)行代碼,可以看到編譯器報(bào)錯(cuò),string是不可變的
在這里插入圖片描述
但是能不能進(jìn)行一些騷操作來(lái)改變?cè)氐闹的兀?/p>
package main
import (
"fmt"
"reflect"
"unsafe"
)
func main() {
a := "hello,world"
b := a[6:]
bptr := (*reflect.StringHeader) (unsafe.Pointer(b))
fmt.Println(a)
fmt.Println(b)
*(*byte)(unsafe.Pointer(bptr.Data)) = '.'
fmt.Println(a)
fmt.Println(b)
}
// 運(yùn)行結(jié)果
hello,world
world
unexpected fault address 0x49d7e3
fatal error: fault
[signal 0xc0000005 code=0x1 addr=0x49d7e3 pc=0x4779fa]
goroutine 1 [running]:
runtime.throw(0x49c948, 0x5)
C:/Program Files/Go/src/runtime/panic.go:1117 +0x79 fp=0xc0000dbe90 sp=0xc0000dbe60 pc=0x405fd9
runtime.sigpanic()
C:/Program Files/Go/src/runtime/signal_windows.go:245 +0x2d6 fp=0xc0000dbee8 sp=0xc0000dbe90 pc=0x4189f6
main.main()
F:/go_workspace/src/code/string_test/main.go:20 +0x13a fp=0xc0000dbf88 sp=0xc0000dbee8 pc=0x4779fa
runtime.main()
C:/Program Files/Go/src/runtime/proc.go:225 +0x256 fp=0xc0000dbfe0 sp=0xc0000dbf88 pc=0x4087f6
runtime.goexit()
C:/Program Files/Go/src/runtime/asm_amd64.s:1371 +0x1 fp=0xc0000dbfe8 sp=0xc0000dbfe0 pc=0x435da1
Process finished with the exit code 2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
在上面的代碼中,因?yàn)樵趃o語(yǔ)言中不能進(jìn)行指針的加減運(yùn)算,因此取切片,讓b的Data指針指向’,'所在的位置。然后把"hello,world"中的逗號(hào)改為點(diǎn),但是發(fā)現(xiàn)還是不行,程序直接崩潰了。看來(lái)go語(yǔ)言中的指針得到了大大的限制,設(shè)計(jì)者并不想讓程序員過(guò)度使用指針來(lái)寫出一些不安全的代碼。
3、使用string給另一個(gè)string賦值
Golang中的字符串的賦值并不是拷貝底層的字符串?dāng)?shù)組,而是數(shù)組指針和長(zhǎng)度字段的拷貝。例如:當(dāng)我們定義了一個(gè)字符串 a := “hello,world” 然后定義了 b := a 底層所做的操作只是創(chuàng)建了兩個(gè)StringHeader的結(jié)構(gòu)體,它們的Data字段都指向同一段數(shù)據(jù),如下圖:
在這里插入圖片描述
我們可以利用代碼來(lái)證實(shí)這一點(diǎn):
package main
import (
"fmt"
"reflect"
"unsafe"
)
func main() {
a := "hello,world"
b := a
fmt.Println(a)
fmt.Println(b)
aptr := (*reflect.StringHeader) (unsafe.Pointer(a))
bptr := (*reflect.StringHeader) (unsafe.Pointer(b))
fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))
fmt.Println("b ptr:", unsafe.Pointer(bptr.Data))
}
// 運(yùn)行結(jié)果
hello, world
hello, world
a ptr: 0x6bdb76
b ptr: 0x6bdb76
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
在上面的代碼中,將a和b轉(zhuǎn)換為StringHeader類型的指針,然后分別打印出,a和b的Data指針的值,發(fā)現(xiàn)是相同的
那么如果對(duì)a做切片賦值給b呢?
func main() {
a := "hello,world"
b := a[6:]
fmt.Println(a)
fmt.Println(b)
aptr := (*reflect.StringHeader) (unsafe.Pointer(a))
bptr := (*reflect.StringHeader) (unsafe.Pointer(b))
fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))
fmt.Println("b ptr:", unsafe.Pointer(bptr.Data))
}
// 運(yùn)行結(jié)果
hello,world
world
a ptr: 0xd4d849
b ptr: 0xd4d84f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0xd4d849 - 0xd4d84f = 0x000006
顯然,也沒(méi)有分配新的數(shù)組并拷貝數(shù)據(jù),而是將原字符數(shù)組的指針的偏移賦給了b的StringHeader的Data
4、string重新賦值
如果對(duì)一個(gè)已經(jīng)賦值的字符串重新賦值,也不會(huì)修改原內(nèi)存空間,而是申請(qǐng)了新的內(nèi)存空間,對(duì)其賦值,并指向新的內(nèi)存空間。如下圖:
在這里插入圖片描述
也可以使用代碼來(lái)證實(shí)一下:
package main
import (
"fmt"
"reflect"
"unsafe"
)
func main() {
a := "hello,world"
aptr := (*reflect.StringHeader) (unsafe.Pointer(a))
fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))
fmt.Println("a len", aptr.Len)
a = "hello,golang"
newAPtr := (*reflect.StringHeader) (unsafe.Pointer(a))
fmt.Println("b ptr:", unsafe.Pointer(newAPtr.Data))
fmt.Println("b len:", newAPtr.Len)
}
// 運(yùn)行結(jié)果
a ptr: 0x3ed7f4
a len 11
b ptr: 0x3edb2c
b len: 12
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
文章知識(shí)點(diǎn)與官方知識(shí)檔案匹配
Go技能樹九陰真經(jīng)字符串
2043 人正在系統(tǒng)學(xué)習(xí)中
點(diǎn)擊閱讀全文
打開CSDN APP,看更多技術(shù)內(nèi)容
Golang底層原理剖析之string類型與字符編碼_cheems~的博客_g...
string類型 string結(jié)構(gòu) go語(yǔ)言中默認(rèn)使用的是UTF-8編碼 string由兩部分組成,一部分是指向字符串起始地址的指針,另一部分是字節(jié)個(gè)數(shù)len注意不是字符個(gè)數(shù),是字節(jié)個(gè)數(shù)!這個(gè)數(shù)據(jù)類型占用16B空間,指向字符串起始地址的指針和存在字節(jié)個(gè)數(shù)的整...
繼續(xù)訪問(wèn)
...底層系列二(基礎(chǔ))_GoGo在努力的博客_golang string底層
1、 string的定義 Golang中的string的定義在reflect包下的value.go中,定義如下: StringHeader 是字符串的運(yùn)行時(shí)表示,其中包含了兩個(gè)字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長(zhǎng)度。 // StringHeader is the runtime representation of a...
繼續(xù)訪問(wèn)
最新發(fā)布 Golang: []string 和 ...string
… 參數(shù)語(yǔ)法形成了可變參數(shù)的參數(shù)。它將接受零個(gè)或多個(gè)string參數(shù),并將它們作為切片引用
繼續(xù)訪問(wèn)
常用的Golang字符串(string)操作
文章目錄Golang中常用的字符串操作一、標(biāo)準(zhǔn)庫(kù)相關(guān)的Package二、常用字符串操作判斷是否為空字符串 正文 Golang中常用的字符串操作 一、標(biāo)準(zhǔn)庫(kù)相關(guān)的Package 二、常用字符串操作 判斷是否為空字符串 思路:直接判斷是否等于""空字符串,由于golang中字符串不能為nil,且為值類型,所以直接與空字符串比較即可 舉例: str := "" if str == ""{...
繼續(xù)訪問(wèn)
golang中的string_xiaodongdonga的博客_golang ...string
golang中的string 在golang中,string其實(shí)是個(gè)結(jié)構(gòu)體,如圖 ,在這個(gè)結(jié)構(gòu)體中有兩個(gè)值,一個(gè)是指向字符數(shù)組的指針str,另一個(gè)是這個(gè)字符串的長(zhǎng)度len。 另外在golang中用的是UFT8邊長(zhǎng)編碼,里面字母是用一個(gè)字節(jié),西方的文字使用兩個(gè)字節(jié),...
繼續(xù)訪問(wèn)
Golang中對(duì)字符串string的相關(guān)操作_Codex_97的博客_go 字符...
golang中擁有string的內(nèi)置類型,可以使用與普通slice類型相似的性質(zhì)。 1.簡(jiǎn)介 strings包提供了很多操作字符串的簡(jiǎn)單函數(shù),通常一般的字符串操作都可以在這個(gè)包中找到。 strconv 包提供了基本數(shù)據(jù)類型和字符串之間的轉(zhuǎn)換。在Go 中,沒(méi)有隱式...
繼續(xù)訪問(wèn)
go-string-set:一種在GoLang中創(chuàng)建字符串集的方法
概述 通過(guò)字符串設(shè)置方法。 用法 go get github.com/wojnosystems/go-string-set package main import ( "github.com/wojnosystems/go-string-set/string_set" "strings" ) func main () { myPeople := string_set . New () myPeople . Add ( "Bob" ) myPeople . Add ( "Jane" ) myPeople . Add ( "Gary" ) myPeople . Add ( "Bob" ) if myPeople . Exists ( "Bob" ) { // Bob exists in myPeople, so this code block execute
Golang:strings包和字符串操作
strings包 string類型值是不可變的,如果想要獲得一個(gè)不一樣的字符串,就只能基于原字符串進(jìn)行剪裁,拼接等操作,然后將得到的新字符串存放到一塊聯(lián)系內(nèi)存中。 string值包含了指向底層字節(jié)數(shù)組頭部的指針值,以及該字節(jié)數(shù)組的長(zhǎng)度。在string值上做切片,就相當(dāng)于在其底層字節(jié)數(shù)組做切片。 而字符串拼接時(shí)(使用+),會(huì)把所有被拼接的字符串依次拷貝到一個(gè)嶄新且足夠大的連續(xù)內(nèi)存空間中,并把持有新...
繼續(xù)訪問(wèn)
golang中的strings.SplitN_盼盼編程的博客_strings.splitn
golang中的字符串操作strings.SplitN package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "hello world hello world" //str := "wo" //以str為分隔符,將s切分成多個(gè)子串,結(jié)果中**不包含*...
繼續(xù)訪問(wèn)
Golang_String常用操作_itzhuzhu.的博客_golang strings
func main() { var x string = "ITzhuzhu" var y string = "itzhuzhu" fmt.Println(strings.EqualFold(x, y)) //true fmt.Println(x == y) //false } 1 2 3 4 5 6 返回子串在字符串第一次出現(xiàn)的索引,如果沒(méi)有則...
繼續(xù)訪問(wèn)
Golang類型的String()方法
作用 用于定制fmt.Println(x)、fmt.Printf("%v", x)、fmt.Print(x)時(shí)輸出的內(nèi)容。 示例 package main import "fmt" type Couple struct { Husband string Wife string } func (self Couple) String() string { return "(husband:" + self.Husband + ", wife:" + self.Wife +
繼續(xù)訪問(wèn)
golang的string
golang中的string是不可變的字節(jié)序列,零值是空字符串,默認(rèn)是UTF-8編碼。 golang中使用字符串最需要注意的是,golang中的字符串是字節(jié)序列,string == []byte,由于一個(gè)字符占用的字節(jié)數(shù)不確定,所以無(wú)法通過(guò)下標(biāo)[i]的方式穩(wěn)定地獲取對(duì)應(yīng)位置的字符。 也就意味著字符串的第i個(gè)字節(jié),不一定就是第i個(gè)字符,原因請(qǐng)參考 unicode與UTF-8 文字符號(hào)在golang中被稱為rune,發(fā)音為/ru:n/,意思是符號(hào)。由于utf-8最多使用4個(gè)字節(jié)來(lái)編碼,所以rune類型是int3
繼續(xù)訪問(wèn)
golang中的strings.Trim_盼盼編程的博客_strings.trim
golang中的字符串操作strings.Trim package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "Hello world hello world" str := "world" //var s = []string{"11","22","33"} //刪除s首尾...
繼續(xù)訪問(wèn)
Golang 字符串
Go語(yǔ)言的代碼是由Unicode字符組成的,它們都必須由Unicode編碼規(guī)范中的UTF-8編碼格式進(jìn)行編碼并存儲(chǔ),Unicode編碼規(guī)范中的編碼格式定義的是字符與字節(jié)序列之間的轉(zhuǎn)換方式。其中的UTF-8是一種可變寬的編碼方案,它會(huì)用一個(gè)或多個(gè)字節(jié)的二進(jìn)制數(shù)來(lái)表示某個(gè)字符,最多使用四個(gè)字節(jié)。Go語(yǔ)言中的一個(gè)string類型值會(huì)由若干個(gè)Unicode字符組成,每個(gè)Unicode字符都可以由一個(gè)rune類型的值來(lái)承載。stringforrange。...
繼續(xù)訪問(wèn)
golang字符串[]string(slice)去重
1、現(xiàn)實(shí)代碼 // []string 去重 func RemoveDuplicate(list []string) []string { // 這個(gè)排序很關(guān)鍵 sort.Strings(list) i := 0 var newlist = []string{""} for j := 0; j len(list); j++ { if strings.Compare(newlist[i], list[j]) == -1 { newlist = append(newlist, lis
繼續(xù)訪問(wèn)
深入理解golang string
golang string string的定義 // string is the set of all strings of 8-bit bytes, conventionally but not // necessarily representing UTF-8-encoded text. A string may be empty, but // not nil. Values of string type are immutable. type string string string里存儲(chǔ)的是字符
繼續(xù)訪問(wèn)
golang中string包
對(duì)于基本類型來(lái)說(shuō),字符串所需要執(zhí)行的操作會(huì)比較復(fù)雜,所以一般語(yǔ)言都會(huì)額外封裝一些方法用于處理字符串,go語(yǔ)言標(biāo)準(zhǔn)庫(kù)中也存在這樣一個(gè)名為strings的庫(kù) 包含判斷,判斷一個(gè)字符中是否有相應(yīng)的某個(gè)子字符串是經(jīng)常遇到的一種字符串操作,再go語(yǔ)言中可以使用strings包中的兩個(gè)方法判斷 ...
繼續(xù)訪問(wèn)
golang中的strings.TrimLeft
golang中的字符串操作strings.TrimLeft package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "Hello world hello world" str := "Hello" //var s = []string{"11","22","33"} //刪除s頭部連續(xù)的包含在str中的字符串 .
繼續(xù)訪問(wèn)
golang入門time與string轉(zhuǎn)換, time加減時(shí)間, 兩個(gè)時(shí)間差
package mainimport ( "fmt" "time")var timeLayoutStr = "2006-01-02 15:04:05" //go中的時(shí)間格式化必須是這個(gè)時(shí)間//var timeLayoutStr = 2006/01/02 03:04:05 //合法, 格式可以改變//var timeLayoutStr = 2019/01/02 15:04:05 /...
繼續(xù)訪問(wèn)
Golang——string
1.string結(jié)構(gòu)體底層 由兩部分組成:指向底層[ ]byte數(shù)組的指針;長(zhǎng)度(類似切片結(jié)構(gòu)體) 2.相同的string常量不會(huì)重復(fù)存儲(chǔ) //由s1、s2的指針指向一塊相同的只讀內(nèi)存,這段內(nèi)存以u(píng)tf-8編碼存放hello數(shù)組 s1 := "hello" s2 := "hello" 3.string常量會(huì)在編譯期分配到只讀段,對(duì)應(yīng)數(shù)據(jù)地址不可寫入,故string不支持修改。 要修改必須轉(zhuǎn)[]byte,string和[]byte轉(zhuǎn)換,會(huì)將這段只讀內(nèi)存的數(shù)據(jù)復(fù)制到堆/棧上。 //wrong s := "he
繼續(xù)訪問(wèn)
熱門推薦 golang -----------字符串(rune,string,type)
一、內(nèi)存布局 字符串在Go語(yǔ)言內(nèi)存模型中用一個(gè)2字長(zhǎng)的數(shù)據(jù)結(jié)構(gòu)表示。它包含一個(gè)指向字符串存儲(chǔ)數(shù)據(jù)的指針和一個(gè)長(zhǎng)度數(shù)據(jù)。因?yàn)閟tring類型是不可變的,對(duì)于多字符串共享同一個(gè)存儲(chǔ)數(shù)據(jù)是安全的。切分操作str[i:j]會(huì)得到一個(gè)新的2字長(zhǎng)結(jié)構(gòu),一個(gè)可能不同的但仍指向同一個(gè)字節(jié)序列(即上文說(shuō)的存儲(chǔ)數(shù)據(jù))的指針和長(zhǎng)度數(shù)據(jù)。這意味著字符串切分可以在不涉及內(nèi)存分配或復(fù)制操作。這使得字符串切分的效率等同于...
繼續(xù)訪問(wèn)
Golang string 常用方法
strings.Compare(p1, p2) 判斷p1是否大于p2,大于:1,小于:-1,等于:0。2.strings.LastIndex(p1,p2) p2在p1中最后一次出現(xiàn)的位置,未出現(xiàn)返回-1。1.strings.Replace(p1,p2,p3,n) 將p1中的p2替換成p3,最多替換n個(gè)。1.strings.Index(p1,p2) p2在p1中第一次出現(xiàn)的位置,未出現(xiàn)返回-1。2.strings.ReplaceAll(p1,p2,p3) 將p1中的所有p2替換成p3。
繼續(xù)訪問(wèn)
golang中的字符串
在go中rune是一個(gè)unicode編碼點(diǎn)。 我們都知道UTF-8將字符編碼為1-4個(gè)字節(jié),比如我們常用的漢字,UTF-8編碼為3個(gè)字節(jié)。所以rune也是int32的別名。
繼續(xù)訪問(wèn)
golang之字符串
Go語(yǔ)言的字符有兩種類型: 一種是byte型,或者叫uint8類型,代表了ASCII碼的一個(gè)字符。 一種是rune類型,或者叫int32類型,代表一個(gè)UTF-8字符,當(dāng)需要處理中文、日文等unicode字符時(shí),則需要用到rune類型。 ...
繼續(xù)訪問(wèn)
Golang的 string 類型
一點(diǎn)睛 字符串就是一串固定長(zhǎng)度的字符連接起來(lái)的字符序列。Go 的字符串是由單個(gè)字節(jié)連接起來(lái)的。Go語(yǔ)言的字符串的字節(jié)使用 UTF-8 編碼標(biāo)識(shí) Unicode 文本。 二 string 使用注意事項(xiàng)和細(xì)節(jié) 1 Go 語(yǔ)言的字符串的字節(jié)使用 UTF-8 編碼標(biāo)識(shí) Unicode 文本,這樣 Golang 統(tǒng)一使用 UTF-8 編碼,中文亂碼問(wèn)題不會(huì)再困擾程序員。 2 字符串一旦賦值了,字符串就不能修改了,在 Go 中字符串是不可變的。 3 字符串的兩種表示形式。 a 雙引號(hào)——會(huì)識(shí)別轉(zhuǎn)義字符 .
繼續(xù)訪問(wèn)
Golang Strings 官方包常用方法,學(xué)會(huì)這些夠用了
1.判斷是否以某字符串打頭/結(jié)尾 2.字符串分割 3.返回子串索引 4.字符串連接 5.字符串轉(zhuǎn)化為大小寫 6.統(tǒng)計(jì)某個(gè)字符在字符串出現(xiàn)的次數(shù) 7.判斷字符串的包含關(guān)系 8.字符串替換
map 是Go語(yǔ)言中基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu),在日常的使用中經(jīng)常被用到。但是它底層是如何實(shí)現(xiàn)的呢?
總體來(lái)說(shuō)golang的map是hashmap,是使用數(shù)組+鏈表的形式實(shí)現(xiàn)的,使用拉鏈法消除hash沖突。
golang的map由兩種重要的結(jié)構(gòu),hmap和bmap(下文中都有解釋),主要就是hmap中包含一個(gè)指向bmap數(shù)組的指針,key經(jīng)過(guò)hash函數(shù)之后得到一個(gè)數(shù),這個(gè)數(shù)低位用于選擇bmap(當(dāng)作bmap數(shù)組指針的下表),高位用于放在bmap的[8]uint8數(shù)組中,用于快速試錯(cuò)。然后一個(gè)bmap可以指向下一個(gè)bmap(拉鏈)。
Golang中map的底層實(shí)現(xiàn)是一個(gè)散列表,因此實(shí)現(xiàn)map的過(guò)程實(shí)際上就是實(shí)現(xiàn)散表的過(guò)程。在這個(gè)散列表中,主要出現(xiàn)的結(jié)構(gòu)體有兩個(gè),一個(gè)叫 hmap (a header for a go map),一個(gè)叫 bmap (a bucket for a Go map,通常叫其bucket)。這兩種結(jié)構(gòu)的樣子分別如下所示:
hmap :
圖中有很多字段,但是便于理解map的架構(gòu),你只需要關(guān)心的只有一個(gè),就是標(biāo)紅的字段: buckets數(shù)組 。Golang的map中用于存儲(chǔ)的結(jié)構(gòu)是bucket數(shù)組。而bucket(即bmap)的結(jié)構(gòu)是怎樣的呢?
bucket :
相比于hmap,bucket的結(jié)構(gòu)顯得簡(jiǎn)單一些,標(biāo)紅的字段依然是“核心”,我們使用的map中的key和value就存儲(chǔ)在這里。“高位哈希值”數(shù)組記錄的是當(dāng)前bucket中key相關(guān)的“索引”,稍后會(huì)詳細(xì)敘述。還有一個(gè)字段是一個(gè)指向擴(kuò)容后的bucket的指針,使得bucket會(huì)形成一個(gè)鏈表結(jié)構(gòu)。例如下圖:
由此看出hmap和bucket的關(guān)系是這樣的:
而bucket又是一個(gè)鏈表,所以,整體的結(jié)構(gòu)應(yīng)該是這樣的:
哈希表的特點(diǎn)是會(huì)有一個(gè)哈希函數(shù),對(duì)你傳來(lái)的key進(jìn)行哈希運(yùn)算,得到唯一的值,一般情況下都是一個(gè)數(shù)值。Golang的map中也有這么一個(gè)哈希函數(shù),也會(huì)算出唯一的值,對(duì)于這個(gè)值的使用,Golang也是很有意思。
Golang把求得的值按照用途一分為二:高位和低位。
如圖所示,藍(lán)色為高位,紅色為低位。 然后低位用于尋找當(dāng)前key屬于hmap中的哪個(gè)bucket,而高位用于尋找bucket中的哪個(gè)key。上文中提到:bucket中有個(gè)屬性字段是“高位哈希值”數(shù)組,這里存的就是藍(lán)色的高位值,用來(lái)聲明當(dāng)前bucket中有哪些“key”,便于搜索查找。 需要特別指出的一點(diǎn)是:我們map中的key/value值都是存到同一個(gè)數(shù)組中的。數(shù)組中的順序是這樣的:
并不是key0/value0/key1/value1的形式,這樣做的好處是:在key和value的長(zhǎng)度不同的時(shí)候,可 以消除padding(內(nèi)存對(duì)齊)帶來(lái)的空間浪費(fèi) 。
現(xiàn)在,我們可以得到Go語(yǔ)言map的整個(gè)的結(jié)構(gòu)圖了:(hash結(jié)果的低位用于選擇把KV放在bmap數(shù)組中的哪一個(gè)bmap中,高位用于key的快速預(yù)覽,用于快速試錯(cuò))
map的擴(kuò)容
當(dāng)以上的哈希表增長(zhǎng)的時(shí)候,Go語(yǔ)言會(huì)將bucket數(shù)組的數(shù)量擴(kuò)充一倍,產(chǎn)生一個(gè)新的bucket數(shù)組,并將舊數(shù)組的數(shù)據(jù)遷移至新數(shù)組。
加載因子
判斷擴(kuò)充的條件,就是哈希表中的加載因子(即loadFactor)。
加載因子是一個(gè)閾值,一般表示為:散列包含的元素?cái)?shù) 除以 位置總數(shù)。是一種“產(chǎn)生沖突機(jī)會(huì)”和“空間使用”的平衡與折中:加載因子越小,說(shuō)明空間空置率高,空間使用率小,但是加載因子越大,說(shuō)明空間利用率上去了,但是“產(chǎn)生沖突機(jī)會(huì)”高了。
每種哈希表的都會(huì)有一個(gè)加載因子,數(shù)值超過(guò)加載因子就會(huì)為哈希表擴(kuò)容。
Golang的map的加載因子的公式是:map長(zhǎng)度 / 2^B(這是代表bmap數(shù)組的長(zhǎng)度,B是取的低位的位數(shù))閾值是6.5。其中B可以理解為已擴(kuò)容的次數(shù)。
當(dāng)Go的map長(zhǎng)度增長(zhǎng)到大于加載因子所需的map長(zhǎng)度時(shí),Go語(yǔ)言就會(huì)將產(chǎn)生一個(gè)新的bucket數(shù)組,然后把舊的bucket數(shù)組移到一個(gè)屬性字段oldbucket中。注意:并不是立刻把舊的數(shù)組中的元素轉(zhuǎn)義到新的bucket當(dāng)中,而是,只有當(dāng)訪問(wèn)到具體的某個(gè)bucket的時(shí)候,會(huì)把bucket中的數(shù)據(jù)轉(zhuǎn)移到新的bucket中。
如下圖所示:當(dāng)擴(kuò)容的時(shí)候,Go的map結(jié)構(gòu)體中,會(huì)保存舊的數(shù)據(jù),和新生成的數(shù)組
上面部分代表舊的有數(shù)據(jù)的bucket,下面部分代表新生成的新的bucket。藍(lán)色代表存有數(shù)據(jù)的bucket,橘黃色代表空的bucket。
擴(kuò)容時(shí)map并不會(huì)立即把新數(shù)據(jù)做遷移,而是當(dāng)訪問(wèn)原來(lái)舊bucket的數(shù)據(jù)的時(shí)候,才把舊數(shù)據(jù)做遷移,如下圖:
注意:這里并不會(huì)直接刪除舊的bucket,而是把原來(lái)的引用去掉,利用GC清除內(nèi)存。
map中數(shù)據(jù)的刪除
如果理解了map的整體結(jié)構(gòu),那么查找、更新、刪除的基本步驟應(yīng)該都很清楚了。這里不再贅述。
值得注意的是,找到了map中的數(shù)據(jù)之后,針對(duì)key和value分別做如下操作:
1
2
3
4
1、如果``key``是一個(gè)指針類型的,則直接將其置為空,等待GC清除;
2、如果是值類型的,則清除相關(guān)內(nèi)存。
3、同理,對(duì)``value``做相同的操作。
4、最后把key對(duì)應(yīng)的高位值對(duì)應(yīng)的數(shù)組index置為空。
作為C語(yǔ)言家族的一員,go和c一樣也支持結(jié)構(gòu)體。可以類比于java的一個(gè)POJO。
在學(xué)習(xí)定義結(jié)構(gòu)體之前,先學(xué)習(xí)下定義一個(gè)新類型。
新類型 T1 是基于 Go 原生類型 int 定義的新自定義類型,而新類型 T2 則是 基于剛剛定義的類型 T1,定義的新類型。
這里要引入一個(gè)底層類型的概念。
如果一個(gè)新類型是基于某個(gè) Go 原生類型定義的, 那么我們就叫 Go 原生類型為新類型的底層類型
在上面的例子中,int就是T1的底層類型。
但是T1不是T2的底層類型,只有原生類型才可以作為底層類型,所以T2的底層類型還是int
底層類型是很重要的,因?yàn)閷?duì)兩個(gè)變量進(jìn)行顯式的類型轉(zhuǎn)換,只有底層類型相同的變量間才能相互轉(zhuǎn)換。底層類型是判斷兩個(gè)類型本質(zhì)上是否相同的根本。
這種類型定義方式通常用在 項(xiàng)目的漸進(jìn)式重構(gòu),還有對(duì)已有包的二次封裝方面
類型別名表示新類型和原類型完全等價(jià),實(shí)際上就是同一種類型。只不過(guò)名字不同而已。
一般我們都是定義一個(gè)有名的結(jié)構(gòu)體。
字段名的大小寫決定了字段是否包外可用。只有大寫的字段可以被包外引用。
還有一個(gè)點(diǎn)提一下
如果換行來(lái)寫
Age: 66,后面這個(gè)都好不能省略
還有一個(gè)點(diǎn),觀察e3的賦值
new返回的是一個(gè)指針。然后指針可以直接點(diǎn)號(hào)賦值。這說(shuō)明go默認(rèn)進(jìn)行了取值操作
e3.Age 等價(jià)于 (*e3).Age
如上定義了一個(gè)空的結(jié)構(gòu)體Empty。打印了元素e的內(nèi)存大小是0。
有什么用呢?
基于空結(jié)構(gòu)體類型內(nèi)存零開銷這樣的特性,我們?cè)谌粘?Go 開發(fā)中會(huì)經(jīng)常使用空 結(jié)構(gòu)體類型元素,作為一種“事件”信息進(jìn)行 Goroutine 之間的通信
這種以空結(jié)構(gòu)體為元素類建立的 channel,是目前能實(shí)現(xiàn)的、內(nèi)存占用最小的 Goroutine 間通信方式。
這種形式需要說(shuō)的是幾個(gè)語(yǔ)法糖。
語(yǔ)法糖1:
對(duì)于結(jié)構(gòu)體字段,可以省略字段名,只寫結(jié)構(gòu)體名。默認(rèn)字段名就是結(jié)構(gòu)體名
這種方式稱為 嵌入字段
語(yǔ)法糖2:
如果是以嵌入字段形式寫的結(jié)構(gòu)體
可以省略嵌入的Reader字段,而直接訪問(wèn)ReaderName
此時(shí)book是一個(gè)各個(gè)屬性全是對(duì)應(yīng)類型零值的一個(gè)實(shí)例。不是nil。這種情況在Go中稱為零值可用。不像java會(huì)導(dǎo)致npe
結(jié)構(gòu)體定義時(shí)可以在字段后面追加標(biāo)簽說(shuō)明。
tag的格式為反單引號(hào)
tag的作用是可以使用[反射]來(lái)檢視字段的標(biāo)簽信息。
具體的作用還要看使用的場(chǎng)景。
比如這里的tag是為了幫助 encoding/json 標(biāo)準(zhǔn)包在解析對(duì)象時(shí)可以利用的規(guī)則。比如omitempty表示該字段沒(méi)有值就不打印出來(lái)。
文章名稱:go語(yǔ)言底層剖析 go語(yǔ)言源碼分析
本文網(wǎng)址:http://chinadenli.net/article48/dodjgep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、App開發(fā)、全網(wǎng)營(yíng)銷推廣、企業(yè)建站、品牌網(wǎng)站制作、移動(dòng)網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)