Go 語言較之 C 語言一個很大的優(yōu)勢就是自帶 GC 功能,可 GC 并不是沒有代價的。寫 C 語言的時候,在一個函數(shù)內(nèi)聲明的變量,在函數(shù)退出后會自動釋放掉,因為這些變量分配在棧上。如果你期望變量的數(shù)據(jù)可以在函數(shù)退出后仍然能被訪問,就需要調(diào)用 malloc 方法在堆上申請內(nèi)存,如果程序不再需要這塊內(nèi)存了,再調(diào)用 free 方法釋放掉。Go 語言不需要你主動調(diào)用 malloc 來分配堆空間,編譯器會自動分析,找出需要 malloc 的變量,使用堆內(nèi)存。編譯器的這個分析過程就叫做逃逸分析。
成都創(chuàng)新互聯(lián)是專業(yè)的驛城網(wǎng)站建設公司,驛城接單;提供網(wǎng)站建設、網(wǎng)站設計,網(wǎng)頁設計,網(wǎng)站設計,建網(wǎng)站,PHP網(wǎng)站建設等專業(yè)做網(wǎng)站服務;采用PHP框架,可快速的進行驛城網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
所以你在一個函數(shù)中通過 dict := make(map[string]int) 創(chuàng)建一個 map 變量,其背后的數(shù)據(jù)是放在??臻g上還是堆空間上,是不一定的。這要看編譯器分析的結(jié)果。
可逃逸分析并不是百分百準確的,它有缺陷。有的時候你會發(fā)現(xiàn)有些變量其實在棧空間上分配完全沒問題的,但編譯后程序還是把這些數(shù)據(jù)放在了堆上。如果你了解 Go 語言編譯器逃逸分析的機制,在寫代碼的時候就可以有意識地繞開這些缺陷,使你的程序更高效。
Go 語言雖然在內(nèi)存管理方面降低了編程門檻,即使你不了解堆棧也能正常開發(fā),但如果你要在性能上較真的話,還是要掌握這些基礎知識。
這里不對堆內(nèi)存和棧內(nèi)存的區(qū)別做太多闡述。簡單來說就是, 棧分配廉價,堆分配昂貴。 棧空間會隨著一個函數(shù)的結(jié)束自動釋放,堆空間需要時間 GC 模塊不斷地跟蹤掃描回收。如果對這兩個概念有些迷糊,建議閱讀下面 2 個文章:
這里舉一個小例子,來對比下堆棧的差別:
stack 函數(shù)中的變量 i 在函數(shù)退出會自動釋放;而 heap 函數(shù)返回的是對變量 i 的引用,也就是說 heap() 退出后,表示變量 i 還要能被訪問,它會自動被分配到堆空間上。
他們編譯出來的代碼如下:
邏輯的復雜度不言而喻,從上面的匯編中可看到, heap() 函數(shù)調(diào)用了 runtime.newobject() 方法,它會調(diào)用 mallocgc 方法從 mcache 上申請內(nèi)存,申請的內(nèi)部邏輯前面文章已經(jīng)講述過。堆內(nèi)存分配不僅分配上邏輯比??臻g分配復雜,它最致命的是會帶來很大的管理成本,Go 語言要消耗很多的計算資源對其進行標記回收(也就是 GC 成本)。
Go 編輯器會自動幫我們找出需要進行動態(tài)分配的變量,它是在編譯時追蹤一個變量的生命周期,如果能確認一個數(shù)據(jù)只在函數(shù)空間內(nèi)訪問,不會被外部使用,則使用棧空間,否則就要使用堆空間。
我們在 go build 編譯代碼時,可使用 -gcflags '-m' 參數(shù)來查看逃逸分析日志。
以上面的兩個函數(shù)為例,編譯的日志輸出是:
日志中的 i escapes to heap 表示該變量數(shù)據(jù)逃逸到了堆上。
需要使用堆空間,所以逃逸,這沒什么可爭議的。但編譯器有時會將 不需要 使用堆空間的變量,也逃逸掉。這里是容易出現(xiàn)性能問題的大坑。網(wǎng)上有很多相關文章,列舉了一些導致逃逸情況,其實總結(jié)起來就一句話:
多級間接賦值容易導致逃逸 。
這里的多級間接指的是,對某個引用類對象中的引用類成員進行賦值。Go 語言中的引用類數(shù)據(jù)類型有 func , interface , slice , map , chan , *Type(指針) 。
記住公式 Data.Field = Value ,如果 Data , Field 都是引用類的數(shù)據(jù)類型,則會導致 Value 逃逸。這里的等號 = 不單單只賦值,也表示參數(shù)傳遞。
根據(jù)公式,我們假設一個變量 data 是以下幾種類型,相應的可以得出結(jié)論:
下面給出一些實際的例子:
如果變量值是一個函數(shù),函數(shù)的參數(shù)又是引用類型,則傳遞給它的參數(shù)都會逃逸。
上例中 te 的類型是 func(*int) ,屬于引用類型,參數(shù) *int 也是引用類型,則調(diào)用 te(j) 形成了為 te 的參數(shù)(成員) *int 賦值的現(xiàn)象,即 te.i = j 會導致逃逸。代碼中其他幾種調(diào)用都沒有形成 多級間接賦值 情況。
同理,如果函數(shù)的參數(shù)類型是 slice , map 或 interface{} 都會導致參數(shù)逃逸。
匿名函數(shù)的調(diào)用也是一樣的,它本質(zhì)上也是一個函數(shù)變量。有興趣的可以自己測試一下。
只要使用了 Interface 類型(不是 interafce{} ),那么賦值給它的變量一定會逃逸。因為 interfaceVariable.Method() 先是間接的定位到它的實際值,再調(diào)用實際值的同名方法,執(zhí)行時實際值作為參數(shù)傳遞給方法。相當于 interfaceVariable.Method.this = realValue
向 channel 中發(fā)送數(shù)據(jù),本質(zhì)上就是為 channel 內(nèi)部的成員賦值,就像給一個 slice 中的某一項賦值一樣。所以 chan *Type , chan map[Type]Type , chan []Type , chan interface{} 類型都會導致發(fā)送到 channel 中的數(shù)據(jù)逃逸。
這本來也是情理之中的,發(fā)送給 channel 的數(shù)據(jù)是要與其他函數(shù)分享的,為了保證發(fā)送過去的指針依然可用,只能使用堆分配。
可變參數(shù)如 func(arg ...string) 實際與 func(arg []string) 是一樣的,會增加一層訪問路徑。這也是 fmt.Sprintf 總是會使參數(shù)逃逸的原因。
例子非常多,這里不能一一列舉,我們只需要記住分析方法就好,即,2 級或更多級的訪問賦值會 容易 導致數(shù)據(jù)逃逸。這里加上 容易 二字是因為隨著語言的發(fā)展,相信這些問題會被慢慢解決,但現(xiàn)階段,這個可以作為我們分析逃逸現(xiàn)象的依據(jù)。
下面代碼中包含 2 種很常規(guī)的寫法,但他們卻有著很大的性能差距,建議自己想下為什么。
Benchmark 和 pprof 給出的結(jié)果:
熟悉堆棧概念可以讓我們更容易看透 Go 程序的性能問題,并進行優(yōu)化。
多級間接賦值會導致 Go 編譯器出現(xiàn)不必要的逃逸,在一些情況下可能我們只需要修改一下數(shù)據(jù)結(jié)構(gòu)就會使性能有大幅提升。這也是很多人不推薦在 Go 中使用指針的原因,因為它會增加一級訪問路徑,而 map , slice , interface{} 等類型是不可避免要用到的,為了減少不必要的逃逸,只能拿指針開刀了。
大多數(shù)情況下,性能優(yōu)化都會為程序帶來一定的復雜度。建議實際項目中還是怎么方便怎么寫,功能完成后通過性能分析找到瓶頸所在,再對局部進行優(yōu)化。
一.幾種公共方法
1)Print:???輸出到控制臺(不接受任何格式化,它等價于對每一個操作數(shù)都應用?%v)
print 在golang中?是屬于輸出到標準錯誤流中并打印,官方不建議寫程序時候用它。可以再debug時候用
2)Println:?輸出到控制臺并換行
3)Printf :?只可以打印出格式化的字符串。只可以直接輸出字符串類型的變量(不可以輸出整形變量和整形等)
4)Sprintf:格式化并返回一個字符串而不帶任何輸出
5)Fprintf:來格式化并輸出到 io.Writers 而不是 os.Stdout
二.帶占位符輸出--網(wǎng)址:? ??
和python差不多的道理,這里簡單補充
v ????值的默認格式
%+v???添加字段名(如結(jié)構(gòu)體)
%#v ?相應值的Go語法表示?
%T????相應值的類型的Go語法表示?
%%????字面上的百分號,并非值的占位符
%c?????相應Unicode碼點所表示的字符?
%x?????十六進制表示,字母形式為小寫 a-f
%X?????十六進制表示,字母形式為大寫 A-F
%U???? Unicode格式:U+1234,等同于?"U+%04X"
你已經(jīng)使用了“fmt.Sprintf("2020-%d-%d",month,day)”進行了合適化,而fmt.Sprintf函數(shù)會返回格式化的字符串,直接將格式化的字符串放到time.parse高數(shù)的第二個參數(shù)位置不就好了。
printf函數(shù)與sprintf不同之處有: (1)函數(shù)的聲明不同 int printf(const char *format [, argument]);int sprintf(char *buffer, const char *format [, argument] );sprintf比printf多一個參數(shù)buffer,這個參數(shù)的作用見(2)的描述。 (
操作字符串離不開字符串的拼接,但是Go中string是只讀類型,大量字符串的拼接會造成性能問題。
拼接字符串,無外乎四種方式,采用“+”,“fmt.Sprintf()”,"bytes.Buffer","strings.Builder"
上面我們創(chuàng)建10萬字符串拼接的測試,可以發(fā)現(xiàn)"bytes.Buffer","strings.Builder"的性能最好,約是“+”的1000倍級別。
這是由于string是不可修改的,所以在使用“+”進行拼接字符串,每次都會產(chǎn)生申請空間,拼接,復制等操作,數(shù)據(jù)量大的情況下非常消耗資源和性能。而采用Buffer等方式,都是預先計算拼接字符串數(shù)組的總長度(如果可以知道長度),申請空間,底層是slice數(shù)組,可以以append的形式向后進行追加。最后在轉(zhuǎn)換為字符串。這申請了不斷申請空間的操作,也減少了空間的使用和拷貝的次數(shù),自然性能也高不少。
bytes.buffer是一個緩沖byte類型的緩沖器存放著都是byte
是一個變長的 buffer,具有 Read 和Write 方法。 Buffer 的 零值 是一個 空的 buffer,但是可以使用,底層就是一個 []byte, 字節(jié)切片。
向Buffer中寫數(shù)據(jù),可以看出Buffer中有個Grow函數(shù)用于對切片進行擴容。
從Buffer中讀取數(shù)據(jù)
strings.Builder的方法和bytes.Buffer的方法的命名幾乎一致。
但實現(xiàn)并不一致,Builder的Write方法直接將字符拼接slice數(shù)組后。
其沒有提供read方法,但提供了strings.Reader方式
Reader 結(jié)構(gòu):
Buffer:
Builder:
可以看出Buffer和Builder底層都是采用[]byte數(shù)組進行裝載數(shù)據(jù)。
先來說說Buffer:
創(chuàng)建好Buffer是一個empty的,off 用于指向讀寫的尾部。
在寫的時候,先判斷當前寫入字符串長度是否大于Buffer的容量,如果大于就調(diào)用grow進行擴容,擴容申請的長度為當前寫入字符串的長度。如果當前寫入字符串長度小于最小字節(jié)長度64,直接創(chuàng)建64長度的[]byte數(shù)組。如果申請的長度小于二分之一總?cè)萘繙p去當前字符總長度,說明存在很大一部分被使用但已讀,可以將未讀的數(shù)據(jù)滑動到數(shù)組頭。如果容量不足,擴展2*c + n 。
其String()方法就是將字節(jié)數(shù)組強轉(zhuǎn)為string
Builder是如何實現(xiàn)的。
Builder采用append的方式向字節(jié)數(shù)組后添加字符串。
從上面可以看出,[]byte的內(nèi)存大小也是以倍數(shù)進行申請的,初始大小為 0,第一次為大于當前申請的最大 2 的指數(shù),不夠進行翻倍.
可以看出如果舊容量小于1024進行翻倍,否則擴展四分之一。(2048 byte 后,申請策略的調(diào)整)。
其次String()方法與Buffer的string方法也有明顯區(qū)別。Buffer的string是一種強轉(zhuǎn),我們知道在強轉(zhuǎn)的時候是需要進行申請空間,并拷貝的。而Builder只是指針的轉(zhuǎn)換。
這里我們解析一下 *(*string)(unsafe.Pointer(b.buf)) 這個語句的意思。
先來了解下unsafe.Pointer 的用法。
也就是說,unsafe.Pointer 可以轉(zhuǎn)換為任意類型,那么意味著,通過unsafe.Pointer媒介,程序繞過類型系統(tǒng),進行地址轉(zhuǎn)換而不是拷貝。
即*A = Pointer = *B
就像上面例子一樣,將字節(jié)數(shù)組轉(zhuǎn)為unsafe.Pointer類型,再轉(zhuǎn)為string類型,s和b中內(nèi)容一樣,修改b,s也變了,說明b和s是同一個地址。但是對s重新賦值后,意味著s的地址指向了“WORLD”,它們所使用的內(nèi)存空間不同了,所以s改變后,b并不會改變。
所以他們的區(qū)別就在于 bytes.Buffer 是重新申請了一塊空間,存放生成的string變量, 而strings.Builder直接將底層的[]byte轉(zhuǎn)換成了string類型返回了回來,去掉了申請空間的操作。
Golang 和java/c不同,Go在不同類型的變量之間賦值時需要顯式轉(zhuǎn)換。也就是說Golang中數(shù)據(jù)類型不能自動轉(zhuǎn)換。
基本語法
表達式T(v))將值v 轉(zhuǎn)換為類型T
T∶就是數(shù)據(jù)類型,比如int32,int64,float32等等
v∶ 就是需要轉(zhuǎn)換的變量
var i int = 100
var b float64 = float64(i)
var c int64 = int64(b)
fmt.Printf("b=%f,c=%d",b,c)
b=100.000000,c=100
登錄后復制
細節(jié)說明
1)Go中,數(shù)據(jù)類型的轉(zhuǎn)換可以是從表示范圍小-表示范圍大,也可以范圍大一范圍小
2) 被轉(zhuǎn)換的是變量存儲的數(shù)據(jù)(即值),變量本身的數(shù)據(jù)類型并沒有變化!
3) 在轉(zhuǎn)換中,比如將 int64 轉(zhuǎn)成int8,編譯時不會報錯,只是轉(zhuǎn)換的結(jié)果是按溢出處理,和
我們希望的結(jié)果不一樣。(在轉(zhuǎn)換的時候需要注意范圍)
var a int64 = 10000000
var b int8 = int8(a)
fmt.Printf("%d",b)
-128
登錄后復制
可以看到在轉(zhuǎn)換的時候,一定要保證轉(zhuǎn)換大數(shù)據(jù)要是對方可以接受的范圍。
n1類型是int32,那么?20整個就是int32類型,可是n2是int64,這樣就會編譯錯誤。
題二n4是12 + 127溢出超過了范圍,運行的時候按照溢出處理。n3是直接編譯不通過,128已經(jīng)超過了int8類型的范圍
基本數(shù)據(jù)類型和string的轉(zhuǎn)換
字符串格式化
Go語言用于控制文本輸出常用的標準庫是fmt
fmt中主要用于輸出的函數(shù)有:
Print: 輸出到控制臺,不接受任何格式化操作
Println: 輸出到控制臺并換行
Printf : 只可以打印出格式化的字符串。只可以直接輸出字符串類型的變量(不可以輸出別的類型)
Sprintf:格式化并返回一個字符串而不帶任何輸出
Fprintf:來格式化并輸出到 io.Writers 而不是 os.Stdout
整數(shù)類型
格 式 描 述
%b 整型以二進制方式顯示
%o 整型以八進制方式顯示
%d 整型以十進制方式顯示
%x 整型以十六進制方式顯示
%X 整型以十六進制、字母大寫方式顯示
%c 相應Unicode碼點所表示的字符
%U Unicode 字符, Unicode格式:123,等同于 "U+007B"
浮點數(shù)
格 式 描 述
%e 科學計數(shù)法,例如 -1234.456e+78
%E 科學計數(shù)法,例如 -1234.456E+78
%f 有小數(shù)點而無指數(shù),例如 123.456
%g 根據(jù)情況選擇 %e 或 %f 以產(chǎn)生更緊湊的(無末尾的0)輸出
%G 根據(jù)情況選擇 %E 或 %f 以產(chǎn)生更緊湊的(無末尾的0)輸出
布爾
格 式 描 述
%t true 或 false
字符串
格 式 描 述
%s 字符串或切片的無解譯字節(jié)
%q 雙引號圍繞的字符串,由Go語法安全地轉(zhuǎn)義
%x 十六進制,小寫字母,每字節(jié)兩個字符
%X 十六進制,大寫字母,每字節(jié)兩個字符
指針
格 式 描 述
%p 十六進制表示,前綴 0x
var num1 int64 = 99
var num2 float64 = 23.99
var b bool = true
var mychar byte = 'h'
str1 := fmt.Sprintf("%d",num1)
str2 := fmt.Sprintf("%f",num2)
bool1 := fmt.Sprintf("%t",b)
mychar1 := fmt.Sprintf("%c",mychar)
fmt.Printf("%T,%T,%T,str1=%v,str2=%v,bool1=%v,mychar1=%v",str1,bool1,str2,str1,str2,bool1,mychar1)
string,string,string,string,str1=99,str2=23.990000,bool1=true,mychar1=h
登錄后復制
?
使用strconv包 基本類型 - string類型
num1 := 99
str1 := strconv.FormatInt(int64(num1),10)
fmt.Printf("%T,%v",str1,str1)
num2 := 99.99
str2 := strconv.FormatFloat(num2,'f',10,64)
fmt.Printf("%T,%v\n",str2,str2)
登錄后復制
strconv包提供了字符串與簡單數(shù)據(jù)類型之間的類型轉(zhuǎn)換功能,可以將簡單類型轉(zhuǎn)換為字符串,也可以將字符串轉(zhuǎn)換為其它簡單類型
string和int轉(zhuǎn)換
int轉(zhuǎn)string的方法是: Itoa()
str := strconv.Itoa(100)
fmt.Printf("type %v, value: %s\n", reflect.TypeOf(str), str)
登錄后復制
2.string轉(zhuǎn)int的方法是:
i, err := strconv.Atoi("100")
fmt.Printf("type %v, value: %d, err: %v\n", reflect.TypeOf(i), i, err)
登錄后復制
并不是所有string都能轉(zhuǎn)化為int, 所以可能會報錯:
i, err := strconv.Atoi("100x")
fmt.Printf("type %v, value: %d, err: %v\n", reflect.TypeOf(i), i, err)
登錄后復制
使用strconv包 string轉(zhuǎn)其他類型
strconv包提供的Parse類函數(shù)用于將字符串轉(zhuǎn)化為給定類型的值:ParseBool()、ParseFloat()、ParseInt()、ParseUint() 由于字符串轉(zhuǎn)換為其它類型可能會失敗,所以這些函數(shù)都有兩個返回值,第一個返回值保存轉(zhuǎn)換后的值,第二個返回值判斷是否轉(zhuǎn)換成功。
1.轉(zhuǎn)bool
b, err := strconv.ParseBool("true")
fmt.Println(b, err)
登錄后復制
2.轉(zhuǎn)float
f1, err := strconv.ParseFloat("3.1", 32)
fmt.Println(f1, err)
f2, err := strconv.ParseFloat("3.1", 64)
fmt.Println(f2, err)
登錄后復制
由于浮點數(shù)的小數(shù)部分 并不是所有小數(shù)都能在計算機中精確的表示, 這就造成了浮點數(shù)精度問題, 比如下面
var n float64 = 0
for i := 0; i 1000; i++ {
n += .01
}
fmt.Println(n)
關于浮點數(shù)精度問題: c計算機不都是0101嗎,你有想過計算機是怎么表示的小數(shù)嗎, 簡單理解就是:
將其整數(shù)部分與小樹部分分開, 比如5.25
對于整數(shù)部分 5 ,我們使用"不斷除以2取余數(shù)"的方法,得到 101
對于小數(shù)部分 .25 ,我們使用"不斷乘以2取整數(shù)"的方法,得到 .01
聽說有一個包可以解決這個問題: github.com/shopspring/decimal
3.轉(zhuǎn)int
func ParseInt(s string, base int, bitSize int) (i int64, err error)
base: 進制,有效值為0、2-36。當base=0的時候,表示根據(jù)string的前綴來判斷以什么進制去解析:0x開頭的以16進制的方式去解析,0開頭的以8進制方式去解析,其它的以10進制方式解析
bitSize: 多少位,有效值為0、8、16、32、64。當bitSize=0的時候,表示轉(zhuǎn)換為int或uint類型。例如bitSize=8表示轉(zhuǎn)換后的值的類型為int8或uint8
fmt.Println(bInt8(-1)) // 0000 0001(原碼) - 1111 1110(反碼) - 1111 1111
// Parse 二進制字符串
i, err := strconv.ParseInt("11111111", 2, 16)
fmt.Println(i, err)
// Parse 十進制字符串
i, err = strconv.ParseInt("255", 10, 16)
fmt.Println(i, err)
// Parse 十六進制字符串
i, err = strconv.ParseInt("4E2D", 16, 16)
fmt.Println(i, err)
4.轉(zhuǎn)uint
func ParseUint(s string, base int, bitSize int) (uint64, error)
用法和轉(zhuǎn)int一樣, 只是轉(zhuǎn)換后的數(shù)據(jù)類型是uint64
u, err := strconv.ParseUint("11111111", 2, 16)
fmt.Println(u, err)
u, err = strconv.ParseUint("255", 10, 16)
fmt.Println(u, err)
u, err = strconv.ParseUint("4E2D", 16, 16)
fmt.Println(u, err)
其他類型轉(zhuǎn)string
將給定類型格式化為string類型:FormatBool()、FormatFloat()、FormatInt()、FormatUint()。
fmt.Println(strconv.FormatBool(true))
// 問題又來了
fmt.Println(strconv.FormatInt(255, 2))
fmt.Println(strconv.FormatInt(255, 10))
fmt.Println(strconv.FormatInt(255, 16))
fmt.Println(strconv.FormatUint(255, 2))
fmt.Println(strconv.FormatUint(255, 10))
fmt.Println(strconv.FormatUint(255, 16))
fmt.Println(strconv.FormatFloat(3.1415, 'E', -1, 64))
func FormatFloat(f float64, fmt byte, prec, bitSize int) string
bitSize表示f的來源類型(32:float32、64:float64),會據(jù)此進行舍入。
fmt表示格式:'f'(-ddd.dddd)、'b'(-ddddp±ddd,指數(shù)為二進制)、'e'(-d.dddde±dd,十進制指數(shù))、'E'(-d.ddddE±dd,十進制指數(shù))、'g'(指數(shù)很大時用'e'格式,否則'f'格式)、'G'(指數(shù)很大時用'E'格式,否則'f'格式)。
prec控制精度(排除指數(shù)部分):對'f'、'e'、'E',它表示小數(shù)點后的數(shù)字個數(shù);對'g'、'G',它控制總的數(shù)字個數(shù)。如果prec 為-1,則代表使用最少數(shù)量的、但又必需的數(shù)字來表示f。
本文標題:go語言sprintf,Go語言之父
本文路徑:http://chinadenli.net/article22/hegojc.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供商城網(wǎng)站、營銷型網(wǎng)站建設、品牌網(wǎng)站設計、響應式網(wǎng)站、做網(wǎng)站、動態(tài)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)