欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

Go語(yǔ)言消息推送系統(tǒng) goeasy消息推送

如何實(shí)現(xiàn)支持?jǐn)?shù)億用戶的長(zhǎng)連消息系統(tǒng)

此文是根據(jù)周洋在【高可用架構(gòu)群】中的分享內(nèi)容整理而成,轉(zhuǎn)發(fā)請(qǐng)注明出處。 周洋,360手機(jī)助手技術(shù)經(jīng)理及架構(gòu)師,負(fù)責(zé)360長(zhǎng)連接消息系統(tǒng),360手機(jī)助手架構(gòu)的開(kāi)發(fā)與維護(hù)。 不知道咱們?nèi)好裁磿r(shí)候改為“Python高可用架構(gòu)群”了,所以不得不說(shuō),很榮幸能在接下來(lái)的一個(gè)小時(shí)里在Python群里討論golang....360消息系統(tǒng)介紹 360消息系統(tǒng)更確切的說(shuō)是長(zhǎng)連接push系統(tǒng),目前服務(wù)于360內(nèi)部多個(gè)產(chǎn)品,開(kāi)發(fā)平臺(tái)數(shù)千款app,也支持部分聊天業(yè)務(wù)場(chǎng)景,單通道多app復(fù)用,支持上行數(shù)據(jù),提供接入方不同粒度的上行數(shù)據(jù)和用戶狀態(tài)回調(diào)服務(wù)。 目前整個(gè)系統(tǒng)按不同業(yè)務(wù)分成9個(gè)功能完整的集群,部署在多個(gè)idc上(每個(gè)集群覆蓋不同的idc),實(shí)時(shí)在線數(shù)億量級(jí)。通常情況下,pc,手機(jī),甚至是智能硬件上的360產(chǎn)品的push消息,基本上是從我們系統(tǒng)發(fā)出的。 關(guān)于push系統(tǒng)對(duì)比與性能指標(biāo)的討論 很多同行比較關(guān)心go語(yǔ)言在實(shí)現(xiàn)push系統(tǒng)上的性能問(wèn)題,單機(jī)性能究竟如何,能否和其他語(yǔ)言實(shí)現(xiàn)的類似系統(tǒng)做對(duì)比么?甚至問(wèn)如果是創(chuàng)業(yè),第三方云推送平臺(tái),推薦哪個(gè)? 其實(shí)各大廠都有類似的push系統(tǒng),市場(chǎng)上也有類似功能的云服務(wù)。包括我們公司早期也有erlang,nodejs實(shí)現(xiàn)的類似系統(tǒng),也一度被公司要求做類似的對(duì)比測(cè)試。我感覺(jué)在討論對(duì)比數(shù)據(jù)的時(shí)候,很難保證大家環(huán)境和需求的統(tǒng)一,我只能說(shuō)下我這里的體會(huì),數(shù)據(jù)是有的,但這個(gè)數(shù)據(jù)前面估計(jì)會(huì)有很多定語(yǔ)~ 第一個(gè)重要指標(biāo):?jiǎn)螜C(jī)的連接數(shù)指標(biāo) 做過(guò)長(zhǎng)連接的同行,應(yīng)該有體會(huì),如果在穩(wěn)定連接情況下,連接數(shù)這個(gè)指標(biāo),在沒(méi)有網(wǎng)絡(luò)吞吐情況下對(duì)比,其實(shí)意義往往不大,維持連接消耗cpu資源很小,每條連接tcp協(xié)議棧會(huì)占約4k的內(nèi)存開(kāi)銷,系統(tǒng)參數(shù)調(diào)整后,我們單機(jī)測(cè)試數(shù)據(jù),最高也是可以達(dá)到單實(shí)例300w長(zhǎng)連接。但做更高的測(cè)試,我個(gè)人感覺(jué)意義不大。 因?yàn)閷?shí)際網(wǎng)絡(luò)環(huán)境下,單實(shí)例300w長(zhǎng)連接,從理論上算壓力就很大:實(shí)際弱網(wǎng)絡(luò)環(huán)境下,移動(dòng)客戶端的斷線率很高,假設(shè)每秒有1000分之一的用戶斷線重連。300w長(zhǎng)連接,每秒新建連接達(dá)到3w,這同時(shí)連入的3w用戶,要進(jìn)行注冊(cè),加載離線存儲(chǔ)等對(duì)內(nèi)rpc調(diào)用,另外300w長(zhǎng)連接的用戶心跳需要維持,假設(shè)心跳300s一次,心跳包每秒需要1w tps。單播和多播數(shù)據(jù)的轉(zhuǎn)發(fā),廣播數(shù)據(jù)的轉(zhuǎn)發(fā),本身也要響應(yīng)內(nèi)部的rpc調(diào)用,300w長(zhǎng)連接情況下,gc帶來(lái)的壓力,內(nèi)部接口的響應(yīng)延遲能否穩(wěn)定保障。這些集中在一個(gè)實(shí)例中,可用性是一個(gè)挑戰(zhàn)。所以線上單實(shí)例不會(huì)hold很高的長(zhǎng)連接,實(shí)際情況也要根據(jù)接入客戶端網(wǎng)絡(luò)狀況來(lái)決定。 第二個(gè)重要指標(biāo):消息系統(tǒng)的內(nèi)存使用量指標(biāo) 這一點(diǎn)上,使用go語(yǔ)言情況下,由于協(xié)程的原因,會(huì)有一部分額外開(kāi)銷。但是要做兩個(gè)推送系統(tǒng)的對(duì)比,也有些需要確定問(wèn)題。比如系統(tǒng)從設(shè)計(jì)上是否需要全雙工(即讀寫是否需要同時(shí)進(jìn)行)如果半雙工,理論上對(duì)一個(gè)用戶的連接只需要使用一個(gè)協(xié)程即可(這種情況下,對(duì)用戶的斷線檢測(cè)可能會(huì)有延時(shí)),如果是全雙工,那讀/寫各一個(gè)協(xié)程。兩種場(chǎng)景內(nèi)存開(kāi)銷是有區(qū)別的。 另外測(cè)試數(shù)據(jù)的大小往往決定我們對(duì)連接上設(shè)置的讀寫buffer是多大,是全局復(fù)用的,還是每個(gè)連接上獨(dú)享的,還是動(dòng)態(tài)申請(qǐng)的。另外是否全雙工也決定buffer怎么開(kāi)。不同的策略,可能在不同情況的測(cè)試中表現(xiàn)不一樣。 第三個(gè)重要指標(biāo):每秒消息下發(fā)量 這一點(diǎn)上,也要看我們對(duì)消息到達(dá)的QoS級(jí)別(回復(fù)ack策略區(qū)別),另外看架構(gòu)策略,每種策略有其更適用的場(chǎng)景,是純粹推?還是推拉結(jié)合?甚至是否開(kāi)啟了消息日志?日志庫(kù)的實(shí)現(xiàn)機(jī)制、以及緩沖開(kāi)多大?flush策略……這些都影響整個(gè)系統(tǒng)的吞吐量。 另外為了HA,增加了內(nèi)部通信成本,為了避免一些小概率事件,提供閃斷補(bǔ)償策略,這些都要考慮進(jìn)去。如果所有的都去掉,那就是比較基礎(chǔ)庫(kù)的性能了。 所以我只能給出大概數(shù)據(jù),24核,64G的服務(wù)器上,在QoS為message at least,純粹推,消息體256B~1kB情況下,單個(gè)實(shí)例100w實(shí)際用戶(200w+)協(xié)程,峰值可以達(dá)到2~5w的QPS...內(nèi)存可以穩(wěn)定在25G左右,gc時(shí)間在200~800ms左右(還有優(yōu)化空間)。 我們正常線上單實(shí)例用戶控制在80w以內(nèi),單機(jī)最多兩個(gè)實(shí)例。事實(shí)上,整個(gè)系統(tǒng)在推送的需求上,對(duì)高峰的輸出不是提速,往往是進(jìn)行限速,以防push系統(tǒng)瞬時(shí)的高吞吐量,轉(zhuǎn)化成對(duì)接入方業(yè)務(wù)服務(wù)器的ddos攻擊所以對(duì)于性能上,我感覺(jué)大家可以放心使用,至少在我們這個(gè)量級(jí)上,經(jīng)受過(guò)考驗(yàn),go1.5到來(lái)后,確實(shí)有之前投資又增值了的感覺(jué)。 消息系統(tǒng)架構(gòu)介紹 下面是對(duì)消息系統(tǒng)的大概介紹,之前一些同學(xué)可能在gopher china上可以看到分享,這里簡(jiǎn)單講解下架構(gòu)和各個(gè)組件功能,額外補(bǔ)充一些當(dāng)時(shí)遺漏的信息: 架構(gòu)圖如下,所有的service都 written by golang.幾個(gè)大概重要組件介紹如下: dispatcher service根據(jù)客戶端請(qǐng)求信息,將應(yīng)網(wǎng)絡(luò)和區(qū)域的長(zhǎng)連接服務(wù)器的,一組IP傳送給客戶端。客戶端根據(jù)返回的IP,建立長(zhǎng)連接,連接Room service. room Service,長(zhǎng)連接網(wǎng)關(guān),hold用戶連接,并將用戶注冊(cè)進(jìn)register service,本身也做一些接入安全策略、白名單、IP限制等。 register service是我們?nèi)謘ession存儲(chǔ)組件,存儲(chǔ)和索引用戶的相關(guān)信息,以供獲取和查詢。 coordinator service用來(lái)轉(zhuǎn)發(fā)用戶的上行數(shù)據(jù),包括接入方訂閱的用戶狀態(tài)信息的回調(diào),另外做需要協(xié)調(diào)各個(gè)組件的異步操作,比如kick用戶操作,需要從register拿出其他用戶做異步操作. saver service是存儲(chǔ)訪問(wèn)層,承擔(dān)了對(duì)redis和mysql的操作,另外也提供部分業(yè)務(wù)邏輯相關(guān)的內(nèi)存緩存,比如廣播信息的加載可以在saver中進(jìn)行緩存。另外一些策略,比如客戶端sdk由于被惡意或者意外修改,每次加載了消息,不回復(fù)ack,那服務(wù)端就不會(huì)刪除消息,消息就會(huì)被反復(fù)加載,形成死循環(huán),可以通過(guò)在saver中做策略和判斷。(客戶端總是不可信的)。 center service提供給接入方的內(nèi)部api服務(wù)器,比如單播或者廣播接口,狀態(tài)查詢接口等一系列api,包括運(yùn)維和管理的api。 舉兩個(gè)常見(jiàn)例子,了解工作機(jī)制:比如發(fā)一條單播給一個(gè)用戶,center先請(qǐng)求Register獲取這個(gè)用戶之前注冊(cè)的連接通道標(biāo)識(shí)、room實(shí)例地址,通過(guò)room service下發(fā)給長(zhǎng)連接 Center Service比較重的工作如全網(wǎng)廣播,需要把所有的任務(wù)分解成一系列的子任務(wù),分發(fā)給所有center,然后在所有的子任務(wù)里,分別獲取在線和離線的所有用戶,再批量推到Room Service。通常整個(gè)集群在那一瞬間壓力很大。 deployd/agent service用于部署管理各個(gè)進(jìn)程,收集各組件的狀態(tài)和信息,zookeeper和keeper用于整個(gè)系統(tǒng)的配置文件管理和簡(jiǎn)單調(diào)度 關(guān)于推送的服務(wù)端架構(gòu) 常見(jiàn)的推送模型有長(zhǎng)輪訓(xùn)拉取,服務(wù)端直接推送(360消息系統(tǒng)目前主要是這種),推拉結(jié)合(推送只發(fā)通知,推送后根據(jù)通知去拉取消息). 拉取的方式不說(shuō)了,現(xiàn)在并不常用了,早期很多是nginx+lua+redis,長(zhǎng)輪訓(xùn),主要問(wèn)題是開(kāi)銷比較大,時(shí)效性也不好,能做的優(yōu)化策略不多。 直接推送的系統(tǒng),目前就是360消息系統(tǒng)這種,消息類型是消耗型的,并且對(duì)于同一個(gè)用戶并不允許重復(fù)消耗,如果需要多終端重復(fù)消耗,需要抽象成不同用戶。 推的好處是實(shí)時(shí)性好,開(kāi)銷小,直接將消息下發(fā)給客戶端,不需要客戶端走從接入層到存儲(chǔ)層主動(dòng)拉取. 但純推送模型,有個(gè)很大問(wèn)題,由于系統(tǒng)是異步的,他的時(shí)序性無(wú)法精確保證。這對(duì)于push需求來(lái)說(shuō)是夠用的,但如果復(fù)用推送系統(tǒng)做im類型通信,可能并不合適。 對(duì)于嚴(yán)格要求時(shí)序性,消息可以重復(fù)消耗的系統(tǒng),目前也都是走推拉結(jié)合的模型,就是只使用我們的推送系統(tǒng)發(fā)通知,并附帶id等給客戶端做拉取的判斷策略,客戶端根據(jù)推送的key,主動(dòng)從業(yè)務(wù)服務(wù)器拉取消息。并且當(dāng)主從同步延遲的時(shí)候,跟進(jìn)推送的key做延遲拉取策略。同時(shí)也可以通過(guò)消息本身的QoS,做純粹的推送策略,比如一些“正在打字的”低優(yōu)先級(jí)消息,不需要主動(dòng)拉取了,通過(guò)推送直接消耗掉。 哪些因素決定推送系統(tǒng)的效果? 首先是sdk的完善程度,sdk策略和細(xì)節(jié)完善度,往往決定了弱網(wǎng)絡(luò)環(huán)境下最終推送質(zhì)量. SDK選路策略,最基本的一些策略如下:有些開(kāi)源服務(wù)可能會(huì)針對(duì)用戶hash一個(gè)該接入?yún)^(qū)域的固定ip,實(shí)際上在國(guó)內(nèi)環(huán)境下不可行,最好分配器(dispatcher)是返回散列的一組,而且端口也要參開(kāi),必要時(shí)候,客戶端告知是retry多組都連不上,返回不同idc的服務(wù)器。因?yàn)槲覀儠?huì)經(jīng)常檢測(cè)到一些case,同一地區(qū)的不同用戶,可能對(duì)同一idc內(nèi)的不同ip連通性都不一樣,也出現(xiàn)過(guò)同一ip不同端口連通性不同,所以用戶的選路策略一定要靈活,策略要足夠完善.另外在選路過(guò)程中,客戶端要對(duì)不同網(wǎng)絡(luò)情況下的長(zhǎng)連接ip做緩存,當(dāng)網(wǎng)絡(luò)環(huán)境切換時(shí)候(wifi、2G、3G),重新請(qǐng)求分配器,緩存不同網(wǎng)絡(luò)環(huán)境的長(zhǎng)連接ip。 客戶端對(duì)于數(shù)據(jù)心跳和讀寫超時(shí)設(shè)置,完善斷線檢測(cè)重連機(jī)制 針對(duì)不同網(wǎng)絡(luò)環(huán)境,或者客戶端本身消息的活躍程度,心跳要自適應(yīng)的進(jìn)行調(diào)整并與服務(wù)端協(xié)商,來(lái)保證鏈路的連通性。并且在弱網(wǎng)絡(luò)環(huán)境下,除了網(wǎng)絡(luò)切換(wifi切3G)或者讀寫出錯(cuò)情況,什么時(shí)候重新建立鏈路也是一個(gè)問(wèn)題。客戶端發(fā)出的ping包,不同網(wǎng)絡(luò)下,多久沒(méi)有得到響應(yīng),認(rèn)為網(wǎng)絡(luò)出現(xiàn)問(wèn)題,重新建立鏈路需要有個(gè)權(quán)衡。另外對(duì)于不同網(wǎng)絡(luò)環(huán)境下,讀取不同的消息長(zhǎng)度,也要有不同的容忍時(shí)間,不能一刀切。好的心跳和讀寫超時(shí)設(shè)置,可以讓客戶端最快的檢測(cè)到網(wǎng)絡(luò)問(wèn)題,重新建立鏈路,同時(shí)在網(wǎng)絡(luò)抖動(dòng)情況下也能完成大數(shù)據(jù)傳輸。 結(jié)合服務(wù)端做策略 另外系統(tǒng)可能結(jié)合服務(wù)端做一些特殊的策略,比如我們?cè)谶x路時(shí)候,我們會(huì)將同一個(gè)用戶盡量映射到同一個(gè)room service實(shí)例上。斷線時(shí),客戶端盡量對(duì)上次連接成功的地址進(jìn)行重試。主要是方便服務(wù)端做閃斷情況下策略,會(huì)暫存用戶閃斷時(shí)實(shí)例上的信息,重新連入的 時(shí)候,做單實(shí)例內(nèi)的遷移,減少延時(shí)與加載開(kāi)銷. 客戶端保活策略 很多創(chuàng)業(yè)公司愿意重新搭建一套push系統(tǒng),確實(shí)不難實(shí)現(xiàn),其實(shí)在協(xié)議完備情況下(最簡(jiǎn)單就是客戶端不回ack不清數(shù)據(jù)),服務(wù)端會(huì)保證消息是不丟的。但問(wèn)題是為什么在消息有效期內(nèi),到達(dá)率上不去?往往因?yàn)樽约篴pp的push service存活能力不高。選用云平臺(tái)或者大廠的,往往sdk會(huì)做一些保活策略,比如和其他app共生,互相喚醒,這也是云平臺(tái)的push service更有保障原因。我相信很多云平臺(tái)旗下的sdk,多個(gè)使用同樣sdk的app,為了實(shí)現(xiàn)服務(wù)存活,是可以互相喚醒和保證活躍的。另外現(xiàn)在push sdk本身是單連接,多app復(fù)用的,這為sdk實(shí)現(xiàn),增加了新的挑戰(zhàn)。 綜上,對(duì)我來(lái)說(shuō),選擇推送平臺(tái),優(yōu)先會(huì)考慮客戶端sdk的完善程度。對(duì)于服務(wù)端,選擇條件稍微簡(jiǎn)單,要求部署接入點(diǎn)(IDC)越要多,配合精細(xì)的選路策略,效果越有保證,至于想知道哪些云服務(wù)有多少點(diǎn),這個(gè)群里來(lái)自各地的小伙伴們,可以合伙測(cè)測(cè)。 go語(yǔ)言開(kāi)發(fā)問(wèn)題與解決方案 下面講下,go開(kāi)發(fā)過(guò)程中遇到挑戰(zhàn)和優(yōu)化策略,給大家看下當(dāng)年的一張圖,在第一版優(yōu)化方案上線前一天截圖~可以看到,內(nèi)存最高占用69G,GC時(shí)間單實(shí)例最高時(shí)候高達(dá)3~6s.這種情況下,試想一次悲劇的請(qǐng)求,經(jīng)過(guò)了幾個(gè)正在執(zhí)行g(shù)c的組件,后果必然是超時(shí)... gc照成的接入方重試,又加重了系統(tǒng)的負(fù)擔(dān)。遇到這種情況當(dāng)時(shí)整個(gè)系統(tǒng)最差情況每隔2,3天就需要重啟一次~ 當(dāng)時(shí)出現(xiàn)問(wèn)題,現(xiàn)在總結(jié)起來(lái),大概以下幾點(diǎn) 1.散落在協(xié)程里的I/O,Buffer和對(duì)象不復(fù)用。 當(dāng)時(shí)(12年)由于對(duì)go的gc效率理解有限,比較奔放,程序里大量short live的協(xié)程,對(duì)內(nèi)通信的很多io操作,由于不想阻塞主循環(huán)邏輯或者需要及時(shí)響應(yīng)的邏輯,通過(guò)單獨(dú)go協(xié)程來(lái)實(shí)現(xiàn)異步。這回會(huì)gc帶來(lái)很多負(fù)擔(dān)。 針對(duì)這個(gè)問(wèn)題,應(yīng)盡量控制協(xié)程創(chuàng)建,對(duì)于長(zhǎng)連接這種應(yīng)用,本身已經(jīng)有幾百萬(wàn)并發(fā)協(xié)程情況下,很多情況沒(méi)必要在各個(gè)并發(fā)協(xié)程內(nèi)部做異步io,因?yàn)槌绦虻牟⑿卸仁怯邢蓿碚撋献鰠f(xié)程內(nèi)做阻塞操作是沒(méi)問(wèn)題。 如果有些需要異步執(zhí)行,比如如果不異步執(zhí)行,影響對(duì)用戶心跳或者等待response無(wú)法響應(yīng),最好通過(guò)一個(gè)任務(wù)池,和一組常駐協(xié)程,來(lái)消耗,處理結(jié)果,通過(guò)channel再傳回調(diào)用方。使用任務(wù)池還有額外的好處,可以對(duì)請(qǐng)求進(jìn)行打包處理,提高吞吐量,并且可以加入控量策略. 2.網(wǎng)絡(luò)環(huán)境不好引起激增 go協(xié)程相比較以往高并發(fā)程序,如果做不好流控,會(huì)引起協(xié)程數(shù)量激增。早期的時(shí)候也會(huì)發(fā)現(xiàn),時(shí)不時(shí)有部分主機(jī)內(nèi)存會(huì)遠(yuǎn)遠(yuǎn)大于其他服務(wù)器,但發(fā)現(xiàn)時(shí)候,所有主要profiling參數(shù)都正常了。 后來(lái)發(fā)現(xiàn),通信較多系統(tǒng)中,網(wǎng)絡(luò)抖動(dòng)阻塞是不可免的(即使是內(nèi)網(wǎng)),對(duì)外不停accept接受新請(qǐng)求,但執(zhí)行過(guò)程中,由于對(duì)內(nèi)通信阻塞,大量協(xié)程被 創(chuàng)建,業(yè)務(wù)協(xié)程等待通信結(jié)果沒(méi)有釋放,往往瞬時(shí)會(huì)迎來(lái)協(xié)程暴漲。但這些內(nèi)存在系統(tǒng)穩(wěn)定后,virt和res都并沒(méi)能徹底釋放,下降后,維持高位。 處理這種情況,需要增加一些流控策略,流控策略可以選擇在rpc庫(kù)來(lái)做,或者上面說(shuō)的任務(wù)池來(lái)做,其實(shí)我感覺(jué)放在任務(wù)池里做更合理些,畢竟rpc通信庫(kù)可以做讀寫數(shù)據(jù)的限流,但它并不清楚具體的限流策略,到底是重試還是日志還是緩存到指定隊(duì)列。任務(wù)池本身就是業(yè)務(wù)邏輯相關(guān)的,它清楚針對(duì)不同的接口需要的流控限制策略。 3.低效和開(kāi)銷大的rpc框架 早期rpc通信框架比較簡(jiǎn)單,對(duì)內(nèi)通信時(shí)候使用的也是短連接。這本來(lái)短連接開(kāi)銷和性能瓶頸超出我們預(yù)期,短連接io效率是低一些,但端口資源夠,本身吞吐可以滿足需要,用是沒(méi)問(wèn)題的,很多分層的系統(tǒng),也有http短連接對(duì)內(nèi)進(jìn)行請(qǐng)求的 但早期go版本,這樣寫程序,在一定量級(jí)情況,是支撐不住的。短連接大量臨時(shí)對(duì)象和臨時(shí)buffer創(chuàng)建,在本已經(jīng)百萬(wàn)協(xié)程的程序中,是無(wú)法承受的。所以后續(xù)我們對(duì)我們的rpc框架作了兩次調(diào)整。 第二版的rpc框架,使用了連接池,通過(guò)長(zhǎng)連接對(duì)內(nèi)進(jìn)行通信(復(fù)用的資源包括client和server的:編解碼Buffer、Request/response),大大改善了性能。 但這種在一次request和response還是占用連接的,如果網(wǎng)絡(luò)狀況ok情況下,這不是問(wèn)題,足夠滿足需要了,但試想一個(gè)room實(shí)例要與后面的數(shù)百個(gè)的register,coordinator,saver,center,keeper實(shí)例進(jìn)行通信,需要建立大量的常駐連接,每個(gè)目標(biāo)機(jī)幾十個(gè)連接,也有數(shù)千個(gè)連接被占用。 非持續(xù)抖動(dòng)時(shí)候(持續(xù)逗開(kāi)多少無(wú)解),或者有延遲較高的請(qǐng)求時(shí)候,如果針對(duì)目標(biāo)ip連接開(kāi)少了,會(huì)有瞬時(shí)大量請(qǐng)求阻塞,連接無(wú)法得到充分利用。第三版增加了Pipeline操作,Pipeline會(huì)帶來(lái)一些額外的開(kāi)銷,利用tcp的全雙特性,以盡量少的連接完成對(duì)各個(gè)服務(wù)集群的rpc調(diào)用。 4.Gc時(shí)間過(guò)長(zhǎng) Go的Gc仍舊在持續(xù)改善中,大量對(duì)象和buffer創(chuàng)建,仍舊會(huì)給gc帶來(lái)很大負(fù)擔(dān),尤其一個(gè)占用了25G左右的程序。之前go team的大咖郵件也告知我們,未來(lái)會(huì)讓使用協(xié)程的成本更低,理論上不需要在應(yīng)用層做更多的策略來(lái)緩解gc. 改善方式,一種是多實(shí)例的拆分,如果公司沒(méi)有端口限制,可以很快部署大量實(shí)例,減少gc時(shí)長(zhǎng),最直接方法。不過(guò)對(duì)于360來(lái)說(shuō),外網(wǎng)通常只能使用80和433。因此常規(guī)上只能開(kāi)啟兩個(gè)實(shí)例。當(dāng)然很多人給我建議能否使用SO_REUSEPORT,不過(guò)我們內(nèi)核版本確實(shí)比較低,并沒(méi)有實(shí)踐過(guò)。 另外能否模仿nginx,fork多個(gè)進(jìn)程監(jiān)控同樣端口,至少我們目前沒(méi)有這樣做,主要對(duì)于我們目前進(jìn)程管理上,還是獨(dú)立的運(yùn)行的,對(duì)外監(jiān)聽(tīng)不同端口程序,還有配套的內(nèi)部通信和管理端口,實(shí)例管理和升級(jí)上要做調(diào)整。 解決gc的另兩個(gè)手段,是內(nèi)存池和對(duì)象池,不過(guò)最好做仔細(xì)評(píng)估和測(cè)試,內(nèi)存池、對(duì)象池使用,也需要對(duì)于代碼可讀性與整體效率進(jìn)行權(quán)衡。 這種程序一定情況下會(huì)降低并行度,因?yàn)橛贸貎?nèi)資源一定要加互斥鎖或者原子操作做CAS,通常原子操作實(shí)測(cè)要更快一些。CAS可以理解為可操作的更細(xì)行為粒度的鎖(可以做更多CAS策略,放棄運(yùn)行,防止忙等)。這種方式帶來(lái)的問(wèn)題是,程序的可讀性會(huì)越來(lái)越像C語(yǔ)言,每次要malloc,各地方用完后要free,對(duì)于對(duì)象池free之前要reset,我曾經(jīng)在應(yīng)用層嘗試做了一個(gè)分層次結(jié)構(gòu)的“無(wú)鎖隊(duì)列”上圖左邊的數(shù)組實(shí)際上是一個(gè)列表,這個(gè)列表按大小將內(nèi)存分塊,然后使用atomic操作進(jìn)行CAS。但實(shí)際要看測(cè)試數(shù)據(jù)了,池技術(shù)可以明顯減少臨時(shí)對(duì)象和內(nèi)存的申請(qǐng)和釋放,gc時(shí)間會(huì)減少,但加鎖帶來(lái)的并行度的降低,是否能給一段時(shí)間內(nèi)的整體吞吐量帶來(lái)提升,要做測(cè)試和權(quán)衡… 在我們消息系統(tǒng),實(shí)際上后續(xù)去除了部分這種黑科技,試想在百萬(wàn)個(gè)協(xié)程里面做自旋操作申請(qǐng)復(fù)用的buffer和對(duì)象,開(kāi)銷會(huì)很大,尤其在協(xié)程對(duì)線程多對(duì)多模型情況下,更依賴于golang本身調(diào)度策略,除非我對(duì)池增加更多的策略處理,減少忙等,感覺(jué)是在把runtime做的事情,在應(yīng)用層非常不優(yōu)雅的實(shí)現(xiàn)。普遍使用開(kāi)銷理論就大于收益。 但對(duì)于rpc庫(kù)或者codec庫(kù),任務(wù)池內(nèi)部,這些開(kāi)定量協(xié)程,集中處理數(shù)據(jù)的區(qū)域,可以嘗試改造~ 對(duì)于有些固定對(duì)象復(fù)用,比如固定的心跳包什么的,可以考慮使用全局一些對(duì)象,進(jìn)行復(fù)用,針對(duì)應(yīng)用層數(shù)據(jù),具體設(shè)計(jì)對(duì)象池,在部分環(huán)節(jié)去復(fù)用,可能比這種無(wú)差別的設(shè)計(jì)一個(gè)通用池更能進(jìn)行效果評(píng)估. 消息系統(tǒng)的運(yùn)維及測(cè)試 下面介紹消息系統(tǒng)的架構(gòu)迭代和一些迭代經(jīng)驗(yàn),由于之前在其他地方有過(guò)分享,后面的會(huì)給出相關(guān)鏈接,下面實(shí)際做個(gè)簡(jiǎn)單介紹,感興趣可以去鏈接里面看 架構(gòu)迭代~根據(jù)業(yè)務(wù)和集群的拆分,能解決部分灰度部署上線測(cè)試,減少點(diǎn)對(duì)點(diǎn)通信和廣播通信不同產(chǎn)品的相互影響,針對(duì)特定的功能做獨(dú)立的優(yōu)化. 消息系統(tǒng)架構(gòu)和集群拆分,最基本的是拆分多實(shí)例,其次是按照業(yè)務(wù)類型對(duì)資源占用情況分類,按用戶接入網(wǎng)絡(luò)和對(duì)idc布點(diǎn)要求分類(目前沒(méi)有條件,所有的產(chǎn)品都部署到全部idc)系統(tǒng)的測(cè)試go語(yǔ)言在并發(fā)測(cè)試上有獨(dú)特優(yōu)勢(shì)。對(duì)于壓力測(cè)試,目前主要針對(duì)指定的服務(wù)器,選定線上空閑的服務(wù)器做長(zhǎng)連接壓測(cè)。然后結(jié)合可視化,分析壓測(cè)過(guò)程中的系統(tǒng)狀態(tài)。但壓測(cè)早期用的比較多,但實(shí)現(xiàn)的統(tǒng)計(jì)報(bào)表功能和我理想有一定差距。我覺(jué)得最近出的golang開(kāi)源產(chǎn)品都符合這種場(chǎng)景,go寫網(wǎng)絡(luò)并發(fā)程序給大家?guī)?lái)的便利,讓大家把以往為了降低復(fù)雜度,拆解或者分層協(xié)作的組件,又組合在了一起。 QA Q1:協(xié)議棧大小,超時(shí)時(shí)間定制原則? 移動(dòng)網(wǎng)絡(luò)下超時(shí)時(shí)間按產(chǎn)品需求通常2g,3G情況下是5分鐘,wifi情況下5~8分鐘。但對(duì)于個(gè)別場(chǎng)景,要求響應(yīng)非常迅速的場(chǎng)景,如果連接idle超過(guò)1分鐘,都會(huì)有ping,pong,來(lái)校驗(yàn)是否斷線檢測(cè),盡快做到重新連接。 Q2:消息是否持久化? 消息持久化,通常是先存后發(fā),存儲(chǔ)用的redis,但落地用的mysql。mysql只做故障恢復(fù)使用。 Q3:消息風(fēng)暴怎么解決的? 如果是發(fā)送情況下,普通產(chǎn)品是不需要限速的,對(duì)于較大產(chǎn)品是有發(fā)送隊(duì)列做控速度,按人數(shù),按秒進(jìn)行控速度發(fā)放,發(fā)送成功再發(fā)送下一條。 Q4:golang的工具鏈支持怎么樣?我自己寫過(guò)一些小程序千把行之內(nèi),確實(shí)很不錯(cuò),但不知道代碼量上去之后,配套的debug工具和profiling工具如何,我看上邊有分享說(shuō)golang自帶的profiling工具還不錯(cuò),那debug呢怎么樣呢,官方一直沒(méi)有出debug工具,gdb支持也不完善,不知你們用的什么? 是這樣的,我們正常就是println,我感覺(jué)基本上可以定位我所有問(wèn)題,但也不排除由于并行性通過(guò)println無(wú)法復(fù)現(xiàn)的問(wèn)題,目前來(lái)看只能靠經(jīng)驗(yàn)了。只要常見(jiàn)并發(fā)嘗試,經(jīng)過(guò)分析是可以找到的。go很快會(huì)推出調(diào)試工具的~ Q5:協(xié)議棧是基于tcp嗎? 是否有協(xié)議拓展功能?協(xié)議棧是tcp,整個(gè)系統(tǒng)tcp長(zhǎng)連接,沒(méi)有考慮擴(kuò)展其功能~如果有好的經(jīng)驗(yàn),可以分享~ Q6:問(wèn)個(gè)問(wèn)題,這個(gè)系統(tǒng)是接收上行數(shù)據(jù)的吧,系統(tǒng)接收上行數(shù)據(jù)后是轉(zhuǎn)發(fā)給相應(yīng)系統(tǒng)做處理么,是怎么轉(zhuǎn)發(fā)呢,如果需要給客戶端返回調(diào)用結(jié)果又是怎么處理呢? 系統(tǒng)上行數(shù)據(jù)是根據(jù)協(xié)議頭進(jìn)行轉(zhuǎn)發(fā),協(xié)議頭里面標(biāo)記了產(chǎn)品和轉(zhuǎn)發(fā)類型,在coordinator里面跟進(jìn)產(chǎn)品和轉(zhuǎn)發(fā)類型,回調(diào)用戶,如果用戶需要阻塞等待回復(fù)才能后續(xù)操作,那通過(guò)再發(fā)送消息,路由回用戶。因?yàn)檎麄€(gè)系統(tǒng)是全異步的。 Q7:問(wèn)個(gè)pushsdk的問(wèn)題。pushsdk的單連接,多app復(fù)用方式,這樣的情況下以下幾個(gè)問(wèn)題是如何解決的:1)系統(tǒng)流量統(tǒng)計(jì)會(huì)把所有流量都算到啟動(dòng)連接的應(yīng)用吧?而啟動(dòng)應(yīng)用的連接是不固定的吧?2)同一個(gè)pushsdk在不同的應(yīng)用中的版本號(hào)可能不一樣,這樣暴露出來(lái)的接口可能有版本問(wèn)題,如果用單連接模式怎么解決? 流量只能算在啟動(dòng)的app上了,但一般這種安裝率很高的app承擔(dān)可能性大,常用app本身被檢測(cè)和殺死可能性較少,另外消息下發(fā)量是有嚴(yán)格控制 的。整體上用戶還是省電和省流量的。我們pushsdk盡量向上兼容,出于這個(gè)目的,push sdk本身做的工作非常有限,抽象出來(lái)一些常見(jiàn)的功能,純推的系統(tǒng),客戶端策略目前做的很少,也有這個(gè)原因。 Q8:生產(chǎn)系統(tǒng)的profiling是一直打開(kāi)的么? 不是一直打開(kāi),每個(gè)集群都有采樣,但需要開(kāi)啟哪個(gè)可以后臺(tái)控制。這個(gè)profling是通過(guò)接口調(diào)用。 Q9:面前系統(tǒng)中的消息消費(fèi)者可不可以分組?類似于Kafka。 客戶端可以訂閱不同產(chǎn)品的消息,接受不同的分組。接入的時(shí)候進(jìn)行bind或者unbind操作 Q10:為什么放棄erlang,而選擇go,有什么特別原因嗎?我們現(xiàn)在用的erlang? erlang沒(méi)有問(wèn)題,原因是我們上線后,其他團(tuán)隊(duì)才做出來(lái),經(jīng)過(guò)qa一個(gè)部門對(duì)比測(cè)試,在沒(méi)有顯著性能提升下,選擇繼續(xù)使用go版本的push,作為公司基礎(chǔ)服務(wù)。 Q11:流控問(wèn)題有排查過(guò)網(wǎng)卡配置導(dǎo)致的idle問(wèn)題嗎? 流控是業(yè)務(wù)級(jí)別的流控,我們上線前對(duì)于內(nèi)網(wǎng)的極限通信量做了測(cè)試,后續(xù)將請(qǐng)求在rpc庫(kù)內(nèi),控制在小于內(nèi)部通信開(kāi)銷的上限以下.在到達(dá)上限前作流控。 Q12:服務(wù)的協(xié)調(diào)調(diào)度為什么選擇zk有考慮過(guò)raft實(shí)現(xiàn)嗎?golang的raft實(shí)現(xiàn)很多啊,比如Consul和ectd之類的。 3年前,還沒(méi)有后兩者或者后兩者沒(méi)聽(tīng)過(guò)應(yīng)該。zk當(dāng)時(shí)公司內(nèi)部成熟方案,不過(guò)目前來(lái)看,我們不準(zhǔn)備用zk作結(jié)合系統(tǒng)的定制開(kāi)發(fā),準(zhǔn)備用自己寫的keeper代替zk,完成配置文件自動(dòng)轉(zhuǎn)數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)結(jié)構(gòu)自動(dòng)同步指定進(jìn)程,同時(shí)里面可以完成很多自定義的發(fā)現(xiàn)和控制策略,客戶端包含keeper的sdk就可以實(shí)現(xiàn)以上的所有監(jiān)控?cái)?shù)據(jù),profling數(shù)據(jù)收集,配置文件更新,啟動(dòng)關(guān)閉等回調(diào)。完全抽象成語(yǔ)keeper通信sdk,keeper之間考慮用raft。 Q13:負(fù)載策略是否同時(shí)在服務(wù)側(cè)與CLIENT側(cè)同時(shí)做的 (DISPATCHER 會(huì)返回一組IP)?另外,ROOM SERVER/REGISTER SERVER連接狀態(tài)的一致性可用性如何保證? 服務(wù)側(cè)保活有無(wú)特別關(guān)注的地方? 安全性方面是基于TLS再加上應(yīng)用層加密? 會(huì)在server端做,比如重啟操作前,會(huì)下發(fā)指令類型消息,讓客戶端進(jìn)行主動(dòng)行為。部分消息使用了加密策略,自定義的rsa+des,另外滿足我們安全公司的需要,也定制開(kāi)發(fā)很多安全加密策略。一致性是通過(guò)冷備解決的,早期考慮雙寫,但實(shí)時(shí)狀態(tài)雙寫同步代價(jià)太高而且容易有臟數(shù)據(jù),比如register掛了,調(diào)用所有room,通過(guò)重新刷入指定register來(lái)解決。 Q14:這個(gè)keeper有開(kāi)源打算嗎? 還在寫,如果沒(méi)耦合我們系統(tǒng)太多功能,一定會(huì)開(kāi)源的,主要這意味著,我們所有的bind在sdk的庫(kù)也需要開(kāi)源~ Q15:比較好奇lisence是哪個(gè)如果開(kāi)源?

創(chuàng)新互聯(lián)主要從事成都做網(wǎng)站、成都網(wǎng)站設(shè)計(jì)、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)徐水,十載網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來(lái)電咨詢建站服務(wù):18982081108

APNS推送Golang SDK使用Proxy代理

蘋果的消息推送是通過(guò)請(qǐng)求域名: 實(shí)現(xiàn)的,該域名解析結(jié)果為美國(guó),這引發(fā)了兩個(gè)問(wèn)題:

1、接口請(qǐng)求時(shí)間長(zhǎng),性能低,而且容易請(qǐng)求超時(shí)報(bào)錯(cuò)

2、高峰期推送請(qǐng)求錯(cuò)誤率升高

總體思路:增加一個(gè)美國(guó)代理服務(wù)器,通過(guò)代理服務(wù)器請(qǐng)求蘋果消息推送服務(wù)

1、原來(lái)流程

2、現(xiàn)在流程

3、具體方案實(shí)施選擇

選擇一:proxy服務(wù)器,部署一個(gè)正向代理服務(wù),提供push消息的正向代理,消息通過(guò)代理服務(wù)器送達(dá)蘋果服務(wù)端

選擇二:proxy服務(wù)器,獨(dú)立實(shí)現(xiàn)、部署一個(gè) 標(biāo)準(zhǔn)的apns服務(wù),負(fù)責(zé) ios消息推送。將需要走美國(guó)節(jié)點(diǎn)的請(qǐng)求轉(zhuǎn)發(fā)到該proxy節(jié)點(diǎn)

具體情況、具體分析,應(yīng)思考的點(diǎn):

問(wèn)題一、蘋果官方提供的SDK中,不支持設(shè)置代理服務(wù)器。官方SDK不適合更改,對(duì)以后系統(tǒng)更新不利

問(wèn)題二、只有蘋果的push服務(wù)需要代理,其他例如華為、小米、vivo不應(yīng)走海外代理

問(wèn)題三、代理安全性

問(wèn)題四、代理方案下,有重試邏輯。 如何準(zhǔn)確定義和判斷失敗, 可能會(huì)引起消息重復(fù)推送

問(wèn)題五、實(shí)現(xiàn)簡(jiǎn)單、有效,正向代理方式:只需實(shí)現(xiàn)一個(gè)實(shí)例化對(duì)象方法,其他利用原始sdk即可。獨(dú)立apns服務(wù)方式:需要實(shí)現(xiàn)一個(gè)apns服務(wù),國(guó)內(nèi)、國(guó)外均需服務(wù)部署,需要增加獨(dú)立的開(kāi)發(fā)和運(yùn)營(yíng)成本,另外還得改造調(diào)用服務(wù),實(shí)現(xiàn)請(qǐng)求調(diào)度,優(yōu)點(diǎn)服務(wù)獨(dú)立、單一,具備一個(gè)單獨(dú)微服務(wù)條件

github.com/sideshow/apns2

方法一: 修改SDK文件

第一步:設(shè)置環(huán)境變量

第二步:修改apns2.NewClient方法

方法二: 從新定義一個(gè)NewClient方法

golang使用Nsq

1. 介紹

最近在研究一些消息中間件,常用的MQ如RabbitMQ,ActiveMQ,Kafka等。NSQ是一個(gè)基于Go語(yǔ)言的分布式實(shí)時(shí)消息平臺(tái),它基于MIT開(kāi)源協(xié)議發(fā)布,由bitly公司開(kāi)源出來(lái)的一款簡(jiǎn)單易用的消息中間件。

官方和第三方還為NSQ開(kāi)發(fā)了眾多客戶端功能庫(kù),如官方提供的基于HTTP的nsqd、Go客戶端go-nsq、Python客戶端pynsq、基于Node.js的JavaScript客戶端nsqjs、異步C客戶端libnsq、Java客戶端nsq-java以及基于各種語(yǔ)言的眾多第三方客戶端功能庫(kù)。

1.1 Features

1). Distributed

NSQ提供了分布式的,去中心化,且沒(méi)有單點(diǎn)故障的拓?fù)浣Y(jié)構(gòu),穩(wěn)定的消息傳輸發(fā)布保障,能夠具有高容錯(cuò)和HA(高可用)特性。

2). Scalable易于擴(kuò)展

NSQ支持水平擴(kuò)展,沒(méi)有中心化的brokers。內(nèi)置的發(fā)現(xiàn)服務(wù)簡(jiǎn)化了在集群中增加節(jié)點(diǎn)。同時(shí)支持pub-sub和load-balanced 的消息分發(fā)。

3). Ops Friendly

NSQ非常容易配置和部署,生來(lái)就綁定了一個(gè)管理界面。二進(jìn)制包沒(méi)有運(yùn)行時(shí)依賴。官方有Docker image。

4.Integrated高度集成

官方的 Go 和 Python庫(kù)都有提供。而且為大多數(shù)語(yǔ)言提供了庫(kù)。

1.2 組件

1.3 拓?fù)浣Y(jié)構(gòu)

NSQ推薦通過(guò)他們相應(yīng)的nsqd實(shí)例使用協(xié)同定位發(fā)布者,這意味著即使面對(duì)網(wǎng)絡(luò)分區(qū),消息也會(huì)被保存在本地,直到它們被一個(gè)消費(fèi)者讀取。更重要的是,發(fā)布者不必去發(fā)現(xiàn)其他的nsqd節(jié)點(diǎn),他們總是可以向本地實(shí)例發(fā)布消息。

NSQ

首先,一個(gè)發(fā)布者向它的本地nsqd發(fā)送消息,要做到這點(diǎn),首先要先打開(kāi)一個(gè)連接,然后發(fā)送一個(gè)包含topic和消息主體的發(fā)布命令,在這種情況下,我們將消息發(fā)布到事件topic上以分散到我們不同的worker中。

事件topic會(huì)復(fù)制這些消息并且在每一個(gè)連接topic的channel上進(jìn)行排隊(duì),在我們的案例中,有三個(gè)channel,它們其中之一作為檔案channel。消費(fèi)者會(huì)獲取這些消息并且上傳到S3。

nsqd

每個(gè)channel的消息都會(huì)進(jìn)行排隊(duì),直到一個(gè)worker把他們消費(fèi),如果此隊(duì)列超出了內(nèi)存限制,消息將會(huì)被寫入到磁盤中。Nsqd節(jié)點(diǎn)首先會(huì)向nsqlookup廣播他們的位置信息,一旦它們注冊(cè)成功,worker將會(huì)從nsqlookup服務(wù)器節(jié)點(diǎn)上發(fā)現(xiàn)所有包含事件topic的nsqd節(jié)點(diǎn)。

nsqlookupd

2. Internals

2.1 消息傳遞擔(dān)保

1)客戶表示已經(jīng)準(zhǔn)備好接收消息

2)NSQ 發(fā)送一條消息,并暫時(shí)將數(shù)據(jù)存儲(chǔ)在本地(在 re-queue 或 timeout)

3)客戶端回復(fù) FIN(結(jié)束)或 REQ(重新排隊(duì))分別指示成功或失敗。如果客戶端沒(méi)有回復(fù), NSQ 會(huì)在設(shè)定的時(shí)間超時(shí),自動(dòng)重新排隊(duì)消息

這確保了消息丟失唯一可能的情況是不正常結(jié)束 nsqd 進(jìn)程。在這種情況下,這是在內(nèi)存中的任何信息(或任何緩沖未刷新到磁盤)都將丟失。

如何防止消息丟失是最重要的,即使是這個(gè)意外情況可以得到緩解。一種解決方案是構(gòu)成冗余 nsqd對(duì)(在不同的主機(jī)上)接收消息的相同部分的副本。因?yàn)槟銓?shí)現(xiàn)的消費(fèi)者是冪等的,以兩倍時(shí)間處理這些消息不會(huì)對(duì)下游造成影響,并使得系統(tǒng)能夠承受任何單一節(jié)點(diǎn)故障而不會(huì)丟失信息。

2.2 簡(jiǎn)化配置和管理

單個(gè) nsqd 實(shí)例被設(shè)計(jì)成可以同時(shí)處理多個(gè)數(shù)據(jù)流。流被稱為“話題”和話題有 1 個(gè)或多個(gè)“通道”。每個(gè)通道都接收到一個(gè)話題中所有消息的拷貝。在實(shí)踐中,一個(gè)通道映射到下行服務(wù)消費(fèi)一個(gè)話題。

在更底的層面,每個(gè) nsqd 有一個(gè)與 nsqlookupd 的長(zhǎng)期 TCP 連接,定期推動(dòng)其狀態(tài)。這個(gè)數(shù)據(jù)被 nsqlookupd 用于給消費(fèi)者通知 nsqd 地址。對(duì)于消費(fèi)者來(lái)說(shuō),一個(gè)暴露的 HTTP /lookup 接口用于輪詢。為話題引入一個(gè)新的消費(fèi)者,只需啟動(dòng)一個(gè)配置了 nsqlookup 實(shí)例地址的 NSQ 客戶端。無(wú)需為添加任何新的消費(fèi)者或生產(chǎn)者更改配置,大大降低了開(kāi)銷和復(fù)雜性。

2.3 消除單點(diǎn)故障

NSQ被設(shè)計(jì)以分布的方式被使用。nsqd 客戶端(通過(guò) TCP )連接到指定話題的所有生產(chǎn)者實(shí)例。沒(méi)有中間人,沒(méi)有消息代理,也沒(méi)有單點(diǎn)故障。

這種拓?fù)浣Y(jié)構(gòu)消除單鏈,聚合,反饋。相反,你的消費(fèi)者直接訪問(wèn)所有生產(chǎn)者。從技術(shù)上講,哪個(gè)客戶端連接到哪個(gè) NSQ 不重要,只要有足夠的消費(fèi)者連接到所有生產(chǎn)者,以滿足大量的消息,保證所有東西最終將被處理。對(duì)于 nsqlookupd,高可用性是通過(guò)運(yùn)行多個(gè)實(shí)例來(lái)實(shí)現(xiàn)。他們不直接相互通信和數(shù)據(jù)被認(rèn)為是最終一致。消費(fèi)者輪詢所有的配置的 nsqlookupd 實(shí)例和合并 response。失敗的,無(wú)法訪問(wèn)的,或以其他方式故障的節(jié)點(diǎn)不會(huì)讓系統(tǒng)陷于停頓。

2.4 效率

對(duì)于數(shù)據(jù)的協(xié)議,通過(guò)推送數(shù)據(jù)到客戶端最大限度地提高性能和吞吐量的,而不是等待客戶端拉數(shù)據(jù)。這個(gè)概念,稱之為 RDY 狀態(tài),基本上是客戶端流量控制的一種形式。

efficiency

2.5 心跳和超時(shí)

組合應(yīng)用級(jí)別的心跳和 RDY 狀態(tài),避免頭阻塞現(xiàn)象,也可能使心跳無(wú)用(即,如果消費(fèi)者是在后面的處理消息流的接收緩沖區(qū)中,操作系統(tǒng)將被填滿,堵心跳)為了保證進(jìn)度,所有的網(wǎng)絡(luò) IO 時(shí)間上限勢(shì)必與配置的心跳間隔相關(guān)聯(lián)。這意味著,你可以從字面上拔掉之間的網(wǎng)絡(luò)連接 nsqd 和消費(fèi)者,它會(huì)檢測(cè)并正確處理錯(cuò)誤。當(dāng)檢測(cè)到一個(gè)致命錯(cuò)誤,客戶端連接被強(qiáng)制關(guān)閉。在傳輸中的消息會(huì)超時(shí)而重新排隊(duì)等待傳遞到另一個(gè)消費(fèi)者。最后,錯(cuò)誤會(huì)被記錄并累計(jì)到各種內(nèi)部指標(biāo)。

2.6 分布式

因?yàn)镹SQ沒(méi)有在守護(hù)程序之間共享信息,所以它從一開(kāi)始就是為了分布式操作而生。個(gè)別的機(jī)器可以隨便宕機(jī)隨便啟動(dòng)而不會(huì)影響到系統(tǒng)的其余部分,消息發(fā)布者可以在本地發(fā)布,即使面對(duì)網(wǎng)絡(luò)分區(qū)。

這種“分布式優(yōu)先”的設(shè)計(jì)理念意味著NSQ基本上可以永遠(yuǎn)不斷地?cái)U(kuò)展,需要更高的吞吐量?那就添加更多的nsqd吧。唯一的共享狀態(tài)就是保存在lookup節(jié)點(diǎn)上,甚至它們不需要全局視圖,配置某些nsqd注冊(cè)到某些lookup節(jié)點(diǎn)上這是很簡(jiǎn)單的配置,唯一關(guān)鍵的地方就是消費(fèi)者可以通過(guò)lookup節(jié)點(diǎn)獲取所有完整的節(jié)點(diǎn)集。清晰的故障事件——NSQ在組件內(nèi)建立了一套明確關(guān)于可能導(dǎo)致故障的的故障權(quán)衡機(jī)制,這對(duì)消息傳遞和恢復(fù)都有意義。雖然它們可能不像Kafka系統(tǒng)那樣提供嚴(yán)格的保證級(jí)別,但NSQ簡(jiǎn)單的操作使故障情況非常明顯。

2.7 no replication

不像其他的隊(duì)列組件,NSQ并沒(méi)有提供任何形式的復(fù)制和集群,也正是這點(diǎn)讓它能夠如此簡(jiǎn)單地運(yùn)行,但它確實(shí)對(duì)于一些高保證性高可靠性的消息發(fā)布沒(méi)有足夠的保證。我們可以通過(guò)降低文件同步的時(shí)間來(lái)部分避免,只需通過(guò)一個(gè)標(biāo)志配置,通過(guò)EBS支持我們的隊(duì)列。但是這樣仍然存在一個(gè)消息被發(fā)布后馬上死亡,丟失了有效的寫入的情況。

2.8 沒(méi)有嚴(yán)格的順序

雖然Kafka由一個(gè)有序的日志構(gòu)成,但NSQ不是。消息可以在任何時(shí)間以任何順序進(jìn)入隊(duì)列。在我們使用的案例中,這通常沒(méi)有關(guān)系,因?yàn)樗械臄?shù)據(jù)都被加上了時(shí)間戳,但它并不適合需要嚴(yán)格順序的情況。

2.9 無(wú)數(shù)據(jù)重復(fù)刪除功能

NSQ對(duì)于超時(shí)系統(tǒng),它使用了心跳檢測(cè)機(jī)制去測(cè)試消費(fèi)者是否存活還是死亡。很多原因會(huì)導(dǎo)致我們的consumer無(wú)法完成心跳檢測(cè),所以在consumer中必須有一個(gè)單獨(dú)的步驟確保冪等性。

3. 實(shí)踐安裝過(guò)程

本文將nsq集群具體的安裝過(guò)程略去,大家可以自行參考官網(wǎng),比較簡(jiǎn)單。這部分介紹下筆者實(shí)驗(yàn)的拓?fù)洌约皀sqadmin的相關(guān)信息。

3.1 拓?fù)浣Y(jié)構(gòu)

topology

實(shí)驗(yàn)采用3臺(tái)NSQD服務(wù),2臺(tái)LOOKUPD服務(wù)。

采用官方推薦的拓?fù)洌l(fā)布的服務(wù)和NSQD在一臺(tái)主機(jī)。一共5臺(tái)機(jī)器。

NSQ基本沒(méi)有配置文件,配置通過(guò)命令行指定參數(shù)。

主要命令如下:

LOOKUPD命令

NSQD命令

工具類,消費(fèi)后存儲(chǔ)到本地文件。

發(fā)布一條消息

3.2 nsqadmin

對(duì)Streams的詳細(xì)信息進(jìn)行查看,包括NSQD節(jié)點(diǎn),具體的channel,隊(duì)列中的消息數(shù),連接數(shù)等信息。

nsqadmin

channel

列出所有的NSQD節(jié)點(diǎn):

nodes

消息的統(tǒng)計(jì):

msgs

lookup主機(jī)的列表:

hosts

4. 總結(jié)

NSQ基本核心就是簡(jiǎn)單性,是一個(gè)簡(jiǎn)單的隊(duì)列,這意味著它很容易進(jìn)行故障推理和很容易發(fā)現(xiàn)bug。消費(fèi)者可以自行處理故障事件而不會(huì)影響系統(tǒng)剩下的其余部分。

事實(shí)上,簡(jiǎn)單性是我們決定使用NSQ的首要因素,這方便與我們的許多其他軟件一起維護(hù),通過(guò)引入隊(duì)列使我們得到了堪稱完美的表現(xiàn),通過(guò)隊(duì)列甚至讓我們?cè)黾恿藥讉€(gè)數(shù)量級(jí)的吞吐量。越來(lái)越多的consumer需要一套嚴(yán)格可靠性和順序性保障,這已經(jīng)超過(guò)了NSQ提供的簡(jiǎn)單功能。

結(jié)合我們的業(yè)務(wù)系統(tǒng)來(lái)看,對(duì)于我們所需要傳輸?shù)陌l(fā)票消息,相對(duì)比較敏感,無(wú)法容忍某個(gè)nsqd宕機(jī),或者磁盤無(wú)法使用的情況,該節(jié)點(diǎn)堆積的消息無(wú)法找回。這是我們沒(méi)有選擇該消息中間件的主要原因。簡(jiǎn)單性和可靠性似乎并不能完全滿足。相比Kafka,ops肩負(fù)起更多負(fù)責(zé)的運(yùn)營(yíng)。另一方面,它擁有一個(gè)可復(fù)制的、有序的日志可以提供給我們更好的服務(wù)。但對(duì)于其他適合NSQ的consumer,它為我們服務(wù)的相當(dāng)好,我們期待著繼續(xù)鞏固它的堅(jiān)實(shí)的基礎(chǔ)。

中行跨境GO消息推送怎么關(guān)閉?

中行跨境GO消息推送關(guān)閉:

您可以通過(guò)您的手機(jī)設(shè)置中的APP權(quán)限管理模塊對(duì)跨境GO進(jìn)行系統(tǒng)通知權(quán)限控制。APP權(quán)限管理模塊根據(jù)手機(jī)品牌和型號(hào)的不同可能位于設(shè)置中不同目錄。

以上內(nèi)容供您參考,業(yè)務(wù)規(guī)定請(qǐng)以實(shí)際為準(zhǔn)。

如有疑問(wèn),歡迎咨詢中國(guó)銀行在線客服。

誠(chéng)邀您下載使用中國(guó)銀行手機(jī)銀行APP或中銀跨境GO APP辦理相關(guān)業(yè)務(wù)。

基于go的websocket消息推送的集群實(shí)現(xiàn)

目前websocket技術(shù)已經(jīng)很成熟,選型Go語(yǔ)言,當(dāng)然是為了節(jié)省成本以及它強(qiáng)大的高并發(fā)性能。我使用的是第三方開(kāi)源的websocket庫(kù)即gorilla/websocket。

由于我們線上推送的量不小,推送后端需要部署多節(jié)點(diǎn)保持高可用,所以需要自己做集群,具體架構(gòu)方案如圖:

Auth Service:鑒權(quán)服務(wù),根據(jù)Token驗(yàn)證用戶權(quán)限。

Collect Service:消息采集服務(wù),負(fù)責(zé)收集業(yè)務(wù)系統(tǒng)消息,存入MongoDB后,發(fā)送給消息分發(fā)服務(wù)。

Dispatch Service:消息分發(fā)服務(wù),根據(jù)路由規(guī)則分發(fā)至對(duì)應(yīng)消息推送服務(wù)節(jié)點(diǎn)上。

Push Service:消息推送服務(wù),通過(guò)websocket將消息推送給用戶。

集群推送的關(guān)鍵點(diǎn)在于,web端與服務(wù)端建立長(zhǎng)連接之后,具體跟哪個(gè)推送節(jié)點(diǎn)保持長(zhǎng)連接的,如果我們能夠找到對(duì)應(yīng)的連接節(jié)點(diǎn),那么我們就可以將消息推送出去。下面講解一下集群的大致流程:

1. web端用戶登錄之后,帶上token與后端推送服務(wù)(Push Service)保持長(zhǎng)連接。

2. 推送服務(wù)收到連接請(qǐng)求之后,攜帶token去鑒權(quán)服務(wù)(Auth Service)驗(yàn)證此token權(quán)限,并返回用戶ID。

3. 把返回的用戶ID與長(zhǎng)連接存入本地緩存,保持用戶ID與長(zhǎng)連接綁定關(guān)系。

4. 再將用戶ID與本推送節(jié)點(diǎn)IP存入redis,建立用戶(即長(zhǎng)連接)與節(jié)點(diǎn)綁定關(guān)系,并設(shè)置失效時(shí)間。

5. 采集服務(wù)(Collect Service)收集業(yè)務(wù)消息,首先存入mongodb,然后將消息透?jìng)鹘o分發(fā)服務(wù)(Dispatch Service)。

6. 分發(fā)服務(wù)收到消息之后,根據(jù)消息體中的用戶ID,從redis中獲取對(duì)應(yīng)的推送服務(wù)節(jié)點(diǎn)IP,然后轉(zhuǎn)發(fā)給對(duì)應(yīng)的推送節(jié)點(diǎn)。

7. 推送服務(wù)節(jié)點(diǎn)收到消息之后,根據(jù)用戶ID,從本地緩存中取出對(duì)應(yīng)的長(zhǎng)連接,將消息推送給客戶端。

其他注意事項(xiàng):

go語(yǔ)言現(xiàn)在很重要么??

Go作為Google2009年推出的語(yǔ)言,其被設(shè)計(jì)成一門應(yīng)用于搭載 Web 服務(wù)器,存儲(chǔ)集群或類似用途的巨型中央服務(wù)器的系統(tǒng)編程語(yǔ)言。

對(duì)于高性能分布式系統(tǒng)領(lǐng)域而言,Go 語(yǔ)言無(wú)疑比大多數(shù)其它語(yǔ)言有著更高的開(kāi)發(fā)效率。它提供了海量并行的支持,這對(duì)于 游戲 服務(wù)端的開(kāi)發(fā)而言是再好不過(guò)了。

到現(xiàn)在Go的開(kāi)發(fā)已經(jīng)是完全開(kāi)放的,并且擁有一個(gè)活躍的社區(qū)。

=================================

哪些大公司在使用Go語(yǔ)言:

1、Google

這個(gè)不用多做介紹,作為開(kāi)發(fā)Go語(yǔ)言的公司,當(dāng)仁不讓。Google基于Go有很多優(yōu)秀的項(xiàng)目,比如: ,大家也可以在Github上 查看更多Google的Go開(kāi)源項(xiàng)目。

2、Facebook

Facebook也在用,為此他們還專門在Github上建立了一個(gè)開(kāi)源組織facebookgo,大家可以通過(guò) 訪問(wèn)查看facebook開(kāi)源的項(xiàng)目,比如著名的是平滑升級(jí)的grace。

3、騰訊

騰訊作為國(guó)內(nèi)的大公司,還是敢于嘗試的,尤其是Docker容器化這一塊,他們?cè)?5年已經(jīng)做了docker萬(wàn)臺(tái)規(guī)模的實(shí)踐,具體可以參考

4、百度

目前所知的百度的使用是在運(yùn)維這邊,是百度運(yùn)維的一個(gè)BFE項(xiàng)目,負(fù)責(zé)前端流量的接入。他們的負(fù)責(zé)人在2016年有分享,大家可以看下這個(gè)

5、阿里

阿里巴巴具體的項(xiàng)目不太清楚,不過(guò)聽(tīng)說(shuō)其系統(tǒng)部門、CDN等正在招Go方面的人。

6、京東

京東云消息推送系統(tǒng)、云存儲(chǔ),以及京東商城等都有使用Go做開(kāi)發(fā)。

7、小米

小米對(duì)Golang的支持,莫過(guò)于運(yùn)維監(jiān)控系統(tǒng)的開(kāi)源,也就是

此外,小米互娛、小米商城、小米視頻、小米生態(tài)鏈等團(tuán)隊(duì)都在使用Golang。

8、360

360對(duì)Golang的使用也不少,一個(gè)是開(kāi)源的日志搜索系統(tǒng)Poseidon,托管在Github上,

==================================

Go適合做什么?為何這么多人偏愛(ài)Go語(yǔ)言?

Go強(qiáng)大的開(kāi)發(fā)團(tuán)隊(duì)

1、自由高效:組合的思想、無(wú)侵入式的接口

Go語(yǔ)言可以說(shuō)是開(kāi)發(fā)效率和運(yùn)行效率二者的完美融合,天生的并發(fā)編程支持。Go語(yǔ)言支持當(dāng)前所有的編程范式,包括過(guò)程式編程、面向?qū)ο缶幊桃约昂瘮?shù)式編程。程序員們可以各取所需、自由組合、想怎么玩就怎么玩。

2、強(qiáng)大的標(biāo)準(zhǔn)庫(kù)

這包括互聯(lián)網(wǎng)應(yīng)用、系統(tǒng)編程和網(wǎng)絡(luò)編程。Go里面的標(biāo)準(zhǔn)庫(kù)基本上已經(jīng)是非常穩(wěn)定了,特別是我這里提到的三個(gè),網(wǎng)絡(luò)層、系統(tǒng)層的庫(kù)非常實(shí)用。

3、部署方便:二進(jìn)制文件、Copy部署

我相信這一點(diǎn)是很多人選擇Go的最大理由,因?yàn)椴渴鹛奖懔耍袁F(xiàn)在也有很多人用Go開(kāi)發(fā)運(yùn)維程序。

4、簡(jiǎn)單的并發(fā)

它包含了降低心智的并發(fā)和簡(jiǎn)易的數(shù)據(jù)同步,我覺(jué)得這是Go最大的特色。之所以寫正確的并發(fā)、容錯(cuò)和可擴(kuò)展的程序如此之難,是因?yàn)槲覀冇昧隋e(cuò)誤的工具和錯(cuò)誤的抽象,Go可以說(shuō)這一塊做的相當(dāng)簡(jiǎn)單。

5、穩(wěn)定性

Go擁有強(qiáng)大的編譯檢查、嚴(yán)格的編碼規(guī)范和完整的軟件生命周期工具,具有很強(qiáng)的穩(wěn)定性,穩(wěn)定壓倒一切。那么為什么Go相比于其他程序會(huì)更穩(wěn)定呢?這是因?yàn)镚o提供了軟件生命周期(開(kāi)發(fā)、測(cè)試、部署、維護(hù)等等)的各個(gè)環(huán)節(jié)的工具,如go tool、gofmt、go test。

================================

我們?yōu)槭裁催x擇GO語(yǔ)言

選擇GO語(yǔ)言,主要是基于兩方面的考慮

1. 執(zhí)行性能 縮短API的響應(yīng)時(shí)長(zhǎng),解決批量請(qǐng)求訪問(wèn)超時(shí)的問(wèn)題。在Uwork的業(yè)務(wù)場(chǎng)景下,一次API批量請(qǐng)求,往往會(huì)涉及對(duì)另外接口服務(wù)的多次調(diào)用,而在之前的PHP實(shí)現(xiàn)模式下,要做到并行調(diào)用是非常困難的,串行處理卻不能從根本上提高處理性能。而GO語(yǔ)言不一樣,通過(guò)協(xié)程可以方便的實(shí)現(xiàn)API的并行處理,達(dá)到處理效率的最大化。 依賴Golang的高性能HTTP Server,提升系統(tǒng)吞吐能力,由PHP的數(shù)百級(jí)別提升到數(shù)千里甚至過(guò)萬(wàn)級(jí)別。

2. 開(kāi)發(fā)效率 GO語(yǔ)言使用起來(lái)簡(jiǎn)單、代碼描述效率高、編碼規(guī)范統(tǒng)一、上手快。 通過(guò)少量的代碼,即可實(shí)現(xiàn)框架的標(biāo)準(zhǔn)化,并以統(tǒng)一的規(guī)范快速構(gòu)建API業(yè)務(wù)邏輯。 能快速的構(gòu)建各種通用組件和公共類庫(kù),進(jìn)一步提升開(kāi)發(fā)效率,實(shí)現(xiàn)特定場(chǎng)景下的功能量產(chǎn)。

Go語(yǔ)言近兩年的發(fā)展速度還是非常快的,一方面Go語(yǔ)言有強(qiáng)大的行業(yè)背書,另一方面Go語(yǔ)言在設(shè)計(jì)時(shí)充分考慮了當(dāng)前的編程環(huán)境,加強(qiáng)了大數(shù)據(jù)量、高并發(fā)等應(yīng)用場(chǎng)景的處理能力,強(qiáng)調(diào)編程語(yǔ)言自身對(duì)于處理性能的追求,相信Go語(yǔ)言在未來(lái)大數(shù)據(jù)和人工智能相關(guān)技術(shù)逐漸落地應(yīng)用的背景下,會(huì)有一個(gè)較為廣闊的發(fā)展空間。

本文標(biāo)題:Go語(yǔ)言消息推送系統(tǒng) goeasy消息推送
URL分享:http://chinadenli.net/article6/hhjcog.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應(yīng)式網(wǎng)站面包屑導(dǎo)航品牌網(wǎng)站建設(shè)網(wǎng)站設(shè)計(jì)手機(jī)網(wǎng)站建設(shè)網(wǎng)站營(yíng)銷

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

綿陽(yáng)服務(wù)器托管