這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何理解Fedlearner,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
為企業(yè)提供成都做網(wǎng)站、成都網(wǎng)站建設(shè)、網(wǎng)站優(yōu)化、成都營銷網(wǎng)站建設(shè)、競價托管、品牌運營等營銷獲客服務(wù)。創(chuàng)新互聯(lián)擁有網(wǎng)絡(luò)營銷運營團(tuán)隊,以豐富的互聯(lián)網(wǎng)營銷經(jīng)驗助力企業(yè)精準(zhǔn)獲客,真正落地解決中小企業(yè)營銷獲客難題,做到“讓獲客更簡單”。自創(chuàng)立至今,成功用技術(shù)實力解決了企業(yè)“網(wǎng)站建設(shè)、網(wǎng)絡(luò)品牌塑造、網(wǎng)絡(luò)營銷”三大難題,同時降低了營銷成本,提高了有效客戶轉(zhuǎn)化率,獲得了眾多企業(yè)客戶的高度認(rèn)可!
Fedlearner
這次頭條開源的Fedlearner與我之前分析過得華為、微眾的聯(lián)邦機器學(xué)習(xí)平臺有什么不同呢?主要體現(xiàn)在以下幾個方面:
產(chǎn)品化:Fedlearner的代碼里有大量的js、Html模塊,也是第一次讓我們可以直觀的看到聯(lián)邦機器學(xué)習(xí)平臺大概是什么樣的,如果做成產(chǎn)品需要長成什么樣。
業(yè)務(wù)多樣化:之前華為、微眾更多地強調(diào)聯(lián)邦機器學(xué)習(xí)在風(fēng)控業(yè)務(wù)的落地。頭條開始強調(diào)聯(lián)邦學(xué)習(xí)在推薦、廣告等業(yè)務(wù)中的落地,并且給了很明確的數(shù)據(jù),在某教育業(yè)務(wù)板塊廣告投放效果增加209%。
可輸出性:如果說之前的聯(lián)邦機器學(xué)習(xí)平臺更多地從理論層面做介紹,這一次字節(jié)的Fedlearner強調(diào)了可輸出性,比如為了保持聯(lián)邦建模雙方的環(huán)境一致性,通過K8S的部署模式快速拉起和管理集群。這是為ToB對外輸出服務(wù)做技術(shù)準(zhǔn)備。
下面分別介紹下Fedlearner在這三方面的一些工作。
以推薦廣告業(yè)務(wù)為例,聯(lián)邦機器學(xué)習(xí)平臺的廣告主和平臺方應(yīng)該各自管理一套模型展示服務(wù)和模型訓(xùn)練服務(wù)。
需要有兩套協(xié)議保證客戶的聯(lián)邦建模,一套是數(shù)據(jù)一致性問題。比如在縱向聯(lián)邦學(xué)習(xí)場景下,用戶在頁面上點擊了某個廣告,平臺方和廣告主各自會捕獲一部分日志。如何能實時的保證這兩部分捕獲的日志的一致性,并且拼接成訓(xùn)練樣本,需要一套實時數(shù)據(jù)樣本拼接協(xié)議。
另一個協(xié)議是多方數(shù)據(jù)安全協(xié)議。比如AB兩個業(yè)務(wù)方,A有4億用戶,B有3億用戶,如何做到通過某種方式找到A和B的交叉用戶,并且不讓A和B互相猜到對方的數(shù)據(jù),需要有一套多方數(shù)據(jù)安全協(xié)議。
基于以上兩套協(xié)議,在雙方聯(lián)合建模過程中,使用GRPC通信,利用TensorFlow做雙方梯度的交換進(jìn)行聯(lián)合建模。
聯(lián)邦機器學(xué)習(xí)的最大業(yè)務(wù)場景在推薦廣告,這個我在一年前的文章中有預(yù)測過。果然頭條特別強調(diào)了推薦場景的應(yīng)用。他提到了推薦業(yè)務(wù)更適合神經(jīng)網(wǎng)絡(luò)算法,風(fēng)控業(yè)務(wù)適合樹形算法。作者也比較認(rèn)同這樣的說法,因為風(fēng)控需要高可解釋性,樹形算法天然滿足這樣的需求。而推薦業(yè)務(wù)對模型可解釋性要求不高,神經(jīng)網(wǎng)絡(luò)算法的復(fù)雜性可以充分保證推薦排序算法的準(zhǔn)確率。
Fedlearner業(yè)務(wù)負(fù)責(zé)人給了一組數(shù)字可以證明聯(lián)邦機器學(xué)習(xí)在推薦業(yè)務(wù)中的落地效果。
這組數(shù)組還是非常有說服力的。其實對于新技術(shù),很多時候面對的壁壘不是技術(shù)問題,而是如何證明業(yè)務(wù)價值,需要第一個吃螃蟹的人,才能推動新技術(shù)在行業(yè)的落地。聯(lián)邦機器學(xué)習(xí)在推薦廣告業(yè)務(wù)中大有可為。
Fedlearner采用的是一套云原生的部署方案。數(shù)據(jù)存放在HDFS,用MySQL存儲系統(tǒng)數(shù)據(jù)。通過Kubernetes管理和拉起任務(wù)。每個Fedlearner的訓(xùn)練任務(wù)需要參與雙方同時拉起K8S任務(wù),通過Master節(jié)點統(tǒng)一管理,Worker建實現(xiàn)通信。
這套方案充分考慮了當(dāng)前做推薦業(yè)務(wù)的用戶的數(shù)倉兼容性,因為大部分客戶的數(shù)倉體系還是Hadoop生態(tài),數(shù)據(jù)存儲在HDFS。同時用K8S又最大限度的保證了聯(lián)合建模雙方計算引擎環(huán)境的一致性。
上述就是小編為大家分享的如何理解Fedlearner了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
網(wǎng)頁題目:如何理解Fedlearner
轉(zhuǎn)載源于:http://chinadenli.net/article44/gjeihe.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供虛擬主機、全網(wǎng)營銷推廣、網(wǎng)站導(dǎo)航、定制網(wǎng)站、云服務(wù)器、關(guān)鍵詞優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)