這篇文章主要介紹“常用的大數(shù)據(jù)分析模型有哪些以及大數(shù)據(jù)的特征有哪些”,在日常操作中,相信很多人在常用的大數(shù)據(jù)分析模型有哪些以及大數(shù)據(jù)的特征有哪些問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”常用的大數(shù)據(jù)分析模型有哪些以及大數(shù)據(jù)的特征有哪些”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
創(chuàng)新互聯(lián)建站-成都網(wǎng)站建設(shè)公司,專注成都網(wǎng)站制作、成都網(wǎng)站建設(shè)、網(wǎng)站營銷推廣,域名注冊,網(wǎng)絡(luò)空間,網(wǎng)站托管、服務(wù)器租用有關(guān)企業(yè)網(wǎng)站制作方案、改版、費(fèi)用等問題,請聯(lián)系創(chuàng)新互聯(lián)建站。
現(xiàn)如今會上如果不說兩句大數(shù)據(jù)、云計(jì)算、區(qū)塊鏈、邊緣計(jì)算等名詞,就感覺被時代拋棄一樣。那今天我們主要為大家講解下什么是大數(shù)據(jù);在做大數(shù)據(jù)可視化時,有哪些常見得到數(shù)據(jù)分析模型。
那么什么是大數(shù)據(jù)呢?
大數(shù)據(jù)(Big Data)概念是1998年由SGI首席科學(xué)家John Masey在USENIX大會上提出的。他當(dāng)時發(fā)表了一篇名為Big Data and the Next Wave of Infrastress的論文,使用了大數(shù)據(jù)來描述數(shù)據(jù)爆炸的現(xiàn)象。但大數(shù)據(jù)真正得到業(yè)界關(guān)注,則是其后多年的事情了。其中大數(shù)據(jù)最重要的發(fā)酵素則是2003-2006年Google發(fā)布的GFS、MapReduce和BigTable三篇論文。
大數(shù)據(jù)是指海量數(shù)據(jù)或巨量數(shù)據(jù),其規(guī)模巨大到無法通過目前主流的計(jì)算機(jī)系統(tǒng)在合理時間內(nèi)獲取、存儲、管理、處理并提煉以幫助使用者決策。
大數(shù)據(jù)有哪些特征呢?
大數(shù)據(jù)的5V特征,即Variety(多樣化)、Volume(大量化)、Velocity(快速化)、Value(價(jià)值密度低)、Veracity(真實(shí)性)。其中,Variety表示來源多和格式多,數(shù)據(jù)可以來源于搜索引擎、社交網(wǎng)絡(luò)、通話記錄、傳感器等等,這些數(shù)據(jù)要么以結(jié)構(gòu)化形式存儲,要么以非結(jié)構(gòu)化數(shù)據(jù)存儲;Volume表示數(shù)據(jù)量比較大,從TB級別,躍升到PB級別。尤其是在移動互聯(lián)時代,視頻、語言等非結(jié)構(gòu)化數(shù)據(jù)快速增長;Velocity表示數(shù)據(jù)存在時效性,需要快速處理,并得到結(jié)果出來,這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的區(qū)別;Value表示大量不相關(guān)信息,不經(jīng)過處理則價(jià)值較低,屬于價(jià)值密度低的數(shù)據(jù)。Veracity(真實(shí)性)數(shù)據(jù)質(zhì)量因數(shù)據(jù)來源以及記錄方式等影響因素的不同,會出現(xiàn)較大的差異,而這種差異性會極大程度地影響數(shù)據(jù)分析的精確性
大數(shù)據(jù)處理流程是怎么樣的呢?
一般的大數(shù)據(jù)處理流程都有以下幾個過程:數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)處理、數(shù)據(jù)展現(xiàn)。如下圖所示。
簡而言之,大數(shù)據(jù)就是數(shù)據(jù)量非常大、數(shù)據(jù)種類繁多、無法用常規(guī)歸類方法應(yīng)用計(jì)算的數(shù)據(jù)集成。
有了這么多的大數(shù)據(jù),我們?nèi)绾问褂媚兀?/p>
通過不同渠道采集來的數(shù)據(jù),經(jīng)過對數(shù)據(jù)清洗后,那接下來就是應(yīng)用大數(shù)據(jù)的時候了。根據(jù)我們的需求目標(biāo)定義不同的數(shù)據(jù)模型,通過數(shù)據(jù)模型對數(shù)據(jù)進(jìn)行篩選,獲得我們需要的數(shù)據(jù)。那么在我們?nèi)粘9ぷ髦杏心男┏S玫拇髷?shù)據(jù)模型呢?今天我們主要分析幾個常用的模型做簡單的介紹。供大家參考。
1、行為事件分析
行為事件分析法:顧名思義主要通過事件的行為來分析,獲得有效的數(shù)據(jù)。目前主要是用來來研究某行為事件的發(fā)生對企業(yè)組織價(jià)值的影響以及影響程度。那么我們的企業(yè)可以借此來追蹤或記錄的用戶行為或業(yè)務(wù)過程。比如用戶注冊、瀏覽產(chǎn)品詳情頁、購買、提現(xiàn)等,通過研究與事件發(fā)生關(guān)聯(lián)的所有因素來挖掘用戶行為事件背后的原因、交互影響等。
在日常工作中,運(yùn)營、市場、產(chǎn)品、數(shù)據(jù)分析師根據(jù)實(shí)際工作情況而關(guān)注不同的事件指標(biāo)。如最近三個月來自哪個渠道的用戶注冊量最高?變化趨勢如何?各時段的人均充值金額是分別多少?上周來自北京發(fā)生過購買行為的獨(dú)立用戶數(shù),按照年齡段的分布情況?每天的獨(dú)立Session數(shù)是多少?諸如此類的指標(biāo)查看的過程中,行為事件分析起到重要作用。
行為事件分析法具有強(qiáng)大的篩選、分組和聚合能力,邏輯清晰且使用簡單,已被廣泛應(yīng)用。行為事件分析法一般經(jīng)過事件定義與選擇、下鉆分析、解釋與結(jié)論等環(huán)節(jié)。尤其是電商公司通過前期的用戶行為數(shù)據(jù)的采集,在促銷活動中就可以有目的的區(qū)域性,定制性用戶廣告投放。通過精準(zhǔn)的用戶行為數(shù)據(jù)分析,可獲得更高精準(zhǔn)用戶的轉(zhuǎn)化率。
2、漏斗分析模型
漏斗分析是一套流程分析,它能夠科學(xué)反映用戶行為狀態(tài)以及從起點(diǎn)到終點(diǎn)各階段用戶轉(zhuǎn)化率情況的重要分析模型。其實(shí)企業(yè)經(jīng)營中經(jīng)常使用到,最簡單的應(yīng)該是我們銷售部門的銷售項(xiàng)目漏斗。銷售管理者通過項(xiàng)目漏斗來分析接下來重點(diǎn)項(xiàng)目跟進(jìn)和贏單概率。銷售漏斗也是一種數(shù)據(jù)分析模型。
漏斗分析模型在電商平臺也是廣泛應(yīng)用。主要在流量監(jiān)控、產(chǎn)品目標(biāo)轉(zhuǎn)化等日常數(shù)據(jù)管理工作中。例如在一款產(chǎn)品服務(wù)平臺中,直播用戶從激活A(yù)PP開始到花費(fèi),一般的用戶購物路徑為激活A(yù)PP、注冊賬號、進(jìn)入直播間、互動行為、禮物花費(fèi)五大階段,漏斗能夠展現(xiàn)出各個階段的轉(zhuǎn)化率,通過漏斗各環(huán)節(jié)相關(guān)數(shù)據(jù)的比較,能夠直觀地發(fā)現(xiàn)和說明問題所在,從而找到優(yōu)化方向。對于業(yè)務(wù)流程相對規(guī)范、周期較長、環(huán)節(jié)較多的流程分析,能夠直觀地發(fā)現(xiàn)和說明問題所在。
3、留存分析模型
留存分析是一種用來分析用戶參與情況/活躍程度的分析模型,考察進(jìn)行初始行為的用戶中,有多少人會進(jìn)行后續(xù)行為。簡要的說就是您舉辦一場活動,邀請了1000人參會,在參會過程中陸續(xù)有人對這個活動不感興趣了,就中途退出了活動現(xiàn)場,還有部分用戶堅(jiān)持下來了,那么堅(jiān)持下來的用戶一定是您的目標(biāo)客戶嗎?那么也未必對吧。我們就需要一個工具來識別留存下來的用戶哪些才是真正的用戶。這就是用來衡量產(chǎn)品對用戶價(jià)值高低的重要方法。留存分析可以幫助回答以下問題:
一個新客戶在未來的一段時間內(nèi)是否成為您期許目標(biāo)用戶的行為?如發(fā)生購買行為,參與活動等;某個平臺改進(jìn)了用戶在線體驗(yàn),邀請有興趣的用戶參與,看是否有成功轉(zhuǎn)化?
4、分布分析模型
分布分析是用戶在特定指標(biāo)下的頻次、總額等的歸類展現(xiàn)。它可以展現(xiàn)出單用戶對產(chǎn)品的依賴程度,分析客戶在不同地區(qū)、不同時段所購買的不同類型的產(chǎn)品數(shù)量、購買頻次等,幫助運(yùn)營人員了解當(dāng)前的客戶狀態(tài),以及客戶的運(yùn)轉(zhuǎn)情況。如訂單金額(100以下區(qū)間、100元-200元區(qū)間、200元以上區(qū)間等)、購買次數(shù)(5次以下、5-10次、10以上)等用戶的分布情況。
分布分析模型的功能與價(jià)值:科學(xué)的分布分析模型支持按時間、次數(shù)、事件指標(biāo)進(jìn)行用戶條件篩選及數(shù)據(jù)統(tǒng)計(jì)。為不同角色的人員統(tǒng)計(jì)用戶在一天/周/月中,有多少個自然時間段(小時/天)進(jìn)行了某項(xiàng)操作、進(jìn)行某項(xiàng)操作的次數(shù)、進(jìn)行事件指標(biāo)。
5、點(diǎn)擊分析模型
即應(yīng)用一種特殊高亮的顏色形式,顯示頁面或頁面組(結(jié)構(gòu)相同的頁面,如商品詳情頁、官網(wǎng)博客等)區(qū)域中不同元素點(diǎn)擊密度的圖示。包括元素被點(diǎn)擊的次數(shù)、占比、發(fā)生點(diǎn)擊的用戶列表、按鈕的當(dāng)前與歷史內(nèi)容等因素。
點(diǎn)擊圖是點(diǎn)擊分析方法的效果呈現(xiàn)。點(diǎn)擊分析具有分析過程高效、靈活、易用,效果直觀的特點(diǎn)。點(diǎn)擊分析采用可視化的設(shè)計(jì)思想與架構(gòu),簡潔直觀的操作方式,直觀呈現(xiàn)訪客熱衷的區(qū)域,幫助運(yùn)營人員或管理者評估網(wǎng)頁的設(shè)計(jì)的科學(xué)性。
6、用戶行為路徑分析模型
用戶路徑分析,顧名思義,用戶在APP或網(wǎng)站中的訪問行為路徑。為了衡量網(wǎng)站優(yōu)化的效果或營銷推廣的效果,以及了解用戶行為偏好,時常要對訪問路徑的轉(zhuǎn)換數(shù)據(jù)進(jìn)行分析。
以電商為例,買家從登錄網(wǎng)站/APP到支付成功要經(jīng)過首頁瀏覽、搜索商品、加入購物車、提交訂單、支付訂單等過程。而在用戶真實(shí)的選購過程是一個交纏反復(fù)的過程,例如提交訂單后,用戶可能會返回首頁繼續(xù)搜索商品,也可能去取消訂單,每一個路徑背后都有不同的動機(jī)。與其他分析模型配合進(jìn)行深入分析后,能為找到快速用戶動機(jī),從而引領(lǐng)用戶走向最優(yōu)路徑或者期望中的路徑。
7、用戶分群分析模型
用戶分群即用戶信息標(biāo)簽化,通過用戶的歷史行為路徑、行為特征、偏好等屬性,將具有相同屬性的用戶劃分為一個群體,并進(jìn)行后續(xù)分析。我們通過漏斗分析可以看到,用戶在不同階段所表現(xiàn)出的行為是不同的,譬如新用戶的關(guān)注點(diǎn)在哪里?已購用戶什么情況下會再次付費(fèi)?因?yàn)槿后w特征不同,行為會有很大差別,因此可以根據(jù)歷史數(shù)據(jù)將用戶進(jìn)行劃分,進(jìn)而再次觀察該群體的具體行為。這就是用戶分群的原理。
8、屬性分析模型
顧名思義,根據(jù)用戶自身屬性對用戶進(jìn)行分類與統(tǒng)計(jì)分析,比如查看用戶數(shù)量在注冊時間上的變化趨勢、查看用戶按省份的分布情況。用戶屬性會涉及到用戶信息,如姓名、年齡、家庭、婚姻狀況、性別、最高教育程度等自然信息;也有產(chǎn)品相關(guān)屬性,如用戶常駐省市、用戶等級、用戶首次訪問渠道來源等。
屬性分析模型的價(jià)值是什么?一座房子的面積無法全面衡量其價(jià)值大小,而房子的位置、風(fēng)格、是否學(xué)區(qū)、交通環(huán)境更是相關(guān)的屬性。同樣,用戶各維度屬性都是進(jìn)行全面衡量用戶畫像的不可或缺的內(nèi)容。
屬性分析主要價(jià)值在:豐富用戶畫像維度,讓用戶行為洞察粒度更細(xì)致??茖W(xué)的屬性分析方法,可以對于所有類型的屬性都可以將“去重?cái)?shù)”作為分析指標(biāo),對于數(shù)值類型的屬性可以將“總和”“均值”“最大值”“最小值”作為分析指標(biāo);可以添加多個維度,沒有維度時無法展示圖形,數(shù)字類型的維度可以自定義區(qū)間,方便進(jìn)行更加精細(xì)化的分析。
到此,關(guān)于“常用的大數(shù)據(jù)分析模型有哪些以及大數(shù)據(jù)的特征有哪些”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!
文章標(biāo)題:常用的大數(shù)據(jù)分析模型有哪些以及大數(shù)據(jù)的特征有哪些
標(biāo)題來源:http://chinadenli.net/article30/gjeeso.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、軟件開發(fā)、網(wǎng)站建設(shè)、網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)