提起數(shù)據(jù)倉(cāng)庫(kù),現(xiàn)在對(duì)很多人來(lái)說(shuō)并不陌生,但大多數(shù)人并未系統(tǒng)地讀過(guò)數(shù)據(jù)倉(cāng)庫(kù)的經(jīng)典論著,更沒(méi)有經(jīng)歷過(guò)成熟的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,因此無(wú)論他們僅僅限于探討有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的話題,還是嘗試數(shù)據(jù)倉(cāng)庫(kù)的項(xiàng)目,往往不解數(shù)據(jù)倉(cāng)庫(kù)的真諦,嘗試的項(xiàng)目很可能是無(wú)疾而終,甚至連數(shù)據(jù)倉(cāng)庫(kù)的基本概念都沒(méi)有真正理解。

數(shù)據(jù)倉(cāng)庫(kù)是現(xiàn)在越來(lái)越熱的話題,但大多數(shù)人,無(wú)論是客戶還是開(kāi)發(fā)商,往往在不明確、不成熟的數(shù)據(jù)倉(cāng)庫(kù)需求與不清晰、不深刻的數(shù)據(jù)倉(cāng)庫(kù)知識(shí)間徘徊。一方面,很多客戶積累了大量的業(yè)務(wù)數(shù)據(jù),總想從中得到些什么,甚至有了一些具體的想法,另一方面,一些軟件開(kāi)發(fā)商在潮流的推動(dòng)下,找來(lái)一些有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的書(shū),也學(xué)用一些有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的軟件工具,在數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目上躍躍欲試。學(xué)費(fèi)總是要花的,數(shù)據(jù)倉(cāng)庫(kù)的項(xiàng)目也是這樣。但與一些IT技術(shù)項(xiàng)目不同的是,這次學(xué)費(fèi)是花了,但怎么不見(jiàn)迅速長(zhǎng)進(jìn)?近些年, 我們?cè)趪?guó)內(nèi)遇到不少這樣的事,客戶與開(kāi)發(fā)商開(kāi)始是熱情高漲,雙方不僅投入了不菲的金錢(qián)和人力,但結(jié)果與期望相差甚遠(yuǎn)。因此,有些人甚至開(kāi)始懷疑數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)的可行性及有效性了。確實(shí),從樸素意義上講,做好哪一件也不容易,往往需要對(duì)真理的不斷追求與對(duì)實(shí)踐的不斷嘗試,做好數(shù)據(jù)倉(cāng)庫(kù)是在啃一塊硬骨頭。我們的體會(huì)是,首先以源頭開(kāi)始,扎扎實(shí)實(shí)地走每一步。急功近利的做法,跨越式地發(fā)展,尤其在數(shù)據(jù)倉(cāng)庫(kù)方面是終究要跌跟頭的,因?yàn)檫@些想法與做法不符合客觀事物發(fā)展的規(guī)律!科學(xué)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)發(fā)展的步驟是,首先學(xué)習(xí)數(shù)據(jù)倉(cāng)庫(kù)的經(jīng)典知識(shí),然后盡可能地學(xué)習(xí)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的成熟的技術(shù)和經(jīng)驗(yàn),甚至不惜到其發(fā)源地和技術(shù)領(lǐng)先的國(guó)家去求經(jīng)驗(yàn),然后不斷地自我實(shí)踐,不斷地總結(jié)與提高。
我們首先來(lái)看看大家在數(shù)據(jù)倉(cāng)庫(kù)概念上有哪些誤區(qū)吧。
1. 數(shù)據(jù)倉(cāng)庫(kù)是個(gè)非常大的數(shù)據(jù)庫(kù)。
很多人望文生義,數(shù)據(jù)既然到了倉(cāng)庫(kù)的量級(jí),那肯定是非常大的數(shù)據(jù)。不錯(cuò),數(shù)據(jù)倉(cāng)庫(kù)往往是個(gè)海量的數(shù)據(jù)集,但它不是必要條件。在數(shù)據(jù)倉(cāng)庫(kù)經(jīng)典定義中,也沒(méi)有數(shù)據(jù)倉(cāng)庫(kù)是大數(shù)據(jù)的概念。實(shí)際上,很多好的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,從當(dāng)今的社會(huì)信息規(guī)模來(lái)看,并不是數(shù)據(jù)量很大,但它們確實(shí)給業(yè)務(wù)分析帶來(lái)了很好的效益。因此評(píng)價(jià)一個(gè)數(shù)據(jù)倉(cāng)庫(kù),從來(lái)沒(méi)有用大小來(lái)衡量的。
2. 數(shù)據(jù)倉(cāng)庫(kù)是將所有的業(yè)務(wù)數(shù)據(jù)存在一起的。
數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)目標(biāo)是將分散的業(yè)務(wù)整合在一起的,但它往往是有目的地按分析需去實(shí)施的,并不是將全部的業(yè)務(wù)數(shù)據(jù)統(tǒng)統(tǒng)都集成在一起,更不是像有些人完全地將所有的業(yè)務(wù)數(shù)據(jù)集中地存儲(chǔ)在一起的,在這里既沒(méi)有有效地?cái)?shù)據(jù)整合,也沒(méi)有按分析需要去集成數(shù)據(jù),只是一個(gè)集中式的龐大數(shù)據(jù)堆。
3. 數(shù)據(jù)倉(cāng)庫(kù)是一次性的工程
我們?cè)?jīng)見(jiàn)過(guò)這樣一個(gè)單位,他們驕傲地告訴我,他們做一個(gè)大的數(shù)據(jù)倉(cāng)庫(kù),這項(xiàng)工程已經(jīng)完成了,他們會(huì)在需要的時(shí)候,到倉(cāng)庫(kù)中分析一些數(shù)據(jù)。開(kāi)始我們產(chǎn)生了一個(gè)疑問(wèn),這些需求不是日常的和周期性的嗎?后來(lái)我們才知道,他們只是將歷史的數(shù)據(jù)截止到每一個(gè)時(shí)間,弄到了一個(gè)專(zhuān)用的數(shù)據(jù)庫(kù)中了,而且數(shù)據(jù)流就到此結(jié)束了,不再有增量數(shù)據(jù)規(guī)律或不規(guī)律地流進(jìn)數(shù)據(jù)倉(cāng)庫(kù)中了。我們說(shuō)這不是真正的數(shù)據(jù)倉(cāng)庫(kù)。
其次我們?cè)購(gòu)臄?shù)據(jù)倉(cāng)庫(kù)項(xiàng)目上看看有哪些誤解。
1. 數(shù)據(jù)模型為什么這么簡(jiǎn)單
由于許多經(jīng)歷過(guò)IT項(xiàng)目的人,往往是技術(shù)不錯(cuò)的人,對(duì)交互型的數(shù)據(jù)操作系統(tǒng)的概念太深,往往用OLTP的思維方式去看待數(shù)據(jù)倉(cāng)庫(kù)。我們?cè)?jīng)為一個(gè)單位設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型,他們的IT主管看了很吃驚,“我們這么復(fù)雜的業(yè)務(wù),分析起來(lái)當(dāng)然也很復(fù)雜,你們?cè)O(shè)計(jì)的數(shù)據(jù)模型怎么這么簡(jiǎn)單?”我們不得不解釋原因,給他們講,數(shù)據(jù)倉(cāng)庫(kù)的目的是什么,什么叫數(shù)據(jù)倉(cāng)庫(kù)的Star schema(星型轉(zhuǎn)換),Snowflake schema(雪花模式)。他們還是似懂非懂。其實(shí),相對(duì)于復(fù)雜的面向業(yè)務(wù)和流程的交互型系統(tǒng)來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)則主要面向分析,將復(fù)雜數(shù)據(jù)模型轉(zhuǎn)變簡(jiǎn)單結(jié)構(gòu)的多維數(shù)據(jù)模型。
2. 為什么占用這么多的資源存儲(chǔ),太浪費(fèi)存儲(chǔ)空間了。
我們遇到這樣一個(gè)故事,一位愛(ài)找錯(cuò)的IT組長(zhǎng)報(bào)告他的上司,發(fā)現(xiàn)了我們將看似相同的數(shù)據(jù)存儲(chǔ)在多個(gè)不同的表中,從而浪費(fèi)了他們的很多寶貴的存儲(chǔ)空間,一時(shí)間他們的經(jīng)理反問(wèn)我們,為什么犯這樣低級(jí)的錯(cuò)誤。我們只得解釋?zhuān)瑪?shù)據(jù)倉(cāng)庫(kù)是面向分析,通常是以存儲(chǔ)空間為代價(jià)來(lái)?yè)Q取查詢上的性能,而是這些數(shù)據(jù)雖然存在不同的表中,但它們是不同的,它們是以不同的數(shù)據(jù)模型形式和不同的數(shù)據(jù)顆粒度存在的,這樣查詢不同量級(jí)的數(shù)據(jù),節(jié)省了大量的計(jì)算時(shí)間,可以獲得很好的查詢性能。于是他們無(wú)語(yǔ),面部露出驚奇的表情。
經(jīng)典的數(shù)據(jù)倉(cāng)庫(kù)
好了,現(xiàn)在我們開(kāi)始追溯經(jīng)典,看看經(jīng)典的數(shù)據(jù)倉(cāng)庫(kù)是什么樣子的。
按照經(jīng)典定義,數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)基于歷史數(shù)據(jù)的,邏輯數(shù)據(jù)整合的,不斷增長(zhǎng)的,滿足特定目標(biāo)的數(shù)據(jù)集合。什么是成熟的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目?成熟表現(xiàn)在哪些方面?我們說(shuō),首先數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)商要成熟,其次數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的客戶要成熟,最后是開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的時(shí)機(jī)要成熟。
1. 數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)商成熟
1.1數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)商對(duì)數(shù)據(jù)倉(cāng)庫(kù)的核心知識(shí)和理論認(rèn)識(shí)要成熟。
這時(shí)開(kāi)展數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目最基本的要求了。如果開(kāi)發(fā)商對(duì)數(shù)據(jù)倉(cāng)庫(kù)的經(jīng)典概念搞不透徹,那將是太可怕了。首先大家要從數(shù)據(jù)倉(cāng)庫(kù)的論著開(kāi)始讀起,如美國(guó)的Kimballl的數(shù)據(jù)倉(cāng)庫(kù),Innon的數(shù)據(jù)倉(cāng)庫(kù)等等。讀了還不行,還要寫(xiě)作業(yè),有條件的到美國(guó)或加拿大來(lái)一趟,多看看成功的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,找找資深人士取取經(jīng)。同時(shí)也不斷博覽群書(shū),看看不同的書(shū)的區(qū)別是什么,哪些人講的有道理。總而言之,要像唐僧那樣去追求真理。
1.2數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)商運(yùn)用的數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)手段要成熟
這是比較難了。初學(xué)者就是要從數(shù)據(jù)倉(cāng)庫(kù)論著的第一節(jié)開(kāi)始實(shí)踐了。這里談的主要是技術(shù)層面。開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目有很多專(zhuān)用工具,但我們不能拘泥于某些工具。我們認(rèn)為工具不是最重要的,人才才是最重要的。哪怕有再多的不同的專(zhuān)用工具,只要我們合理安排數(shù)據(jù)倉(cāng)庫(kù)所需的軟硬件,只需精通某一個(gè)或少數(shù)的專(zhuān)用工具,都可以做好數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,因此大家不要過(guò)多的把精力投入到不同的工具和技術(shù)的學(xué)習(xí)中,而且將經(jīng)典的理論與實(shí)際情況結(jié)合起來(lái),將理論轉(zhuǎn)化到可行的實(shí)踐技術(shù)中。
1.3數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)商需要有成熟的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目經(jīng)驗(yàn)
這里談得主要是如何成功地將數(shù)據(jù)倉(cāng)庫(kù)技術(shù)應(yīng)用于大量不同的實(shí)際項(xiàng)目中,這一方面需要開(kāi)發(fā)商要對(duì)有關(guān)行業(yè)的業(yè)務(wù)和相關(guān)專(zhuān)業(yè)的概念有深刻的理解,還要運(yùn)用適當(dāng)?shù)募夹g(shù)進(jìn)行設(shè)計(jì)、開(kāi)發(fā)。拿來(lái)主義是個(gè)不錯(cuò)的方案,不妨到有成熟數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目經(jīng)驗(yàn)的國(guó)內(nèi)、外單位去學(xué)習(xí),或?qū)⑦@些專(zhuān)家請(qǐng)來(lái)做顧問(wèn)。
1.4數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)商對(duì)客戶的培訓(xùn)與教育要有成熟的方法
對(duì)于大多數(shù)客戶來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目是個(gè)新鮮事。對(duì)剛要吃螃蟹的人要做心理輔導(dǎo)和知識(shí)輔導(dǎo)。數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)商要給客戶作必要的數(shù)據(jù)倉(cāng)庫(kù)知識(shí)培訓(xùn),當(dāng)然是講者自己首先要將數(shù)據(jù)倉(cāng)庫(kù)知識(shí)搞通。我們?cè)?jīng)看過(guò)這樣一個(gè)項(xiàng)目,開(kāi)發(fā)商與客戶對(duì)他們的項(xiàng)目還均較滿意,但我們發(fā)現(xiàn)那其實(shí)不是一個(gè)真正定義上的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目。
2. 數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的客戶要成熟
2.1數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的客戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)的認(rèn)識(shí)與知識(shí)要成熟
首先客戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)的基本概念和知識(shí)要有一定了解,最好客戶派出精干的信息人員和專(zhuān)業(yè)人員搞一個(gè)數(shù)據(jù)倉(cāng)庫(kù)短期學(xué)習(xí),再到有成功案例的單位重點(diǎn)地參觀考察一下,然后將有關(guān)流程向領(lǐng)導(dǎo)講明白,因?yàn)轭I(lǐng)導(dǎo)認(rèn)識(shí)的層次與水平將對(duì)今后的項(xiàng)目有很大的影響。
2.2數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的客戶對(duì)自己的需求要成熟
進(jìn)一步講,客戶要下來(lái)好好分析,既然數(shù)據(jù)倉(cāng)庫(kù)能做這些事,我們究竟需 要什么,我們最急需的是什么,我們的分期規(guī)劃是什么,我們哪些需求 是可操作性比較強(qiáng)的,哪些是有困難的,哪些是異想天開(kāi)的。
2.3數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的客戶對(duì)項(xiàng)目投入、產(chǎn)出、風(fēng)險(xiǎn)的認(rèn)識(shí)要成熟
數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目往往是看起來(lái)容易做起來(lái)難。看似不太復(fù)雜的數(shù)據(jù),整起來(lái)還真不容易。因此科學(xué)設(shè)計(jì)與規(guī)劃決定著項(xiàng)目的成敗。數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的初學(xué)客戶與初學(xué)開(kāi)發(fā)商由于經(jīng)驗(yàn)不足,對(duì)數(shù)據(jù)倉(cāng)庫(kù)理解不透,對(duì)困難準(zhǔn)備不足,常常規(guī)劃了不合理的人力和開(kāi)發(fā)應(yīng)用周期,結(jié)果導(dǎo)致了種種問(wèn)題,最終的結(jié)果就是表現(xiàn)各異地達(dá)不到預(yù)期結(jié)果與目標(biāo)。需要的沒(méi)做到,因此對(duì)于初學(xué)們來(lái)說(shuō),首先將目標(biāo)放低一些,多規(guī)劃一些分期投入,在以后的項(xiàng)目中再逐漸改進(jìn),良性循環(huán)。
3. 數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目開(kāi)發(fā)時(shí)機(jī)要成熟
3.1分析需求是否足夠的健全
正如之前的例子,如果是想分析時(shí)就要全部分析一下,這不算成熟的需求。我們說(shuō)健全的需求應(yīng)是指業(yè)務(wù)需求,通常是定期需要的,基本是業(yè)務(wù)依賴的。
3.2業(yè)務(wù)系統(tǒng)的數(shù)據(jù)能涵蓋分析需求嗎?
對(duì)于通常的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目進(jìn)行需求分析,首先看看我們的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)全不全,這事做起來(lái)不難,但我們需要細(xì)化和量化,確實(shí)做到量力(數(shù)據(jù))而行,不要等到開(kāi)發(fā)時(shí),才看清現(xiàn)在的數(shù)據(jù)并不滿足需求。
3.3業(yè)務(wù)系統(tǒng)足夠健壯么?
數(shù)據(jù)倉(cāng)庫(kù)所有的數(shù)據(jù)技術(shù)源于業(yè)務(wù)系統(tǒng),而且數(shù)據(jù)是短暫地由業(yè)務(wù)系統(tǒng)流向數(shù)據(jù)倉(cāng)庫(kù)。盡管,通常數(shù)據(jù)倉(cāng)庫(kù)的ETL操作對(duì)業(yè)務(wù)系統(tǒng)影響較小,有的并不從生產(chǎn)庫(kù)中取數(shù)據(jù),但還是對(duì)業(yè)務(wù)系統(tǒng)的穩(wěn)定性和可靠性有一定要求的。
3.4軟硬件是否具備
中國(guó)有句俗語(yǔ),叫既來(lái)之則安之。如果前面的條件都成熟了,那最后就需要有相應(yīng)的軟硬件配套。這里說(shuō)的軟件是指客戶的人力資源,即業(yè)務(wù)分析人員、IT支持人員,數(shù)據(jù)分析應(yīng)用人員等,硬件是指數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目所需的服務(wù)器,網(wǎng)絡(luò)設(shè)備,終端設(shè)備,以及系統(tǒng)軟件、數(shù)據(jù)庫(kù)軟件、應(yīng)用軟件等。如果確保這些軟硬件都能滿足,那就可以開(kāi)始實(shí)施了。
數(shù)據(jù)倉(cāng)庫(kù)需要考慮的幾個(gè)方面
1. 首先整個(gè)項(xiàng)目的設(shè)計(jì)與目標(biāo)要基本符合經(jīng)典的數(shù)據(jù)倉(cāng)庫(kù)概念和理論。不要做一個(gè)四不像的東西,數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)基于歷史數(shù)據(jù)的,邏輯數(shù)據(jù)整合的,不斷增長(zhǎng)的,滿足特定目標(biāo)的數(shù)據(jù)集合。
2. 項(xiàng)目的結(jié)果應(yīng)該達(dá)到了預(yù)期的目標(biāo)。
評(píng)價(jià)項(xiàng)目的建設(shè)目標(biāo)是否達(dá)到了預(yù)期的目標(biāo),不是項(xiàng)目建成驗(yàn)收的結(jié)果,而是交付使用一段時(shí)間以后,通常是半年以上,對(duì)應(yīng)用結(jié)果的評(píng)價(jià)。
3. 項(xiàng)目具有可靠的穩(wěn)定性。數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)可靠地與業(yè)務(wù)系統(tǒng)相銜接,數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目評(píng)價(jià)是考驗(yàn)它對(duì)數(shù)據(jù)的駕馭能力,可以以駕馭數(shù)據(jù)流程的能力為標(biāo)準(zhǔn)。數(shù)據(jù)倉(cāng)庫(kù)的實(shí)質(zhì)是數(shù)據(jù)計(jì)算技術(shù)。數(shù)據(jù)源源不斷地從業(yè)務(wù)系統(tǒng)流向數(shù)據(jù)倉(cāng)庫(kù)中,歷史數(shù)據(jù)能否始終健康成長(zhǎng)?即保證它的完整、準(zhǔn)確、不重復(fù)、不缺失,隨著數(shù)據(jù)量不斷地增長(zhǎng),系統(tǒng)的性能依然良好可用。
4. 項(xiàng)目是可維護(hù)的。
我們?cè)?jīng)見(jiàn)過(guò)這樣的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,它的數(shù)據(jù)模型設(shè)計(jì)得很巧妙,但忽視了數(shù)據(jù)倉(cāng)庫(kù)在增長(zhǎng)到一定數(shù)據(jù)量時(shí)的的性能,結(jié)果系統(tǒng)運(yùn)行第一年效果不錯(cuò),第二年就性能大大降低了,而且隨著數(shù)據(jù)不斷地增長(zhǎng),系統(tǒng)越來(lái)越慢,除了對(duì)數(shù)據(jù)模型推翻重組別外幾乎是沒(méi)有有效的辦法了。還有其他方面設(shè)計(jì)和開(kāi)發(fā)不當(dāng)?shù)模瑪?shù)據(jù)越來(lái)越不準(zhǔn)確,導(dǎo)致結(jié)果最后不可用。
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
最后,我們?cè)俸?jiǎn)單提一下數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系。什么是數(shù)據(jù)挖掘呢?數(shù)據(jù)挖掘就是采用一定技術(shù)和方法發(fā)現(xiàn)隱藏在數(shù)據(jù)中的規(guī)律和知識(shí)的工作。數(shù)據(jù)挖掘需要應(yīng)用一定的數(shù)學(xué)和計(jì)算技術(shù)對(duì)較大數(shù)據(jù)集做深層次的分析,它通常需要與項(xiàng)目的業(yè)務(wù)流程和專(zhuān)業(yè)知識(shí)深入相結(jié)合,工作流程須基本符合數(shù)據(jù)挖掘業(yè)界標(biāo)準(zhǔn)- CRISP。
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系就像是一對(duì)戰(zhàn)略合作伙伴,彼此合作是共贏的,但雙方又是獨(dú)立自主的,并不以對(duì)方為前提條件。數(shù)據(jù)挖掘并不是依賴于數(shù)據(jù)倉(cāng)庫(kù), ,實(shí)際上的商業(yè)應(yīng)用項(xiàng)目當(dāng)中數(shù)據(jù)挖掘往往是相對(duì)獨(dú)立的,數(shù)據(jù)挖掘要的數(shù)據(jù)是有它特殊的需求,數(shù)據(jù)可以來(lái)源于數(shù)據(jù)倉(cāng)庫(kù),也可以直接從數(shù)據(jù)源里來(lái)取,并不是說(shuō)是數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘有必然的關(guān)系,也不是先有數(shù)據(jù)倉(cāng)庫(kù)后有數(shù)據(jù)挖掘,所有的數(shù)據(jù)挖掘一定基于數(shù)據(jù)倉(cāng)庫(kù),不是這個(gè)概念。
那么,沒(méi)有數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用是什么?沒(méi)有數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘是怎樣工作的?數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘是怎樣結(jié)合的?好處是什么?我們以后再講。
作者:
Hong Song Lin(洪松林) 福安易數(shù)據(jù)技術(shù)(天津)有限公司(F&E DATA TECHNOLOGY CORP. )創(chuàng)始人,外國(guó)專(zhuān)家局引智技術(shù)專(zhuān)家,加拿大OCP認(rèn)證專(zhuān)家,有20年智能計(jì)算(數(shù)據(jù)倉(cāng)庫(kù)、商務(wù)智能及數(shù)據(jù)挖掘)方面的研究、設(shè)計(jì)、開(kāi)發(fā)和培訓(xùn)經(jīng)驗(yàn)。掌握北美先進(jìn)的項(xiàng)目經(jīng)驗(yàn),曾在加拿大安大略省衛(wèi)生部(OMH)、蒙特利爾銀行(BMO)、加拿大研科電訊公司(TELUS )、安省高教委(OCAS)等大型機(jī)構(gòu)參與多個(gè)大型智能計(jì)算項(xiàng)目。近年來(lái)在國(guó)內(nèi)主持多個(gè)智能計(jì)算產(chǎn)品的總體設(shè)計(jì)和研發(fā)工作,將北美的智能計(jì)算技術(shù)及業(yè)務(wù)經(jīng)驗(yàn)與中國(guó)的專(zhuān)業(yè)需求和數(shù)據(jù)環(huán)境有效地結(jié)合起來(lái),開(kāi)發(fā)了以數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘和數(shù)據(jù)統(tǒng)計(jì)為技術(shù)核心的智能數(shù)據(jù)分析產(chǎn)品,國(guó)內(nèi)首創(chuàng),并在北京、天津等地得到成功應(yīng)用。
當(dāng)前題目:基礎(chǔ)理論:數(shù)據(jù)倉(cāng)庫(kù)DW的辯識(shí)
網(wǎng)站路徑:http://chinadenli.net/article44/soidee.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制開(kāi)發(fā)、營(yíng)銷(xiāo)型網(wǎng)站建設(shè)、網(wǎng)站導(dǎo)航、網(wǎng)站策劃、網(wǎng)站設(shè)計(jì)公司、全網(wǎng)營(yíng)銷(xiāo)推廣
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)