Impala的特點有哪些

本篇內(nèi)容主要講解“Impala的特點有哪些”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實用性強。下面就讓小編來帶大家學習“Impala的特點有哪些”吧!

創(chuàng)新互聯(lián)長期為1000+客戶提供的網(wǎng)站建設(shè)服務(wù)，團隊從業(yè)經(jīng)驗10年，關(guān)注不同地域、不同群體，并針對不同對象提供差異化的產(chǎn)品和服務(wù)；打造開放共贏平臺，與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為灌南企業(yè)提供專業(yè)的網(wǎng)站設(shè)計制作、網(wǎng)站設(shè)計，灌南網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。

Impala 是參照google 的新三篇論文Dremel(大批量數(shù)據(jù)查詢工具)的開源實現(xiàn)，功能類似shark（依賴于hive）和Drill（apache），impala 是clouder 公司主導開發(fā)并開源，基于hive 并使用內(nèi)存進行計算，兼顧數(shù)據(jù)倉庫，具有實時，批處理，多并發(fā)等優(yōu)點。是使用cdh 的首選PB 級大數(shù)據(jù)實時查詢分析引擎。（Impala 依賴cdh 是完全沒有問題的，官網(wǎng)說可以單獨運行，但是他單獨運行會出現(xiàn)好多的問題）

Impala與Shark、sparkSQL、Drill等的簡單比較
Impala的特點有哪些

Impala起步較早，目前能夠商用的為數(shù)不多的大數(shù)據(jù)查詢引擎之一；
CDH5不支持sparkSQL；
Drill起步晚，尚不成熟；
shark功能和架構(gòu)上同Impala相似，該項目已經(jīng)停止開發(fā)。

Impala特點

基于內(nèi)存進行計算，能夠?qū)B級數(shù)據(jù)進行交互式實時查詢/分析；
無需轉(zhuǎn)換為MR，直接讀取HDFS數(shù)據(jù)
C++編寫，LLVM統(tǒng)一編譯運行
兼容HiveSQL
具有數(shù)據(jù)倉庫的特性，可對hive數(shù)據(jù)直接做數(shù)據(jù)分析
支持Data Local
支持列式存儲
支持JDBC/ODBC遠程訪問
支持sql92標準，并具有自己的解析器和優(yōu)化器
Impala核心組件
對于impala 來講，是沒有主節(jié)點的，而要理解主節(jié)點，impala statestore 和catalog server兩個角色，就具備集群調(diào)節(jié)的功能，根據(jù)以上的特點，對impala 進行配置優(yōu)化配置impala 內(nèi)存，每一個deamon 都需要配置內(nèi)存，因為真正做查詢工作的就是deamon 所在的節(jié)點，所以impala 的總內(nèi)存，就是所有deamon 節(jié)點的內(nèi)存之和；如果要在哪臺機器上面匯總，就需要在那一臺機器上的內(nèi)存調(diào)大一些；我們了解到的，真正提供查詢的是deamon,那么我們連接哪一臺呢？Impala,你可以連接其中deamon 任何一個都行，可以根據(jù)自己的需求來，（1）當你查詢的量相對大的時候，你就連接內(nèi)存大的機器，（2）當每臺機器都適合查詢的情況下也可以隨機找一臺機器，自己寫一個輪詢或者權(quán)重算法；解決高并發(fā)問題
- Statestore Daemon
- Catalog Daemon（1.2 版本之后才加入）
- Impala Daemon（主要來提供查詢）

猜你還喜歡下面的內(nèi)容

欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

Impala的特點有哪些