如下圖所示,從邏輯上來看,Hive包含了3大部分。
創(chuàng)新互聯(lián)堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都網(wǎng)站建設、成都做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務,滿足客戶于互聯(lián)網(wǎng)時代的安遠網(wǎng)站設計、移動媒體設計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡建設合作伙伴!
用戶操作Hive的接口主要有三個:CLI,Client 和 WUI。
其中最常用的是CLI,Cli啟動的時候,會同時啟動一個Hive副本。
Client是Hive的客戶端,用戶連接至Hive Server。在啟動 Client模式的時候,需要指出Hive Server所在節(jié)點,并且在該節(jié)點啟動Hive Server。而客戶端則又可以分為三種Thrift Client,JDBC Client,ODBC Client。
Web Interface是通過瀏覽器訪問Hive。
實現(xiàn)了session handler,在JDBC/ODBC接口上實現(xiàn)了執(zhí)行和獲取信息的API。
該組件用于對不同的查詢表達式做解析查詢,語義分析,最終會根據(jù)從metastore中查詢到的表和分區(qū)元數(shù)據(jù)生成一個execution plain。
該組件會執(zhí)行由compiler創(chuàng)建的execution。其中plan從數(shù)據(jù)結(jié)構(gòu)上來看,是一個DAG,該組件會管理plan的不同stage與組件中執(zhí)行這些plan之間的依賴。
Hive的metastore組件是hive元數(shù)據(jù)集中存放地。該組件存儲了包括變量表中列和列類型等結(jié)構(gòu)化的信息以及數(shù)據(jù)倉庫中的分區(qū)信息(包括列和列類型信息,讀寫數(shù)據(jù)時必要的序列化和反序列化信息,數(shù)據(jù)被存儲在HDFS文件中的位置)。
Metastore組件包括兩個部分:metastore services和Meta storage database。
使用遠程的metastore services,可以讓metastore services和hive services運行在不同的進程里,這樣也保證了hive的穩(wěn)定性,提升了hive services的效率。
流程大致步驟為:
解析用戶提交的Hive語句->對其進行解析->分解為表、字段、分區(qū)等Hive對象
根據(jù)解析到的信息構(gòu)建對應的表、字段、分區(qū)等對象,從SEQUENCE_TABLE中獲取構(gòu)建對象的最新的ID,與構(gòu)建對象信息(名稱、類型等等)一同通過DAO方法寫入元數(shù)據(jù)庫的表中,成功后將SEQUENCE_TABLE中對應的最新ID+5。
實際上常見的RDBMS都是通過這種方法進行組織的,其系統(tǒng)表中和Hive元數(shù)據(jù)一樣顯示了這些ID信息。通過這些元數(shù)據(jù)可以很容易的讀取到數(shù)據(jù)。
優(yōu)化器是一個不斷更新的組件,大部分plan的轉(zhuǎn)移都是通過優(yōu)化器完成的。
新聞標題:hive基本架構(gòu)
網(wǎng)頁鏈接:http://chinadenli.net/article42/gjshec.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供用戶體驗、定制開發(fā)、品牌網(wǎng)站制作、服務器托管、做網(wǎng)站、
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)