1、列簇的設計
列簇盡量少,最好不超過3個。因為每個列簇是存在一個獨立的HFile里的,flush和compaction操作都是針對一個Region進行的,當一個列簇的數(shù)據很多需要flush的時候,其它列簇即使數(shù)據很少也需要flush,這樣就產生的大量不必要的io操作。
在多列簇的情況下,注意各列簇數(shù)據的數(shù)量級要一致。如果兩個列簇的數(shù)量級相差太大,會使數(shù)量級少的列簇的數(shù)據掃描效率低下。
將經常查詢和不經常查詢的數(shù)據放到不同的列簇。
因為列簇和列的名字會存在HBase的每個Cell中,所以他們的名字應該盡可能的短。比如,用f:q代替mycolumnfamily:mycolumnqualifier
2、rowkey的設計
避免使用遞增的數(shù)字或時間做為rowkey。
如果rowkey是整型,用二進制的方式比用string來存儲更節(jié)約空間
合理的控制rowkey的長度,盡可能短,因為rowkey的數(shù)據也會存在每個Cell中。
如果需要將表預分裂為多個region是,最好自定義分裂的規(guī)則。
另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。
文章名稱:Hbase之表設計原則-創(chuàng)新互聯(lián)
分享地址:http://chinadenli.net/article30/dgdsso.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供全網營銷推廣、網站策劃、建站公司、關鍵詞優(yōu)化、域名注冊、小程序開發(fā)
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內容