一樣是數(shù)據(jù)庫

網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站制作的開發(fā),更需要了解用戶,從用戶角度來建設(shè)網(wǎng)站,獲得較好的用戶體驗(yàn)。創(chuàng)新互聯(lián)多年互聯(lián)網(wǎng)經(jīng)驗(yàn),見的多,溝通容易、能幫助客戶提出的運(yùn)營建議。作為成都一家網(wǎng)絡(luò)公司,打造的就是網(wǎng)站建設(shè)產(chǎn)品直銷的概念。選擇創(chuàng)新互聯(lián),不只是建站,我們把建站作為產(chǎn)品,不斷的更新、完善,讓每位來訪用戶感受到浩方產(chǎn)品的價(jià)值服務(wù)。
NOSQL查詢速度快,但是占用空間也大(都去索引那邊了)
但是NOSQL查詢復(fù)雜的邏輯關(guān)系的時(shí)候,只能批量獲取到本地去統(tǒng)計(jì)而SQL能通過條件和關(guān)聯(lián)表等方式進(jìn)行篩選只顯示符合條件的語句。
NOSQL用于無條件或少條件下的存取。百億級數(shù)據(jù)也能快速取出。
SQL用于復(fù)雜的邏輯存取。在數(shù)據(jù)量不多的情況下也能跟NOSQL一樣用于數(shù)據(jù)存儲。
HBase 是典型的 NoSQL 數(shù)據(jù)庫,通常被描述成稀疏的、分布式的、持久化的,由行鍵、列鍵和時(shí)間戳進(jìn)行索引的多維有序映射數(shù)據(jù)庫,主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。因?yàn)?HBase 基于 Hadoop 的 HDFS 完成分布式存儲,以及 MapReduce 完成分布式并行計(jì)算,所以它的一些特點(diǎn)與 Hadoop 相同,依靠橫向擴(kuò)展,通過不斷增加性價(jià)比高的商業(yè)服務(wù)器來增加計(jì)算和存儲能力。
HBase 雖然基于 Bigtable 的開源實(shí)現(xiàn),但它們之間還是有很多差別的,Bigtable 經(jīng)常被描述成鍵值數(shù)據(jù)庫,而 HBase 則是面向列存儲的分布式數(shù)據(jù)庫。
下面介紹 HBase 具備的顯著特性,這些特性讓 HBase 成為當(dāng)前和未來最實(shí)用的數(shù)據(jù)庫之一。
容量巨大
HBase 的單表可以有百億行、百萬列,可以在橫向和縱向兩個(gè)維度插入數(shù)據(jù),具有很大的彈性。
當(dāng)關(guān)系型數(shù)據(jù)庫的單個(gè)表的記錄在億級時(shí),查詢和寫入的性能都會呈現(xiàn)指數(shù)級下降,這種龐大的數(shù)據(jù)量對傳統(tǒng)數(shù)據(jù)庫來說是一種災(zāi)難,而 HBase 在限定某個(gè)列的情況下對于單表存儲百億甚至更多的數(shù)據(jù)都沒有性能問題。
HBase 采用 LSM 樹作為內(nèi)部數(shù)據(jù)存儲結(jié)構(gòu),這種結(jié)構(gòu)會周期性地將較小文件合并成大文件,以減少對磁盤的訪問。
擴(kuò)展性強(qiáng)
HBase 工作在 HDFS 之上,理所當(dāng)然地支持分布式表,也繼承了 HDFS 的可擴(kuò)展性。HBase 的擴(kuò)展是橫向的,橫向擴(kuò)展是指在擴(kuò)展時(shí)不需要提升服務(wù)器本身的性能,只需添加服務(wù)器到現(xiàn)有集群即可。
HBase 表根據(jù) Region 大小進(jìn)行分區(qū),分別存在集群中不同的節(jié)點(diǎn)上,當(dāng)添加新的節(jié)點(diǎn)時(shí),集群就重新調(diào)整,在新的節(jié)點(diǎn)啟動(dòng) HBase 服務(wù)器,動(dòng)態(tài)地實(shí)現(xiàn)擴(kuò)展。這里需要指出,HBase 的擴(kuò)展是熱擴(kuò)展,即在不停止現(xiàn)有服務(wù)的前提下,可以隨時(shí)添加或者減少節(jié)點(diǎn)。
高可靠性
HBase 運(yùn)行在 HDFS 上,HDFS 的多副本存儲可以讓它在岀現(xiàn)故障時(shí)自動(dòng)恢復(fù),同時(shí) HBase 內(nèi)部也提供 WAL 和 Replication 機(jī)制。
WAL(Write-Ahead-Log)預(yù)寫日志是在 HBase 服務(wù)器處理數(shù)據(jù)插入和刪除的過程中用來記錄操作內(nèi)容的日志,保證了數(shù)據(jù)寫入時(shí)不會因集群異常而導(dǎo)致寫入數(shù)據(jù)的丟失;而 Replication 機(jī)制是基于日志操作來做數(shù)據(jù)同步的。
Web1.0的時(shí)代,數(shù)據(jù)訪問量很有限,用一夫當(dāng)關(guān)的高性能的單點(diǎn)服務(wù)器可以解決大部分問題。
隨著Web2.0的時(shí)代的到來,用戶訪問量大幅度提升,同時(shí)產(chǎn)生了大量的用戶數(shù)據(jù)。加上后來的智能移動(dòng)設(shè)備的普及,所有的互聯(lián)網(wǎng)平臺都面臨了巨大的性能挑戰(zhàn)。
NoSQL(NoSQL = Not Only SQL ),意即“不僅僅是SQL”,泛指非關(guān)系型的數(shù)據(jù)庫。
NoSQL 不依賴業(yè)務(wù)邏輯方式存儲,而以簡單的key-value模式存儲。因此大大的增加了數(shù)據(jù)庫的擴(kuò)展能力。
Memcache Memcache Redis Redis MongoDB MongoDB 列式數(shù)據(jù)庫 列式數(shù)據(jù)庫 Hbase Hbase
HBase是Hadoop項(xiàng)目中的數(shù)據(jù)庫。它用于需要對大量的數(shù)據(jù)進(jìn)行隨機(jī)、實(shí)時(shí)的讀寫操作的場景中。
HBase的目標(biāo)就是處理數(shù)據(jù)量非常龐大的表,可以用普通的計(jì)算機(jī)處理超過10億行數(shù)據(jù),還可處理有數(shù)百萬列元素的數(shù)據(jù)表。
Cassandra Cassandra
Apache Cassandra是一款免費(fèi)的開源NoSQL數(shù)據(jù)庫,其設(shè)計(jì)目的在于管理由大量商用服務(wù)器構(gòu)建起來的龐大集群上的海量數(shù)據(jù)集(數(shù)據(jù)量通常達(dá)到PB級別)。在眾多顯著特性當(dāng)中,Cassandra最為卓越的長處是對寫入及讀取操作進(jìn)行規(guī)模調(diào)整,而且其不強(qiáng)調(diào)主集群的設(shè)計(jì)思路能夠以相對直觀的方式簡化各集群的創(chuàng)建與擴(kuò)展流程。
主要應(yīng)用:社會關(guān)系,公共交通網(wǎng)絡(luò),地圖及網(wǎng)絡(luò)拓譜(n*(n-1)/2)
因?yàn)樗饕唷M粭l個(gè)數(shù)據(jù),NOSQL占用空間是一般SQL數(shù)據(jù)庫的3-5倍。
你可以理解成NOSQL默認(rèn)開啟全字段索引和全文索引什么的。
其實(shí)在十萬級以下的數(shù)據(jù),只要SQL建好索引的情況并不比NOSQL慢。NOSQL主要是用于千萬上億級的時(shí)候。
標(biāo)題名稱:百億級nosql,百億級企業(yè)什么意思
分享鏈接:http://chinadenli.net/article38/dsgocsp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、網(wǎng)站排名、ChatGPT、關(guān)鍵詞優(yōu)化、建站公司、外貿(mào)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容