nosql場景,nosql的特點

nosql（mongodb）的適用場景是什么，比如讀多寫少，還是寫多讀少，還是別的什么

一般nosql適用的場景都是讀多寫少，因為數(shù)據(jù)庫主要壓力來自于用戶的讀取數(shù)據(jù)。

專注于為中小企業(yè)提供成都做網(wǎng)站、網(wǎng)站制作、成都外貿(mào)網(wǎng)站建設服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)崆峒免費做網(wǎng)站提供優(yōu)質(zhì)的服務。我們立足成都，凝聚了一批互聯(lián)網(wǎng)行業(yè)人才，有力地推動了超過千家企業(yè)的穩(wěn)健成長，幫助中小企業(yè)通過網(wǎng)站建設實現(xiàn)規(guī)模擴充和轉(zhuǎn)變。

常見NoSQL數(shù)據(jù)庫的應用場景是怎么樣的

文檔數(shù)據(jù)庫

源起：受Lotus Notes啟發(fā)。

數(shù)據(jù)模型：包含了key-value的文檔集合

例子：CouchDB, MongoDB

優(yōu)點：數(shù)據(jù)模型自然，編程友好，快速開發(fā)，web友好，CRUD。

圖數(shù)據(jù)庫

源起：歐拉和圖理論。

數(shù)據(jù)模型：節(jié)點和關系，也可處理鍵值對。

例子：AllegroGraph, InfoGrid, Neo4j

優(yōu)點：解決復雜的圖問題。

關系數(shù)據(jù)庫

源起： E. F. Codd 在A Relational Model of Data for Large Shared Data Banks提出的

數(shù)據(jù)模型：各種關系

例子：VoltDB, Clustrix, MySQL

優(yōu)點：高性能、可擴展的OLTP，支持SQL，物化視圖，支持事務，編程友好。

對象數(shù)據(jù)庫

源起：圖數(shù)據(jù)庫研究

數(shù)據(jù)模型：對象

例子：Objectivity, Gemstone

優(yōu)點：復雜對象模型，快速鍵值訪問，鍵功能訪問，以及圖數(shù)據(jù)庫的優(yōu)點。

Key-Value數(shù)據(jù)庫

源起：Amazon的論文 Dynamo 和 Distributed HashTables。

數(shù)據(jù)模型：鍵值對

例子：Membase, Riak

優(yōu)點：處理大量數(shù)據(jù)，快速處理大量讀寫請求。編程友好。

BigTable類型數(shù)據(jù)庫

源起：Google的論文 BigTable。

數(shù)據(jù)模型：列簇，每一行在理論上都是不同的

例子：HBase, Hypertable, Cassandra

優(yōu)點：處理大量數(shù)據(jù)，應對極高寫負載，高可用，支持跨數(shù)據(jù)中心， MapReduce。

數(shù)據(jù)結構服務

源起： ?

數(shù)據(jù)模型：字典操作，lists, sets和字符串值

例子：Redis

優(yōu)點：不同于以前的任何數(shù)據(jù)庫

網(wǎng)格數(shù)據(jù)庫

源起：數(shù)據(jù)網(wǎng)格和元組空間研究。

數(shù)據(jù)模型：基于空間的架構

例子：GigaSpaces, Coherence

優(yōu)點：適于事務處理的高性能和高擴展性

高性能 NoSQL

關系數(shù)據(jù)庫經(jīng)過幾十年的發(fā)展，已經(jīng)非常成熟，但同時也存在不足：

表結構是強約束的，業(yè)務變更時擴充很麻煩。

如果對大數(shù)據(jù)量的表進行統(tǒng)計運算，I/O會很高，因為即使只針對某列進行運算，也需要將整行數(shù)據(jù)讀入內(nèi)存。

全文搜索只能使用 Like 進行整表掃描，性能非常低。

針對這些不足，產(chǎn)生了不同的 NoSQL 解決方案，在某些場景下比關系數(shù)據(jù)庫更有優(yōu)勢，但同時也犧牲了某些特性，所以不能片面的迷信某種方案，應將其作為 SQL 的有利補充。

NoSQL != No SQL，而是：

NoSQL = Not Only SQL

典型的 NoSQL 方案分為4類：

Redis 是典型，其 value 是具體的數(shù)據(jù)結構，包括 string, hash, list, set, sorted set, bitmap, hyperloglog，常被稱為數(shù)據(jù)結構服務器。

以 list 為例：

LPOP key 是移除并返回隊列左邊的第一個元素。

如果用關系數(shù)據(jù)庫就比較麻煩了，需要操作：

Redis 的缺點主要體現(xiàn)在不支持完成的ACID事務，只能保證隔離性和一致性，無法保證原子性和持久性。

最大的特點是 no-schema，無需在使用前定義字段，讀取一個不存在的字段也不會導致語法錯誤。

特點：

以電商為例，不同商品的屬性差異很大，如冰箱和電腦，這種差異性在關系數(shù)據(jù)庫中會有很大的麻煩，而使用文檔數(shù)據(jù)庫則非常方便。

文檔數(shù)據(jù)庫的主要缺點：

關系數(shù)據(jù)庫是按行來存儲的，列式數(shù)據(jù)庫是按照列來存儲數(shù)據(jù)。

按行存儲的優(yōu)勢：

在某些場景下，這些優(yōu)勢就成為劣勢了，例如，計算超重人員的數(shù)據(jù)，只需要讀取體重這一列進行統(tǒng)計即可，但行式存儲會將整行數(shù)據(jù)讀取到內(nèi)存中，很浪費。

而列式存儲中，只需要讀取體重這列的數(shù)據(jù)即可，I/O 將大大減少。

除了節(jié)省I/O，列式存儲還有更高的壓縮比，可以節(jié)省存儲空間。普通行式數(shù)據(jù)庫的壓縮比在 3:1 到 5:1 左右，列式數(shù)據(jù)庫在 8:1 到 30:1，因為單個列的數(shù)據(jù)相似度更高。

列式存儲的隨機寫效率遠低于行式存儲，因為行式存儲時同一行多個列都存儲在連續(xù)空間中，而列式存儲將不同列存儲在不連續(xù)的空間。

一般將列式存儲應用在離線大數(shù)據(jù)分析統(tǒng)計場景，因為這時主要針對部分列進行操作，而且數(shù)據(jù)寫入后無須更新。

關系數(shù)據(jù)庫通過索引進行快速查詢，但在全文搜索的情景下，索引就不夠了，因為：

假設有一個交友網(wǎng)站，信息表如下：

需要匹配性別、地點、語言列。

需要匹配性別、地點、愛好列。

實際搜索中，各種排列組合非常多，關系數(shù)據(jù)庫很難支持。

全文搜索引擎是使用倒排索引技術，建立單詞到文檔的索引，例如上面的表信息建立倒排索引：

所以特別適合根據(jù)關鍵詞來查詢文檔內(nèi)容。

上面介紹了幾種典型的NoSQL方案，及各自的適用場景和特點，您可以根據(jù)實際需求進行選擇。

為什么海量數(shù)據(jù)場景中NoSQL越來越重要

本質(zhì)是因為：隨著互聯(lián)網(wǎng)的進一步發(fā)展與各行業(yè)信息化建設進程加快、參與者的增多，人們對軟件有了更多更新的要求，需要軟件不僅能實現(xiàn)功能，而且要求保證許多人可以共同參與使用，因而軟件所需承載的數(shù)據(jù)量和吞吐量必須達到相應的需求。而目前的關系型數(shù)據(jù)庫在某些方面有一些缺點，導致不能滿足需要。

具體則需要對比關系型數(shù)據(jù)庫與Nosql之間的區(qū)別可以得出

關系型數(shù)據(jù)庫

關系型數(shù)據(jù)庫把所有的數(shù)據(jù)都通過行和列的二元表現(xiàn)形式表示出來。

關系型數(shù)據(jù)庫的優(yōu)勢：

1.?保持數(shù)據(jù)的一致性（事務處理）

2.由于以標準化為前提，數(shù)據(jù)更新的開銷很小（相同的字段基本上都只有一處）

3.?可以進行Join等復雜查詢

其中能夠保持數(shù)據(jù)的一致性是關系型數(shù)據(jù)庫的最大優(yōu)勢。

關系型數(shù)據(jù)庫的不足：

不擅長的處理

1.?大量數(shù)據(jù)的寫入處理（這點尤為重要）

2.?為有數(shù)據(jù)更新的表做索引或表結構（schema）變更

3.?字段不固定時應用

4.?對簡單查詢需要快速返回結果的處理

--大量數(shù)據(jù)的寫入處理

讀寫集中在一個數(shù)據(jù)庫上讓數(shù)據(jù)庫不堪重負，大部分網(wǎng)站已使用主從復制技術實現(xiàn)讀寫分離，以提高讀寫性能和讀庫的可擴展性。

所以在進行大量數(shù)據(jù)操作時，會使用數(shù)據(jù)庫主從模式。數(shù)據(jù)的寫入由主數(shù)據(jù)庫負責，數(shù)據(jù)的讀入由從數(shù)據(jù)庫負責，可以比較簡單地通過增加從數(shù)據(jù)庫來實現(xiàn)規(guī)模化，但是數(shù)據(jù)的寫入?yún)s完全沒有簡單的方法來解決規(guī)模化問題。

第一，要想將數(shù)據(jù)的寫入規(guī)模化，可以考慮把主數(shù)據(jù)庫從一臺增加到兩臺，作為互相關聯(lián)復制的二元主數(shù)據(jù)庫使用，確實這樣可以把每臺主數(shù)據(jù)庫的負荷減少一半，但是更新處理會發(fā)生沖突，可能會造成數(shù)據(jù)的不一致，為了避免這樣的問題，需要把對每個表的請求分別分配給合適的主數(shù)據(jù)庫來處理。

第二，可以考慮把數(shù)據(jù)庫分割開來，分別放在不同的數(shù)據(jù)庫服務器上，比如將不同的表放在不同的數(shù)據(jù)庫服務器上，數(shù)據(jù)庫分割可以減少每臺數(shù)據(jù)庫服務器上的數(shù)據(jù)量，以便減少硬盤IO的輸入、輸出處理，實現(xiàn)內(nèi)存上的高速處理。但是由于分別存儲字不同服務器上的表之間無法進行Join處理，數(shù)據(jù)庫分割的時候就需要預先考慮這些問題，數(shù)據(jù)庫分割之后，如果一定要進行Join處理，就必須要在程序中進行關聯(lián)，這是非常困難的。

--為有數(shù)據(jù)更新的表做索引或表結構變更

在使用關系型數(shù)據(jù)庫時，為了加快查詢速度需要創(chuàng)建索引，為了增加必要的字段就一定要改變表結構，為了進行這些處理，需要對表進行共享鎖定，這期間數(shù)據(jù)變更、更新、插入、刪除等都是無法進行的。如果需要進行一些耗時操作，例如為數(shù)據(jù)量比較大的表創(chuàng)建索引或是變更其表結構，就需要特別注意，長時間內(nèi)數(shù)據(jù)可能無法進行更新。

--字段不固定時的應用

如果字段不固定，利用關系型數(shù)據(jù)庫也是比較困難的，有人會說，需要的時候加個字段就可以了，這樣的方法也不是不可以，但在實際運用中每次都進行反復的表結構變更是非常痛苦的。你也可以預先設定大量的預備字段，但這樣的話，時間一長很容易弄不清除字段和數(shù)據(jù)的對應狀態(tài)，即哪個字段保存有哪些數(shù)據(jù)。

--對簡單查詢需要快速返回結果的處理? （這里的“簡單”指的是沒有復雜的查詢條件）

這一點稱不上是缺點，但不管怎樣，關系型數(shù)據(jù)庫并不擅長對簡單的查詢快速返回結果，因為關系型數(shù)據(jù)庫是使用專門的sql語言進行數(shù)據(jù)讀取的，它需要對sql與越南進行解析，同時還有對表的鎖定和解鎖等這樣的額外開銷，這里并不是說關系型數(shù)據(jù)庫的速度太慢，而只是想告訴大家若希望對簡單查詢進行高速處理，則沒有必要非使用關系型數(shù)據(jù)庫不可。

NoSQL數(shù)據(jù)庫

關系型數(shù)據(jù)庫應用廣泛，能進行事務處理和表連接等復雜查詢。相對地，NoSQL數(shù)據(jù)庫只應用在特定領域，基本上不進行復雜的處理，但它恰恰彌補了之前所列舉的關系型數(shù)據(jù)庫的不足之處。

優(yōu)點：

易于數(shù)據(jù)的分散

各個數(shù)據(jù)之間存在關聯(lián)是關系型數(shù)據(jù)庫得名的主要原因，為了進行join處理，關系型數(shù)據(jù)庫不得不把數(shù)據(jù)存儲在同一個服務器內(nèi)，這不利于數(shù)據(jù)的分散，這也是關系型數(shù)據(jù)庫并不擅長大數(shù)據(jù)量的寫入處理的原因。相反NoSQL數(shù)據(jù)庫原本就不支持Join處理，各個數(shù)據(jù)都是獨立設計的，很容易把數(shù)據(jù)分散在多個服務器上，故減少了每個服務器上的數(shù)據(jù)量，即使要處理大量數(shù)據(jù)的寫入，也變得更加容易，數(shù)據(jù)的讀入操作當然也同樣容易。

典型的NoSQL數(shù)據(jù)庫

臨時性鍵值存儲（memcached、Redis）、永久性鍵值存儲（ROMA、Redis）、面向文檔的數(shù)據(jù)庫（MongoDB、CouchDB）、面向列的數(shù)據(jù)庫（Cassandra、HBase）

一、鍵值存儲

它的數(shù)據(jù)是以鍵值的形式存儲的，雖然它的速度非常快，但基本上只能通過鍵的完全一致查詢獲取數(shù)據(jù)，根據(jù)數(shù)據(jù)的保存方式可以分為臨時性、永久性和兩者兼具三種。

（1）臨時性

所謂臨時性就是數(shù)據(jù)有可能丟失，memcached把所有數(shù)據(jù)都保存在內(nèi)存中，這樣保存和讀取的速度非常快，但是當memcached停止時，數(shù)據(jù)就不存在了。由于數(shù)據(jù)保存在內(nèi)存中，所以無法操作超出內(nèi)存容量的數(shù)據(jù)，舊數(shù)據(jù)會丟失。總結來說：

。在內(nèi)存中保存數(shù)據(jù)

。可以進行非常快速的保存和讀取處理

。數(shù)據(jù)有可能丟失

（2）永久性

所謂永久性就是數(shù)據(jù)不會丟失，這里的鍵值存儲是把數(shù)據(jù)保存在硬盤上，與臨時性比起來，由于必然要發(fā)生對硬盤的IO操作，所以性能上還是有差距的，但數(shù)據(jù)不會丟失是它最大的優(yōu)勢。總結來說：

。在硬盤上保存數(shù)據(jù)

。可以進行非常快速的保存和讀取處理（但無法與memcached相比）

。數(shù)據(jù)不會丟失

（3）兩者兼?zhèn)?/p>

Redis屬于這種類型。Redis有些特殊，臨時性和永久性兼具。Redis首先把數(shù)據(jù)保存在內(nèi)存中，在滿足特定條件（默認是?15分鐘一次以上，5分鐘內(nèi)10個以上，1分鐘內(nèi)10000個以上的鍵發(fā)生變更）的時候?qū)?shù)據(jù)寫入到硬盤中，這樣既確保了內(nèi)存中數(shù)據(jù)的處理速度，又可以通過寫入硬盤來保證數(shù)據(jù)的永久性，這種類型的數(shù)據(jù)庫特別適合處理數(shù)組類型的數(shù)據(jù)。總結來說：

。同時在內(nèi)存和硬盤上保存數(shù)據(jù)

。可以進行非常快速的保存和讀取處理

。保存在硬盤上的數(shù)據(jù)不會消失（可以恢復）

。適合于處理數(shù)組類型的數(shù)據(jù)

二、面向文檔的數(shù)據(jù)庫

MongoDB、CouchDB屬于這種類型，它們屬于NoSQL數(shù)據(jù)庫，但與鍵值存儲相異。

（1）不定義表結構

即使不定義表結構，也可以像定義了表結構一樣使用，還省去了變更表結構的麻煩。

（2）可以使用復雜的查詢條件

跟鍵值存儲不同的是，面向文檔的數(shù)據(jù)庫可以通過復雜的查詢條件來獲取數(shù)據(jù)，雖然不具備事務處理和Join這些關系型數(shù)據(jù)庫所具有的處理能力，但初次以外的其他處理基本上都能實現(xiàn)。

三、?面向列的數(shù)據(jù)庫

Cassandra、HBae、HyperTable屬于這種類型，由于近年來數(shù)據(jù)量出現(xiàn)爆發(fā)性增長，這種類型的NoSQL數(shù)據(jù)庫尤其引入注目。

普通的關系型數(shù)據(jù)庫都是以行為單位來存儲數(shù)據(jù)的，擅長以行為單位的讀入處理，比如特定條件數(shù)據(jù)的獲取。因此，關系型數(shù)據(jù)庫也被成為面向行的數(shù)據(jù)庫。相反，面向列的數(shù)據(jù)庫是以列為單位來存儲數(shù)據(jù)的，擅長以列為單位讀入數(shù)據(jù)。

面向列的數(shù)據(jù)庫具有搞擴展性，即使數(shù)據(jù)增加也不會降低相應的處理速度（特別是寫入速度），所以它主要應用于需要處理大量數(shù)據(jù)的情況。另外，把它作為批處理程序的存儲器來對大量數(shù)據(jù)進行更新也是非常有用的。但由于面向列的數(shù)據(jù)庫跟現(xiàn)行數(shù)據(jù)庫存儲的思維方式有很大不同，故應用起來十分困難。

總結：關系型數(shù)據(jù)庫與NoSQL數(shù)據(jù)庫并非對立而是互補的關系，即通常情況下使用關系型數(shù)據(jù)庫，在適合使用NoSQL的時候使用NoSQL數(shù)據(jù)庫，讓NoSQL數(shù)據(jù)庫對關系型數(shù)據(jù)庫的不足進行彌補。

nosql能夠用再哪些場景

nosql分類太多了，下面列舉幾個比較常見的：

Redis：非常適合需要表達時間線的web服務，例如微博

Cassandra：只有順序?qū)懀瑳]有隨機寫的設計，滿足高負荷情形的性能需求

MongoDB：面向文檔，擅長處理非結構化數(shù)據(jù)

Neo4J：可以快速實現(xiàn)基于圖的計算（如果用SQL計算可能花更長的時間）

希望對你所有幫助。

nosql數(shù)據(jù)庫一般有哪幾種類型？分別用在什么場景

特點：

它們可以處理超大量的數(shù)據(jù)。

它們運行在便宜的PC服務器集群上。

PC集群擴充起來非常方便并且成本很低，避免了“sharding”操作的復雜性和成本。

它們擊碎了性能瓶頸。

NoSQL的支持者稱，通過NoSQL架構可以省去將Web或Java應用和數(shù)據(jù)轉(zhuǎn)換成SQL友好格式的時間，執(zhí)行速度變得更快。

“SQL并非適用于所有的程序代碼，” 對于那些繁重的重復操作的數(shù)據(jù)，SQL值得花錢。但是當數(shù)據(jù)庫結構非常簡單時，SQL可能沒有太大用處。

沒有過多的操作。

雖然NoSQL的支持者也承認關系數(shù)據(jù)庫提供了無可比擬的功能集合，而且在數(shù)據(jù)完整性上也發(fā)揮絕對穩(wěn)定，他們同時也表示，企業(yè)的具體需求可能沒有那么多。

Bootstrap支持

因為NoSQL項目都是開源的，因此它們?nèi)狈烫峁┑恼街С帧＿@一點它們與大多數(shù)開源項目一樣，不得不從社區(qū)中尋求支持。

優(yōu)點：

易擴展

NoSQL數(shù)據(jù)庫種類繁多，但是一個共同的特點都是去掉關系數(shù)據(jù)庫的關系型特性。數(shù)據(jù)之間無關系，這樣就非常容易擴展。也無形之間，在架構的層面上帶來了可擴展的能力。

大數(shù)據(jù)量，高性能

NoSQL數(shù)據(jù)庫都具有非常高的讀寫性能，尤其在大數(shù)據(jù)量下，同樣表現(xiàn)優(yōu)秀。這得益于它的無關系性，數(shù)據(jù)庫的結構簡單。一般MySQL使用 Query Cache，每次表的更新Cache就失效，是一種大粒度的Cache，在針對web2.0的交互頻繁的應用，Cache性能不高。而NoSQL的 Cache是記錄級的，是一種細粒度的Cache，所以NoSQL在這個層面上來說就要性能高很多了。

靈活的數(shù)據(jù)模型

NoSQL無需事先為要存儲的數(shù)據(jù)建立字段，隨時可以存儲自定義的數(shù)據(jù)格式。而在關系數(shù)據(jù)庫里，增刪字段是一件非常麻煩的事情。如果是非常大數(shù)據(jù)量的表，增加字段簡直就是一個噩夢。這點在大數(shù)據(jù)量的web2.0時代尤其明顯。

高可用

NoSQL在不太影響性能的情況，就可以方便的實現(xiàn)高可用的架構。比如Cassandra，HBase模型，通過復制模型也能實現(xiàn)高可用。

主要應用：

Apache HBase

這個大數(shù)據(jù)管理平臺建立在谷歌強大的BigTable管理引擎基礎上。作為具有開源、Java編碼、分布式多個優(yōu)勢的數(shù)據(jù)庫，Hbase最初被設計應用于Hadoop平臺，而這一強大的數(shù)據(jù)管理工具，也被Facebook采用，用于管理消息平臺的龐大數(shù)據(jù)。

Apache Storm

用于處理高速、大型數(shù)據(jù)流的分布式實時計算系統(tǒng)。Storm為Apache Hadoop添加了可靠的實時數(shù)據(jù)處理功能，同時還增加了低延遲的儀表板、安全警報，改進了原有的操作方式，幫助企業(yè)更有效率地捕獲商業(yè)機會、發(fā)展新業(yè)務。

Apache Spark

該技術采用內(nèi)存計算，從多迭代批量處理出發(fā)，允許將數(shù)據(jù)載入內(nèi)存做反復查詢，此外還融合數(shù)據(jù)倉庫、流處理和圖計算等多種計算范式，Spark用Scala語言實現(xiàn)，構建在HDFS上，能與Hadoop很好的結合，而且運行速度比MapReduce快100倍。

Apache Hadoop

該技術迅速成為了大數(shù)據(jù)管理標準之一。當它被用來管理大型數(shù)據(jù)集時，對于復雜的分布式應用，Hadoop體現(xiàn)出了非常好的性能，平臺的靈活性使它可以運行在商用硬件系統(tǒng)，它還可以輕松地集成結構化、半結構化和甚至非結構化數(shù)據(jù)集。

Apache Drill

你有多大的數(shù)據(jù)集？其實無論你有多大的數(shù)據(jù)集，Drill都能輕松應對。通過支持HBase、Cassandra和MongoDB，Drill建立了交互式分析平臺，允許大規(guī)模數(shù)據(jù)吞吐，而且能很快得出結果。

Apache Sqoop

也許你的數(shù)據(jù)現(xiàn)在還被鎖定于舊系統(tǒng)中，Sqoop可以幫你解決這個問題。這一平臺采用并發(fā)連接，可以將數(shù)據(jù)從關系數(shù)據(jù)庫系統(tǒng)方便地轉(zhuǎn)移到Hadoop中，可以自定義數(shù)據(jù)類型以及元數(shù)據(jù)傳播的映射。事實上，你還可以將數(shù)據(jù)（如新的數(shù)據(jù)）導入到HDFS、Hive和Hbase中。

Apache Giraph

這是功能強大的圖形處理平臺，具有很好可擴展性和可用性。該技術已經(jīng)被Facebook采用，Giraph可以運行在Hadoop環(huán)境中，可以將它直接部署到現(xiàn)有的Hadoop系統(tǒng)中。通過這種方式，你可以得到強大的分布式作圖能力，同時還能利用上現(xiàn)有的大數(shù)據(jù)處理引擎。

Cloudera Impala

Impala模型也可以部署在你現(xiàn)有的Hadoop群集上，監(jiān)視所有的查詢。該技術和MapReduce一樣，具有強大的批處理能力，而且Impala對于實時的SQL查詢也有很好的效果，通過高效的SQL查詢，你可以很快的了解到大數(shù)據(jù)平臺上的數(shù)據(jù)。

Gephi

它可以用來對信息進行關聯(lián)和量化處理，通過為數(shù)據(jù)創(chuàng)建功能強大的可視化效果，你可以從數(shù)據(jù)中得到不一樣的洞察力。Gephi已經(jīng)支持多個圖表類型，而且可以在具有上百萬個節(jié)點的大型網(wǎng)絡上運行。Gephi具有活躍的用戶社區(qū)，Gephi還提供了大量的插件，可以和現(xiàn)有系統(tǒng)完美的集成到一起，它還可以對復雜的IT連接、分布式系統(tǒng)中各個節(jié)點、數(shù)據(jù)流等信息進行可視化分析。

MongoDB

這個堅實的平臺一直被很多組織推崇，它在大數(shù)據(jù)管理上有極好的性能。MongoDB最初是由DoubleClick公司的員工創(chuàng)建，現(xiàn)在該技術已經(jīng)被廣泛的應用于大數(shù)據(jù)管理。MongoDB是一個應用開源技術開發(fā)的NoSQL數(shù)據(jù)庫，可以用于在JSON這樣的平臺上存儲和處理數(shù)據(jù)。目前，紐約時報、Craigslist以及眾多企業(yè)都采用了MongoDB，幫助他們管理大型數(shù)據(jù)集。（Couchbase服務器也作為一個參考）。

十大頂尖公司：

Amazon Web Services

Forrester將AWS稱為“云霸主”，談到云計算領域的大數(shù)據(jù)，那就不得不提到亞馬遜。該公司的Hadoop產(chǎn)品被稱為EMR（Elastic Map Reduce），AWS解釋這款產(chǎn)品采用了Hadoop技術來提供大數(shù)據(jù)管理服務，但它不是純開源Hadoop，經(jīng)過修改后現(xiàn)在被專門用在AWS云上。

Forrester稱EMR有很好的市場前景。很多公司基于EMR為客戶提供服務，有一些公司將EMR應用于數(shù)據(jù)查詢、建模、集成和管理。而且AWS還在創(chuàng)新，F(xiàn)orrester稱未來EMR可以基于工作量的需要自動縮放調(diào)整大小。亞馬遜計劃為其產(chǎn)品和服務提供更強大的EMR支持，包括它的RedShift數(shù)據(jù)倉庫、新公布的Kenesis實時處理引擎以及計劃中的NoSQL數(shù)據(jù)庫和商業(yè)智能工具。不過AWS還沒有自己的Hadoop發(fā)行版。

Cloudera

Cloudera有開源Hadoop的發(fā)行版，這個發(fā)行版采用了Apache Hadoop開源項目的很多技術，不過基于這些技術的發(fā)行版也有很大的進步。Cloudera為它的Hadoop發(fā)行版開發(fā)了很多功能，包括Cloudera管理器，用于管理和監(jiān)控，以及名為Impala的SQL引擎等。Cloudera的Hadoop發(fā)行版基于開源Hadoop，但也不是純開源的產(chǎn)品。當Cloudera的客戶需要Hadoop不具備的某些功能時，Cloudera的工程師們就會實現(xiàn)這些功能，或者找一個擁有這項技術的合作伙伴。Forrester表示：“Cloudera的創(chuàng)新方法忠于核心Hadoop，但因為其可實現(xiàn)快速創(chuàng)新并積極滿足客戶需求，這一點使它不同于其他那些供應商。”目前，Cloudera的平臺已經(jīng)擁有200多個付費客戶，一些客戶在Cloudera的技術支持下已經(jīng)可以跨1000多個節(jié)點實現(xiàn)對PB級數(shù)據(jù)的有效管理。

Hortonworks

和Cloudera一樣，Hortonworks是一個純粹的Hadoop技術公司。與Cloudera不同的是，Hortonworks堅信開源Hadoop比任何其他供應商的Hadoop發(fā)行版都要強大。Hortonworks的目標是建立Hadoop生態(tài)圈和Hadoop用戶社區(qū)，推進開源項目的發(fā)展。Hortonworks平臺和開源Hadoop聯(lián)系緊密，公司管理人員表示這會給用戶帶來好處，因為它可以防止被供應商套牢（如果Hortonworks的客戶想要離開這個平臺，他們可以輕松轉(zhuǎn)向其他開源平臺）。這并不是說Hortonworks完全依賴開源Hadoop技術，而是因為該公司將其所有開發(fā)的成果回報給了開源社區(qū)，比如Ambari，這個工具就是由Hortonworks開發(fā)而成，用來填充集群管理項目漏洞。Hortonworks的方案已經(jīng)得到了Teradata、Microsoft、Red Hat和SAP這些供應商的支持。

IBM

當企業(yè)考慮一些大的IT項目時，很多人首先會想到IBM。IBM是Hadoop項目的主要參與者之一，F(xiàn)orrester稱IBM已有100多個Hadoop部署，它的很多客戶都有PB級的數(shù)據(jù)。IBM在網(wǎng)格計算、全球數(shù)據(jù)中心和企業(yè)大數(shù)據(jù)項目實施等眾多領域有著豐富的經(jīng)驗。“IBM計劃繼續(xù)整合SPSS分析、高性能計算、BI工具、數(shù)據(jù)管理和建模、應對高性能計算的工作負載管理等眾多技術。”

Intel

和AWS類似，英特爾不斷改進和優(yōu)化Hadoop使其運行在自己的硬件上，具體來說，就是讓Hadoop運行在其至強芯片上，幫助用戶打破Hadoop系統(tǒng)的一些限制，使軟件和硬件結合的更好，英特爾的Hadoop發(fā)行版在上述方面做得比較好。Forrester指出英特爾在最近才推出這個產(chǎn)品，所以公司在未來還有很多改進的可能，英特爾和微軟都被認為是Hadoop市場上的潛力股。

MapR Technologies

MapR的Hadoop發(fā)行版目前為止也許是最好的了，不過很多人可能都沒有聽說過。Forrester對Hadoop用戶的調(diào)查顯示，MapR的評級最高，其發(fā)行版在架構和數(shù)據(jù)處理能力上都獲得了最高分。MapR已將一套特殊功能融入其Hadoop發(fā)行版中。例如網(wǎng)絡文件系統(tǒng)（NFS）、災難恢復以及高可用性功能。Forrester說MapR在Hadoop市場上沒有Cloudera和Hortonworks那樣的知名度，MapR要成為一個真正的大企業(yè)，還需要加強伙伴關系和市場營銷。

Microsoft

微軟在開源軟件問題上一直很低調(diào)，但在大數(shù)據(jù)形勢下，它不得不考慮讓Windows也兼容Hadoop，它還積極投入到開源項目中，以更廣泛地推動Hadoop生態(tài)圈的發(fā)展。我們可以在微軟的公共云Windows Azure HDInsight產(chǎn)品中看到其成果。微軟的Hadoop服務基于Hortonworks的發(fā)行版，而且是為Azure量身定制的。

微軟也有一些其他的項目，包括名為Polybase的項目，讓Hadoop查詢實現(xiàn)了SQLServer查詢的一些功能。Forrester說：“微軟在數(shù)據(jù)庫、數(shù)據(jù)倉庫、云、OLAP、BI、電子表格（包括PowerPivot）、協(xié)作和開發(fā)工具市場上有很大優(yōu)勢，而且微軟擁有龐大的用戶群，但要在Hadoop這個領域成為行業(yè)領導者還有很遠的路要走。”

Pivotal Software

EMC和Vmware部分大數(shù)據(jù)業(yè)務分拆組合產(chǎn)生了Pivotal。Pivotal一直努力構建一個性能優(yōu)越的Hadoop發(fā)行版，為此，Pivotal在開源Hadoop的基礎上又添加了一些新的工具，包括一個名為HAWQ的SQL引擎以及一個專門解決大數(shù)據(jù)問題的Hadoop應用。Forrester稱Pivotal Hadoop平臺的優(yōu)勢在于它整合了Pivotal、EMC、Vmware的眾多技術，Pivotal的真正優(yōu)勢實際上等于EMC和Vmware兩大公司為其撐腰。到目前為止，Pivotal的用戶還不到100個，而且大多是中小型客戶。

Teradata

對于Teradata來說，Hadoop既是一種威脅也是一種機遇。數(shù)據(jù)管理，特別是關于SQL和關系數(shù)據(jù)庫這一領域是Teradata的專長。所以像Hadoop這樣的NoSQL平臺崛起可能會威脅到Teradata。相反，Teradata接受了Hadoop，通過與Hortonworks合作，Teradata在Hadoop平臺集成了SQL技術，這使Teradata的客戶可以在Hadoop平臺上方便地使用存儲在Teradata數(shù)據(jù)倉庫中的數(shù)據(jù)。

AMPLab

通過將數(shù)據(jù)轉(zhuǎn)變?yōu)樾畔ⅲ覀儾趴梢岳斫馐澜纾@也正是AMPLab所做的。AMPLab致力于機器學習、數(shù)據(jù)挖掘、數(shù)據(jù)庫、信息檢索、自然語言處理和語音識別等多個領域，努力改進對信息包括不透明數(shù)據(jù)集內(nèi)信息的甄別技術。除了Spark，開源分布式SQL查詢引擎Shark也源于AMPLab，Shark具有極高的查詢效率，具有良好的兼容性和可擴展性。近幾年的發(fā)展使計算機科學進入到全新的時代，而AMPLab為我們設想一個運用大數(shù)據(jù)、云計算、通信等各種資源和技術靈活解決難題的方案，以應對越來越復雜的各種難題。

本文題目：nosql場景,nosql的特點
當前URL：http://chinadenli.net/article40/dsgssho.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站導航、手機網(wǎng)站建設、網(wǎng)站建設、品牌網(wǎng)站建設、靜態(tài)網(wǎng)站、域名注冊

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容