mysql大表怎么分區(qū),mysql數(shù)據(jù)表分區(qū)

十、MySQL表分區(qū)

??表分區(qū)是將?個(gè)表的數(shù)據(jù)按照?定的規(guī)則?平劃分為不同的邏輯塊，并分別進(jìn)?物理存儲(chǔ)，這個(gè)規(guī)則就叫做分區(qū)函數(shù)，可以有不同的分區(qū)規(guī)則。5.7可以通過(guò)show plugins語(yǔ)句查看當(dāng)前MySQL是否?持表分區(qū)功能。

成都創(chuàng)新互聯(lián)公司服務(wù)項(xiàng)目包括忠縣網(wǎng)站建設(shè)、忠縣網(wǎng)站制作、忠縣網(wǎng)頁(yè)制作以及忠縣網(wǎng)絡(luò)營(yíng)銷(xiāo)策劃等。多年來(lái)，我們專(zhuān)注于互聯(lián)網(wǎng)行業(yè)，利用自身積累的技術(shù)優(yōu)勢(shì)、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等，向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案，忠縣網(wǎng)站推廣取得了明顯的社會(huì)效益與經(jīng)濟(jì)效益。目前，我們服務(wù)的客戶(hù)以成都為中心已經(jīng)輻射到忠縣省份的部分城市，未來(lái)相信會(huì)繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶(hù)的支持與信任！

??但當(dāng)表中含有主鍵或唯?鍵時(shí)，則每個(gè)被?作分區(qū)函數(shù)的字段必須是表中唯?鍵和主鍵的全部或?部分，否則就?法創(chuàng)建分區(qū)表。?如下?的表由于唯?鍵和主鍵沒(méi)有相同的字段，所以?法創(chuàng)建表分區(qū)

上述例?中刪除唯?鍵，確保主鍵中的字段包含分區(qū)函數(shù)中的所有字段，創(chuàng)建成功

或者將主鍵擴(kuò)展為包含ref字段

表分區(qū)的主要優(yōu)勢(shì)在于：

??可以允許在?個(gè)表?存儲(chǔ)更多的數(shù)據(jù)，突破磁盤(pán)限制或者?件系統(tǒng)限制

??對(duì)于從表?將過(guò)期或歷史的數(shù)據(jù)移除在表分區(qū)很容易實(shí)現(xiàn)，只要將對(duì)應(yīng)的分區(qū)移除即可

??對(duì)某些查詢(xún)和修改語(yǔ)句來(lái)說(shuō)，可以 ?動(dòng) 將數(shù)據(jù)范圍縮?到?個(gè)或?個(gè)表分區(qū)上，優(yōu)化語(yǔ)句執(zhí)?效率。?且可以通過(guò) 顯示指定表分區(qū) 來(lái)執(zhí)?語(yǔ)句，?如 SELECT * FROM t PARTITION (p0,p1) WHERE c 5

表分區(qū)類(lèi)型分為：

范圍表分區(qū)，按照?定的范圍值來(lái)確定每個(gè)分區(qū)包含的數(shù)據(jù)，分區(qū)函數(shù)使?的字段必須只能是整數(shù)類(lèi)型，分區(qū)的定義范圍必須是連續(xù)的，且不能有重疊部分，通過(guò)使?VALUES LESS THAN來(lái)定義分區(qū)范圍，表分區(qū)的范圍定義是從?到?定義的

?如：

??Store_id6的數(shù)據(jù)被放在p0分區(qū)?，6=store_id10之間的數(shù)據(jù)被放在p1分區(qū)?，以此類(lèi)推，當(dāng)新插?的數(shù)據(jù)為(72, ‘Mitchell’, ‘Wilson’, ‘1998-06-25’, NULL, 13) 時(shí)，則新數(shù)據(jù)被插?到p2分區(qū)?，但當(dāng)插?的數(shù)據(jù)的store_id為21時(shí)，由于沒(méi)有分區(qū)去容納此數(shù)據(jù)，所以會(huì)報(bào)錯(cuò)，我們需要修改?下表的定義

報(bào)錯(cuò)：

修改表的定義：

?? MAXVALUE關(guān)鍵詞的作?是表示可能的最?值，所以任何store_id=16的數(shù)據(jù)都會(huì)被寫(xiě)?到p3分區(qū)?。分區(qū)函數(shù)中也可以使?表達(dá)式，?如：

?? 對(duì)timestamp字段類(lèi)型可以使?的表達(dá)式?前僅有unix_timestamp ，其他的表達(dá)式都不允許

列表表分區(qū)，按照?個(gè)?個(gè)確定的值來(lái)確定每個(gè)分區(qū)包含的數(shù)據(jù)，通過(guò)PARTITION BY LIST(expr)分區(qū)函數(shù)表達(dá)式必須返回整數(shù)，取值范圍通過(guò)VALUES IN (value_list)定義

對(duì)List表分區(qū)來(lái)說(shuō)，沒(méi)有MAXVALUE特殊值，所有的可能取值都需要再VALUES IN中包含，如果有未定義的取值則會(huì)報(bào)錯(cuò)

同樣，當(dāng)有主鍵或者唯?鍵存在的情況下，分區(qū)函數(shù)字段需要包含在主鍵或唯?鍵中

對(duì)range和list表分區(qū)來(lái)說(shuō)，分區(qū)函數(shù)可以包含多個(gè)字段，分區(qū)多字段函數(shù)(column partition) 所涉及的字段類(lèi)型可以包括：

范圍多字段分區(qū)函數(shù)與普通的范圍分區(qū)函數(shù)的區(qū)別在于：

a) 字段類(lèi)型多樣化

b) 范圍多字段分區(qū)函數(shù) 不?持表達(dá)式，只能?字段名

c) 范圍多字段分區(qū)函數(shù)?持?個(gè)或多個(gè)字段

再?如創(chuàng)建如下的表分區(qū)：

對(duì)多列對(duì)?來(lái)說(shuō)：

當(dāng)然只要保證取值范圍是增?的，表分區(qū)就能創(chuàng)建成功，?如：

但如果取值范圍不是增?的，就會(huì)返回錯(cuò)誤：

對(duì)其他數(shù)據(jù)類(lèi)型的?持：

list列表多字段表分區(qū)，例如：你有一個(gè)在12個(gè)城市客戶(hù)的業(yè)務(wù), 為了銷(xiāo)售和市場(chǎng)的目的, 你的組織每3個(gè)城市劃分為一個(gè)區(qū)域針對(duì)LIST COLUMNS分區(qū), 你可以基于城市的名稱(chēng)創(chuàng)建一個(gè)客戶(hù)數(shù)據(jù)表并聲明4個(gè)分區(qū)當(dāng)你的客戶(hù)在對(duì)應(yīng)的這個(gè)區(qū)域:

使用日期分區(qū)

但是這種情況在日期增長(zhǎng)到非常大的時(shí)候是很復(fù)雜的, 所以這種還是使用RANGE 分區(qū)方式比較好

??按照?個(gè)?定義的函數(shù)返回值來(lái)確定每個(gè)分區(qū)包含的數(shù)據(jù)，這個(gè) ?定義函數(shù)也可以?xún)H僅是?個(gè)字段名字

??通過(guò)PARTITION BY HASH (expr)?句來(lái)表達(dá)哈希表分區(qū)，其中的 expr表達(dá)式必須返回?個(gè)整數(shù)，基于分區(qū)個(gè)數(shù)的取模（%）運(yùn)算。根據(jù)余數(shù)插?到指定的分區(qū)

??對(duì)哈希表分區(qū)來(lái)說(shuō)只需要定義分區(qū)的個(gè)數(shù)，其他的事情由內(nèi)部完成

如果沒(méi)有寫(xiě)明PARTITIONS字段，則默認(rèn)為1，表達(dá)式可以是整數(shù)類(lèi)型字段，也可以是?個(gè)函數(shù)，?如

?如： CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE) PARTITION BY HASH( YEAR(col3) ) PARTITIONS 4;

如果插??條數(shù)據(jù)對(duì)應(yīng)的col3為‘2005-09-15’時(shí)，則插?數(shù)據(jù)的分區(qū)計(jì)算?法為：

??與哈希表分區(qū)類(lèi)似，只不過(guò)哈希表分區(qū)依賴(lài)于?定義的函數(shù)，?key表分區(qū)的哈希算法是依賴(lài)MySQL本身， CREATE TABLE ... PARTITION BY KEY () 創(chuàng)建key表分區(qū)，括號(hào)??可以包含0個(gè)或者多個(gè)字段，所引?的字段必須是主鍵或者主鍵的?部分，如果括號(hào)??沒(méi)有字段，則代表使?主鍵

如果表中沒(méi)有主鍵但有唯?鍵，則使?唯?鍵，但唯?鍵字段必須定義為not null ，否則報(bào)錯(cuò)

所引?的字段未必必須是整數(shù)類(lèi)型，其他的類(lèi)型也可以使?，?如：

?表分區(qū)，是在表分區(qū)的基礎(chǔ)上再創(chuàng)建表分區(qū)的概念，每個(gè)表分區(qū)下的?表分區(qū)個(gè)數(shù)必須?致，?如：

ts表?yè)碛腥齻€(gè)范圍分區(qū)，同時(shí)每個(gè)分區(qū)都各?有兩個(gè)?分區(qū)，所以總共有6個(gè)分區(qū)

?表分區(qū)必須是范圍/列表分區(qū)+哈希/key?表分區(qū)的組合

?表分區(qū)也可以顯示的指定?表分區(qū)的名字，?如：

不同的表分區(qū)對(duì)NULL值的處理?式不同

對(duì)范圍表分區(qū)來(lái)說(shuō)，如果插?的是NULL值，則將數(shù)據(jù)放到最?的分區(qū)表?

對(duì)list表分區(qū)來(lái)說(shuō)，?持NULL值的唯?情況就是某個(gè)分區(qū)的允許值中包含NULL

對(duì)哈希表分區(qū)和Key表分區(qū)來(lái)說(shuō)，NULL值會(huì)被當(dāng)成0值對(duì)待

通過(guò)alter table命令可以執(zhí)?增加，刪除，重新定義，合并或者拆分表分區(qū)的管理動(dòng)作

對(duì)范圍表分區(qū)和列表表分區(qū)來(lái)說(shuō)，刪除?個(gè)表分區(qū)命令如下：

刪除表分區(qū)的動(dòng)作不光會(huì)把分區(qū)刪掉，也會(huì)把表分區(qū)?原來(lái)的數(shù)據(jù)給刪除掉

在原分區(qū)上增加?個(gè)表分區(qū)可以通過(guò)alter table … add partition語(yǔ)句來(lái)完成

但對(duì)范圍表分區(qū)來(lái)說(shuō)，增加的表分區(qū)必須在尾部增加，在頭部或者在中間增加都會(huì)失敗：

為解決這個(gè)問(wèn)題，可以使? REORGANIZE 命令：

對(duì)列表表分區(qū)來(lái)說(shuō)，只要新增加的分區(qū)對(duì)應(yīng)的值在之前的表分區(qū)中沒(méi)有出現(xiàn)過(guò)，就可以通過(guò)alter table… add partition來(lái)增加

當(dāng)然，也可以通過(guò)REORGANIZE命令將之前的多個(gè)分區(qū)合并成?個(gè)或?個(gè)分區(qū)，但要保持分區(qū)值?致：

更復(fù)雜的?如將多個(gè)分區(qū)重組成多個(gè)分區(qū)：

MySQL-分區(qū)表

對(duì)底層表的封裝，意味著索引也是按照分區(qū)的子表定義的，而沒(méi)有全局索引。（所以即使有唯一性索引，在不同子表中可能會(huì)有重復(fù)數(shù)據(jù)）

單表數(shù)據(jù)量超大時(shí)索引失效

將單表分區(qū)成數(shù)個(gè)區(qū)域，通過(guò)分區(qū)函數(shù)，可以快速地定位到數(shù)據(jù)的區(qū)域。而且相比于索引，分區(qū)不需要額外的數(shù)據(jù)結(jié)構(gòu)記錄每個(gè)分區(qū)的數(shù)據(jù)，代價(jià)更低。只需要一個(gè)簡(jiǎn)單的表達(dá)式就可以指向正確的分區(qū)

可以只是用簡(jiǎn)單的分區(qū)方式存放表，不要任何索引，只要將查詢(xún)定位到需要的大致數(shù)據(jù)位置，通過(guò)where條件，將需要的數(shù)據(jù)限制在少數(shù)分區(qū)中，則效率是很高的。WARNNING：查詢(xún)需要掃描的分區(qū)個(gè)數(shù)限制在一個(gè)很小的數(shù)量。

如果數(shù)據(jù)有明顯的“熱點(diǎn)”，可以將熱點(diǎn)數(shù)據(jù)單獨(dú)放在一個(gè)分區(qū)，讓這個(gè)分區(qū)的數(shù)據(jù)能夠有機(jī)會(huì)都緩存在內(nèi)存中。

如果分區(qū)表達(dá)式的值可以是NULL：第一個(gè)分區(qū)會(huì)使一個(gè)特殊分區(qū)。以partition by range year(order_date)為例，所有在order_date列為NULL或者非法值的數(shù)據(jù)都會(huì)被放到第一個(gè)分區(qū)。那么所有的查詢(xún)?cè)诙ㄎ环謪^(qū)后都會(huì)增加掃描第一個(gè)分區(qū)。而且如果第一個(gè)分區(qū)很大的時(shí)候，查詢(xún)的成本會(huì)被這個(gè)“拖油瓶”分區(qū)無(wú)情的增加。

創(chuàng)建一個(gè)無(wú)用的第一分區(qū)可以解決這個(gè)問(wèn)題，partition p_nulls values less than (0);

對(duì)于分區(qū)列和索引列不匹配的查詢(xún)，雖然查詢(xún)能夠使用索引，但是無(wú)法通過(guò)分區(qū)定位到目標(biāo)數(shù)據(jù)的分區(qū)（也就是數(shù)據(jù)分布相對(duì)更加分散）,需要遍歷每個(gè)分區(qū)內(nèi)的索引，除非查詢(xún)中的條件同時(shí)也包含分區(qū)條件。所以期望分區(qū)條件范圍被熱門(mén)查詢(xún)索引所包含。

對(duì)于范圍分區(qū) 技術(shù)，需要適當(dāng)限制分區(qū)的數(shù)量，否則對(duì)于大量數(shù)據(jù)批量導(dǎo)入的場(chǎng)景，選擇分區(qū)的成本過(guò)高。對(duì)于大多數(shù)系統(tǒng)，100個(gè)左右的分區(qū)是沒(méi)有問(wèn)題的。

MySQL數(shù)據(jù)庫(kù)性能優(yōu)化之分區(qū)分表分庫(kù)

分表是分散數(shù)據(jù)庫(kù)壓力的好方法。

分表，最直白的意思，就是將一個(gè)表結(jié)構(gòu)分為多個(gè)表，然后，可以再同一個(gè)庫(kù)里，也可以放到不同的庫(kù)。

當(dāng)然，首先要知道什么情況下，才需要分表。個(gè)人覺(jué)得單表記錄條數(shù)達(dá)到百萬(wàn)到千萬(wàn)級(jí)別時(shí)就要使用分表了。

分表的分類(lèi)

**1、縱向分表**

將本來(lái)可以在同一個(gè)表的內(nèi)容，人為劃分為多個(gè)表。（所謂的本來(lái)，是指按照關(guān)系型數(shù)據(jù)庫(kù)的第三范式要求，是應(yīng)該在同一個(gè)表的。）

分表理由：根據(jù)數(shù)據(jù)的活躍度進(jìn)行分離，（因?yàn)椴煌钴S的數(shù)據(jù)，處理方式是不同的）

案例：

對(duì)于一個(gè)博客系統(tǒng)，文章標(biāo)題，作者，分類(lèi)，創(chuàng)建時(shí)間等，是變化頻率慢，查詢(xún)次數(shù)多，而且最好有很好的實(shí)時(shí)性的數(shù)據(jù)，我們把它叫做冷數(shù)據(jù)。而博客的瀏覽量，回復(fù)數(shù)等，類(lèi)似的統(tǒng)計(jì)信息，或者別的變化頻率比較高的數(shù)據(jù)，我們把它叫做活躍數(shù)據(jù)。所以，在進(jìn)行數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)的時(shí)候，就應(yīng)該考慮分表，首先是縱向分表的處理。

這樣縱向分表后：

首先存儲(chǔ)引擎的使用不同，冷數(shù)據(jù)使用MyIsam 可以有更好的查詢(xún)數(shù)據(jù)。活躍數(shù)據(jù)，可以使用Innodb ,可以有更好的更新速度。

其次，對(duì)冷數(shù)據(jù)進(jìn)行更多的從庫(kù)配置，因?yàn)楦嗟牟僮鲿r(shí)查詢(xún)，這樣來(lái)加快查詢(xún)速度。對(duì)熱數(shù)據(jù)，可以相對(duì)有更多的主庫(kù)的橫向分表處理。

其實(shí)，對(duì)于一些特殊的活躍數(shù)據(jù)，也可以考慮使用memcache ,redis之類(lèi)的緩存，等累計(jì)到一定量再去更新數(shù)據(jù)庫(kù)。或者mongodb 一類(lèi)的nosql 數(shù)據(jù)庫(kù)，這里只是舉例，就先不說(shuō)這個(gè)。

**2、橫向分表**

字面意思，就可以看出來(lái)，是把大的表結(jié)構(gòu)，橫向切割為同樣結(jié)構(gòu)的不同表，如，用戶(hù)信息表，user_1,user_2等。表結(jié)構(gòu)是完全一樣，但是，根據(jù)某些特定的規(guī)則來(lái)劃分的表，如根據(jù)用戶(hù)ID來(lái)取模劃分。

分表理由：根據(jù)數(shù)據(jù)量的規(guī)模來(lái)劃分，保證單表的容量不會(huì)太大，從而來(lái)保證單表的查詢(xún)等處理能力。

案例：同上面的例子，博客系統(tǒng)。當(dāng)博客的量達(dá)到很大時(shí)候，就應(yīng)該采取橫向分割來(lái)降低每個(gè)單表的壓力，來(lái)提升性能。例如博客的冷數(shù)據(jù)表，假如分為100個(gè)表，當(dāng)同時(shí)有100萬(wàn)個(gè)用戶(hù)在瀏覽時(shí)，如果是單表的話，會(huì)進(jìn)行100萬(wàn)次請(qǐng)求，而現(xiàn)在分表后，就可能是每個(gè)表進(jìn)行1萬(wàn)個(gè)數(shù)據(jù)的請(qǐng)求（因?yàn)椋豢赡芙^對(duì)的平均，只是假設(shè)），這樣壓力就降低了很多很多。

延伸：為什么要分表和分區(qū)？

日常開(kāi)發(fā)中我們經(jīng)常會(huì)遇到大表的情況，所謂的大表是指存儲(chǔ)了百萬(wàn)級(jí)乃至千萬(wàn)級(jí)條記錄的表。這樣的表過(guò)于龐大，導(dǎo)致數(shù)據(jù)庫(kù)在查詢(xún)和插入的時(shí)候耗時(shí)太長(zhǎng)，性能低下，如果涉及聯(lián)合查詢(xún)的情況，性能會(huì)更加糟糕。分表和表分區(qū)的目的就是減少數(shù)據(jù)庫(kù)的負(fù)擔(dān)，提高數(shù)據(jù)庫(kù)的效率，通常點(diǎn)來(lái)講就是提高表的增刪改查效率。

什么是分表？

分表是將一個(gè)大表按照一定的規(guī)則分解成多張具有獨(dú)立存儲(chǔ)空間的實(shí)體表，我們可以稱(chēng)為子表，每個(gè)表都對(duì)應(yīng)三個(gè)文件，MYD數(shù)據(jù)文件，.MYI索引文件，.frm表結(jié)構(gòu)文件。這些子表可以分布在同一塊磁盤(pán)上，也可以在不同的機(jī)器上。app讀寫(xiě)的時(shí)候根據(jù)事先定義好的規(guī)則得到對(duì)應(yīng)的子表名，然后去操作它。

什么是分區(qū)？

分區(qū)和分表相似，都是按照規(guī)則分解表。不同在于分表將大表分解為若干個(gè)獨(dú)立的實(shí)體表，而分區(qū)是將數(shù)據(jù)分段劃分在多個(gè)位置存放，可以是同一塊磁盤(pán)也可以在不同的機(jī)器。分區(qū)后，表面上還是一張表，但數(shù)據(jù)散列到多個(gè)位置了。app讀寫(xiě)的時(shí)候操作的還是大表名字，db自動(dòng)去組織分區(qū)的數(shù)據(jù)。

**MySQL分表和分區(qū)有什么聯(lián)系呢？**

1、都能提高mysql的性高，在高并發(fā)狀態(tài)下都有一個(gè)良好的表現(xiàn)。

2、分表和分區(qū)不矛盾，可以相互配合的，對(duì)于那些大訪問(wèn)量，并且表數(shù)據(jù)比較多的表，我們可以采取分表和分區(qū)結(jié)合的方式（如果merge這種分表方式，不能和分區(qū)配合的話，可以用其他的分表試），訪問(wèn)量不大，但是表數(shù)據(jù)很多的表，我們可以采取分區(qū)的方式等。

3、分表技術(shù)是比較麻煩的，需要手動(dòng)去創(chuàng)建子表，app服務(wù)端讀寫(xiě)時(shí)候需要計(jì)算子表名。采用merge好一些，但也要?jiǎng)?chuàng)建子表和配置子表間的union關(guān)系。

4、表分區(qū)相對(duì)于分表，操作方便，不需要?jiǎng)?chuàng)建子表。

我們知道對(duì)于大型的互聯(lián)網(wǎng)應(yīng)用，數(shù)據(jù)庫(kù)單表的數(shù)據(jù)量可能達(dá)到千萬(wàn)甚至上億級(jí)別，同時(shí)面臨這高并發(fā)的壓力。Master-Slave結(jié)構(gòu)只能對(duì)數(shù)據(jù)庫(kù)的讀能力進(jìn)行擴(kuò)展，寫(xiě)操作還是集中在Master中，Master并不能無(wú)限制的掛接Slave庫(kù)，如果需要對(duì)數(shù)據(jù)庫(kù)的吞吐能力進(jìn)行進(jìn)一步的擴(kuò)展，可以考慮采用分庫(kù)分表的策略。

**1、分表**

在分表之前，首先要選中合適的分表策略（以哪個(gè)字典為分表字段，需要將數(shù)據(jù)分為多少?gòu)埍恚箶?shù)據(jù)能夠均衡的分布在多張表中，并且不影響正常的查詢(xún)。在企業(yè)級(jí)應(yīng)用中，往往使用org_id(組織主鍵)做為分表字段，在互聯(lián)網(wǎng)應(yīng)用中往往是userid。在確定分表策略后，當(dāng)數(shù)據(jù)進(jìn)行存儲(chǔ)及查詢(xún)時(shí)，需要確定到哪張表里去查找數(shù)據(jù)，

數(shù)據(jù)存放的數(shù)據(jù)表 = 分表字段的內(nèi)容 % 分表數(shù)量

**2、分庫(kù)**

分表能夠解決單表數(shù)據(jù)量過(guò)大帶來(lái)的查詢(xún)效率下降的問(wèn)題，但是不能給數(shù)據(jù)庫(kù)的并發(fā)訪問(wèn)帶來(lái)質(zhì)的提升，面對(duì)高并發(fā)的寫(xiě)訪問(wèn)，當(dāng)Master無(wú)法承擔(dān)高并發(fā)的寫(xiě)入請(qǐng)求時(shí)，不管如何擴(kuò)展Slave服務(wù)器，都沒(méi)有意義了。我們通過(guò)對(duì)數(shù)據(jù)庫(kù)進(jìn)行拆分，來(lái)提高數(shù)據(jù)庫(kù)的寫(xiě)入能力，即所謂的分庫(kù)。分庫(kù)采用對(duì)關(guān)鍵字取模的方式，對(duì)數(shù)據(jù)庫(kù)進(jìn)行路由。

數(shù)據(jù)存放的數(shù)據(jù)庫(kù)=分庫(kù)字段的內(nèi)容%數(shù)據(jù)庫(kù)的數(shù)量

**3、即分表又分庫(kù)**

數(shù)據(jù)庫(kù)分表可以解決單表海量數(shù)據(jù)的查詢(xún)性能問(wèn)題，分庫(kù)可以解決單臺(tái)數(shù)據(jù)庫(kù)的并發(fā)訪問(wèn)壓力問(wèn)題。

當(dāng)數(shù)據(jù)庫(kù)同時(shí)面臨海量數(shù)據(jù)存儲(chǔ)和高并發(fā)訪問(wèn)的時(shí)候，需要同時(shí)采取分表和分庫(kù)策略。一般分表分庫(kù)策略如下：

中間變量 = 關(guān)鍵字%（數(shù)據(jù)庫(kù)數(shù)量*單庫(kù)數(shù)據(jù)表數(shù)量）

庫(kù) = 取整（中間變量/單庫(kù)數(shù)據(jù)表數(shù)量）

表 = （中間變量%單庫(kù)數(shù)據(jù)表數(shù)量）

實(shí)例：

1、分庫(kù)分表

很明顯，一個(gè)主表（也就是很重要的表，例如用戶(hù)表）無(wú)限制的增長(zhǎng)勢(shì)必嚴(yán)重影響性能，分庫(kù)與分表是一個(gè)很不錯(cuò)的解決途徑，也就是性能優(yōu)化途徑，現(xiàn)在的案例是我們有一個(gè)1000多萬(wàn)條記錄的用戶(hù)表members,查詢(xún)起來(lái)非常之慢，同事的做法是將其散列到100個(gè)表中，分別從members0到members99，然后根據(jù)mid分發(fā)記錄到這些表中，牛逼的代碼大概是這樣子：

復(fù)制代碼代碼如下:

?php

for($i=0;$i 100; $i++ ){

//echo "CREATE TABLE db2.members{$i} LIKE db1.members

echo "INSERT INTO members{$i} SELECT * FROM members WHERE mid%100={$i}

}

2、不停機(jī)修改mysql表結(jié)構(gòu)

同樣還是members表，前期設(shè)計(jì)的表結(jié)構(gòu)不盡合理，隨著數(shù)據(jù)庫(kù)不斷運(yùn)行，其冗余數(shù)據(jù)也是增長(zhǎng)巨大，同事使用了下面的方法來(lái)處理：

先創(chuàng)建一個(gè)臨時(shí)表：

/*創(chuàng)建臨時(shí)表*/

CREATE TABLE members_tmp LIKE members

然后修改members_tmp的表結(jié)構(gòu)為新結(jié)構(gòu)，接著使用上面那個(gè)for循環(huán)來(lái)導(dǎo)出數(shù)據(jù)，因?yàn)?000萬(wàn)的數(shù)據(jù)一次性導(dǎo)出是不對(duì)的，mid是主鍵，一個(gè)區(qū)間一個(gè)區(qū)間的導(dǎo)，基本是一次導(dǎo)出5萬(wàn)條吧，這里略去了

接著重命名將新表替換上去：

/*這是個(gè)頗為經(jīng)典的語(yǔ)句哈*/

RENAME TABLE members TO members_bak,members_tmp TO members;

就是這樣，基本可以做到無(wú)損失，無(wú)需停機(jī)更新表結(jié)構(gòu)，但實(shí)際上RENAME期間表是被鎖死的，所以選擇在線少的時(shí)候操作是一個(gè)技巧。經(jīng)過(guò)這個(gè)操作，使得原先8G多的表，一下子變成了2G多。

Mysql分區(qū)表Partition

一、背景

話說(shuō)風(fēng)和日麗的一天，為提高隨著業(yè)務(wù)增長(zhǎng)的大表（3510449行吧）的訪問(wèn)效率，于是決定對(duì)表分區(qū)，記錄如下。

二、實(shí)操

結(jié)合業(yè)務(wù)，若干條記錄會(huì)集中在一個(gè)日期，查詢(xún)時(shí)也往往只查詢(xún)一個(gè)日期內(nèi)的數(shù)據(jù)，于是選取分區(qū)字段為時(shí)間。

創(chuàng)建分區(qū) 比如

CREATE TABLE message_all (

id int(10) NOT NULL AUTO_INCREMENT,

......

createtime datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '創(chuàng)建時(shí)間'

PRIMARY KEY ( id , createtime )

) ENGINE=InnoDB DEFAULT CHARSET=utf8

PARTITION BY RANGE (YEAR(createtime))

(PARTITION p2015 VALUES LESS THAN (2016) ENGINE = InnoDB,

PARTITION p2016 VALUES LESS THAN (2017) ENGINE = InnoDB,

PARTITION p2017 VALUES LESS THAN (2018) ENGINE = InnoDB,

PARTITION p2018 VALUES LESS THAN MAXVALUE ENGINE = InnoDB)

不過(guò)我們表已經(jīng)有了當(dāng)然不能這么建，除非你想導(dǎo)一次數(shù)據(jù)。

如下操作：

1、

ALTER TABLE message_all PARTITION BY RANGE (to_days(createtime))

(

PARTITION p2015 VALUES LESS THAN (to_days('2016-01-01')),

PARTITION p2016 VALUES LESS THAN (to_days('2017-01-01')),

PARTITION p2017 VALUES LESS THAN (to_days('2018-01-01')),

PARTITION p2018 VALUES LESS THAN MAXVALUE

);

或者

2、ALTER TABLE message_all PARTITION BY RANGE (YEAR(createtime))

(

PARTITION p2015 VALUES LESS THAN (YEAR('2016-01-01'))

);

然后追加。

ALTER TABLE message_all ADD PARTITION

(

PARTITION p2016 VALUES LESS THAN (YEAR('2017-01-01')),

PARTITION p2017 VALUES LESS THAN (YEAR('2018-01-01')),

PARTITION p2018 VALUES LESS THAN MAXVALUE

);

這里會(huì)有幾種錯(cuò)誤情況：

1、ALTER TABLE message_all PARTITION BY RANGE (to_days(createtime)) ;

[Err] 1492 - For RANGE partitions each partition must be defined

解釋?zhuān)罕仨氈付ㄖ辽僖粋€(gè)分區(qū)。

2、[Err] 1492 - A PRIMARY KEY must include all columns in the table's partitioning function

解釋?zhuān)悍謪^(qū)字段必須是主鍵之一。

3、[Err] 1492 - Constant, random or timezone-dependent expressions in (sub)partitioning function are not allowed

解釋?zhuān)悍謪^(qū)字段為timestamp，換成datetime。

4、[Err] 1526 - Table has no partition for value xxxx

解釋?zhuān)河米芳臃绞降谝淮伪仨毟采w目前所有數(shù)據(jù)。

總結(jié)：

1、創(chuàng)建時(shí)必須指定至少一個(gè)分區(qū)。

2、key必須為主鍵之一。

3、RANGE處必須為INT型，時(shí)間字段用函數(shù)轉(zhuǎn)——YEAR()、YEARWEEK()、TO_DAYS()。

4、THAN處必須為INT型，時(shí)間字段用函數(shù)轉(zhuǎn)——TO_DAYS、TO_SECONDS()、UNIX_TIMESTAMP()。

5、它就是以?xún)蓚€(gè)INT比大小劃分的文件。

6、所有ENGINE必須一樣。

7、范圍分區(qū)添加只能在最大值后面追加。

8、分區(qū)是有上限的貌似1024個(gè)。

用到的其他操作

1、刪除分區(qū)（直接扔掉分區(qū)文件，數(shù)據(jù)也沒(méi)了）

ALTER TABLE message_all DROP PARTITION p2016;

2、清空分區(qū)數(shù)據(jù)

ALTER TABLE message_all TRUNCATE PARTITION p2017;

3、重定義（可實(shí)現(xiàn)：分區(qū)拆分、合并、重命名）

ALTER TABLE message_all REORGANIZE PARTITION p201601,p201602,p201603,p201604 INTO

(

PARTITION p2016012 VALUES less than(TO_DAYS('2016-03-01')),

PARTITION p2016034 VALUES less than(TO_DAYS('2016-05-01'))

);

檢查/查看你的分區(qū)

1、SHOW TABLE STATUS LIKE 'message_all';

2、SELECT * FROM information_schema.partitions WHERE table_name='message_all';

3、SHOW CREATE TABLE message_all;

4、EXPLAIN SELECT COUNT(1) FROM message_all WHERE createtime= '2016-01-01' AND createtime '2016-12-30';如果用到了分區(qū)partitions里會(huì)有顯示。

5、指定分區(qū)查

SELECT COUNT(1) FROM message_all PARTITION (p2016) 表別名 WHERE ......;

到這里就結(jié)束啦，土豆白。

一些概念

水平分區(qū)Partition有以下幾種模式

MySQL按月自動(dòng)創(chuàng)建分區(qū)表(千萬(wàn)級(jí)大表優(yōu)化)

對(duì)用戶(hù)來(lái)說(shuō)，分區(qū)表是一個(gè)獨(dú)立的邏輯表，但是底層由多個(gè)物理子表組成，實(shí)現(xiàn)分區(qū)的代碼實(shí)際上是通過(guò)對(duì)一組底層表的對(duì)象封裝，但對(duì)SQL層來(lái)說(shuō)是一個(gè)完全封裝底層的黑盒子。

MySQL實(shí)現(xiàn)分區(qū)的方式也意味著索引也是按照分區(qū)的子表定義，沒(méi)有全局索引。

分區(qū)的意思是指將同一表中不同行的記錄分配到不同的物理文件中，幾個(gè)分區(qū)就有幾個(gè).idb文件。MySQL數(shù)據(jù)庫(kù)的分區(qū)是局部分區(qū)索引，一個(gè)分區(qū)中既存了數(shù)據(jù)，又放了索引。也就是說(shuō)，每個(gè)區(qū)的聚集索引和非聚集索引都放在各自區(qū)的（不同的物理文件）。

1、可以讓單表存儲(chǔ)更多的數(shù)據(jù) 。

2、分區(qū)表的數(shù)據(jù)更容易維護(hù) ，可以通過(guò)刪除與那些數(shù)據(jù)有關(guān)的分區(qū)，更容易刪除數(shù)據(jù)，也可以增加新的分區(qū)來(lái)支持新插入的數(shù)據(jù)。另外，還可以對(duì)一個(gè)獨(dú)立分區(qū)進(jìn)行優(yōu)化、檢查、修復(fù)等操作。

3、部分查詢(xún)能夠從查詢(xún)條件確定只落在少數(shù)分區(qū)上，查詢(xún)速度會(huì)很快。

4、通過(guò)跨多個(gè)磁盤(pán)來(lái)分散數(shù)據(jù)查詢(xún)，來(lái) 獲得更大的查詢(xún)吞吐量。

要使定時(shí)事件起作用，MySQL的常量GLOBAL event_scheduler必須為on或者是1。

1、查看scheduler的當(dāng)前狀態(tài)：

2、修改scheduler狀態(tài)為打開(kāi)(0:off , 1:on)：

3、臨時(shí)打開(kāi)定時(shí)器(四種方法)：

4、永久生效的方法，修改配置文件my.cnf

5、臨時(shí)開(kāi)啟某個(gè)事件

6、臨時(shí)關(guān)閉某個(gè)事件

MySQL 高級(jí)特性（二）：數(shù)據(jù)表分區(qū)策略及優(yōu)缺點(diǎn)分析

當(dāng)面對(duì)巨大的數(shù)據(jù)表的時(shí)候，至少有一件事情是確定的，表太大了以至于每次查詢(xún)的時(shí)候我們沒(méi)法做全表掃描。而這個(gè)時(shí)候也沒(méi)法使用索引，或者說(shuō)索引意義不大，更不用說(shuō)索引的維護(hù)代價(jià)和空間占用非常高。如果是依賴(lài)索引，會(huì)導(dǎo)致大量的碎片和低聚集度的數(shù)據(jù)，這會(huì)導(dǎo)致查詢(xún)的時(shí)候有上千次的隨機(jī) I/O 訪問(wèn)而導(dǎo)致宕機(jī)。這種情況下一般只會(huì)使用1-2個(gè)索引，而不會(huì)更多。這種情況下，有兩個(gè)可行的選項(xiàng)：查詢(xún)必須從數(shù)據(jù)表的指定的部分順序查找或者是期望的部分?jǐn)?shù)據(jù)及其索引與服務(wù)器的內(nèi)存匹配。

需要再次重申：在存儲(chǔ)空間過(guò)大時(shí)，除非索引覆蓋了整個(gè)查詢(xún)，否則二叉樹(shù)索引就無(wú)法發(fā)揮作用。服務(wù)端需要查找數(shù)據(jù)表的一整行數(shù)據(jù)，并且會(huì)在一個(gè)大空間跨度里執(zhí)行隨機(jī) I/O 操作，這會(huì)導(dǎo)致查詢(xún)響應(yīng)時(shí)間無(wú)法接受。而維護(hù)索引（磁盤(pán)空間，I/O 操作）的代價(jià)同樣很高。

而這是分區(qū)能夠解決的問(wèn)題。這其中的關(guān)鍵就是分區(qū)是索引的一個(gè)初級(jí)形式，它的負(fù)荷低并且能夠讓我們從臨近的數(shù)據(jù)中獲取結(jié)果。這種情形下，我們可以依次掃描相鄰的數(shù)據(jù)或者是將臨近的數(shù)據(jù)加載到內(nèi)存進(jìn)行檢索。分區(qū)之所以負(fù)荷低是因?yàn)樗](méi)有指針指向?qū)?yīng)的數(shù)據(jù)行，也不需要被更新。分區(qū)并不精確地將數(shù)據(jù)按行劃分，也沒(méi)有涉及到所謂的數(shù)據(jù)結(jié)構(gòu)。實(shí)際上，分區(qū)相當(dāng)于對(duì)數(shù)據(jù)進(jìn)行了分類(lèi)。

對(duì)于大數(shù)據(jù)表，有兩種策略進(jìn)行分區(qū)：

兩種分區(qū)策略是基于兩個(gè)關(guān)鍵假設(shè)：在查詢(xún)的時(shí)候可以通過(guò)過(guò)濾分區(qū)縮小查找范圍，且分區(qū)自身的代價(jià)不高。然而，這兩個(gè)假設(shè)未必總是有效，下面是可能遇到的問(wèn)題：

如上所述，分區(qū)并不是完美解決方案，目前版本的 MySQL還有一些其他的約束：

當(dāng)然，隨著 MySQL 版本的更新迭代，對(duì)分區(qū)的支持也越來(lái)越好，并且很多分區(qū)的問(wèn)題都得到了修復(fù)。

網(wǎng)站名稱(chēng)：mysql大表怎么分區(qū),mysql數(shù)據(jù)表分區(qū)
本文鏈接：http://chinadenli.net/article5/dsggdii.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供App設(shè)計(jì)、營(yíng)銷(xiāo)型網(wǎng)站建設(shè)、響應(yīng)式網(wǎng)站、品牌網(wǎng)站建設(shè)、網(wǎng)站制作、網(wǎng)站內(nèi)鏈

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容