MySQL 過濾重復(fù)數(shù)據(jù)
成都創(chuàng)新互聯(lián)2013年開創(chuàng)至今,先為可克達(dá)拉等服務(wù)建站,可克達(dá)拉等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為可克達(dá)拉企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
有些 MySQL 數(shù)據(jù)表中可能存在重復(fù)的記錄,有些情況我們允許重復(fù)數(shù)據(jù)的存在,但有時(shí)候我們也需要?jiǎng)h除這些重復(fù)的數(shù)據(jù)。
如果你需要讀取不重復(fù)的數(shù)據(jù)可以在 SELECT 語句中使用 DISTINCT 關(guān)鍵字來過濾重復(fù)數(shù)據(jù)。
from 樹懶學(xué)堂- 一站式數(shù)據(jù)知識(shí)學(xué)習(xí)平臺(tái)
你也可以使用 GROUP BY 來讀取數(shù)據(jù)表中不重復(fù)的數(shù)據(jù):
MySQL 刪除重復(fù)數(shù)據(jù)
有些 MySQL 數(shù)據(jù)表中可能存在重復(fù)的記錄,有些情況我們允許重復(fù)數(shù)據(jù)的存在,但有時(shí)候我們也需要?jiǎng)h除這些重復(fù)的數(shù)據(jù)。
本章節(jié)我們將為大家介紹如何防止數(shù)據(jù)表出現(xiàn)重復(fù)數(shù)據(jù)及如何刪除數(shù)據(jù)表中的重復(fù)數(shù)據(jù)。
刪除重復(fù)數(shù)據(jù)
如果你想刪除數(shù)據(jù)表中的重復(fù)數(shù)據(jù),你可以使用以下的SQL語句:
from 樹懶學(xué)堂 - 一站式數(shù)據(jù)知識(shí)平臺(tái)
當(dāng)然你也可以在數(shù)據(jù)表中添加 INDEX(索引) 和 PRIMAY KEY(主鍵)這種簡單的方法來刪除表中的重復(fù)記錄。方法如下:
在用select語句查詢mysql數(shù)據(jù)庫的時(shí)候,你可以加上distinct修飾符,這樣就可以去掉好多重復(fù)的,比如
SELECT
distinct(`lcontent`)
FROM
`caiji_ym_liuyan`
當(dāng)然實(shí)際情況中的重復(fù)問題還有很多,需要自己的實(shí)際情況,構(gòu)造相應(yīng)的select語句。
一張user表 中的name字段,里面有10個(gè)張三。我要只查詢出一個(gè)張三。
SQL: select distinct name from user
如果還要查詢出id
SQL: select distinct name,id from user
SQL :select name from user group by name
group by理解:表里的某一個(gè)字段(比如:name) 當(dāng)出現(xiàn)相同的數(shù)據(jù)時(shí),group by就將這2條數(shù)據(jù)合二為一。name就顯示一條 數(shù)據(jù)了。 但是name達(dá)到合二為一了,這2條數(shù)據(jù)的其他數(shù)據(jù)怎么辦呢? 這時(shí)候需要配合聚合函數(shù)的使用。
where條件:分組前的條件,配合任何關(guān)鍵字使用
Having 條件:分組后的條件 (事后條件) ,只配合group by使用。having條件通常使用聚合函數(shù)
SQL :select deptno,sum(sal) from emp group by deptno having sum(sal) 9000;
SQL: select deptno,count(*) from emp where sal 1000 group by deptno haing sum(sal) 8000
拓展:
聚合函數(shù)定義:聚合函數(shù)對(duì)一組值進(jìn)行計(jì)算并返回單一的值。(以下都屬于聚合函數(shù))
count(*) : 不包括空值。返回對(duì)行數(shù)目的計(jì)數(shù)。計(jì)算出有多少行,多少條數(shù)據(jù)。
count() : 包含空值。返回對(duì)數(shù)目的計(jì)數(shù)。計(jì)算表里有多少行,相當(dāng)于多少條數(shù)據(jù)。
sum() : 求和運(yùn)算
max(); 最大值
min(): 最小值
avg(): 平均值
通常情況下,一個(gè)我們在做一個(gè)產(chǎn)品的時(shí)候,一開始可能由于設(shè)計(jì)考慮不周或者程序?qū)懙牟粔驀?yán)謹(jǐn),某個(gè)字段上的值產(chǎn)生重復(fù)了,但是又必須去掉,這個(gè)時(shí)候就稍微麻煩了一點(diǎn),直接加一個(gè) UNIQUE KEY 肯定是不行了,因?yàn)闀?huì)報(bào)錯(cuò)。
現(xiàn)在,我們來采用一種變通的辦法,不過可能會(huì)丟失一些數(shù)據(jù) :)
在這里,我們設(shè)定一個(gè)表,其結(jié)構(gòu)如下:
mysql desc `user`;
+-------+------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------+------------------+------+-----+---------+----------------+
| id | int(10) unsigned | NO | PRI | NULL | auto_increment |
| name | char(10) | NO | | | |
| extra | char(10) | NO | | | |
+-------+------------------+------+-----+---------+----------------+
原來表中的數(shù)據(jù)假定有以下幾條:
mysql SELECT * FROM `user`;
+----+-------+--------+
| id | name | extra |
+----+-------+--------+
| 1 | user1 | user1 |
| 2 | user2 | user2 |
| 3 | user3 | user3 |
| 4 | user4 | user4 |
| 5 | user5 | user5 |
| 6 | user3 | user6 |
| 7 | user6 | user7 |
| 8 | user2 | user8 |
| 9 | USER2 | user9 |
| 10 | USER6 | user10 |
+----+-------+--------+
1、將原來的數(shù)據(jù)導(dǎo)出
mysqlSELECT * INTO OUTFILE '/tmp/user.txt' FROM `user`;
2、清空數(shù)據(jù)表
mysqlTRUNCATE TABLE `user`;
3、創(chuàng)建唯一索引,并且修改 `name` 字段的類型為 BINARY CHAR 區(qū)分大小寫
mysql ALTER TABLE `user` MODIFY `name` CHAR(10) BINARY NOT NULL DEFAULT '';
mysql ALTER TABLE `user` ADD UNIQUE KEY ( `name` );
現(xiàn)在來看看新的表結(jié)構(gòu):
mysql desc user;
+-------+------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------+------------------+------+-----+---------+----------------+
| id | int(10) unsigned | NO | PRI | NULL | auto_increment |
| name | char(10) | NO | UNI | | |
| extra | char(10) | NO | | | |
+-------+------------------+------+-----+---------+----------------+
4、把數(shù)據(jù)導(dǎo)回去,在這里,有兩種選擇:新的重復(fù)記錄替換舊的記錄,只保留最新的記錄 或者是 新的記錄略過,只保留最舊的記錄
mysql LOAD DATA INFILE '/tmp/user.txt' REPLACE INTO TABLE `user`;
Query OK, 10 rows affected (0.00 sec)
Records: 8 Deleted: 2 Skipped: 0 Warnings: 0
mysql SELECT * FROM USER;
+----+-------+--------+
| id | name | extra |
+----+-------+--------+
| 1 | user1 | user1 |
| 8 | user2 | user8 |
| 6 | user3 | user6 |
| 4 | user4 | user4 |
| 5 | user5 | user5 |
| 7 | user6 | user7 |
| 9 | USER2 | user9 |
| 10 | USER6 | user10 |
+----+-------+--------+
上面是采用 REPLACE 的方式,可以看到,導(dǎo)入過程中刪掉了兩條數(shù)據(jù),結(jié)果驗(yàn)證確實(shí)是 新的重復(fù)記錄替換舊的記錄,只保留最新的記錄。
現(xiàn)在,來看看用 IGNORE 的方式:
mysql LOAD DATA INFILE '/tmp/user.txt' IGNORE INTO TABLE `user`;
Query OK, 6 rows affected (0.01 sec)
Records: 8 Deleted: 0 Skipped: 2 Warnings: 0
mysql SELECT * FROM USER;
+----+-------+--------+
| id | name | extra |
+----+-------+--------+
| 1 | user1 | user1 |
| 2 | user2 | user2 |
| 3 | user3 | user3 |
| 4 | user4 | user4 |
| 5 | user5 | user5 |
| 7 | user6 | user7 |
| 9 | USER2 | user9 |
| 10 | USER6 | user10 |
+----+-------+--------+
看到了吧,確實(shí)是 新的記錄略過,只保留最舊的記錄。
mysql數(shù)據(jù)表中有多條重復(fù)數(shù)據(jù)記錄,現(xiàn)在想刪除刪除部分重復(fù)數(shù)據(jù),保留最后一條更新或者插入的數(shù)據(jù)。
以學(xué)生表為例,我們創(chuàng)建一個(gè)簡單的數(shù)據(jù)表來做實(shí)驗(yàn):
往表里面插入一些實(shí)驗(yàn)數(shù)據(jù):
我們可以根據(jù)分組查詢先將重復(fù)數(shù)據(jù)查詢出來,同時(shí)也可以獲取到最后的更新時(shí)間,然后再與原表聯(lián)表查詢小于最大時(shí)間的數(shù)據(jù),將查詢出來的數(shù)據(jù)刪除。
------先來慢慢消化-------
在做刪除前,我們可以先看看有哪些數(shù)據(jù)是有重復(fù)的:
可以看到張三,李四,王五的數(shù)據(jù)是有重復(fù)的,趙六沒有重復(fù),下面我們查找最后更新的記錄。
可以看到,最后更新的數(shù)據(jù)為15:57:46的記錄沒有在結(jié)果中。
可以看到重復(fù)記錄已經(jīng)被清理掉。
假如有兩行記錄是完全一樣的,這個(gè)方法就不可行了,往表里面在跑一次數(shù)據(jù)插入:
執(zhí)行刪除計(jì)劃:
創(chuàng)建一個(gè)臨時(shí)表存放最后插入的一條數(shù)據(jù)(包含重復(fù)與沒有重復(fù)的),然后清空原表,再將臨時(shí)表的數(shù)據(jù)復(fù)制到原表中,最后把臨時(shí)表刪除。
這個(gè)很好理解,相當(dāng)于ctrl+c,ctrl+v的操作,數(shù)據(jù)表如下:
這樣數(shù)據(jù)去重就完成了,需要注意的是, 如果表數(shù)據(jù)量很大,注意在group by 里面的字段建立索引,同時(shí),生產(chǎn)環(huán)境注意好先進(jìn)行數(shù)據(jù)備份操作 。
分享文章:mysql怎么去重復(fù),mysql消除重復(fù)
新聞來源:http://chinadenli.net/article44/heciee.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、品牌網(wǎng)站建設(shè)、品牌網(wǎng)站制作、標(biāo)簽優(yōu)化、網(wǎng)站建設(shè)、云服務(wù)器
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)