默認情況下uniq只會檢索相鄰的重復(fù)數(shù)據(jù)從而去重。在/tmp/uniq.txt中雖然“onmpw web site” 有三條,但是其中一條是和其他兩條不相鄰的,所以只去重了一條,同理“error php function”也是這種情況。

成都創(chuàng)新互聯(lián)公司成立于2013年,我們提供高端網(wǎng)站建設(shè)公司、成都網(wǎng)站制作、成都網(wǎng)站設(shè)計、網(wǎng)站定制、成都全網(wǎng)營銷推廣、小程序制作、微信公眾號開發(fā)、成都網(wǎng)站營銷服務(wù),提供專業(yè)營銷思路、內(nèi)容策劃、視覺設(shè)計、程序開發(fā)來完成項目落地,為主動防護網(wǎng)企業(yè)提供源源不斷的流量和訂單咨詢。
第三,用sort+sed命令,同樣需要sort命令先排序。
騷年,你有仔細觀察者兩個命令嗎?舉個例子:文件filea為:a b c c d b 執(zhí)行sort filea |uniq -u |wc -l,先排序,則刪除了c和b的行;執(zhí)行sort -u filea |wc -l,排序,同時刪除相同的行,則只刪除c行。
方法為:先通過cat命令讀取customers的內(nèi)容,然后通過管道符傳給sort命令進行升序排序,并傳入-u參數(shù),-u表示去除重復(fù)行,最后通過輸出重定向,將輸出內(nèi)容保存到目標文件內(nèi)。
1、sort命令的語法格式:sort[參數(shù)][文件]Linux sort命令參數(shù):-b:忽略每行前面開始出的空格符號。-c:檢查文件是否已經(jīng)按照順序排序。-d:排序時,處理英文字母、數(shù)字及空格字符外,忽略其他的字符。
2、語法:sort [選項] 文件說明:sort命令對指定文件中所有的行進行排序,并將結(jié)果顯示在標準輸出上。如不指定輸入文件或使用“- ”,則表示排序內(nèi)容來自標準輸入。
3、一個辦法是執(zhí)行如下命令:里面涉及三個指令:du、sort、more 既然用到了,就順便多了解一下這三個指令的用法,算是做下個人筆記。首先是du 作用:用來查看文件所占用的磁盤情況。
4、用sort命令對text文件中各行排序后輸出其結(jié)果。請注意,在原文件的第三行上的第一個單詞完全相同,該命令將從它們的第二個單詞vegetables與fruit的首字符處繼續(xù)進行比較。
5、Linux與用戶有關(guān)的命令: passwd命令:更改用戶口令。 格式:passwd [用戶名] su命令:可以讓一個普通用戶擁有超級用戶或其他用戶的權(quán)限,也可以讓超級擁護以普通用戶的身份做一些事情。
6、Linux 下面 sort 可以按列排序,功能強大,但是其排序的說明有些晦澀。
主要用到的命令有sort,uniq和cut。其中,sort主要功能是排序,uniq主要功能是實現(xiàn)相鄰文本行的去重,cut可以從文本行中提取相應(yīng)的文本列(簡單地說,就是按列操作文本行)。
默認情況下uniq只會檢索相鄰的重復(fù)數(shù)據(jù)從而去重。在/tmp/uniq.txt中雖然“onmpw web site” 有三條,但是其中一條是和其他兩條不相鄰的,所以只去重了一條,同理“error php function”也是這種情況。
方法為:先通過cat命令讀取customers的內(nèi)容,然后通過管道符傳給sort命令進行升序排序,并傳入-u參數(shù),-u表示去除重復(fù)行,最后通過輸出重定向,將輸出內(nèi)容保存到目標文件內(nèi)。
騷年,你有仔細觀察者兩個命令嗎?舉個例子:文件filea為:a b c c d b 執(zhí)行sort filea |uniq -u |wc -l,先排序,則刪除了c和b的行;執(zhí)行sort -u filea |wc -l,排序,同時刪除相同的行,則只刪除c行。
在Linux系統(tǒng)里常用于文本查看、操作、統(tǒng)計的命令:通過多敲鍵盤,形成手感 肌肉記憶 ,熟練掌握這些命令,在以后生信分析中游刃有余。
文章標題:linux去重統(tǒng)計命令 linux文件去重
網(wǎng)址分享:http://chinadenli.net/article36/decsgpg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信小程序、面包屑導(dǎo)航、網(wǎng)站排名、虛擬主機、App開發(fā)、全網(wǎng)營銷推廣
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)