Linux下常用文本處理命令大全
成都創(chuàng)新互聯(lián)公司公司2013年成立,先為敦煌等服務(wù)建站,敦煌等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為敦煌企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
Linux下面有很多經(jīng)典的非常有用的命令,其中處理文本的命令就有很多。下面就讓我們一起看看這些經(jīng)典的Linux文本處理命令有哪些吧。
一. sort
文件排序, 通常用在管道中當(dāng)過濾器來使用. 這個命令可以依據(jù)指定的關(guān)鍵字或指定的字符位置, 對文件行進(jìn)行排序. 使用-m選項(xiàng), 它將會合并預(yù)排序的輸入文件. 想了解這個命令的全部參數(shù)請參考這個命令的info頁.
二. tsort
拓?fù)渑判? 讀取以空格分隔的有序?qū)? 并且依靠輸入模式進(jìn)行排序.
三. uniq
這個過濾器將會刪除一個已排序文件中的重復(fù)行. 這個命令經(jīng)常出現(xiàn)在sort命令的管道后邊.
四. expand, unexpand
expand命令將會把每個tab轉(zhuǎn)化為一個空格. 這個命令經(jīng)常用在管道中.
unexpand命令將會把每個空格轉(zhuǎn)化為一個tab. 效果與expand命令相反.
五. cut
一個從文件中提取特定域的工具. 這個命令與awk中使用的print $N命令很相似, 但是更受限. 在腳本中使用cut命令會比使用awk命令來得容易一些. 最重要的選項(xiàng)就是-d(字段定界符)和-f(域分隔符)選項(xiàng).
六. paste
將多個文件, 以每個文件一列的形式合并到一個文件中, 合并后文件中的每一列就是原來的一個文件. 與cut結(jié)合使用, 經(jīng)常用于創(chuàng)建系統(tǒng)log文件.
七. join
這個命令與paste命令屬于同類命令. 但是它能夠完成某些特殊的目地. 這個強(qiáng)力工具能夠以一種特殊的形式來合并兩個文件, 這種特殊的形式本質(zhì)上就是一個關(guān)聯(lián)數(shù)據(jù)庫的簡單版本.
join命令只能夠操作兩個文件. 它可以將那些具有特定標(biāo)記域(通常是一個數(shù)字標(biāo)簽)的行合并起來, 并且將結(jié)果輸出到stdout. 被加入的文件應(yīng)該事先根據(jù)標(biāo)記域進(jìn)行排序以便于能夠正確的匹配.
八. head
把文件的頭部內(nèi)容打印到stdout上(默認(rèn)為10行, 可以自己修改). 這個命令有一些比較有趣的選項(xiàng).
九. tail
將一個文件結(jié)尾部分的內(nèi)容輸出到stdout中(默認(rèn)為10行). 通常用來跟蹤一個系統(tǒng)logfile的.修改情況, 如果使用-f選項(xiàng)的話, 這個命令將會繼續(xù)顯示添加到文件中的行.
十. wc
wc可以統(tǒng)計(jì)文件或I/O流中的”單詞數(shù)量”:
十一. fold
將輸入按照指定寬度進(jìn)行折行. 這里有一個非常有用的選項(xiàng)-s, 這個選項(xiàng)可以使用空格進(jìn)行斷行(譯者: 事實(shí)上只有外文才需要使用空格斷行, 中文是不需要的)(請參考例子 12-23和例子 A-1).
十二. fmt
一個簡單的文件格式器, 通常用在管道中, 將一個比較長的文本行輸出進(jìn)行”折行”.
十三. col
這個命令用來濾除標(biāo)準(zhǔn)輸入的反向換行符號. 這個工具還可以將空白用等價(jià)的tab來替換. col工具最主要的應(yīng)用還是從特定的文本處理工具中過濾輸出, 比如groff和tbl. (譯者: 主要用來將man頁轉(zhuǎn)化為文本.)
十四. column
列格式化工具. 通過在合適的位置插入tab, 這個過濾工具會將列類型的文本轉(zhuǎn)化為”易于打印”的表格式進(jìn)行輸出.
十五. colrm
列刪除過濾器. 這個工具將會從文件中刪除指定的列(列中的字符串)并且寫到文件中, 如果指定的列不存在, 那么就回到stdout. colrm 2 4 filename將會刪除filename文件中每行的第2到第4列之間的所有字符. p="" /filename將會刪除filename文件中每行的第2到第4列之間的所有字符.
Caution: 如果這個文件包含tab和不可打印字符, 那將會引起不可預(yù)期的行為. 在這種情況下, 應(yīng)該通過管道的手段使用expand和unexpand來預(yù)處理colrm.
十六. nl
計(jì)算行號過濾器. nl filename將會把filename文件的所有內(nèi)容都輸出到stdout上, 但是會在每個非空行的前面加上連續(xù)的行號. 如果沒有filename參數(shù), 那么就操作stdin.
nl命令的輸出與cat -n非常相似, 然而, 默認(rèn)情況下nl不會列出空行.
十七. pr
格式化打印過濾器. 這個命令會將文件(或stdout)分頁, 將它們分成合適的小塊以便于硬拷貝打印或者在屏幕上瀏覽. 使用這個命令的不同的參數(shù)可以完成好多任務(wù), 比如對行和列的操作, 加入行, 設(shè)置頁邊, 計(jì)算行號, 添加頁眉, 合并文件等等. pr命令集合了許多命令的功能, 比如nl, paste, fold, column, 和expand.
pr -o 5 –width=65 fileZZZ | more 這個命令對fileZZZ進(jìn)行了比較好的分頁, 并且打印到屏幕上. 文件的縮進(jìn)被設(shè)置為5, 總寬度設(shè)置為65.
一個非常有用的選項(xiàng)-d, 強(qiáng)制隔行打印(與sed -G效果相同).
十八. gettext
GNU gettext包是專門用來將程序的輸出翻譯或者本地化為不同國家語言的工具集. 在最開始的時候僅僅支持C語言, 現(xiàn)在已經(jīng)支持了相當(dāng)數(shù)量的其它程序語言和腳本語言.
想要查看gettext程序如何在shell腳本中使用. 請參考info頁.
十九. msgfmt
一個產(chǎn)生二進(jìn)制消息目錄的程序. 這個命令主要用來本地化.
二十. iconv
一個可以將文件轉(zhuǎn)化為不同編碼格式(字符集)的工具. 這個命令主要用來本地化.
二十一. recode
可以認(rèn)為這個命令是上邊iconv命令的專業(yè)版本. 這個非常靈活的并可以把整個文件都轉(zhuǎn)換為不同編碼格式的工具并不是Linux標(biāo)準(zhǔn)安裝的一部分.
二十二. TeX, gs
TeX和Postscript都是文本標(biāo)記語言, 用來對打印和格式化的視頻顯示進(jìn)行預(yù)拷貝.
TeX是Donald Knuth精心制作的排版系統(tǒng). 通常情況下, 通過編寫腳本的手段來把所有的選項(xiàng)和參數(shù)封裝起來一起傳到標(biāo)記語言中是一件很方便的事情.
cat
/etc/inittab
這個簡單,輸出inittab文件內(nèi)容
|
管道
,也就是將上面的內(nèi)容作為下面命令的輸入
egrep
使用擴(kuò)展正則表達(dá)式的grep
'(^\s*$|^.{1}$)`
是個正則表達(dá)式
表示匹配只有空格/TAB的空行或只有頭上一個任意字符的行,具體的
^表示匹配行首,\s表示包括空格、制表符、換頁符等空白字符的其中任意一個
*表示任意個,$表示行尾,而|表示或
^同樣的行首,.表示任意字符
{1}表示有且僅的一個,$同樣行尾
|
又是管道
wc
-l
計(jì)行數(shù)
整個命令的作用是查看inittab中的空白行及只有頭上一個字符的行數(shù)
按第三列分組求數(shù)量和的語句,應(yīng)該就是你需要的
awk '{print $3}' list.txt|sort -u|uniq -c
Linux常用指令---grep(搜索過濾) (轉(zhuǎn))
Linux系統(tǒng)中g(shù)rep命令是一種強(qiáng)大的文本搜索工具,它能使用正則表達(dá)式搜索文本,并把匹?配的行打印出來。grep全稱是Global?Regular?Expression?Print,表示全局正則表達(dá)式版本,它的使用權(quán)限是所有用戶。
grep的工作方式是這樣的,它在一個或多個文件中搜索字符串模板。如果模板包括空格,則必須被引用,模板后的所有字符串被看作文件名。搜索的結(jié)果被送到標(biāo)準(zhǔn)輸出,不影響原文件內(nèi)容。
grep可用于shell腳本,因?yàn)間rep通過返回一個狀態(tài)值來說明搜索的狀態(tài),如果模板搜索成功,則返回0,如果搜索不成功,則返回1,如果搜索的文件不存在,則返回2。我們利用這些返回值就可進(jìn)行一些自動化的文本處理工作。
1.命令格式:
grep?[option]?pattern?file
2.命令功能:
用于過濾/搜索的特定字符??墒褂谜齽t表達(dá)式能多種命令配合使用,使用上十分靈活。
3.命令參數(shù):
-a???--text???#不要忽略二進(jìn)制的數(shù)據(jù)。???
-A顯示行數(shù)???--after-context=顯示行數(shù)???#除了顯示符合范本樣式的那一列之外,并顯示該行之后的內(nèi)容。???
-b???--byte-offset???#在顯示符合樣式的那一行之前,標(biāo)示出該行第一個字符的編號。???
-B顯示行數(shù)???--before-context=顯示行數(shù)???#除了顯示符合樣式的那一行之外,并顯示該行之前的內(nèi)容。???
-c????--count???#計(jì)算符合樣式的列數(shù)。???
-C顯示行數(shù)????--context=顯示行數(shù)或-顯示行數(shù)???#除了顯示符合樣式的那一行之外,并顯示該行之前后的內(nèi)容。???
-d?動作??????--directories=動作???#當(dāng)指定要查找的是目錄而非文件時,必須使用這項(xiàng)參數(shù),否則grep指令將回報(bào)信息并停止動作。???
-e范本樣式??--regexp=范本樣式???#指定字符串做為查找文件內(nèi)容的樣式。???
-E??????--extended-regexp???#將樣式為延伸的普通表示法來使用。???
-f規(guī)則文件??--file=規(guī)則文件???#指定規(guī)則文件,其內(nèi)容含有一個或多個規(guī)則樣式,讓grep查找符合規(guī)則條件的文件內(nèi)容,格式為每行一個規(guī)則樣式。???
-F???--fixed-regexp???#將樣式視為固定字符串的列表。???
-G???--basic-regexp???#將樣式視為普通的表示法來使用。???
-h???--no-filename???#在顯示符合樣式的那一行之前,不標(biāo)示該行所屬的文件名稱。???
-H???--with-filename???#在顯示符合樣式的那一行之前,表示該行所屬的文件名稱。???
-i????--ignore-case???#忽略字符大小寫的差別。???
-l????--file-with-matches???#列出文件內(nèi)容符合指定的樣式的文件名稱。???
-L???--files-without-match???#列出文件內(nèi)容不符合指定的樣式的文件名稱。???
-n???--line-number???#在顯示符合樣式的那一行之前,標(biāo)示出該行的列數(shù)編號。???
-q???--quiet或--silent???#不顯示任何信息。???
-r???--recursive???#此參數(shù)的效果和指定“-d?recurse”參數(shù)相同。???
-s???--no-messages???#不顯示錯誤信息。???
-v???--revert-match???#顯示不包含匹配文本的所有行。???
-V???--version???#顯示版本信息。???
-w???--word-regexp???#只顯示全字符合的列。???
-x????--line-regexp???#只顯示全列符合的列。???
-y???#此參數(shù)的效果和指定“-i”參數(shù)相同。
4.規(guī)則表達(dá)式:
grep的規(guī)則表達(dá)式:
^??#錨定行的開始?如:'^grep'匹配所有以grep開頭的行。????
$??#錨定行的結(jié)束?如:'grep$'匹配所有以grep結(jié)尾的行。????
.??#匹配一個非換行符的字符?如:'gr.p'匹配gr后接一個任意字符,然后是p。????
*??#匹配零個或多個先前字符?如:'*grep'匹配所有一個或多個空格后緊跟grep的行。????
.*???#一起用代表任意字符。???
[]???#匹配一個指定范圍內(nèi)的字符,如'[Gg]rep'匹配Grep和grep。????
[^]??#匹配一個不在指定范圍內(nèi)的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。????
\(..\)??#標(biāo)記匹配字符,如'\(love\)',love被標(biāo)記為1。????
\??????#錨定單詞的開始,如:'\
\??????#錨定單詞的結(jié)束,如'grep\'匹配包含以grep結(jié)尾的單詞的行。????
x\{m\}??#重復(fù)字符x,m次,如:'0\{5\}'匹配包含5個o的行。????
x\{m,\}??#重復(fù)字符x,至少m次,如:'o\{5,\}'匹配至少有5個o的行。????
x\{m,n\}??#重復(fù)字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10個o的行。???
\w????#匹配文字和數(shù)字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零個或多個文字或數(shù)字字符,然后是p。???
\W????#\w的反置形式,匹配一個或多個非單詞字符,如點(diǎn)號句號等。???
\b????#單詞鎖定符,如:?'\bgrep\b'只匹配grep。??
POSIX字符:
為了在不同國家的字符編碼中保持一至,POSIX(The?Portable?Operating?System?Interface)增加了特殊的字符類,如[:alnum:]是[A-Za-z0-9]的另一個寫法。要把它們放到[]號內(nèi)才能成為正則表達(dá)式,如[A-?Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字符類。
[:alnum:]????#文字?jǐn)?shù)字字符???
[:alpha:]????#文字字符???
[:digit:]????#數(shù)字字符???
[:graph:]????#非空字符(非空格、控制字符)???
[:lower:]????#小寫字符???
[:cntrl:]????#控制字符???
[:print:]????#非空字符(包括空格)???
[:punct:]????#標(biāo)點(diǎn)符號???
[:space:]????#所有空白字符(新行,空格,制表符)???
[:upper:]????#大寫字符???
[:xdigit:]???#十六進(jìn)制數(shù)字(0-9,a-f,A-F)??
5.使用實(shí)例:
實(shí)例1:查找指定進(jìn)程
命令:
ps?-ef|grep?svn
輸出:
[root@localhost?~]#?ps?-ef|grep?svn
root?4943???1??????0??Dec05?????00:00:00?svnserve?-d?-r?/opt/svndata/grape/
root?16867?16838??0?19:53?pts/0????00:00:00?grep?svn
[root@localhost?~]#
說明:
第一條記錄是查找出的進(jìn)程;第二條結(jié)果是grep進(jìn)程本身,并非真正要找的進(jìn)程。
實(shí)例2:查找指定進(jìn)程個數(shù)
命令:
ps?-ef|grep?svn?-c
ps?-ef|grep?-c?svn
輸出:
[root@localhost?~]#?ps?-ef|grep?svn?-c
2
[root@localhost?~]#?ps?-ef|grep?-c?svn?
2
[root@localhost?~]#
說明:
實(shí)例3:從文件中讀取關(guān)鍵詞進(jìn)行搜索
命令:
cat?test.txt?|?grep?-f?test2.txt
輸出:
[root@localhost?test]#?cat?test.txt?
hnlinux
peida.cnblogs.com
ubuntu
ubuntu?linux
redhat
Redhat
linuxmint
[root@localhost?test]#?cat?test2.txt?
linux
Redhat
[root@localhost?test]#?cat?test.txt?|?grep?-f?test2.txt
hnlinux
ubuntu?linux
Redhat
linuxmint
[root@localhost?test]#
說明:
輸出test.txt文件中含有從test2.txt文件中讀取出的關(guān)鍵詞的內(nèi)容行
實(shí)例3:從文件中讀取關(guān)鍵詞進(jìn)行搜索?且顯示行號
命令:
cat?test.txt?|?grep?-nf?test2.txt
輸出:
[root@localhost?test]#?cat?test.txt?
hnlinux
peida.cnblogs.com
ubuntu
ubuntu?linux
redhat
Redhat
linuxmint
[root@localhost?test]#?cat?test2.txt?
linux
Redhat
[root@localhost?test]#?cat?test.txt?|?grep?-nf?test2.txt
1:hnlinux
4:ubuntu?linux
6:Redhat
7:linuxmint
[root@localhost?test]#
說明:
輸出test.txt文件中含有從test2.txt文件中讀取出的關(guān)鍵詞的內(nèi)容行,并顯示每一行的行號
實(shí)例5:從文件中查找關(guān)鍵詞
命令:
grep?'linux'?test.txt
輸出:
[root@localhost?test]#?grep?'linux'?test.txt?
hnlinux
ubuntu?linux
linuxmint
[root@localhost?test]#?grep?-n?'linux'?test.txt?
1:hnlinux
4:ubuntu?linux
7:linuxmint
[root@localhost?test]#
說明:
實(shí)例6:從多個文件中查找關(guān)鍵詞
命令:
grep?'linux'?test.txt?test2.txt
輸出:
[root@localhost?test]#?grep?-n?'linux'?test.txt?test2.txt?
test.txt:1:hnlinux
test.txt:4:ubuntu?linux
test.txt:7:linuxmint
test2.txt:1:linux
[root@localhost?test]#?grep?'linux'?test.txt?test2.txt?
test.txt:hnlinux
test.txt:ubuntu?linux
test.txt:linuxmint
test2.txt:linux
[root@localhost?test]#
說明:
多文件時,輸出查詢到的信息內(nèi)容行時,會把文件的命名在行最前面輸出并且加上":"作為標(biāo)示符
實(shí)例7:grep不顯示本身進(jìn)程
命令:
ps?aux|grep?\[s]sh
ps?aux?|?grep?ssh?|?grep?-v?"grep"
輸出:
[root@localhost?test]#?ps?aux|grep?ssh
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0?
root??16901??0.0??0.0??61180???764?pts/0??S+???20:31???0:00?grep?ssh
[root@localhost?test]#?ps?aux|grep?\[s]sh]
[root@localhost?test]#?ps?aux|grep?\[s]sh
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0?
[root@localhost?test]#?ps?aux?|?grep?ssh?|?grep?-v?"grep"
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0
說明:
實(shí)例8:找出已u開頭的行內(nèi)容
命令:
cat?test.txt?|grep?^u
輸出:
[root@localhost?test]#?cat?test.txt?|grep?^u
ubuntu
ubuntu?linux
[root@localhost?test]#
說明:
實(shí)例9:輸出非u開頭的行內(nèi)容
命令:
cat?test.txt?|grep?^[^u]
輸出:
[root@localhost?test]#?cat?test.txt?|grep?^[^u]
hnlinux
peida.cnblogs.com
redhat
Redhat
linuxmint
[root@localhost?test]#
說明:
實(shí)例10:輸出以hat結(jié)尾的行內(nèi)容
命令:
cat?test.txt?|grep?hat$
輸出:
[root@localhost?test]#?cat?test.txt?|grep?hat$
redhat
Redhat
[root@localhost?test]#
說明:
實(shí)例11:輸出ip地址
命令:
ifconfig?eth0|grep?-E?"([0-9]{1,3}\.){3}[0-9]"
輸出:
[root@localhost?test]#?ifconfig?eth0|grep?"[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}"
inet?addr:192.168.120.204??Bcast:192.168.120.255??Mask:255.255.255.0
[root@localhost?test]#?ifconfig?eth0|grep?-E?"([0-9]{1,3}\.){3}[0-9]"
inet?addr:192.168.120.204??Bcast:192.168.120.255??Mask:255.255.255.0
[root@localhost?test]#
說明:
實(shí)例12:顯示包含ed或者at字符的內(nèi)容行
命令:
cat?test.txt?|grep?-E?"ed|at"
輸出:
[root@localhost?test]#?cat?test.txt?|grep?-E?"peida|com"
peida.cnblogs.com
[root@localhost?test]#?cat?test.txt?|grep?-E?"ed|at"
redhat
Redhat
[root@localhost?test]#
說明:
實(shí)例13:顯示當(dāng)前目錄下面以.txt?結(jié)尾的文件中的所有包含每個字符串至少有7個連續(xù)小寫字符的字符串的行
命令:
grep?'[a-z]\{7\}'?*.txt
輸出:
[root@localhost?test]#?grep?'[a-z]\{7\}'?*.txt
test.txt:hnlinux
test.txt:peida.cnblogs.com
test.txt:linuxmint
[root@localhost?test]#
實(shí)例14:日志文件過大,不好查看,我們要從中查看自己想要的內(nèi)容,或者得到同一類數(shù)據(jù),比如說沒有404日志信息的
命令:
grep?'.'?access1.log|grep?-Ev?'404'??access2.log
grep?'.'?access1.log|grep?-Ev?'(404|/photo/|/css/)'??access2.log
grep?'.'?access1.log|grep?-E?'404'??access2.log
輸出:
[root@localhost?test]#?grep?“.”access1.log|grep?-Ev?“404”??access2.log
說明:上面3句命令前面兩句是在當(dāng)前目錄下對access1.log文件進(jìn)行查找,找到那些不包含404的行,把它們放到access2.log中,后面去掉’v’,即是把有404的行放入access2.log
grep (過濾)
過濾需要的內(nèi)容,
-v 需要排除的內(nèi)容,
-i不分辨大小寫,
-n匹配的內(nèi)容在其行首顯示行號,
-A (after)顯示匹配字符串及其后n行,
-B (before)顯示匹配字符串及其前n行,
-C(context)顯示匹配字符串
下邊是想湊字?jǐn)?shù)的啦啦
linxu下的grep命令其實(shí)是一個搜索文件文本的工具。下面由我為大家整理了linux的grep命令的詳細(xì)解釋的相關(guān)知識,希望對大家有幫助!
一、linux中的grep命令的詳細(xì)解釋
1.作用
Linux系統(tǒng)中g(shù)rep命令是一種強(qiáng)大的文本搜索工具,它能使用正則表達(dá)式搜索文本,并把匹 配的行打印出來。grep全稱是Global Regular Expression Print,表示全局正則表達(dá)式版本,它的使用權(quán)限是所有用戶。
2.格式
grep [options]
3.主要參數(shù)
[options]主要參數(shù):
-c:只輸出匹配行的計(jì)數(shù)。
-I:不區(qū)分大 小寫(只適用于單字符)。
-h:查詢多文件時不顯示文件名。
-l:查詢多文件時只輸出包含匹配字符的文件名。
-n:顯示匹配行及 行號。
-s:不顯示不存在或無匹配文本的錯誤信息。
-v:顯示不包含匹配文本的所有行。
pattern正則表達(dá)式主要參數(shù):
\: 忽略正則表達(dá)式中特殊字符的原有含義。
^:匹配正則表達(dá)式的開始行。
$: 匹配正則表達(dá)式的結(jié)束行。
\:從匹配正則表達(dá) 式的行開始。
\:到匹配正則表達(dá)式的行結(jié)束。
[ ]:單個字符,如[A]即A符合要求 。
[ - ]:范圍,如[A-Z],即A、B、C一直到Z都符合要求 。
。:所有的單個字符。
* :有字符,長度可以為0。
二、linux中的grep命令的詳解實(shí)例
1.grep命令使用簡單實(shí)例
$ grep ‘test’ d*
顯示所有以d開頭的文件中包含 test的行。
$ grep ‘test’ aa bb cc
顯示在aa,bb,cc文件中匹配test的行。
$ grep ‘[a-z]\{5\}’ aa
顯示所有包含每個字符串至少有5個連續(xù)小寫字符的字符串的行。
$ grep ‘w\(es\)t.*\1′ aa
如果west被匹配,則es就被存儲到內(nèi)存中,并標(biāo)記為1,然后搜索任意個字符(.*),這些字符后面緊跟著 另外一個es(\1),找到就顯示該行。如果用egrep或grep -E,就不用”\”號進(jìn)行轉(zhuǎn)義,直接寫成’w(es)t.*\1′就可以了。
2.grep命令使用復(fù)雜實(shí)例
假設(shè)您正在’/usr/src/Linux/Doc’目錄下搜索帶字符 串’magic’的文件:
$ grep magic /usr/src/Linux/Doc/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?
其中文件’sysrp.txt’包含該字符串,討論的是 SysRQ 的功能。
默認(rèn)情況下,’grep’只搜索當(dāng)前目錄。如果 此目錄下有許多子目錄,’grep’會以如下形式列出:
grep: sound: Is a directory
這可能會使’grep’ 的輸出難于閱讀。這里有兩種解決的辦法:
明確要求搜索子目錄:grep -r
或忽略子目錄:grep -d skip
如果有很多 輸出時,您可以通過管道將其轉(zhuǎn)到’less’上閱讀:
$ grep magic /usr/src/Linux/Documentation/* | less
這樣,您就可以更方便地閱讀。
有一點(diǎn)要注意,您必需提供一個文件過濾方式(搜索全部文件的話用 *)。如果您忘了,’grep’會一直等著,直到該程序被中斷。如果您遇到了這樣的情況,按 CTRL c ,然后再試。
下面還有一些有意思的命令行參數(shù):
grep -i pattern files :不區(qū)分大小寫地搜索。默認(rèn)情況區(qū)分大小寫,
grep -l pattern files :只列出匹配的文件名,
grep -L pattern files :列出不匹配的文件名,
grep -w pattern files :只匹配整個單詞,而不是字符串的一部分(如匹配’magic’,而不是’magical’),
grep -C number pattern files :匹配的上下文分別顯示[number]行,
grep pattern1 | pattern2 files :顯示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 :顯示既匹配 pattern1 又匹配 pattern2 的行。
grep -n pattern files 即可顯示行號信息
grep -c pattern files 即可查找總行數(shù)
這里還有些用于搜索的特殊符號:
\ 和 \ 分別標(biāo)注單詞的開始與結(jié)尾。
例如:
grep man * 會匹配 ‘Batman’、’manic’、’man’等,
grep ‘\man’ * 匹配’manic’和’man’,但不是’Batman’,
grep ‘\man\’ 只匹配’man’,而不是’Batman’或’manic’等其他的字符串。
‘^’:指匹配的字符串在行首,
‘$’:指匹配的字符串在行 尾,
文章標(biāo)題:linux命令篩選文本 linux篩選文件名稱
瀏覽地址:http://chinadenli.net/article4/hpegoe.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、企業(yè)建站、用戶體驗(yàn)、移動網(wǎng)站建設(shè)、定制開發(fā)、網(wǎng)站導(dǎo)航
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)