博文結(jié)構(gòu)
什么是正則表達式
基礎(chǔ)正則表達式
延伸正則表達式
文件的格式化與相關(guān)處理創(chuàng)新互聯(lián)建站為企業(yè)級客戶提高一站式互聯(lián)網(wǎng)+設(shè)計服務(wù),主要包括成都網(wǎng)站制作、成都網(wǎng)站設(shè)計、app軟件定制開發(fā)、重慶小程序開發(fā)公司、宣傳片制作、LOGO設(shè)計等,幫助客戶快速提升營銷能力和企業(yè)形象,創(chuàng)新互聯(lián)各部門都有經(jīng)驗豐富的經(jīng)驗,可以確保每一個作品的質(zhì)量和創(chuàng)作周期,同時每年都有很多新員工加入,為我們帶來大量新的創(chuàng)意。
正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。
由于系統(tǒng)如果在繁忙的情況之下,每天產(chǎn)生的訊息信息會多到你無法想像的地步,而我們也都知道,系統(tǒng)的“錯誤訊息登錄文件”的內(nèi)容記載了系統(tǒng)產(chǎn)生的所有訊息,當(dāng)然,這包含你的系統(tǒng)是否被“***”的記錄數(shù)據(jù)
在編寫處理字符串的程序時,經(jīng)常會有查找符合某些復(fù)雜規(guī)則的字符串的需要。正則表達式就是用于描述這些規(guī)則的工具。換句話說,正則表達式就是記錄文本規(guī)則的代碼。
正則表達式與shell在linux當(dāng)中的角色定位
不論是對于系統(tǒng)的認(rèn)識與系統(tǒng)的管理部分
正則表達式的字串表示方式依照不同的嚴(yán)謹(jǐn)度而分為:基礎(chǔ)正則表達式與延伸正則表達式。延伸型正則表達式除了簡單的一組字串處理之外,還可以作群組的字串處理
1.語系對正則表達式的影響
zh_TW.big5 及 C 這兩種語系的輸出結(jié)果分別如下:
LANG=C 時:0 1 2 3 4 ... A B C D ... Z a b c d ...z
LANG=zh_TW 時:0 1 2 3 4 ... a A b B c C d D ... z Z
2.正則表達式有三部分組成:
案例如下:
[root@localhost ~]# grep -n "the" /etc/man_db.conf
\\-n 顯示行號 搜尋特定字符串
[root@localhost ~]# grep -vn 'the' /etc/man_db.conf
\\反轉(zhuǎn)查找 意思就是查找不是‘the’的行顯示出來
[root@localhost ~]# grep -in 'the' /etc/man_db.conf
\\取得不論大小寫的 the 這個字串
[root@localhost ~]# grep -n 't[ae]se' /etc/man_db.conf
\\想要搜尋 test 或 tast 這兩個單字時,可以發(fā)現(xiàn)到
[root@localhost ~]# grep -n '[^g]oo' /etc/man_db.conf
\\利用中括號【】來搜尋集合字符
\\^開頭 $結(jié)束
[root@localhost ~]# grep -n '[0-9]' /etc/man_db.conf
\\取得有數(shù)字的那一行
[root@localhost ~]# grep -n '^the' /etc/man_db.conf
\\行首與行尾字符^ $
中括號內(nèi)的^表示反向搜尋
中括號外的^表示以……開頭
[root@localhost ~]# grep -n '^[a-z]' /etc/man_db.conf
\\查找開頭為小寫字母
[root@localhost ~]# grep -n '^[[:lower:]]' /etc/man_db.conf
\\這和上面一條一樣都是顯示小寫字母,可以看上面那個圖
[root@localhost ~]# grep -n '^[^a-zA-Z]' /etc/man_db.conf
\\不想要開頭是英文字母
[root@localhost ~]# grep -n '\.$' /etc/man_db.conf
\\找出來,行尾結(jié)束為小數(shù)點(.)的那一行
特別注意到,因為小數(shù)點具有其他意義所以必須要使用跳脫字符(\)來加以解除其特殊意義
Windows的斷行字符。 (.^M$)
Linux的斷行字符 . (.$)
**. (小數(shù)點):代表“一定有一個任意字符”的意思;
*(星星號):代表“重復(fù)前一個字符, 0 到無窮多次”的意思,為組合形態(tài)
**
[root@localhost ~]# grep -n 'g..d' /etc/man_db.conf
\\查找g??d共有四個字符開頭為g,結(jié)尾為d
[root@localhost ~]# grep -n 'ooo*' /etc/man_db.conf
\\查找至少兩個 o 以上的字串
\\注意,o*為一個單位,*代表重復(fù)前面的字母無限次
[root@localhost ~]# grep -n 'goo*g' /etc/man_db.conf
\\字串開頭與結(jié)尾都是 g,但是兩個 g 之間僅能存在至少一個 o
[root@localhost ~]# grep -n '[]0-9[0-9]*' /etc/man_db.conf
\\找出“任意數(shù)字”的行列
[root@localhost ~]# grep -n 'go\{2,5\}g' /etc/man_db.conf
\\找出 g 后面接 2 到 5 個 o ,然后再接一個 g 的字串
[root@localhost ~]# grep -n 'go\{2,\}g' /etc/man_db.conf
\\找出2 個 o 以上的 goooo....g
注:“正則表達式的特殊字符”與一般在命令行輸入指令的“萬用字符”并不相同,例如,在萬用字符當(dāng)中的 代表的是“ 0 ~ 無限多個字符”的意思,但是在正則表達式當(dāng)中, 則是“重復(fù) 0 到無窮多個的前一個 RE 字符”的意思~使用的意義并不相同,不要混了
語法如下:
[root@localhost ~]# ]sed [-nefr] [動作 ]
選項與參數(shù)如下:
-n :使用安靜(silent)模式。在一般sed的用法中,所有來自STDIN 的數(shù)據(jù)一般都會被列出到屏幕上。但如果加上-n參數(shù)后,則只有經(jīng)過sed特殊處理的那一行(或者動作)才會被列出來。
-e :直接在命令行界面上進行sed的動作編輯;
-f :直接將sed的動作寫在一一個文件內(nèi), -f filename 則可以執(zhí)行filename 內(nèi)的sed動作;
-r:sed的動作支持的是延伸型正則表達式的語法。(默認(rèn)是基礎(chǔ)正則表達式語法)
-i:直接修改讀取的文件內(nèi)容,而不是由屏幕輸出。
案例:
[root@localhost ~]# nl /etc/passwd | sed '2,5'd
\\刪除2到5行內(nèi)容
[root@localhost ~]# nl /etc/passwd | sed 'asd'
\\在所有后面行加上asd
[root@localhost ~]# nl /etc/passwd | sed '2a da ....\
aaa'
\\增將兩行以上
[root@localhost ~]# nl /etc/passwd | sed '2,5c ccccccccccccc'
\\第2-5行的內(nèi)容取代成為ccccccccc
[root@localhost ~]# nl /etc/passwd | sed -n '5,7p'
\\僅列出5到7行的內(nèi)容
部分?jǐn)?shù)據(jù)的搜尋與取代的功能
sed 's/要被取代的字串/新的字串/g'
sed 的“ -i ”選項可以直接修改文件內(nèi)容,
awk是一個強大的工具,相對于grep的查找,sed的編輯,awk在其對數(shù)據(jù)分析并生成報告時,顯得尤為強大。簡單來說awk就是把文件逐行的讀入,以空格為默認(rèn)分隔符將每行切片,切開的部分再進行各種分析處理。
語法如下:
[root@localhost ~]# awk '條 件類型1{動作1}條件類型2{動作2} .. ' filenamne
[root@localhost ~]# last -n 5 | awk '{print $1 "\t" $3}'
\\取出帳號與登陸者的 IP ,且?guī)ぬ柵c IP 之間以 [tab] 隔開
**整個 awk 的處理流程是:
[root@localhost ~]# last -n 5 | awk '{print $1 "\t lines: "NR"\t columns: "NF}'
root lines: 1 columns: 10
root lines: 2 columns: 10
(unknown lines: 3 columns: 10
reboot lines: 4 columns: 11
root lines: 5 columns: 10
lines: 6 columns: 0
wtmp lines: 7 columns: 7
[root@localhost ~]#
\\在awk內(nèi)的NR,NF等變量要用大寫,且不需要$!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
網(wǎng)頁題目:正則表達式及三劍客(grep,awk,sed)詳解-創(chuàng)新互聯(lián)
當(dāng)前地址:http://chinadenli.net/article26/djgdcg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、App設(shè)計、網(wǎng)站策劃、云服務(wù)器、企業(yè)建站、用戶體驗
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容