欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

正則表達(dá)式匹配閉合HTML標(biāo)簽的示例分析

小編給大家分享一下正則表達(dá)式匹配閉合HTML標(biāo)簽的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

成都創(chuàng)新互聯(lián)公司主要從事成都做網(wǎng)站、成都網(wǎng)站制作、成都外貿(mào)網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)平順,十多年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專(zhuān)業(yè),歡迎來(lái)電咨詢(xún)建站服務(wù):13518219792

任何復(fù)雜的正則表達(dá)式都是由簡(jiǎn)單的子表達(dá)式組成的,要想寫(xiě)出復(fù)雜的正則來(lái),一方面需要有化繁為簡(jiǎn)的功底,另外一方面,我們需要從正則引擎的角度去思考問(wèn)題。關(guān)于正則引擎的原理,推薦《Mastering Regular Expression》中文名叫《精通正則表達(dá)式》。挺不錯(cuò)的一本書(shū)。

OK,先確定我們要解決的問(wèn)題——從一段Html文本中找出特定id的標(biāo)簽的innerHTML。

這里面最大的難點(diǎn)就是,Html標(biāo)簽是支持嵌套的,怎么能夠找到指定標(biāo)簽相對(duì)應(yīng)的閉合標(biāo)簽?zāi)兀?/p>

我們可以這樣想,先匹配最前面的起始標(biāo)簽,假設(shè)是div吧(<div),接著一旦遇到嵌套div,就“壓入堆?!保竺嫒绻龅絛iv閉合標(biāo)簽了,就“彈出堆棧”。如果遇到閉合標(biāo)簽的時(shí)候,堆棧里面已經(jīng)沒(méi)有東西了,那么匹配結(jié)束,此結(jié)束標(biāo)簽為正確的閉合標(biāo)簽。

我之所以能夠這樣去思考,是因?yàn)槲伊私膺^(guò)正則的特性,我知道正則中的平衡組能夠?qū)崿F(xiàn)我剛才說(shuō)的“堆棧”操作。所以,如果我們要編寫(xiě)復(fù)雜正則表達(dá)式,需要對(duì)正則的一些高級(jí)特性至少有所了解,這樣我們思考問(wèn)題才有個(gè)方向。

匹配任意閉合HTML標(biāo)簽的正則表達(dá)式:

<(?<HtmlTag>[\w]+)[^>]*?>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*</\k<HtmlTag>>

如果只想匹配div標(biāo)簽,可以使用下面的正則表達(dá)式:

<(?<HtmlTag>div)[^>]*?>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*</\k<HtmlTag>>

是的,你可以把div修改成任意你想要匹配的HTML標(biāo)簽

如果想同時(shí)匹配多個(gè)HTML標(biāo)簽,可以使用下面的正則表達(dá)式:

<(?<HtmlTag>(div|span|h2))[^>]*?>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*</\k<HtmlTag>>

你還可以繼續(xù)添加更多要匹配的標(biāo)簽

如果想匹配包含ID的標(biāo)簽,可以使用下面的正則表達(dá)式:

<(?<HtmlTag>[\w]+)[^>]*\s[iI][dD]=(?<Quote>["']?)footer(?(Quote)\k<Quote>)[^>]*?(/>|>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)*</\k<HtmlTag>>)

這個(gè)正則匹配任意id為footer的HTML標(biāo)簽

創(chuàng)新互聯(lián)小編補(bǔ)充:

正則 \k

你也可以自己指定子表達(dá)式的組名。要指定一個(gè)子表達(dá)式的組名,請(qǐng)使用這樣的語(yǔ)法:(?<Word>\w+)(或者把尖括號(hào)換成'也行:(?'Word'\w+)),這樣就把\w+的組名指定為Word了。要反向引用這個(gè)分組捕獲的內(nèi)容,你可以使用\k<Word>,所以上一個(gè)例子也可以寫(xiě)成這樣:\b(?<Word>\w+)\b\s+\k<Word>\b。

有,但是是跟<>配合用的,詳見(jiàn)下面:
指定子表達(dá)式的組名。要指定一個(gè)子表達(dá)式的組名,請(qǐng)使用這樣的語(yǔ)法:(?<Word>\w+)(或者把尖括號(hào)換成'也行:(?'Word'\w+)),這樣就把\w+的組名指定為Word了。要反向引用這個(gè)分組捕獲的內(nèi)容,你可以使用\k<Word>,所以上一個(gè)例子也可以寫(xiě)成這樣:\b(?<Word>\w+)\b\s+\k<Word>\b。

以上是“正則表達(dá)式匹配閉合HTML標(biāo)簽的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

網(wǎng)站名稱(chēng):正則表達(dá)式匹配閉合HTML標(biāo)簽的示例分析
文章URL:http://chinadenli.net/article42/gpjiec.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、做網(wǎng)站、網(wǎng)站收錄、品牌網(wǎng)站設(shè)計(jì)搜索引擎優(yōu)化、虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)