欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

JAVA過濾標(biāo)簽實(shí)現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法示例

本文實(shí)例講述了JAVA過濾標(biāo)簽實(shí)現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法。分享給大家供大家參考,具體如下:

創(chuàng)新互聯(lián)主營(yíng)金灣網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,app開發(fā)定制,金灣h5重慶小程序開發(fā)搭建,金灣網(wǎng)站營(yíng)銷推廣歡迎金灣等地區(qū)企業(yè)咨詢

/**
* 把html內(nèi)容轉(zhuǎn)為文本
* @param html 需要處理的html文本
* @param filterTags 需要保留的html標(biāo)簽樣式
* @return
*/
public static String trimHtml2Txt(String html, String[] filterTags){
    html = html.replaceAll("\\<head>[\\s\\S]*?</head>(?i)", "");//去掉head
    html = html.replaceAll("\\<!--[\\s\\S]*?-->", "");//去掉注釋
    html = html.replaceAll("\\<![\\s\\S]*?>", "");
    html = html.replaceAll("\\<style[^>]*>[\\s\\S]*?</style>(?i)", "");//去掉樣式
    html = html.replaceAll("\\<script[^>]*>[\\s\\S]*?</script>(?i)", "");//去掉js
    html = html.replaceAll("\\<w:[^>]+>[\\s\\S]*?</w:[^>]+>(?i)", "");//去掉word標(biāo)簽
    html = html.replaceAll("\\<xml>[\\s\\S]*?</xml>(?i)", "");
    html = html.replaceAll("\\<html[^>]*>|<body[^>]*>|</html>|</body>(?i)", "");
    html = html.replaceAll("\\\r\n|\n|\r", " ");//去掉換行
    html = html.replaceAll("\\<br[^>]*>(?i)", "\n\r");
    List<String> tags = new ArrayList<String>();
    List<String> s_tags = new ArrayList<String>();
    List<String> halfTag = Arrays.asList(new String[]{"img","table","thead","th","tr","td"});//
    if(filterTags != null && filterTags.length > 0){
      for (String tag : filterTags) {
        tags.add("<"+tag+(halfTag.contains(tag)?"":">"));//開始標(biāo)簽
        if(!"img".equals(tag)) tags.add("</"+tag+">");//結(jié)束標(biāo)簽
        s_tags.add("#REPLACETAG"+tag+(halfTag.contains(tag)?"":"REPLACETAG#"));//盡量替換為復(fù)雜一點(diǎn)的標(biāo)記,以免與顯示文本混合,如:文本中包含#td、#table等
        if(!"img".equals(tag)) s_tags.add("#REPLACETAG/"+tag+"REPLACETAG#");
      }
    }
    html = StringUtils.replaceEach(html, tags.toArray(new String[tags.size()]), s_tags.toArray(new String[s_tags.size()]));
    html = html.replaceAll("\\</p>(?i)", "\n\r");
    html = html.replaceAll("\\<[^>]+>", "");
    html = StringUtils.replaceEach(html,s_tags.toArray(new String[s_tags.size()]),tags.toArray(new String[tags.size()]));
    html = html.replaceAll("\\ ", " ");
    return html.trim();
}

PS:這里再為大家推薦一款功能類似的在線工具供大家參考使用:

在線html/js/css代碼過濾工具
http://tools.jb51.net/code/htmlfilter

另外,關(guān)于正則操作,這里再為大家推薦兩款相關(guān)在線工具:

JavaScript正則表達(dá)式在線測(cè)試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

更多關(guān)于java算法相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Java數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Java字符與字符串操作技巧總結(jié)》、《Java操作DOM節(jié)點(diǎn)技巧總結(jié)》、《Java文件與目錄操作技巧匯總》和《Java緩存操作技巧匯總》

希望本文所述對(duì)大家java程序設(shè)計(jì)有所幫助。

網(wǎng)頁標(biāo)題:JAVA過濾標(biāo)簽實(shí)現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法示例
網(wǎng)頁URL:http://chinadenli.net/article0/jeepio.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、網(wǎng)站設(shè)計(jì)公司、用戶體驗(yàn)、定制開發(fā)、品牌網(wǎng)站制作、Google

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

小程序開發(fā)
亚洲综合色婷婷七月丁香| 国产成人亚洲欧美二区综| 日韩不卡一区二区在线| 久久亚洲成熟女人毛片| 欧美同性视频免费观看| 中文字幕熟女人妻视频| 中文字幕一区二区久久综合| 日韩精品综合免费视频| 国产小青蛙全集免费看| 99久热只有精品视频最新| 激情亚洲内射一区二区三区| 99久热只有精品视频免费看| 中国少妇精品偷拍视频| 高清免费在线不卡视频| 国产一区二区三区精品免费| 欧美日本亚欧在线观看| 中文字幕高清免费日韩视频 | 久久夜色精品国产高清不卡| 草草视频福利在线观看| 在线日本不卡一区二区| 福利专区 久久精品午夜| 国产一区二区不卡在线视频| 成人午夜激情免费在线| 亚洲一级在线免费观看| 丁香六月啪啪激情综合区| 精品熟女少妇一区二区三区| 毛片在线观看免费日韩| 国产午夜精品在线免费看| 欧美午夜一区二区福利视频| 欧美一区二区口爆吞精| 亚洲av又爽又色又色| 五月婷婷缴情七月丁香 | 能在线看的视频你懂的| 亚洲中文字幕日韩在线| 欧美一区二区三区喷汁尤物| 亚洲专区中文字幕在线| 成人精品视频一区二区在线观看| 亚洲日本韩国一区二区三区| 国产毛片对白精品看片| 亚洲精品熟女国产多毛| 日木乱偷人妻中文字幕在线|