test.html:

成都創(chuàng)新互聯(lián)專(zhuān)注于文成網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠(chéng)為您提供文成營(yíng)銷(xiāo)型網(wǎng)站建設(shè),文成網(wǎng)站制作、文成網(wǎng)頁(yè)設(shè)計(jì)、文成網(wǎng)站官網(wǎng)定制、重慶小程序開(kāi)發(fā)服務(wù),打造文成網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供文成網(wǎng)站排名全網(wǎng)營(yíng)銷(xiāo)落地服務(wù)。
!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" ""
html
head
meta http-equiv="Content-Type" content="text/html; charset=GB18030"
titleInsert title here/title
/head
body
div class="neirong"
《瘋狂android講義》
br /
第1章 android應(yīng)用與開(kāi)發(fā)環(huán)境1
br /
1.1 android的發(fā)展和搜首歷史2
br /
1.1.1 android的發(fā)展和簡(jiǎn)介2
br /
1.1.2 android平臺(tái)架構(gòu)及特性3
br /
....................
/div
div class="read-more"more1/div
div class="read-more"more2/div
哪漏腔/body
/html
java:
// 獲取網(wǎng)頁(yè)內(nèi)容
URL url = Test1.class.getResource("test.html");
StringBuffer sbf = new StringBuffer();
try {
URLConnection uc = url.openConnection();
uc.connect();
InputStream in = uc.getInputStream();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String temp = null;
while ((temp = br.readLine()) != null) {
sbf.append(temp);
}
br.close();
in.close();
System.out.println(sbf.toString());
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
System.out.println("解析。。。"李衫);
// 解析網(wǎng)頁(yè)內(nèi)容
String p1 = "div class=\"neirong\"(.*?)(?=/div)";
Pattern p = Pattern點(diǎn)抗 pile(p1);
Matcher matcher = p.matcher(sbf.toString());
if (matcher.find()) {
String innerDiv = matcher.group(1);
String[] strs = innerDiv.split("br\\s*/");
for (String str : strs) {
System.out.println(str);
}
}
Java訪問(wèn)網(wǎng)絡(luò)url,獲取網(wǎng)頁(yè)的html代碼
方式一:
一是使用URL類(lèi)的openStream()方法:
openStream()方法與制定的URL建立連接并返回InputStream類(lèi)的對(duì)象,以從這一連接中讀取數(shù)據(jù);
openStream()方法只叢渣褲能讀取網(wǎng)絡(luò)資源。
二是使用URL類(lèi)的openConnection()方法:
openConnection()方法會(huì)創(chuàng)建一個(gè)URLConnection類(lèi)的對(duì)象,此對(duì)象在本地機(jī)和URL指定的遠(yuǎn)程節(jié)點(diǎn)建立一條HTTP協(xié)議的數(shù)據(jù)通道,可進(jìn)行雙向數(shù)據(jù)傳滲簡(jiǎn)輸。類(lèi)URLConnection提供了很多設(shè)置和獲取連接參數(shù)的方法,最常用到的是getInputStream()和getOutputStream()方法。
openConnection()方法既能讀取又能發(fā)送數(shù)據(jù)。
列如:
public static void main(String args[]) throws Exception {
try {
//輸入url路徑梁襲
URL url = new URL("url路徑"); InputStream in =url.openStream(); InputStreamReader isr = new InputStreamReader(in); BufferedReader bufr = new BufferedReader(isr); String str; while ((str = bufr.readLine()) != null) { System.out.println(str); } bufr.close(); isr.close(); in.close(); } catch (Exception e) { e.printStackTrace(); } }
網(wǎng)絡(luò)爬蟲(chóng)是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的扒擾程序,它為搜索春仿旦引擎從萬(wàn)維網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成。傳統(tǒng)爬蟲(chóng)從一個(gè)或若干初始網(wǎng)頁(yè)的URL開(kāi)始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿(mǎn)足系統(tǒng)的一定停止條件。
java實(shí)現(xiàn)網(wǎng)頁(yè)源碼獲取的步驟:
(1)新建URL對(duì)象,表示要訪問(wèn)的網(wǎng)址。如:url=new URL("");
(2)建立HTTP連接,返回連大卜接對(duì)象urlConnection對(duì)象。如:urlConnection = (HttpURLConnection)url.openConnection();
(3)獲取相應(yīng)HTTP 狀態(tài)碼。如responsecode=urlConnection.getResponseCode();
(4)如果HTTP 狀態(tài)碼為200,表示成功。從urlConnection對(duì)象獲取輸入流對(duì)象來(lái)獲取請(qǐng)求的網(wǎng)頁(yè)源代碼。
分享標(biāo)題:java獲取網(wǎng)頁(yè)代碼實(shí)現(xiàn) java獲取網(wǎng)頁(yè)源代碼
本文網(wǎng)址:http://chinadenli.net/article25/dsppsci.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、網(wǎng)站導(dǎo)航、網(wǎng)站收錄、網(wǎng)站內(nèi)鏈、網(wǎng)站排名、虛擬主機(jī)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)