小編給大家分享一下java中如何計算文本句子數(shù),相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創(chuàng)新互聯(lián)網絡公司擁有十載的成都網站開發(fā)建設經驗,1000+客戶的共同信賴。提供網站設計制作、成都網站設計、網站開發(fā)、網站定制、買友情鏈接、建網站、網站搭建、響應式網站建設、網頁設計師打造企業(yè)風格,提供周到的售前咨詢和貼心的售后服務
1、任務簡介
本節(jié)任務是計算文本中的句子數(shù),并且對于句子數(shù)的劃分標準為“。” “!”和“?”三種符號。
2、基本任務和代碼
1)具體思路
(1)首先需要使用InputStreamReader類和BufferedReader類實現(xiàn)文本的讀取,由于我使用的文本文檔均為utf-8編碼,所以還需要指定編碼格式為utf-8;
(2)然后需要定義一個空的字符串變量,在對文本逐行讀出后將讀出的內容追加到該空字符串后;
(3)逐行讀出文檔,然后使用for循環(huán)對該行中的每一個字符進行遍歷,使用toString()方法得到每一個字符,再使用if語句和equals()方法字符是否為“?!?“!”和“?”三種符號之一,若為其中之一則句子數(shù)+1;
(4)將計算得出的句子長度打印出來;
2)任務代碼
程序保存為juzi1.java,代碼如下:
import java.io.*;//導入java.io包中的所有類 import java.util.Scanner;//導入java.util包中的Scanner類 public class juzi1 {//類名 public static void main(String[] args) {//程序主函數(shù) try {//try代碼塊,當發(fā)生異常時會轉到catch代碼塊中 //讀取指定的文件 Scanner s = new Scanner(System.in);//創(chuàng)建scanner,控制臺會一直等待輸入,直到敲回車結束 System.out.println("請輸入想要打開的文本文檔:");//輸入提示信息 String a = s.nextLine();//定義字符串變量,并賦值為用戶輸入的信息 //創(chuàng)建類進行文件的讀取,并指定編碼格式為utf-8 InputStreamReader read = new InputStreamReader(new FileInputStream(a),"utf-8"); BufferedReader in = new BufferedReader(read);//可用于讀取指定文件 StringBuffer b = new StringBuffer();//定義一個字符串變量b,便于后續(xù)進行內容追加的操作 String str = null;//定義一個字符串類型變量str String d = null;//定義一個字符串類型變量c int e = 0;//定義一個int型變量,用于統(tǒng)計句子數(shù) while((str = in.readLine()) != null) {//readLine()方法, 用于讀取一行,只要讀取內容不為空就一直執(zhí)行 b.append(str);//將該行內容追加到字符串b的后面 for (int j = 0; j < str.length(); j++) {//for循環(huán)的條件,當j小于該行長度時就一直循環(huán)并自增 d = Character.toString(str.charAt(j));//返回一個字符串對象 if (d.equals("。")||d.equals("?")||d.equals("!")) {//if語句的條件,判斷是否為句子 e++;//若為一句則e自增一次 } } } in.close();//關閉流 System.out.println("該文本共有"+e+"個句子");//輸出總的句子數(shù) } catch (IOException e) {//當try代碼塊有異常時轉到catch代碼塊 e.printStackTrace();//printStackTrace()方法是打印異常信息在程序中出錯的位置及原因 } } }
3)運行結果
(1)所有文件均保存在路徑D:\demo7下,首先對一個簡單的文本文檔(格式為utf-8)的句子數(shù)進行計算,該文本文檔命名為 lsy.txt,內容如下:
從中可以看出該文本文檔中共有4句話,然后在命令行中對程序進行編譯,并運行程序讀取該txt文檔,計算結果如下:
(2)最后在命令行下使用該程序對原版《西游記》txt文檔進行計算,計算結果如下:
由此可以計算得出我使用的《西游記》文檔共含有30804個句子。
以上是“java中如何計算文本句子數(shù)”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道!
新聞名稱:java中如何計算文本句子數(shù)
當前URL:http://chinadenli.net/article24/piooce.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供服務器托管、面包屑導航、軟件開發(fā)、電子商務、網站建設、動態(tài)網站
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)