2023-12-01 分類: 網(wǎng)站建設(shè)
php字符編碼轉(zhuǎn)換類,支持ANSI、big、UTF-8、UTF-8+bom相互轉(zhuǎn)換。
四種常見的文本文件編碼方式
ANSI 編碼:
無文件頭(文件編碼開頭的有效字節(jié))
ANSI編碼的字母數(shù)字占一個字節(jié),漢字占兩個字節(jié)
回車換行,單字節(jié),十六進制表示為0d 0a
編碼:
文件頭,十六進制表示為FF FE
每個字符用兩個字節(jié)編碼
回車,換行,雙字節(jié),十六進制表示為000d 000a
大編碼:
文件頭的十六進制表示為FE FF
后面的編碼就是把字符的高位放在前面,低位放在后面,正好是編碼的逆過程
回車,換行php轉(zhuǎn)unicode編碼,雙字節(jié)php轉(zhuǎn)unicode編碼,十六進制表示為 0d00 0a00
UTF-8 編碼:
文件頭,十六進制表示為EF bb bF
UTF-8 是一種可變長度的字符編碼。數(shù)字、字母、回車、換行都用1個字節(jié)表示,漢字占3個字節(jié)。
回車換行,單字節(jié),十六進制表示為0d 0a
轉(zhuǎn)換原則:先將字符編碼轉(zhuǎn)換為UTF-8,再由UTF-8轉(zhuǎn)換為對應(yīng)的字符編碼。
..php
_allow_charset)){
$this->_in_charset = $in_charset;
}
// 檢查輸出編碼
if(in_array($out_charset, $this->_allow_charset)){
$this->_out_charset = $out_charset;
}
}
/** 轉(zhuǎn)換
* @param String $str 要轉(zhuǎn)換的字符串
* @return String 轉(zhuǎn)換后的字符串
*/
public function convert($str){
$str = $this->convToUtf8($str); // 先轉(zhuǎn)為utf8
$str = $this->convFromUtf8($str); // 從utf8轉(zhuǎn)為對應(yīng)的編碼
return $str;
}
/** 把編碼轉(zhuǎn)為UTF-8編碼
* @param String $str
* @return String
*/
private function convToUtf8($str){
if($this->_in_charset=='utf-8'){ // 編碼已經(jīng)是utf-8,不用轉(zhuǎn)
return $str;
}
switch($this->_in_charset){
case 'utf-8bom':
$str = substr($str, 3);
break;
case 'ansi':
$str = iconv('GbK', 'UTF-8//IGNORE', $str);
break;
case 'unicode':
$str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2));
break;
case 'unicodebe':
$str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2));
break;
default:
break;
}
return $str;
}
/** 把UTF-8編碼轉(zhuǎn)換為輸出編碼
* @param String $str
* @return String
*/
private function convFromUtf8($str){
if($this->_out_charset=='utf-8'){ // 輸出編碼已經(jīng)是utf-8,不用轉(zhuǎn)
return $str;
}
switch($this->_out_charset){
case 'utf-8bom':
$str = "\xef\xbb\xbf".$str;
break;
case 'ansi':
$str = iconv('UTF-8', 'GbK//IGNORE', $str);
break;
case 'unicode':
$str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str);
break;
case 'unicodebe':
$str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str);
break;
default:
break;
}
return $str;
}
} // class end
?>演示:將 big 轉(zhuǎn)換為 utf-8+bom
convert($str);
file_put_contents('response/utf-8bom.txt', $response, true);
?>源碼下載地址:點擊查看
以上介紹了pHp字符編碼轉(zhuǎn)換類,支持ANSI、big、UTF-8、UTF-8+bom之間的轉(zhuǎn)換,包括內(nèi)容,希望對pHp教程感興趣的朋友有所幫助.
免責(zé)聲明:本文首發(fā)于php中文網(wǎng)。轉(zhuǎn)載請注明出處。感謝您的尊重!如果您有任何問題,請聯(lián)系我們
網(wǎng)頁題目:四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標(biāo)志性)
當(dāng)前地址:http://chinadenli.net/news48/297848.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、Google、網(wǎng)站建設(shè)、電子商務(wù)、面包屑導(dǎo)航、移動網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容