前言

十年專注成都網(wǎng)站制作,企業(yè)網(wǎng)站建設(shè),個人網(wǎng)站制作服務(wù),為大家分享網(wǎng)站制作知識、方案,網(wǎng)站設(shè)計(jì)流程、步驟,成功服務(wù)上千家企業(yè)。為您提供網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁設(shè)計(jì)及定制高端網(wǎng)站建設(shè)服務(wù),專注于企業(yè)網(wǎng)站建設(shè),高端網(wǎng)頁制作,對成都資質(zhì)代辦等多個行業(yè),擁有豐富的營銷推廣經(jīng)驗(yàn)。
最近偶然在[C++ Quiz](http://cppquiz.org)上看到一道題:
// 以下代碼的輸出是什么?
#include<iostream>
int main(){
int x=0; //What is wrong here??/
x=1;
std::cout<<x;
}這個看似簡單,實(shí)際很容易采坑。
之前也是偶然間了解到C++的 Digraph(雙字符組) ,但是當(dāng)時沒有進(jìn)行擴(kuò)展了解,沒想到C++還有 Trigraph(三字符組) …,這個概念其實(shí)也很簡單,維基百科的詞條 三字符組與雙字符組 寫的也很清楚,就直接搬運(yùn)過來一下。
下面話不多說了,來一起看看詳細(xì)的介紹吧
緣起
C語言的源程序的最低必須的字符集是基于7位ASCII碼字符集,是 ISO 646-1983 Invariant Code Set 的一個超集。ISO 646最初是1972年頒布的一項(xiàng)國際化的7位ASCII標(biāo)準(zhǔn),規(guī)定了12個字符所對應(yīng)的 碼位 保持對各國標(biāo)準(zhǔn)開放: # $ @ [ \ ] ^ ` { | } ~ 。 因此法國標(biāo)準(zhǔn)AFNOR NF Z 62010-1982把碼位0x7c(ASCII碼的 | )定義為ù,用法文鍵盤就難以輸入C語言的位或運(yùn)算符 | ;碼位0x7e(ASCII碼的 ~)定義為 ¨ (即 分音符 ),法文鍵盤就難以輸入C語言的位非運(yùn)算符 ~ 。 加拿大法語標(biāo)準(zhǔn)CSA Z243.4-1985中把碼位0x5e(ASCII碼的 ^ )在定義為É,導(dǎo)致難以輸入C語言的異或運(yùn)算符 ^ 。
三字符組
為解決上述的C語言源代碼輸入問題,C語言標(biāo)準(zhǔn)規(guī)定預(yù)處理器(C preprocessor)在掃描處理C語言源文件時,替換下述的3字符出現(xiàn)為1個字符
| 三字符組 | 替換為 |
|---|---|
| ??= | # |
| ??/ | \ |
| ??' | ^ |
| ??( | [ |
| ??) | ] |
| ??! | | |
| ??< | { |
| ??> | } |
| ??- | ~ |
注意 :編譯器對 三字符組 的處理是在解析注釋、宏的步驟的前面,可以理解為優(yōu)先處理 三字符組
那我們再回頭看上面那個題,其等價于:
// 以下代碼的輸出是什么?
#include<iostream>
int main(){
int x=0; //What is wrong here\ <- ??/被解釋為\,使得自動折行
x=1; <- 此行其實(shí)是被注釋掉的
std::cout<<x;
}故,如果希望在源程序中有兩個連續(xù)的問號,且不希望被預(yù)處理器替換,這種情況出現(xiàn)在字符常量、字符串字面值或者是程序注釋中,可選辦法是用字符串的自動連接: "...?""?..." 或者轉(zhuǎn)義序列: "...?\?..." 。
注意 :Trigraph(三字符組) 在 C++17 被移除了語法
從Microsoft Visual C++ 2010版開始,該編譯器默認(rèn)不再自動替換三字符組。如果需要使用三字符組替換(如為了兼容古老的軟件代碼),需要設(shè)置編譯器命令行選項(xiàng) /Zc:trigraphs
g++仍默認(rèn)支持三字符組,但會給出編譯警告。
雙字符組
1994年公布了一項(xiàng)C語言標(biāo)準(zhǔn)的修正案,引入了更具有可讀性的5個雙字符組。這也包括進(jìn)了 C99 標(biāo)準(zhǔn)。
| 雙字符組 | 替換為 |
|---|---|
| <: | [ |
| :> | ] |
| <% | { |
| %> | } |
| %: | # |
不同于 三字符組 在源文件的任何出現(xiàn)都會被預(yù)處理器替換, 雙字符 如果出現(xiàn)在字符串字面值(quoted string)、字符常量、程序注釋中將不被替換 。雙字符組的替換發(fā)生在編譯器對源程序的tokenization階段(即識別出關(guān)鍵字、標(biāo)識符等,類似于自然語言的“斷詞”),僅當(dāng)雙字符組作為一個token或者token的組成部分時(如 %:%: 被替換為預(yù)處理運(yùn)算符 ## ),雙字符組才被替換為單字符。 g++支持上述雙字符組替換。但Microsoft Visual C++不支持雙字符組替換。
Token
C++標(biāo)準(zhǔn)支持C語言的三字符組與雙字符組(包括C99中的增補(bǔ))。C++自身還提供了下述內(nèi)置的關(guān)鍵字:
| 關(guān)鍵字 | 等價于 |
|---|---|
| and | && |
| bitor | | |
| or | || |
| xor | ^ |
| compl | ~ |
| bitand | & |
| and_eq | &= |
| or_eq | |= |
| xor_eq | ^= |
| not | ! |
| not_eq | != |
Microsoft Visual C++編譯器要求如果使用上述關(guān)鍵字,必須包含頭文件 ciso646 ,否則編譯報錯。如“ error C2065: ‘not' : undeclared identifier”。而g++編譯器就不要求包含頭文件ciso646。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對創(chuàng)新互聯(lián)的支持。
網(wǎng)頁名稱:C++中Digraphs、Trigraphs和Tokens的深入講解
地址分享:http://chinadenli.net/article16/pgjggg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、網(wǎng)站導(dǎo)航、網(wǎng)站改版、企業(yè)網(wǎng)站制作、商城網(wǎng)站、App設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)