接到電話,告知公司負(fù)責(zé)的某維保客戶數(shù)據(jù)庫出現(xiàn)了故障
客戶反饋,應(yīng)用端出現(xiàn)了磁盤讀寫錯誤:

同時,登錄數(shù)據(jù)庫時也出現(xiàn)了錯誤:

同時,用戶反饋說部分業(yè)務(wù)已經(jīng)中斷
登錄操作系統(tǒng), 通過查詢gv$instance視圖,得知是一個雙節(jié)點的11gR2的集群
檢查節(jié)點1的數(shù)據(jù)庫告警日志,ASM告警日志,CRSD日志,未發(fā)現(xiàn)近期可疑錯誤信息
登錄節(jié)點2, 發(fā)現(xiàn)數(shù)據(jù)庫服務(wù)的/oracle目錄的空間占用已達到100%。檢查磁盤文件空間占用發(fā)現(xiàn), 監(jiān)聽的產(chǎn)生的listener.log, XML文件占用了大量空間,遂清理之
從報錯日志來看,磁盤寫入出現(xiàn)了問題,懷疑數(shù)據(jù)文件有物理壞塊。但是用dbv userid/password file='+DATA/數(shù)據(jù)庫名/datafile/system.345' 并未檢查出有壞塊
清理出oracle軟件安裝目錄之后,用戶反映業(yè)務(wù)已經(jīng)恢復(fù)正常。 但是對于這個錯誤還是有點不解,為什么磁盤空間的問題會導(dǎo)致數(shù)據(jù)文件寫入的錯誤。
繼續(xù)檢查:
ASM的告警日志中出現(xiàn)了如下的信息:
Tue Jun 12 17:00:27 2018
Non critical error DIA-48181 caught while writing to trace file "/oracle/app/diag/asm/+asm/+ASM2/trace/+ASM2_ora_5142.trc"
Error message: HPUX-ia64 Error: 28: No space left on deviceAdditional information: 1 Writing to the above trace
file is disabled for now on...
創(chuàng)新互聯(lián)主營通海網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,
app軟件開發(fā),通海h5
成都小程序開發(fā)搭建,通海網(wǎng)站營銷推廣歡迎通海等地區(qū)企業(yè)咨詢
Non critical error ORA-48113
caught while writing to trace file "/oracle/app/diag/asm/+asm/+ASM2/trace/+ASM2_ora_14098.trc"
Error message:
Writing to the above trace file is disabled for now on...
WARNING: ASM communication error: op 0 state 0x0 (15055)
ERROR: direct connection failure with ASMNOTE: Deferred communication with ASM instance這里已經(jīng)出現(xiàn)了ASM連接中斷的信息。
難怪會出現(xiàn)磁盤讀寫錯誤
清理掉日志文件之后,告警日志里也沒有新的信息寫入
檢查集群組件狀態(tài):
$ /oracle/grid/bin/crsctl check crs
CRS-4638: Oracle High
Availability Services is online
CRS-4535: Cannot
communicate with Cluster Ready Services
CRS-4529: Cluster
Synchronization Services is online
CRS-4533: Event Manager is
online
CRS服務(wù)已經(jīng)出現(xiàn)了問題
總結(jié):
應(yīng)可以推斷出,/oracle目錄磁盤空間占滿,導(dǎo)致了數(shù)據(jù)庫實例通過ASM讀寫數(shù)據(jù)文件時,登錄ASM出現(xiàn)了錯誤。 此時就出現(xiàn)了前文中所示的寫入system表空間的錯誤
這里還有一個比較關(guān)鍵的提示:
ORA-29701: unable to connect to Cluster
Sychironization Service
這里已經(jīng)是集群層面的進程出現(xiàn)問題了。與數(shù)據(jù)文件本身并無聯(lián)系(清理空間后業(yè)務(wù)也恢復(fù)了正常)
網(wǎng)頁題目:HP-UX上一次Oracle軟件安裝目錄磁盤空間滿導(dǎo)致的故障-創(chuàng)新互聯(lián)
本文來源:http://chinadenli.net/article0/cohdio.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供全網(wǎng)營銷推廣、網(wǎng)站導(dǎo)航、品牌網(wǎng)站制作、自適應(yīng)網(wǎng)站、小程序開發(fā)、Google
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源:
創(chuàng)新互聯(lián)