1 引言
我廠#705機(jī)組DCS系統(tǒng)系2004年大修中DCS系統(tǒng)及DEH一體化改造完畢,DCS及DEH系統(tǒng)采用和利時(shí)公司SmartPrO3.1.3軟件系統(tǒng),硬件為和利時(shí)公司MACS TM系統(tǒng)硬件,系統(tǒng)改造后,運(yùn)行穩(wěn)定。但是系統(tǒng)在2006年5月下旬#705機(jī)組DCS系統(tǒng)頻繁出現(xiàn)死機(jī)!
2 故障簡(jiǎn)況
系統(tǒng)在2006年5月25晚上鍋爐制粉盤(pán)死機(jī),運(yùn)行人員看到顯示畫(huà)面數(shù)據(jù)變化遲滯,切換畫(huà)面后正常。
系統(tǒng)在2006年5月30下午下班后,接到運(yùn)行打來(lái)電話,鍋爐主盤(pán)死機(jī),甲引全開(kāi)。在現(xiàn)場(chǎng)發(fā)現(xiàn)甲引開(kāi)接點(diǎn)一直發(fā)出,運(yùn)行人員切換畫(huà)面及重新登錄無(wú)效,熱工人員對(duì)其接點(diǎn)進(jìn)行切換后,重新操作恢復(fù)正常。
下面是#705機(jī)組DCS系統(tǒng)頻繁出現(xiàn)死機(jī)(時(shí)間30s不等又自行恢復(fù))現(xiàn)象(表1所示):有時(shí)一個(gè)站數(shù)據(jù)顯示滯緩、操作不靈活、送引風(fēng)調(diào)節(jié)中某個(gè)出現(xiàn)指令一直發(fā)出、嚴(yán)重時(shí)整個(gè)操作員站短時(shí)數(shù)據(jù)中斷,嚴(yán)重影響了我廠的機(jī)組安全運(yùn)行,下面是處理的整個(gè)過(guò)程。
表1 系統(tǒng)死機(jī)記錄

3 故障分析
硬件角度:通過(guò)以上現(xiàn)象主要是人機(jī)接口故障,對(duì)于單臺(tái)操作員站有問(wèn)題,主機(jī)有可能有問(wèn)題,主板、硬盤(pán)、通訊網(wǎng)卡等,通過(guò)檢查發(fā)現(xiàn)有三臺(tái)機(jī)主板出現(xiàn)問(wèn)題。
通信網(wǎng)絡(luò)角度:一般容易發(fā)生在接點(diǎn)總線、就地總線處、或地址標(biāo)識(shí)錯(cuò)誤所造成。
系統(tǒng)角度:參數(shù)設(shè)定、系統(tǒng)操作不合理、服務(wù)器出現(xiàn)故障等原因。
著重圍繞上面幾個(gè)方面進(jìn)行查找故障點(diǎn):從死機(jī)范圍及影響設(shè)備來(lái)看,分析是主機(jī)問(wèn)題,但是對(duì)于6月9日整個(gè)系統(tǒng)出現(xiàn)死機(jī),懷疑是服務(wù)器問(wèn)題,筆者將這一情況迅速反映廠家。廠家開(kāi)始懷疑是服務(wù)器設(shè)置或存在病毒,根據(jù)現(xiàn)場(chǎng)情況,DCS有很嚴(yán)格的規(guī)定,不準(zhǔn)任何人在DCS上拷貝,與MIS系統(tǒng)連接是單向傳輸,中間也加了隔離裝置,病毒不太可能;設(shè)置參數(shù)經(jīng)廠家確認(rèn)后也沒(méi)有問(wèn)題;最后還是把問(wèn)題集中了服務(wù)器上,對(duì)趨勢(shì)存在斷點(diǎn)問(wèn)題進(jìn)行了共同分析,主服務(wù)器成了最后故障點(diǎn)。
4 故障處理
5月25日鍋爐制粉盤(pán)出現(xiàn)死機(jī)后,熱工人員發(fā)現(xiàn)主機(jī)故障,更換了一臺(tái)主機(jī),對(duì)系統(tǒng)進(jìn)行檢查后,將系統(tǒng)重新啟動(dòng),系統(tǒng)運(yùn)行正常,并將這一情況反映至DELL廠家進(jìn)行修復(fù),DELL廠家6月2日將主機(jī)修好。
5月29日鍋爐運(yùn)行發(fā)現(xiàn)鍋爐主盤(pán)系統(tǒng)風(fēng)煙數(shù)據(jù)全部顯示#COM后,大約30s后,系統(tǒng)數(shù)據(jù)顯示自行恢復(fù),但是乙側(cè)引風(fēng)機(jī)液偶調(diào)節(jié)關(guān)指令一直保持,液偶全關(guān)至0,運(yùn)行人員及時(shí)調(diào)節(jié)甲側(cè)設(shè)備保住機(jī)組穩(wěn)定,之后,熱工人員對(duì)主盤(pán)進(jìn)行檢查,將這一情況反映廠家,廠家分析系統(tǒng)參數(shù)設(shè)置有問(wèn)題,將參數(shù)檢查無(wú)誤,反饋給廠家。得到廠家答復(fù):在SmartPrO3.1.3中有這樣問(wèn)題,系統(tǒng)死機(jī)時(shí),如果操作的話,在恢復(fù)后,系統(tǒng)會(huì)一直記憶這個(gè)指令,造成全或全關(guān)現(xiàn)象,解決這個(gè)問(wèn)題只有對(duì)系統(tǒng)進(jìn)行升級(jí)。由于系統(tǒng)運(yùn)行,故對(duì)發(fā)電分場(chǎng)監(jiān)盤(pán)人員交代:在系統(tǒng)出現(xiàn)數(shù)據(jù)滯緩時(shí),不要進(jìn)行操作,待系統(tǒng)運(yùn)行畫(huà)面正常時(shí)再進(jìn)行DCS系統(tǒng)進(jìn)行操作。
6月4日又出現(xiàn)一次5月29日同樣現(xiàn)象,但設(shè)備為甲引風(fēng)機(jī)液偶全開(kāi),運(yùn)行迅速對(duì)設(shè)備進(jìn)行關(guān)聯(lián)調(diào)整,熱工處理檢查后系統(tǒng)正常,判斷還是系統(tǒng)通訊方面的問(wèn)題。由于出現(xiàn)死機(jī)現(xiàn)象與主要集中在#12IO站和鍋爐控制主盤(pán),是不是#12IO站主控有問(wèn)題呢,但查找的相關(guān)資料沒(méi)有反映出這一問(wèn)題。
6月7日早上7點(diǎn)多又出現(xiàn)一次5月29日同樣現(xiàn)象,這次設(shè)備為甲引風(fēng)機(jī)液偶全開(kāi),開(kāi)度100%,熱工檢查發(fā)現(xiàn)主盤(pán)主機(jī)有問(wèn)題,將主機(jī)進(jìn)行了更換,我們也對(duì)主機(jī)加強(qiáng)了檢查力度。
6月8日又出現(xiàn)兩次死機(jī),連續(xù)出現(xiàn)三次同樣故障,嚴(yán)重威脅機(jī)組安全運(yùn)行,迅速和北京和利時(shí)廠家取得聯(lián)系,根據(jù)廠家的提示,筆者對(duì)服務(wù)器及#12IO站進(jìn)行檢查,發(fā)現(xiàn)主服務(wù)器右下方的三色球有好幾個(gè),廠家懷疑在運(yùn)行中主從服務(wù)器有切換現(xiàn)象,征詢能否主控制進(jìn)行切換,并且對(duì)鍋爐主盤(pán)主機(jī)與打印站的互換,下午四時(shí)熱工對(duì)#12站系統(tǒng)進(jìn)行切換。
6月9日運(yùn)行反映甲送風(fēng)機(jī)在系統(tǒng)死機(jī)后,關(guān)指令一直發(fā)出,一次風(fēng)壓迅速下降800Pa,系統(tǒng)的不穩(wěn)定嚴(yán)重威脅到機(jī)組的正常運(yùn)行,熱工專業(yè)人員對(duì)系統(tǒng)檢查后,對(duì)主服務(wù)器進(jìn)行重新啟動(dòng),發(fā)現(xiàn)趨勢(shì)有斷點(diǎn),列表在后,懷疑的重點(diǎn)集中為主服務(wù)器。一直待到19:00也未發(fā)現(xiàn)其他情況,晚上20:00又接到運(yùn)行電話,DCS系統(tǒng)出現(xiàn)兩次死機(jī),這次不是鍋爐主盤(pán)一臺(tái),而是操作員站全部死機(jī),迅速趕往現(xiàn)場(chǎng),系統(tǒng)已經(jīng)自行恢復(fù)正常,這次暴露出來(lái)主服務(wù)器肯定存在問(wèn)題,大家對(duì)運(yùn)行監(jiān)視組合進(jìn)行調(diào)整,鍋爐主盤(pán)比較重要,制粉盤(pán)近期運(yùn)行較好,將鍋爐主盤(pán)與制粉盤(pán)交換位置;與鍋爐主盤(pán)商量讓其到制粉盤(pán)監(jiān)盤(pán),將鍋爐主盤(pán)退出進(jìn)行重新新建工程,系統(tǒng)檢查無(wú)誤后,在運(yùn)行登錄,將與系統(tǒng)關(guān)聯(lián)的GPS系統(tǒng)退出。并同時(shí)聯(lián)系廠家盡快到現(xiàn)場(chǎng)解決問(wèn)題。
廠家6月10到廠后,對(duì)鍋爐主盤(pán)進(jìn)行檢查未發(fā)現(xiàn)異常,同時(shí)對(duì)更換到打印站的主機(jī)進(jìn)行檢查,發(fā)現(xiàn)計(jì)算機(jī)設(shè)置有不一致的地方,并對(duì)其進(jìn)行了處理。詢問(wèn)6月6日~6月9日有11次的10~35s的問(wèn)題(表2所示),廠家分析服務(wù)器有問(wèn)題,我廠有服務(wù)器備件,提議更換主服務(wù)器,廠家認(rèn)為沒(méi)有必要,軟件問(wèn)題進(jìn)行重裝就可以解決,系統(tǒng)升級(jí)后,這方面的問(wèn)題就不存在了,所以沒(méi)有更換主服務(wù)器。對(duì)系統(tǒng)升級(jí),徹底解決系統(tǒng)死機(jī)期間操作的指令一直發(fā)出問(wèn)題。
表2 趨勢(shì)斷點(diǎn)記錄表

機(jī)組6月13日停機(jī)調(diào)峰,利用這個(gè)機(jī)會(huì)配合廠家對(duì)服務(wù)器進(jìn)行重新安裝,并對(duì)系統(tǒng)進(jìn)行了升級(jí)為SmartPrO3.0.3+SP2,在中試對(duì)DCS系統(tǒng)測(cè)試后,于6月16日將系統(tǒng)重新恢復(fù)運(yùn)行,機(jī)組目前運(yùn)行狀態(tài)良好。
5 結(jié)束語(yǔ)
綜合以上經(jīng)過(guò),筆者發(fā)現(xiàn)系統(tǒng)出現(xiàn)死機(jī)的主要問(wèn)題是主服務(wù)器的問(wèn)題,在今年大修前我們采納了廠家建議購(gòu)置了一臺(tái)服務(wù)器備件;在運(yùn)行中對(duì)設(shè)備的日常維護(hù)很重要,不單是保證設(shè)備在正常的環(huán)境中運(yùn)行,設(shè)備巡回檢查一定要落到實(shí)處,發(fā)揮巡回檢查的真正意義。
系統(tǒng)出現(xiàn)某臺(tái)操作員站問(wèn)題,由于設(shè)備已經(jīng)有3年的使用期,今年的大修中筆者更換了幾臺(tái)有問(wèn)題的主機(jī),對(duì)這次主機(jī)部分出現(xiàn)問(wèn)題,筆者聯(lián)系了DELL廠家對(duì)有問(wèn)題的主機(jī)進(jìn)行了更換。
對(duì)DCS系統(tǒng)缺陷處理,主機(jī)更換中一定要檢查徹底。
對(duì)于其連接的其他系統(tǒng)如MIS等,由于其服務(wù)器是直接掛在DCS系統(tǒng)的服務(wù)器上的,所以對(duì)其的操作一定要規(guī)范,其IP地址不能與DCS系統(tǒng)有重復(fù)的。
多與廠家溝通,因?yàn)閺S家對(duì)其使用系統(tǒng)問(wèn)題見(jiàn)識(shí)要比用戶多,有些東西不需要等事到臨頭才來(lái)解決,所以才可以防患于未然。










