數(shù)據(jù)中心管理人員,尤其是那些負(fù)責(zé)設(shè)施監(jiān)督,必須為產(chǎn)生營(yíng)收的業(yè)務(wù)運(yùn)營(yíng)提供支持的數(shù)據(jù)中心管理人員們正在不斷努力,以克服停機(jī)的威脅,這是理所當(dāng)然的。研究表明,僅僅一分鐘的停機(jī)時(shí)間平均帶來的損失將超過7,900美元,而長(zhǎng)時(shí)間的斷電無疑將嚴(yán)重影響到企業(yè)的運(yùn)行,甚至可能讓數(shù)據(jù)中心管理人員被解雇。
減少這種風(fēng)險(xiǎn)的最佳方式之一便是對(duì)支持?jǐn)?shù)據(jù)中心不間斷電源(UPS)的電池實(shí)施維護(hù)。在一系列的電池組中,僅僅只是一處損壞就能引起您的UPS在發(fā)生中斷時(shí)運(yùn)行失敗。而維護(hù)電池的第一步是要了解他們真正的使用壽命,并通過相關(guān)策略使您數(shù)據(jù)中心的關(guān)鍵基礎(chǔ)設(shè)施發(fā)揮最大價(jià)值。
電池的使用壽命
如果你的數(shù)據(jù)中心采用UPS電池管理關(guān)鍵設(shè)備已經(jīng)有一段時(shí)間了,你可能已經(jīng)發(fā)現(xiàn),電池制造商所設(shè)計(jì)的電池壽命并不與電池真正的使用壽命相同。設(shè)計(jì)的壽命是制造商在實(shí)驗(yàn)室考慮到電池的設(shè)計(jì)和電池老化的條件下所得出的。而電池實(shí)際的使用壽命不僅僅需要考慮電池老化的影響,還需要考慮到其是如何被應(yīng)用,安裝和維護(hù)的。簡(jiǎn)單地說,認(rèn)為電池的設(shè)計(jì)壽命和實(shí)際使用壽命是相同的,會(huì)讓您的數(shù)據(jù)中心存在風(fēng)險(xiǎn)。
艾默生網(wǎng)絡(luò)能源公司旗下Liebert Services團(tuán)隊(duì)所服務(wù)的電池組超過40000串,執(zhí)行了高達(dá)600000次的檢查或維修訪問。因此,我們對(duì)于電池真正的使用壽命有著深刻的理解。根據(jù)我們?cè)谶@方面的經(jīng)驗(yàn),即使電池的設(shè)計(jì)壽命可達(dá)10年或以上,但基于運(yùn)行環(huán)境和維護(hù)等幾個(gè)方面的因素,其很可能在使用了三年之后就已經(jīng)開始不怎么好用了。UPS和電池維護(hù)是實(shí)現(xiàn)最佳性能和電池投資回報(bào)的兩大重要因素。
電池的維護(hù)
進(jìn)行預(yù)防維修和主動(dòng)更換電池計(jì)劃可以在發(fā)生停電、線路高峰、意外斷電、及其他電源相關(guān)的問題時(shí)大大減少中斷失敗的風(fēng)險(xiǎn)。
一項(xiàng)針對(duì)超過5000臺(tái)三相UPS單位和24000多串電池的研究發(fā)現(xiàn),定期預(yù)防性維護(hù)對(duì)于保證UPS可靠性的作用是相當(dāng)明顯的。這項(xiàng)研究表明,一年的平均故障間隔時(shí)間(Mean Time Between Failure,MTBF)內(nèi)獲得兩次預(yù)防性維護(hù)(PM)服務(wù)訪問的單位比未實(shí)施預(yù)防性維護(hù)訪問的UPS的性能好23倍。根據(jù)該項(xiàng)研究,技術(shù)熟練的服務(wù)提供商具有非常低的錯(cuò)誤率,進(jìn)一步使得可靠性穩(wěn)步增長(zhǎng)。
數(shù)據(jù)表明,平均故障間隔時(shí)間(MTBF)與可預(yù)防性維護(hù)次數(shù)成正比。(來源:艾默生網(wǎng)絡(luò)能源)
通常,重要的PM訪問任務(wù)包括對(duì)設(shè)備實(shí)施完整的視覺檢查,其中就有配件,電線,電纜和所有的斷路器,以及檢查空氣過濾器是否清潔。在該P(yáng)M服務(wù)結(jié)束之后,系統(tǒng)的運(yùn)行測(cè)試應(yīng)包括單位轉(zhuǎn)移和電池放電。然而,在一個(gè)更全面的電池管理程序中,監(jiān)控才是關(guān)鍵。
電池監(jiān)控服務(wù)
在一項(xiàng)針對(duì)累積運(yùn)行時(shí)間超過了7億小時(shí),覆蓋了電池使用壽命超過三年的數(shù)據(jù)分析中發(fā)現(xiàn),較之那些未安裝電池監(jiān)控系統(tǒng)的數(shù)據(jù)中心,那些已經(jīng)安裝了電池監(jiān)控系統(tǒng)的數(shù)據(jù)中心能夠大大減少由于電池故障所引發(fā)的運(yùn)行中斷的幾率。盡管這些數(shù)據(jù)中心仍然可能發(fā)生中斷事故,這些事故均是由人為的操作錯(cuò)誤包括沒有認(rèn)真查看系統(tǒng)或不知道如何正確分析監(jiān)測(cè)數(shù)據(jù)等孤立因素造成的。這同時(shí)也顯示了數(shù)據(jù)中心需要相關(guān)的專家來正確的監(jiān)測(cè)報(bào)警數(shù)據(jù),維護(hù)系統(tǒng)。
這些電池監(jiān)測(cè)服務(wù)增添了一個(gè)高水平的保護(hù),增強(qiáng)了數(shù)據(jù)中心對(duì)于其關(guān)鍵基礎(chǔ)設(shè)施的信心,讓數(shù)據(jù)中心管理人員能夠安心的知道其電池是被監(jiān)控的,進(jìn)而實(shí)現(xiàn)了將非計(jì)劃停機(jī)降到最小化的可能性。此外,這種持續(xù)性的監(jiān)控,允許數(shù)據(jù)中心根據(jù)趨勢(shì)分析來規(guī)劃未來的電池投資。
對(duì)于今天繁忙的數(shù)據(jù)中心和IT經(jīng)理們而言,一個(gè)倍受歡迎的方案是采用遠(yuǎn)程分析服務(wù)來分析固定電池的監(jiān)控,將遠(yuǎn)程監(jiān)控技術(shù)嵌入到電源保護(hù)基礎(chǔ)設(shè)施。這種技術(shù)應(yīng)包括綜合數(shù)據(jù)采集以便能夠盡早的提供預(yù)警。
利用強(qiáng)大的遠(yuǎn)程監(jiān)控技術(shù),負(fù)責(zé)管理重要基礎(chǔ)設(shè)施的單個(gè)管理員不必是專家,目前也能夠在復(fù)雜的數(shù)據(jù)中心管理各種技術(shù),同時(shí)也能夠增加工作人員的數(shù)量。憑借其嵌入式能力,監(jiān)控功能還使管理員能夠提高平均無故障時(shí)間和平均修復(fù)時(shí)間(MTTR)。
通過正確的監(jiān)測(cè)技術(shù),提高M(jìn)TTR是可能的。因?yàn)檫B續(xù)的連接允許基礎(chǔ)設(shè)施專家提供最高水平的支持。他們能夠不斷地收集和分析關(guān)鍵參數(shù)數(shù)據(jù),并將這些信息轉(zhuǎn)換為可操作的計(jì)劃。這種遠(yuǎn)程診斷可以讓維修技師更明智,使他們到達(dá)出現(xiàn)故障的設(shè)備之前,就能夠有針對(duì)性的瞄準(zhǔn)需要修復(fù)的地方。
最終,遠(yuǎn)程UPS和電池監(jiān)測(cè),恢復(fù)一個(gè)UPS操作的時(shí)間遠(yuǎn)遠(yuǎn)小于一個(gè)連續(xù)時(shí)間的方法,在后者中,一個(gè)簡(jiǎn)單的事件也可能超過八小時(shí)。具備早期發(fā)現(xiàn)潛在問題的能力、以及針對(duì)缺陷或電池退化快速做出響應(yīng),能夠最大化UPS電池系統(tǒng)的可靠性,使你的數(shù)據(jù)中心保持的當(dāng)今數(shù)據(jù)中心所需的動(dòng)態(tài)適應(yīng)性。
鑒于企業(yè)業(yè)務(wù)對(duì)于數(shù)據(jù)中心系統(tǒng)依賴性的增強(qiáng),數(shù)據(jù)中心需要把更多的重點(diǎn)放在數(shù)據(jù)中心的可用性和關(guān)鍵電源系統(tǒng)的可靠性方面,數(shù)據(jù)中心管理人員必須知道如何最好地避免停機(jī),這意味著必須了解你的UPS電池的實(shí)際使用壽命和實(shí)施預(yù)防性維護(hù)的最佳實(shí)踐。憑借全面的預(yù)防性維修計(jì)劃,包括遠(yuǎn)程監(jiān)控服務(wù),進(jìn)而避免代價(jià)高昂的停機(jī)時(shí)間,而且最重要的是,保障你數(shù)據(jù)中心的正常運(yùn)作!