如何在發(fā)生災(zāi)難時確保數(shù)據(jù)中心正常運行時間和電氣安全?
2020-02-07 09:58:15
供稿:網(wǎng)友
當災(zāi)難來襲時,許多關(guān)鍵設(shè)施可能會面臨災(zāi)難性的后果,但是數(shù)據(jù)中心尤其脆弱。無論是企業(yè)內(nèi)部部署數(shù)據(jù)中心、托管數(shù)據(jù)中心還是邊緣數(shù)據(jù)中心,其所擁有的大量關(guān)鍵業(yè)務(wù)信息都無法托管到其他設(shè)施。因此在斷電的情況下,其他設(shè)施都會面臨重大的業(yè)務(wù)后果。
為數(shù)據(jù)中心供電的電氣設(shè)備也很獨特。因此,雖然災(zāi)難造成的數(shù)據(jù)中心停機后果非常嚴重,但電氣安全問題帶來的潛在風(fēng)險也是如此。
以下通過電力中斷和電氣安全兩種視角來研究災(zāi)難對數(shù)據(jù)中心的影響:
與災(zāi)難有關(guān)的停機成本
隨著美國近期發(fā)生一些重大災(zāi)難(從墨西哥灣的颶風(fēng)到加州的森林火災(zāi)),現(xiàn)在是數(shù)據(jù)中心運營商了解此類災(zāi)難在導(dǎo)致中斷時如何影響其運營的好時機。
UptimeInstitute公司在2018年的評估調(diào)查報告中提供了有關(guān)電源管理趨勢和當前挑戰(zhàn)的見解,重點是數(shù)據(jù)中心。該調(diào)查報告發(fā)現(xiàn)了停電數(shù)量上升的令人擔(dān)憂的趨勢,基礎(chǔ)設(shè)施停電和“嚴重服務(wù)質(zhì)量下降”事件的數(shù)量比上一年增加了6%,31%的受訪者表示在自己的數(shù)據(jù)中心經(jīng)歷了電力中斷事件。
數(shù)據(jù)中心的電力中斷可能會給企業(yè)帶來巨大的收入損失。最近一項IT智能咨詢(ITIC)的研究發(fā)現(xiàn),在47個垂直市場中,81%的企業(yè)估計,他們的平均每小時停機成本(不包括災(zāi)難性停機)超過30萬美元。33%以上的企業(yè)表示,每小時的停機時間會使他們損失100萬美元或更多。
雖然每個行業(yè)都面臨著自己的一系列挑戰(zhàn),但數(shù)據(jù)中心的特殊之處在于,它們對100%正常運行時間的期望與訪問關(guān)鍵業(yè)務(wù)數(shù)據(jù)的需求直接相關(guān),任何訪問的丟失都可能發(fā)生超出其他業(yè)務(wù)范圍的后果。重大電力中斷的威脅突出表明,需要電力備份解決方案來保護和最大限度地減少停機的影響。
備用電源系統(tǒng)的關(guān)鍵組件
為了防止這些高成本并保持系統(tǒng)正常運行,數(shù)據(jù)中心需要一個集成的電源系統(tǒng)來進行電源管理和災(zāi)難預(yù)防。首先從一個或多個不間斷電源系統(tǒng)(UPS)(通常與備用發(fā)電機和配電單元結(jié)合部署)開始,以確保電力中斷期間提供可靠電源,保障關(guān)鍵IT資產(chǎn)繼續(xù)運行。這些系統(tǒng)通過在電源事件期間提供網(wǎng)絡(luò)和其他應(yīng)用程序的可用性來幫助企業(yè)避免數(shù)據(jù)丟失和硬件損壞。
隨著向混合云環(huán)境發(fā)展的趨勢不斷發(fā)展,監(jiān)視軟件現(xiàn)在已成為電源管理系統(tǒng)的重要組成部分。此外,一些企業(yè)已經(jīng)實施了虛擬化基礎(chǔ)設(shè)施,可以將其與電源監(jiān)控軟件結(jié)合使用,以在發(fā)生災(zāi)難或其他事件的可能性較小的情況下簡化并最大化其管理電源的能力。通過使電源管理解決方案與常見的虛擬化管理平臺(如來自VMware、Cisco、NetApp、DellEMC、HPE、Nutanix和ScaleComputing的虛擬化管理平臺)結(jié)合起來,企業(yè)及其IT團隊可以擴展其服務(wù)的可用性。此功能允許團隊從單個控制臺遠程管理物理和虛擬服務(wù)器以及電源管理設(shè)備。
歸根結(jié)底,數(shù)據(jù)中心運營商需要知道其基礎(chǔ)設(shè)施中采用了哪些電源管理技術(shù),并了解這些解決方案是否能夠在災(zāi)難發(fā)生時滿足其可靠性需求。采用正確的電源系統(tǒng)可能意味著業(yè)務(wù)連續(xù)性或數(shù)千美元的收入損失之間的差異。
安全勢在必行
在數(shù)據(jù)中心為災(zāi)難做好準備時,電氣安全可能會被忽略。這其中有幾個原因。企業(yè)通常依賴專業(yè)人員安裝電氣設(shè)備,甚至依賴電氣設(shè)備制造商自己來確保其基礎(chǔ)設(shè)施的安全。但現(xiàn)實是,每個組織都有自己的角色,尤其是數(shù)據(jù)中心運營商。
數(shù)據(jù)中心的電氣系統(tǒng)通常是為功能性、美觀性、易維護性、高效性和安全性而設(shè)計的,但由于存在許多相互競爭的優(yōu)先級(更不用說數(shù)據(jù)中心運營商面臨的許多其他職責(zé)),安全性并不總是能得到它所需要的關(guān)注。
第一步也是最重要的一步是花時間了解給定位置可能面臨的獨特環(huán)境和挑戰(zhàn)。這可能包括審核當前的配電資產(chǎn),并審查關(guān)鍵負載分析、發(fā)電機連接性、可用性和燃料來源,從而確定發(fā)生風(fēng)險的位置以及在發(fā)生災(zāi)難時如何解決這些風(fēng)險。此外,必須具有設(shè)施配電系統(tǒng)的最新單線圖。為了確保安全是重中之重,考慮采用現(xiàn)代化或更新在災(zāi)難期間可能變得不安全的特定設(shè)備,并利用這些更改的機會的方法將很有幫助。
在此之后,數(shù)據(jù)中心可以在其設(shè)施內(nèi)實施緊急情況連續(xù)性計劃,以識別合格人員。然后,他們可以利用數(shù)據(jù),通過隔離危險的設(shè)備或?qū)⑽kU的設(shè)備放在限制未經(jīng)授權(quán)的員工訪問的安全位置,使員工能夠快速安全地減少危害。企業(yè)團隊必須確保將連續(xù)性計劃傳達給適當?shù)臄?shù)據(jù)中心員工和服務(wù)人員,并進行災(zāi)難演習(xí),以便員工可以有效地做出響應(yīng)。
與備用電源計劃一樣,電氣安全也需要對設(shè)施的運營采取整體方法。設(shè)施設(shè)計的結(jié)構(gòu)、管道、HVAC和其他方面在安全中起著至關(guān)重要的作用,如果在整體災(zāi)難規(guī)劃工作中未將其考慮在內(nèi),則會造成危害。
結(jié)論
災(zāi)難隨時可能發(fā)生,并且會對企業(yè)業(yè)務(wù)運營造成許多不利影響。數(shù)據(jù)中心運營商需要一個全面的災(zāi)難備災(zāi)策略,其中既要包含用于預(yù)防中斷的技術(shù),又要包含負責(zé)確保電氣安全的程序、協(xié)議和人員。有了正確的方法和計劃,數(shù)據(jù)中心運營商可以讓災(zāi)難對人員安全和業(yè)務(wù)整體健康的影響降至最低。
編輯:Harris