無論組織是否已經(jīng)制定完善的災(zāi)難恢復(fù)計(jì)劃,還是剛剛開始實(shí)施,需要了解將其災(zāi)難恢復(fù)策略提升到更高水平的方法。
無論組織采取多少安全措施來保護(hù)其資源,最終不可避免地會(huì)發(fā)生一些故障、失敗或其他災(zāi)難。在實(shí)施災(zāi)難恢復(fù)措施時(shí),最好是做好準(zhǔn)備,而不是匆忙地決定和實(shí)施計(jì)劃。
由于現(xiàn)代企業(yè)都依賴于數(shù)據(jù)和IT基礎(chǔ)設(shè)施,因此災(zāi)難恢復(fù)(DR)計(jì)劃是業(yè)務(wù)運(yùn)營的重要組成部分。面臨的災(zāi)難事件從網(wǎng)絡(luò)攻擊到硬件故障,再到小規(guī)模的停電,所有這些問題都會(huì)導(dǎo)致停機(jī),從而使組織面臨糟糕的客戶和員工體驗(yàn)、聲譽(yù)受損和盈利能力下降。
采用可靠的災(zāi)難恢復(fù)計(jì)劃,企業(yè)可以更快地恢復(fù)數(shù)據(jù),并顯著減少損失。無論組織開始制定災(zāi)難恢復(fù)策略,還是已經(jīng)制定了正在尋求改進(jìn)的策略,以下九個(gè)建議都將能夠改進(jìn)災(zāi)難恢復(fù)計(jì)劃,并幫助從組織遇到的任何災(zāi)難中快速恢復(fù)。
1. 擁有完整的文檔
文件存檔從來都不是一件有趣的事,但是記錄組織的災(zāi)難恢復(fù)計(jì)劃是全面、快速恢復(fù)的重要組成部分。
其文檔應(yīng)包括恢復(fù)計(jì)劃的目的和方法、每個(gè)策略的步驟、每個(gè)角色的職責(zé)以及計(jì)劃每個(gè)階段涉及的角色。其語言應(yīng)該清晰明了,以便任何人都能按照指示行事,高級(jí)管理人員應(yīng)具有明確的指揮系統(tǒng),以防發(fā)生災(zāi)難。
如果組織沒有制定策略文件,災(zāi)難恢復(fù)負(fù)責(zé)人不在現(xiàn)場(chǎng)或在災(zāi)難期間無法聯(lián)系,則可能會(huì)造成極大的破壞,因此必須立即執(zhí)行這一步。
2. 評(píng)估風(fēng)險(xiǎn)
業(yè)務(wù)中所有最佳實(shí)施的事情都始于風(fēng)險(xiǎn)評(píng)估,災(zāi)難恢復(fù)也不例外。而良好的災(zāi)難恢復(fù)策略將考慮業(yè)務(wù)的所有功能領(lǐng)域,了解面臨哪些潛在威脅以及依賴哪些IT資源。
完整的IT清單和數(shù)據(jù)審核可以通過識(shí)別關(guān)鍵軟件應(yīng)用程序,以及運(yùn)行它們所需的任何硬件基礎(chǔ)設(shè)施來幫助完成此任務(wù)。
風(fēng)險(xiǎn)評(píng)估還應(yīng)考慮任何可能影響外部合作伙伴和服務(wù)供應(yīng)商的問題,尤其是在云計(jì)算環(huán)境中,這將構(gòu)成災(zāi)難恢復(fù)計(jì)劃的基礎(chǔ)。
3. 災(zāi)難演習(xí)
組織為其數(shù)據(jù)中心設(shè)施制定疏散策略并不能阻止火災(zāi)的發(fā)生,但是定期進(jìn)行消防演習(xí)意味著,當(dāng)警報(bào)響起時(shí),每個(gè)人都知道該怎么辦以及要去哪里避險(xiǎn),并且在理論上都要安全撤離。
災(zāi)難恢復(fù)策略需要進(jìn)行定期的測(cè)試,以確保每個(gè)流程和系統(tǒng)都能正常工作。組織制定有效的災(zāi)難恢復(fù)計(jì)劃是目標(biāo),但是讓人放心的是,如果發(fā)生災(zāi)難,將會(huì)遵循該計(jì)劃。
4. 為不同級(jí)別的災(zāi)害做好準(zhǔn)備
災(zāi)難的類型和規(guī)模多種多樣,如果組織不做好準(zhǔn)備,有時(shí)一個(gè)小災(zāi)難就可能導(dǎo)致更長時(shí)間的停機(jī)。
良好的災(zāi)難恢復(fù)策略將對(duì)不同級(jí)別的災(zāi)難做出不同程度的響應(yīng),以確保較小的問題能夠讓負(fù)責(zé)的團(tuán)隊(duì)立即處理。
5. 采用云計(jì)算
并非所有基于云計(jì)算的災(zāi)難恢復(fù)系統(tǒng)都是以相同的方式工作。其中一些提供基于云計(jì)算的備份和恢復(fù),而其他一些則使用虛擬化來維護(hù)服務(wù)器和應(yīng)用程序的副本,數(shù)據(jù)從生產(chǎn)系統(tǒng)復(fù)制到虛擬化的故障轉(zhuǎn)移系統(tǒng)。
云計(jì)算災(zāi)難恢復(fù)具有其優(yōu)點(diǎn)和缺點(diǎn),但與許多基于云計(jì)算的服務(wù)一樣,它可以被廣泛使用,而無需備份和恢復(fù)硬件的前期投資成本。
6. 優(yōu)先考慮彈性
災(zāi)難恢復(fù)是IT服務(wù)組織希望永遠(yuǎn)不會(huì)被使用的服務(wù)之一。這就是為什么將彈性作為IT基礎(chǔ)設(shè)施中的指導(dǎo)原則很重要的原因。
確保基礎(chǔ)設(shè)施具有彈性,這需要良好實(shí)踐以及對(duì)技術(shù)和服務(wù)的投資,這些技術(shù)和服務(wù)既支持業(yè)務(wù),又可以最大程度地降低故障風(fēng)險(xiǎn)。
在追求彈性時(shí),最重要的原則是避免出現(xiàn)單點(diǎn)故障。如果關(guān)鍵應(yīng)用程序是在某臺(tái)服務(wù)器運(yùn)行的,并且只能在這臺(tái)服務(wù)器運(yùn)行,那么這就是一個(gè)潛在的弱點(diǎn)。
作為災(zāi)難??恢復(fù)策略的一部分,需要評(píng)估組織中硬件和軟件的彈性,并查看是否有任何需要改進(jìn)的地方。
部署故障切換設(shè)備、不間斷電源、備用發(fā)電機(jī)和備用服務(wù)器都有助于降低故障風(fēng)險(xiǎn)。
7. 評(píng)估安全實(shí)踐
安全本身是一個(gè)單獨(dú)的主題,但與災(zāi)難恢復(fù)策略有著千絲萬縷的聯(lián)系。從理論上來說,良好的安全措施將最大限度地降低災(zāi)難恢復(fù)計(jì)劃必須執(zhí)行的風(fēng)險(xiǎn)。
但是,作為全面災(zāi)難恢復(fù)策略的一部分,應(yīng)該評(píng)估安全性方面的潛在弱點(diǎn),并在必要時(shí)采取措施以加強(qiáng)安全措施,并制定應(yīng)對(duì)特定防御措施的計(jì)劃。
8. 修改和重新訪問
一旦組織災(zāi)難恢復(fù)計(jì)劃到位,就很容易擱置它。但是,隨著新技術(shù)的采用,新員工的加入以及企業(yè)內(nèi)部情況的變化,應(yīng)該對(duì)策略進(jìn)行修訂。
例如,如果實(shí)施了一項(xiàng)新的云計(jì)算技術(shù),則災(zāi)難恢復(fù)計(jì)劃應(yīng)更新為這一特定工具的特定策略,包括備份數(shù)據(jù)的方式和位置,以及如何恢復(fù)數(shù)據(jù)。
9. 建立關(guān)鍵的響應(yīng)團(tuán)隊(duì)
如果沒有使系統(tǒng)恢復(fù)所需的在線人員,就無法實(shí)施分步恢復(fù)策略。關(guān)鍵的響應(yīng)團(tuán)隊(duì)除了現(xiàn)有內(nèi)部人員外,還應(yīng)包括外部聯(lián)系人,例如軟件供應(yīng)商。
需要明確定義災(zāi)難恢復(fù)的角色和職責(zé),強(qiáng)調(diào)需要全面的文檔和培訓(xùn)。擁有更多分布式資源和專業(yè)知識(shí)的大型組織將發(fā)現(xiàn)自己更有能力執(zhí)行恢復(fù)計(jì)劃,因?yàn)樗鼈兛梢岳脕碜远鄠€(gè)位置的資源,具體取決于經(jīng)歷的災(zāi)難的類型和位置。
具有諷刺意味的是,此處的最佳實(shí)踐是組建備份團(tuán)隊(duì)。通過確保團(tuán)隊(duì)中的每個(gè)角色都有一個(gè)影子成員,在不合時(shí)宜的災(zāi)難情況下,組織仍有人可以介入以填補(bǔ)空缺的角色。
組織還必須考慮團(tuán)隊(duì)成員之間的溝通。通過多種方式與每個(gè)成員聯(lián)系,并在災(zāi)難恢復(fù)計(jì)劃上明確聯(lián)系方式,組織可以快速有效地做出反應(yīng)。