참고: 이 내용은 2022. 5. 4에 게시된 컨텐츠(Business Continuity in the Cloud Era: 5-Step Disaster Recovery Plan)에서 번역되었습니다.

비즈니스 연속성은 매우 중요합니다. 비즈니스 운영은 데이터에 대한 액세스와 이를 통해 얻을 수 있는 통찰력에 의존하며, 예측 불가능한 이벤트의 급증으로 인해 보장하기가 더욱 어려워진 필수 사항입니다. 인적 오류, 정전, 날씨 패턴의 변화에서 광범위한 하드웨어 오작동에 이르기까지 모든 것이 ‘재해’를 의미할 수 있으며, 이로 인해 기업의 컴퓨팅 능력과 고객 및 인력에게 서비스를 제공할 수 있는 능력이 중단될 수 있습니다. 

더 많은 데이터 워크로드가 클라우드로 이동함에 따라 오래된 플레이북을 재고해야 합니다. 클라우드 시대에 맞게 기존 백업 및 복원 계획을 수정해야 합니다. 기업의 준비 여부에 관계없이 재난이 닥칠 것이므로 사전에 철저하고, 테스트되고, 조정된 전략을 개발하는 것이 필수적입니다. 

다음은 재해 복구 및 비즈니스 연속성 계획을 수행하기 위한 다섯 가지 단계이며, 각 단계에는 실행 가능한 모범 사례와 매개 변수가 포함되어 있습니다. 

1단계: 잠재적 위험 유형 설명

먼저 회사에서 발생할 수 있는 잠재적인 장애에 대해 파악하는 것이 중요합니다. 시간을 내어 모든 조직에서 가장 일반적인 위험을 평가하여 시간과 노력이 가장 필요한 곳을 확인하십시오. 

가장 일반적인 다섯 가지 유형의 장애는 인적 오류, 단일 인스턴스 장애, 영역 장애, 영역 장애 및 다중 영역 장애입니다. 가용성 영역, 내장된 중복 및 클라우드 간 복제를 통해 이러한 문제를 해결할 수 있습니다. 

조직의 잠재적 위험과 과제를 평가했으면 이제 기본 스토리지 및 보조 스토리지의 영역을 선택해야 합니다. 복제라고 하는 기본 및 보조 영역을 동기화하면 모든 수준에서 실패 위험을 줄일 수 있습니다. 영역을 선택할 때는 다음 매개 변수를 고려하십시오.

  • 단일 클라우드 전략과 멀티 클라우드 전략 중 하나를 결정합니다.
  • 재해가 양쪽 모두에 영향을 미치지 않을 만큼 멀리 떨어진 지역을 선택하십시오.
  • 어떤 데이터를 저장 중인지, 지역 규정이 적용되는지 여부를 고려하십시오.
  • 좀 더 경제적인 지역 및 클라우드 공급자 전반으로 소비를 이전하는 것을 고려하십시오.
  • 지역별로 최고의 클라우드 공급자를 활용하려면 지역별 발자국을 활용하십시오.
2단계: 다양한 위험의 영향 및 대응 방법 고려

이제 조직에 미칠 수 있는 잠재적인 위험에 대해 설명했으므로 이러한 위험이 비즈니스에 어떤 영향을 미칠 수 있는지 평가하고 데이터 중단에 대해 적시에 대응하기 위한 계획을 수립해야 합니다. 먼저 운영 중단이 각 이해관계자에게 미치는 비즈니스 영향을 수량화하는 것부터 시작하겠습니다. 다음과 같은 질문을 할 수 있습니다. 일일 판매 보고서가 지연되거나 재고 대시보드가 예정대로 새로 고쳐지지 않으면 어떻게 됩니까? 어떤 데이터가 중요 애플리케이션 또는 클라이언트 기반 애플리케이션을 지원합니까? 

한 가지 중요한 단계는 비즈니스 사용 사례를 중요도에 따라 순위를 매기는 것입니다. 각 사례를 RTO(복구 시간 목표), RPO(복구 시점 목표) 및 세분화 측면에서 어떻게 비교합니까? 이 연습은 각 실패 시나리오를 해결하는 비즈니스 연속성 계획을 수립하는 데 도움이 됩니다.

접근 방식에 따라 어떤 조치를 취해야 하는지, 장애 조치를 시작하기 전에 애플리케이션 팀에 어떻게 알려야 하는지, 어떤 종속 시스템을 활성화해야 하는지, 그리고 계획을 수정하기 위해 이러한 답변을 이해 관계자에게 어떻게 공유해야 하는지 등이 결정됩니다.

마지막으로 재해 복구 훈련을 자주 실행하여 엔드 투 엔드 장애 조치 계획에서 가장 취약한 링크를 식별해야 합니다. 가정은 모든 실패의 어머니입니다.

3단계: 규칙, 역할 및 책임 지정

누가 어떤 데이터를 사용할 수 있고 누가 데이터에 액세스할 수 있는지 결정하는 잘 정의된 계층은 재해 발생 시 필수적인 요소입니다. 문제가 발생하기 전에 어떤 데이터베이스를 보호할 것인지, 기본 백업 센터 역할을 할 지역이 어디인지, 일부 수준의 데이터에 액세스할 수 없는 경우 누가 이러한 거버넌스 결정을 내릴 것인지를 결정해야 합니다. 

복구 또는 장애조치가 진행되는 동안에도 동일한 사항이 적용됩니다. 인증 도구는 이러한 어려운 시기에 생명을 구할 수 있으며, 가장 성공적인 비즈니스 연속성 계획은 모든 형태의 인증을 지원합니다. 이 기간 동안 액세스 및 권한을 유지하는 작업은 4단계로 수행될 수 있습니다.

  • 여러 계정에서 역할 기반 액세스 제어를 일관되게 유지하십시오.
  • 계정 간에 데이터 마스킹 정책을 일관되게 동기화하십시오.
  • 여러 복제본에 걸쳐 리소스 할당을 유지하고 소비를 관리하십시오.
  • 특정 시점 일관성을 확보하십시오.
4단계:비즈니스 연속성에 대해 비용의 진정한 범위 평가하기

비즈니스 연속성을 위한 예산 편성은 어려워 보일 수 있습니다. 첫 번째 단계는 운영 중단 시 회사의 최소 요구 사항(즉, RPO)을 설정하는 것입니다. 두 가지 주요 비용 원인은 복제될 데이터베이스 수와 복제 빈도입니다.

고려해야 할 몇 가지 질문은 다음과 같습니다. 반드시 운영을 지속해야 하는 부서 및 팀은 어디입니까? 기업에서 일정 기간 동안 없어도 되는 부서 및 팀이 있습니까? 얼마나 많은 데이터를 손실할 수 있으며, 얼마나 오래 손실할 수 있습니까?

예산 결정에 영향을 줄 수 있는 기타 유용한 조치로는 업계의 잠재적 취약성 검사, 가장 중요한 데이터 결정, 운영 중단 비용 측정을 위한 실제 테스트 실행 등이 있습니다.

5단계: 긴급 사태 대책을 통해 성과를 거둘 방법 탐색

비즈니스 연속성은 단순히 재해에 대비한 계획 방법일 뿐만 아니라 데이터 공유, 협업 및 통찰력을 통해 성능을 향상하는 방법이 될 수 있습니다. 

일부 복구 시스템은 기업이 필요할 때까지 휴면 상태에 있지만, 더 많은 작업을 수행하는 시스템이 등장하고 있습니다. 일부 시스템은 복구 활용 여부에 관계없이 ROI가 명확한 가치 창출 자산 역할을 합니다. 또한 사일로를 제거하려는 기업의 경우 이러한 시스템을 통해 페타바이트 단위의 데이터를 신속하게 이동하고 증분 동기화를 유지할 수 있습니다.

복구 시스템으로 복구뿐만 아니라 그 이상을 수행할 수 있습니다. 최상의 비즈니스 연속성 계획 수립에 대한 추가 지원은 클라우드에서 5단계로 성공적인 비즈니스 연속성 전략을 구축하는 방법을 참조하십시오. 보다 자세한 단계, 다이어그램 및 모범 사례를 볼 수 있습니다.