재해복구(DR)의 재발견 By 팔콘스토어

재해복구(DR)의 재발견,

원 클릭 DR, 모의 훈련 자동화, 운영계에 부담을 주지 않는 데이터 분석과 리포팅

Part 1. 멀티 사이트 DR 환경에서의 복구 및 모의 훈련 자동화

Part 2. 운영계에 부담을 주지 않는 데이터 분석과 리포팅

사이버테러가 급증하면서 정보보호 관리체계(ISMS) 인증에 대한 기업과 정부 기관의 관심이 커지고 있습니다. 더불어 ISMS의 한 축인 재해복구(DR)도 새로운 관점에서 접근하는 곳이 늘고 있습니다. 대규모 사이버테러의 경우 기업이나 기관 전체를 마비시키는 파괴력을 갖다 보니 몇몇 중요 시스템이 아니라 모든 비즈니스를 실시간으로 보호하는 것에 대한 중요성에 공감을 하는 것입니다. 이런 흐름에 맞추어 최근 멀티 사이트 DR과 형식적 훈련이 아니라 실제 데이터를 가지고 모의 훈련을 하는 방법을 소개하겠습니다. 더불어 DR 센터를 활용한 데이터 분석과 리포팅에 대해 소개하겠습니다.

글. 팔콘스토어 김광정 이사 ([email protected])

 

Part 1. 멀티 사이트 DR 환경에서의 복구 및 모의 훈련 자동화

지리적으로 분산된 곳에 시스템을 운영하는 조직에게 DR 구축은 매우 부담스러운 과제입니다. 여러 곳의 시스템을 동일한 장비와 구성으로 백업센터에 통합하려면 많은 시간과 자본이 투입됩니다.

사이트를 구축해도 문제입니다. 통합 센터는 단일 센터보다 관리가 까다롭습니다. 이런 고민을 푼 A기관의 사례를 소개합니다. A기관은 정부 주요 부처 중 하나로 전자정부 정보보호체계 준수의 일환으로 멀티 사이트 DR을 구축하고 시뮬레이션이 아닌 실제 데이터를 가지고 정기 모의훈련을 실시하고 있습니다.

이기종 환경의 멀티 사이트 DR

A기관은 iSCSI, FC, FCoE 등 다양한 프로토콜을 지원하는 팔콘스토어 NSS로 기존에 사용하던 이기종 스토리지 자원을 활용해 멀티 사이트 DR을 구축했습니다.

A기관은 미션 크리티컬한 지역의 경우 스토리지 이중화로 물리적 안정성을 확보했습니다. 그리고 통합 DR 센터에 스탠바이 서버 풀과 팔콘스토어 NSS로 묶은 이기종 스토리지 풀을 구축했습니다. 각 지역과 통합 DR 센터를 연결해 지속적인 복제가 이루어지도록 해 논리적으로 30분 내 복구가 가능하도록 했습니다.

1

 

전문 엔지니어 없이도 10분 내 DR 센터 가동

A기관은 장애나 재해로 운영권이 통합 DR 센터로 넘어올 때 10분 내 업무를 이어 받을 수 있길 원했습니다. 문제가 발생한 곳에서 재해를 선포한 후 10분내 통합 DR 센터가 가동되도록 하려면? 어떤 담당자가 근무하건 외부에 도움 요청하지 않고 바로 처리할 수 있어야 한다고 생각했습니다.

답은 GUI 관리자 화면에서 마우스 클릭 몇 번이면 서비스가 재계 되도록 하는 ‘자동화’가 필요했습니다. A기관은 팔콘스토어의 RecoverTrac을 사용해 전문 엔지니어 도움 없이 누구나 위급 상황에 대처할 수 있도록 했습니다.

2

자동 역복제로 사이트 정상화 후 추가적인 복제 필요 없어

A기관은 문제가 생긴 사이트가 정상화 되어 재해 종료를 선포한 후 통합 DR 센터가 가동된 후 변화된 데이터를 해당 사이트로 복제하는 것도 자동화 되길 원했습니다.

과거 경험에 비추어 볼 때 재해 종료 후 역복제에 너무 많은 시간이 걸릴 경우 정합성 보장이 너무 어렵다는 것을 잘 알았기 때문입니다. 참고로 일반적인 DR 솔루션은 장애나 재해 발생 후 DR 센터가 서비스를 이관 받은 후 변화되는 데이터를 사이트 정상화 후 가져올 때 전체 데이터를 대상으로 역복제를 수행합니다.

팔콘스토어의 RecoverTrac은 GUI 화면 상에서 재해 종료를 선택할 수 있습니다. 이를 선택하면 10분 내 DR 센터에서 원 사이트로 운영권이 10분 내 넘어 갑니다. 변동된 데이터에 대한 역복제나 정합성 보장 작업도 필요 없습니다. 재해 선포 후 DR센터 가동 때부터 자동으로 변동된 내용에 대한 역복제가 자동으로 이루어지기 때문입니다.

 

실제 운영 데이터로 모의 훈련 시행

A기관은 년간 4회 가량 DR 모의 훈련을 합니다. A기관의 모의 훈련은 시뮬레이션이 아닙니다. 실제 운영 환경에서 실 데이터를 가지고 합니다.

이게 가능한 것은 팔콘스토어의 RecoverTrac이 있기 때문입니다. 복구 절차가 자동화 되어 있고 훈련 후 따로 역복제를 할 필요가 없어 실제 환경에서 모의 훈련이 가능한 것입니다.
A기관은 모의 훈련 시 재해 선포를 한 후 각 지역 전산실 서비스를 중지합니다. 그리고 통합 DR 센터에서 8시간 정도 실제 운영을 합니다. 이후 각 사이트를 정상화 합니다.

이 작업을 할 때에도 외부 전문 엔지니어의 도움은 필요 없습니다. 각 지역 전산실 담당자들은 VPN을 통해 통합 DR 센터에 접속해 실제 훈련에 참여합니다.

Part 2. 운영계에 부담을 주지 않는 데이터 분석과 리포팅

백업과 복구 기술은 이제 데이터 분석의 영역에서도 그 쓰임이 활발합니다. 최근 기업들의 DR 센터에는 중요한 업무 대부분이 복제 됩니다. 복제 방식 역시 큰 비용을 들이지 않아도 실시간에 가까운 복제가 가능하기 때문에 거의 주센터에 있는 기간계 시스템과 시차가 거의 없습니다. 이런 이유로 최근 DR 센터로 복제되는 기간계 데이터를 대상으로 데이터 분석과 리포팅 시스템을 구축하는 기업들이 늘고 있습니다. 주센터에서 매일 업무 시간 후 배치(Batch) 작업을 거친 후 데이터 분석 플랫폼으로 데이터를 가져오려면 아무래도 부하가 발생합니다. 또한 OLTP 관련 보고서 생성 역시 부하가 생깁니다. 하지만 팔콘스토어 CDP를 활용해 지속적인 복제를 수행할 경우 주센터에 있는 시스템에 걸리는 부하 걱정을 할 필요가 없습니다.

DR 센터를 바라보는 데이터 분석과 리포팅

 
운영 중인 기간계에서 분석을 위한 원천 데이터를 뽑는 데 드는 부하가 없다면? DR 센터에 실제 운영계와 동일하게 복제되어 있는 기간계 시스템을 대상으로 데이터 추출 작업을 하면 됩니다.

이 경우 두 가지 측면에서 부하가 줄어 듭니다. 첫 번째는 데이터 추출입니다. DR 센터에 있는 시스템은 실제 운영 중인 시스템이 아닙니다. 따라서 부하 걱정을 할 필요가 없습니다.

두 번째는 리포팅 입니다. OLTP(Online Transaction Processing) 시스템에서 리포트를 뽑기 위해 데이터를 참조하는 것 역시 부하가 걸립니다. 이 역시 실제 운영 시스템이 아니라 DR 센터에 복제되어 있는 시스템을 이용한다면 부하 분산을 할 수 있습니다.

아래 그림은 전통적인 OLTP 성 시스템에서 데이터를 뽑아 데이터 분석 플랫폼과 리포팅 서비스에서 처리하는 절차입니다. 이 모든 절차를 처리함에 있어 부하 걱정이 없다는 것이 DR 센터를 분석의 대상으로 바라보는 것이 갖는 이점입니다.

aaa

 

멀티 사이트 데이터 통합에도 유리

지리적으로 떨어진 곳에 전산실을 운영하는 곳이라면 DR 센터에 데이터 분석 플랫폼을 구성하는 것이 데이터 통합 측면에서도 유리합니다.

1:N이 멀티 사이트를 대상으로 한 통합 DR 센터를 구축하면 여러 곳에 흩어진 데이터를 단일 지점으로 통합할 수 있습니다. 이처럼 단일 지점에 데이터 통합이 일어 난다면 데이터 분석이나 리포팅 서비스를 위한 데이터 추출을 위해 EDW와 같이 복잡하고 비용이 많이 드는 방법을 쓰지 않아도 됩니다.

DR과 데이터 분석을 별개의 것이 아니라 데이터 관점에서 보면 좀더 간단한 데이터 통합 방안이 분명 존재합니다.

제대로 된 스냅샷 기술의 선택이 관건

 
데이터 분석 플랫폼이 DR 센터를 데이터 소스로 바라보게 설계 하는 가장 중요한 이유는 결국 부하를 줄이고 혹시 모를 운영계 시스템에 끼칠 영향을 최소화 하기 위해서 입니다.

그렇다면 이런 구성을 할 때 어떤 점을 주의 깊게 살펴야 할까? 바로 스냅샷 기술입니다. 스토리지, 백업 솔루션 등 스냅샷 기술을 제공하는 곳은 많습니다. 하지만 제대로 된 구성을 갖추었는지 여부는 업체마다 차이가 분명히 납니다. 스냅샷 기술을 데이터 분석에 활용하고자 한다면 실시간성, WAN 최적화 기반 복제 두 가지 요건을 충복시켜야 합니다.

참고로 실시간성 보장이 중요한 데이터 분석을 감안할 때 DR 센터에 데이터 분석 플랫폼을 구축하고자 할 때 소스 데이터 시스템과의 복제는 CDP/NSS의 기술이 적합합니다.

팔콘스토어 CDP/NSS는 기업에서 쓰는 주요 ERP, CRM 등 주요 시스템에 대한 스냅샷 에이전트를 제공하고, 볼륨 당 최대 1,000개의 스냅샷을 저장할 수 있으며 continuous 복제 또는 delta 복제를 제공합니다. 이는 주센터와 DR센터 간 데이터 동기화 시차를 최소화 할 수 있음을 뜻합니다.

데이터 정합성 걱정을 할 필요가 없습니다. 여러 위치와 애플리케이션을 대상으로 스냅샷 작업을 동시에 처리할 수 있는 기능(consistency group)을 지원하기 때문에 운영계 전체 시스템에 대한 백업 데이터의 정합성 유지도 가능합니다.

다음으로 DR 사이트의 경우 원격지에 위치하는 경우가 많기 때문에 대역폭을 효율적으로 사용하는 것이 중요합니다. 또한 개인정보보호 등의 이유로 암호화 적용 대상 데이터가 늘고 있는데 무거운 데이터를 효율적으로 전송하는 하는 것도 필요합니다. 팔콘스토어 CDP/NSS는 스토리지 레벨에서 비중복 섹터만 원격 복제하는 WAN 최적화 전송기술을 제공해 대역폭에 대한 절감요구도 충족시킵니다.

4444

 

추가적인 재해복구(DR)이나 백업 또는 팔콘스토어 제품에  문의사항이 있으신 분은 댓글로 문의해 주세요 🙂

글. 팔콘스토어 김광정 이사 ([email protected])

!!! 쉐어드IT는 기업전산관리자들과 IT기업 종사자들간의 건전한 소통의 장이 되고자 노력하고 있습니다. 본 칼럼은 아무런 경제적 대가 없이 순수한 의도로 제공받은 글임을 알려드리는 바이며 전산과 관련된 유익한 글을 제공하고 싶으신 IT기업 회원께서는 [email protected] 로 연락 주시기 바랍니다.

 

  

 

About SharedIT

SharedIT

Leave a Reply

첫번째 댓글을 작성해 주세요.

메일 알림 설정
wpDiscuz