저희 회사는 주로 백업, HA, DR에 대한 고객사 니즈 분석 및 컨설팅과 그에 대한 솔루션을 제안 구축을 하고 있는 데이터보호 전문 파트너 입니다.

오늘은 “백업을 넘어 재해 복구를 향해"주제로 현재 다양한 환경으로 변화하고 있는 서버 환경을 보다 효과적으로 보호할 수 있는 재해 복구 방안과 그에 대해 최적화되어 있다고 생각되는 퀘스트 “래피드 리커버리(Rapid Recovery)"에 대해 설명 드리겠습니다.




먼저, 재해복구 솔루션이 필요하게 된 배경을 살펴 보겠습니다.
현재 서버환경은 많은 변화가 있었으며, 전통적인 온프레미스의 물리적 서버환경은 중요 업무관련 서버일수록 시스템는 매우 복잡하다는 문제를 가지고 있습니다.

또한 물리서버 환경과 더불어 혼재되어 있는 가상화 환경의 관리가 필요하며 나아가 일부 대외 서비스를 위한 클라우드상의 서버에 대해 보호 방법론을이 필요합니다.

그리고 이런 다양한 서버 환경의 보안 홀을 통한 랜섬웨어 감염에 따른 시스템 운영 중단 문제와, 급격한 자연 환경 변화에 따른 자연 재해와 인재사고 및 그리고 점점 노후화 되는 하드웨어의 장애등의 재해 포인트는 늘어가고 있습니다.

이러한 다양한 시스템 환경과 재해 포인트가 늘어 가는 상황을 대비하기 위해서는 가용성을 높일 수 있는 방법론이 반드시 필요합니다.




이런 시스템 가용성을 높이는 방법론은 크게 3가지를 들 수 있습니다.
먼저 첫번째 방법론은 백업 및 복구 입니다. 백업 및 복구는 다들 아시겠지만 원본 데이터를 다른 곳으로 복사 후 장애 발생시 복사본으로 원본을 회복시키는 방법입니다. 가장 보편적이고 일반적인 방법론입니다.

두번째는 HA 입니다. HA는 고가용성 솔루션 이라고도 하며 서비스의 연속성을 유지하는 방법 또는 솔루션이며, 장애 발생후 수분내 서비스 재개를 목표로 운영용 서버 2대를 Active 및 Stand By 형태로 구성 및 데이터를 실시간 복제를 수행합니다. 그리고 Active 서버가 장애 시 장애 대기 서버(Stand by)로 서비스를 재개 하게 됩니다.

세번째는 재해 복구(DR) 입니다. 재해 복구는 장애발생시 다운된 시스템을 정상으로 회복시켜 서비스를 재개하는 방법론입니다.

세가지 모두 가용성을 높이는 기술이지만, 이중에서 가장 포괄적 대처 방법론은 재해 복구 입니다. 어떠한 상황에서도 시스템 즉, OS 어플리케이션 데이터 모두를 회복시켜 서비스를 재개하는 것을 목표로 하게 되므로, 일부의 서버뿐만 아니라 전체 IDC센터가 대상이 될 수 있기 때문입니다.

그럼 재해복구(DR)라는 방법론에 대해 좀 더 알아 보도록 하겠습니다.




앞에서 살펴본 가용성을 높이는 방법론 중에서 HA를 제외한 백업과 DR의 개념은 거의 유사합니다. 백업은 장애 발생시 백업된 데이터를 원복하는 행위이며,재해복구(DR)은 시스템을 손실 전 상태로 회복시켜 서비스를 재개 하는 행위 입니다.

두가지 방법론은 장애 시 복구라는 의미는 같으나, DR은 앞서 말씀드렸듯이 좀 더 포괄적인 개념을 가지고 있습니다. 백업은 로컬 내 일부 데이터 또는 시스템이 대상이지만, DR은 전체 전산환경을 대상으로 하여 어떤 상황에서든 서비스를 재개하는 것이 목표입니다.

그러나 이러한 DR 관련 기술은 다양한 문제점을 가지고 있습니다. DR 사이트 구성시 동일한 시스템을 구성해야 하고, 원거리의 복제를 위한 구현의 복잡성을 들 수 있으며, S/W 라이선스 추가 및 이러한 구성을 위해 과도한 비용 투자 또한 문제 입니다.
이렇게 구성한 DR센터가 효율적으로 운영이 되어야 하는데, 현실적으로는 삼성SDS의 IDC센터 화재사건과 같이 장애 발생시 정상적인 재해복구 기능을 통한 서비스 재개가 가능한가라는 의구심은 해결해야할 과제 중 하나 입니다. 삼성과 같이 서비스 재기동의 의구심도 들 수 있습니다.

그럼 효과적인 DR 방안은 없을까요? 저는 이 문제를 해결을 할 수 있는 가장 단순한 방법이 비용 효율적이고 쉽고 빠르고 정확한 시스템(OS)이미지 백업이 될 수 있다고 생각합니다.



왜 제가 재해복구에 적합한 솔루션이 이미지 백업 솔루션이라고 하는지 궁금하실 것 같습니다. 그 부분을 이해하기 위해 먼저 두가지 백업 방식에 대한 비교 및 오해를 알아 보겠습니다.

먼저 이미지 백업 솔루션은 구동 방식이 간결하고 운영이 쉽다라는 장점과 시스템 즉, OS, APP. DATA 전체를 백업 및 복구할 수 있어 최악의 상황에서 빠른 서비스 재개가 가능한 장점을 가지고 있습니다. 그에 반면 데이터 백업은 구동방식이 다양하고 세밀하여 운영이 어렵고, 시스템 전체 복구가 어려워 전체 시스템 장애시 다운 타임이 길어 질 수 있습니다.

하지만, 데이터 백업 솔루션은 Windows 및 Linux 와 유닉스 등 다양한 OS 및 매우 다양한 DB 어플리케이션을 지원하므로, 광범위한 데이터 보호가 가능하며 복원이 가능합니다. 또한 복원 시 데이터 개체단위 즉, DB 테이블 단위까지의 복구가 세밀하게 가능하여 일부 데이터 손실시 빠른 복원이 가능합니다.

그런 반면 이미지 백업은 Unix OS 지원을 할 수 없는 제약이 있습니다. 하지만 이미지 백업 솔루션을 시스템 백업 및 복원을 할 수 있는 기능만으로도 재해복구에는 많은 이득을 얻을 수 있습니다.

그 밖에 이미지 백업 솔루션에 대한 인식 오류에 대해 알아 보겠습니다.

제일 많이 듣는 내용이 이미지 백업 솔루션은 데이터 단위로 복구 못한다 라는 것입니다. 하지만 이런 내용은 사실이 아닙니다. 이미 수년전부터 이미지 백업 솔루션은 시스템 복원 뿐만 아니라, 파일 및 VM단위 메일 단위 등으로 복원이 가능한 기능을 포함하고 있습니다.

두번째 오해는 이미지 백업 솔루션은 DB 백업에 대한 정합성을 보장 하지 못하고 복구도 못한다 라는 인식입니다. Windows 환경의 이미지백업의 경우에는 기본적은 Windows 내에 포함되어 있는 VSS(Volume Shadow Copy Service)라는 MS가 제공하는 백업API를 사용하여 시스템 백업을 하게 되어 있습니다. VSS는 MS가 자신들의 OS 및 어플리케이션을 백업 시 복구를 보장하는 기술입니다. 더불어, 이미지 백업 솔루션 내에는 MS-SQL 및 Oracle 백업 정합성 검사를 통한 복구 보장을 해주는 기능이 포함되어 있습니다.

이러한 두가지 기능을 바탕으로 리커버리 포인트를 어제 날짜로 복구 시 시스템 및 DB는 100% 복구 및 서비스 재개가 가능합니다.

세번째 오해는 이미지 백업 솔루션은 가상화 환경 백업 지원이 약하다 라는 것입니다. 하지만 이미 수해 전부터 이미지 백업 솔루션은 Hyper-V 및 VMware 환경에 대한 백업을 기본 지원 하고 있으며, VM 단위 백업 및 파일 단위 복구 기능을 기본 지원 하고 있습니다.
마지막 오해는 데이터 백업 솔루션에 있는 데이터 중복제거 기술과 원거리 복제 기능이 없거나 취약하여 재해 복구 환경 구성에 이미지 백업은 적합하지 않다라는 편견입니다.

이 또한 이미 이미지백업 솔루션은 중복제거기술 및 중복제거 저장소 기능을 기본 포함하고 있고, 대표적인 데이터 백업솔루션인 넷백업에 포함되어 있는 AIR 기능과 같이 WAN 최적화 복제 기능을 통한 빠른 원격지로의 백업데이터 복제가 쉽게 가능합니다.

현재 출시되어 있는 이미지 백업 관련 솔루션은 많이 있습니다. 위에서 기술한 기능 중 일부만 포함되어 있는 제품도 있고, 전체 기능을 포함하고 있는 제품들도 몇 가지가 있겠습니다.

저희 회사는 다양한 관련 솔루션을 테스트하고 실제 환경에 배포 및 운영을 하고 있고, 그에 따른 경험을 바탕으로 위와 같은 재해복구 시나리오에 가장 최적화 되어 있는 솔루션은 퀘스트의 “래피드 리커버리(Rapid Recovery)” 라고 생각합니다. 해당 제품은 이미 다양한 재해복구 환경에서 뛰어난 효과를 입증하고 있고 그에 대한 수상내역이 많은 솔루션으로 어느정도 인지도가 있고 해당 재해복구 분야에서는 안정성을 입증한 제품이기 때문입니다.


해당 제품은 윈도우 및 리눅스 시스템 백업 및 DR 구축 솔루션으로 기본적인 시스템 백업 및 복구 기능 외에 재해복구를 위한 원거리 데이터 복제 기능과, 백업 소산을 위한 아카이브 기능 및 언제 어디서든 관리할 수 있는 통합 웹관리 콘솔을 제공합니다.



기본적으로 백업은 이미지 스냅샷 백업 기술을 사용하여, 저장 공간 및 백업 I/O를 최소화 시켰으며, 특히 초기 1회 풀 백업 이후에는 영구 증분 백업방식(Forever Incremental)으로 백업 함으로써 백업의 효율성을 극대화 시켜, 매우 빠른 백업이 가능합니다.



원본 데이터는 중복제거 및 압축되어 백업 스토리지에 저장됩니다. 또한 백업 저장소에 저장되는 다른 서버의 데이터와도 중복 제거되는 글로벌 중복제거 기능을 사용함으로써, 백업 저장소의 효율성을 극대화 시킬 수 있습니다.



그리고, 백업된 이미지 백업 데이터는 어떠한 상황에서도 복구가 합니다.
즉, 원본서버로의 시스템 복구 뿐만 아니라, 전혀 다른 이기종 하드웨어 서버로의 복구, 가상화 환경과 더 나아가 클라우드 환경으로 복구가 가능 합니다. 이러한 복구 시나리오를 통해 원본 서버의 장애 발생시 언제 어디서든 서비스를 재개할 수 있는 복구 시나리오 가능합니다.


또한 백업된 데이터는 매일 밤 자동 정합성 검사를 통해 실제 백업된 데이터가 정상인지, 그리고 복구가 가능한지를 확인 합니다. 이러한 자동화된 복구 정합성 검사 기능을 통해 보다 안정된 복구 환경의 입증을 고객에게 할 수 있습니다.



백업 데이터가 백업서버의 장애로 인한 손실에 따른 대비책은 아카이브 기능을 통해 가능합니다. 아카이브는 백업 데이터를 원격의 NAS 또는 클라우드에 복사 및 저장하는 기능으로 1차 백업본 장애 시 아카이브 저장소의 백업 데이터를 통해 원본 서버 시스템을 복구 시킬 수 있어, 기본 권장되는 기능 입니다.


다음 설명 드릴 기능인 “Virtual Standby” 기능을 주목하여 주십시요. 해당 기능은 래피드 리커버리의 기능 중 가장 가치가 높은 기능이며, DR 사이트 구축에 매우 효과적인 기능입니다.

Virtual Standby 기능은 자동으로 백업된 데이터를 하이퍼바이저 가상환경으로 P2V 하여 VM을 생성해주는 기능으로, 백업 즉시 자동으로 증분 P2V를 통해 VM이 지속 업데이트 됩니다. 이러한 상황에서 원본 서버 장애 시 Stand By 중인 VM을 가동하여 즉시 서비스 재개를 시킴으로써 RTO(Recovery Time Objective) 를 획기적으로 단축 시킬 수 있습니다.

이러한 환경은 VMware 및 Hyper-V 뿐만 아니라, MS Azure 클라우드 환경을 지원함으로써 유연한 DR 사이트 구축이 가능 해집니다.


앞에서 말씀 드린, Virtual Standby 기능으로 장애 발생 서버의 즉각적인 서비스 재개가 가능합니다. 하지만 본사 또는 IDC 전체가 재해에 따른 재난상황이 발생했을 때에는 복구가 사실상 불가능합니다. 이러한 어떤 재난 상황을 모두 대비 하기 위해서 보통 금융사와 대기업은 원격지에 DR 사이트를 구축하는 것이 일반적입니다.

원격지 DR사이트 구축 시 가장 큰 문제는 대용량 원본 백업 데이터를 원격지로 복제하는 것입니다. 이러한 문제를 래피드 리커버리(Rapid Recovery)에서는 원거리 복제 기능에서 해결 할 수 있습니다. 먼저 백업 시 데이터는 중복 제거되어 백업 서버의 백업저장소에 저장됩니다. 초기 1회 복제시에는 Full 복제가 필요하므로, 복제서버를 백업서버와 같은 LAN에 구성하여, Full 복제 합니다. 이후 복제서버는 DR사이트에 위치 후 증분 백업에 대한 복제가 중복제거 및 압축되어 WAN 상에서 매우 빠른 복제가 가능합니다.



앞에서 말씀 드린 Virtual Standby 기능과 WAN 복제 기능을 조합하면, 비용 효율적이면서도 매우 빠른 원격지 DR 구성이 가능합니다.
즉, 운영사이트에서 백업서버로 중복제거 백업 후 WAN상에서 압축 및 중복제거를 통한 원격 DR 사이트로 복제 이후 DR 사이트에 있는 하이퍼바이저 가상환경으로 자동 P2V를 구현합니다. 이러한 복잡한 과정이 래피드 리커버리(Rapid Recovery)에서는 하나의 일련 작업으로 매우 단순하게 구성이 가능하며, 장애 발생시 VM을 통한 즉각 서비스 재개가 가능한 가상화 DR 센터 구축이 가능합니다.
저희 회사는 Virtual Standby 및WAN 최적화 복제 기능을 통해 DR사이트를 해외에 구축한 경험이 있습니다.



최종 정리하여 말씀드리면, 래피드 리커버리(Rapid Recovery)는 빠르고 쉬운 백업 방식과 다양한 복구 방법론을 제시하여 매우 쉬운 DR 환경 구축이 가능한 재난복구 솔루션이다 라고 생각 하시면 되겠습니다.

저의 기고문이 이번에는 특정 제품의 제품 소개를 한 부분이 있지만, 도입부에 언급한 재해복구 솔루션의 필요성에 대해서는 다시 한번 고민을 해보시고 꼭 해당 제품이 아니더라도 효과적인 재해복구 방안을 마련하시길 바랍니다. 긴 글을 읽어 주시느라 고생하셨습니다.