백업S/W의 중복제거 스토리지 엔진 vs 중복제거 어플라이언스 장비 비교

매번 오랜만입니다.  먹고 사는게 바쁘다 보니,  인사드리기가 없습니다. 이번에도 인기없는 백업 이야기 입니다. 저희회사 수석엔지니어분이 기고할 내용을 올려 봅니다.

 

들어가면서

중복제거 스토리지라는 하드웨어와 소프트웨어를 이용한 중복제거 기술을 사용하는 것과의 차이점이 과연 무엇이 있을까란 궁금증이 중복제거를 접해본 분이라면 한번쯤 고민을 해봤을 사항인 듯 합니다. 엔지니어 입장에서 저 또한 그러한 궁금증을 가지고 있었으며, 우연한 기회에 두 개의 스토리지를 비교할 수 있는 기회가 되어 리뷰를 작성하게 되었습니다.

하드웨어 중복제거 스토리지는 DR4000 이라는 DELL 사의 하드웨어를 이용하였고, 소프트웨어 중복제거는 Backup Exec 2014 를 이용하여 소프트웨어 적인 중복제거를 이용하여 두 개의 제품을 비교하였습니다.

 

1. 클라이언트단 중복제거 기능소개

클라이언트단 중복제거는 백업 받는 서버의 CPU 및 메모리를 이용하여 중복되는 데이터에 대한 중복제거 처리를 한 후 중복되지 않는 데이터만 저장소로 넘기는 작업입니다. 해당 작업의 장점은 전체 백업을 하더라도 새로운 데이터만 저장소로 넘기기 때문에 네트워크 리소스의 사용률을 적게 이용할 수 있습니다. 대신 백업 받는 서버의 CPU 및 메모리를 사용하여 중복 제거를 사용하기 때문에 해당 서버의 기타 어플리케이션의 CPU 및 메모리 사용률이 낮을 경우 권장하는 백업 방법 입니다.

DR4000(중복제거 어플라이언스)을 이용하여 클라이언트 중복제거를하는 경우 데이터의 이동 경로는 아래 그림을 참고하시기 바랍니다.
백업시 위와 같은 이동 경로로 데이터가 저장되며, Client Server 에서 이동 되는 데이터는 중복제거 된 데이터이며, DR 4000 장비에서 이동되는 정보는 백업된 서버, 드라이브, 폴더 및 파일 이름 같은 Catalog 정보가 Backup Exec 2014로 저장되게 됩니다.

Backup Exec 2014(소프트웨어 중복제거 엔진)을 통한 클라이언트 중복제거를 이용하는 경우 데이터의 이동 경로는 아래 그림을 참고 하시기 바랍니다.


백업 S/W 사용시 위와 같은 이동 경로로 데이터가 저장되며, Backup Exec 2014에서는 데이터를 저장소에 저장하는 기능과 catalog 정보를 저장하는 기능을 동시에 처리하게 됩니다.

그럼 DR 4000과 Backup Exec 2014를 이용하여 클라이언트 중복제거 백업 시 비교한 표를보도록 하겠습니다.

Client 중복 제거

Client->dr4000으로 데이터 전송

저장소

네트워크 환경

1차 백업 속도

2차 백업 속도

RDX 8000으로
복제 속도

Client 평균 CPU 사용량

Master 평균 CPU 사용량

Client 평균 메모리 사용량

Master 평균 메모리 사용량

DR 4000(Open Storage)

기가비트 허브

5,067MB/분

8,445MB/분

1,686MB/분

13.03%

0.08%

373MB

48MB

마스터 중복제거 저장소

기가비트 허브

4,794MB/분

9,236MB/분

1704MB/분

9.45%

2.96%

233MB

887MB

 

DR 4000으로 최초 전체 백업의 경우 분당 5,067MB(시간당 304GB 백업)의 속도를 보여 주었으며,

2차 백업부터 본격적으로 Client 에서 중복제거 후 스토리지로 저장되며 이 때의 속도는 분당 8,445MB(시간당 506GB 백업) 의 속도가 나타났습니다. Client에서 사용된 CPU는 평균 13%를 사용하였으며, 메모리는 373MB 정도를 사용한 것을 볼 수 있습니다.

반면 Backup Exec 2014 자체 중복제거를 이용한 최초 전체 백업의 경우 분당 4,794MB(시간당 287GB 백업), 2차 백업 시에는 분당 9,236MB(시간당 554GB 백업)의 속도가 나타났습니다.

테스트 결과의 숫자상으로 본다면, 클라이언트 중복제거 시에는 Backup Exec 2014(백업소프트웨어 중복제거엔진)를 이용하여 백업하는 것이 Client의 CPU 소모를 줄이면서도 더 빠르게 백업이 되는 것을 볼 수 있습니다.

이와 같은 결과는 Client에 DR4100(중복제거 스토리지) 연결에 필요한 Open Storage의 플러그인을 설치 후 Backup Exec Agent와 호환을 이뤄 중복제거 작업을 진행 하는 것 보다 Backup Exec Agent의 서비스가 단독으로 중복제거 처리를 하는 것이 처리 속도를 더욱 끌어 올릴 수 있다는 결과로 보여집니다.

 

2. 마스터단 중복제거

마스터단 중복제거는 Client에서 일단 모든 데이터를 백업서버로 가져온 후 백업서버에서 중복되는 데이터를 제거하여 스토리지로 보내는 방식입니다.

클라이언트단 중복제거보단 네트워크 소모율이 많지만, 소스단의 CPU 및 메모리를 사용하지 않기 때문에 백업이 실행 시 Client에 영향을 덜 받게 백업할 수 있습니다.

Client의 성능이 좋지 않거나 백업 시 기타 어플리케이션 서비스에 영향을 끼치는 경우 이러한 백업 방법을 사용하게 됩니다.

DR4000(중복제거 어플라이언스)을 이용하여 마스터단 중복제거를를 하는 경우 데이터의 이동 경로는 아래 그림을 참고하십시요.

 

마스터단 중복제거시에는 이와 같은 경로로 데이터가 저장되며, 백업 대상의 모든 데이터를 일단 백업 서버로 가져와 중복제거를 하여 중복제거 된 데이터를 DR4000으로 보내는 방식 입니다.

Backup Exec 2014(소프트웨어 중복제거 엔진)을 통한 마스터 중복제거를 하는 이용하는 경우 데이터의 이동 경로는 아래 그림을 참고하십시요.

 

 

이와 같은 경로로 데이터가 저장되며, 백업 대상의 모든 데이터를 백업 서버로 가져와 중복제거 및 카탈로그 처리를 백업 서버에서 동시에 하는 방식입니다.

그럼 DR 4000과 Backup Exec 2014를 이용하여 마스터 중복제거 백업 시 비교한 표를 보도록 하겠습니다.

Master 중복 제거

Client->Backup Server->dr4000으로 데이터 전송

저장소

네트워크 환경

1차 백업 속도

2차 백업 속도

RDX 8000으로
복제 속도

Client 평균 CPU 사용량

Master 평균 CPU 사용량

Client 평균 메모리 사용량

Master 평균 메모리 사용량

DR 4000(Open Storage)

기가비트 허브

3,736MB/분

6,276MB/분

1,686MB/분

3.10%

13.49%

80MB

333MB

마스터 중복제거 저장소

기가비트 허브

3,867MB/분

4,656MB/분

1686MB/분

0.95%

16%

97MB

1.1GB

 

DR 4000으로 최초 전체 백업의 경우 분당 3,736MB(시간당 224GB 백업)의 속도를 보여 주었으며,

2차 백업 시 본격적으로 백업서버에서 중복제거 후 스토리지로 저장되며 이 때의 속도는 분당 6,276MB(시간당 376GB 백업) 의 속도가 나타났습니다. Client에서 사용된 CPU는 평균 3.10%, 메모리는 80MB 정도를 사용했으며, 백업서버에서는 CPU 13.49%, 메모리는 333MB를 사용한 것을 볼 수 있습니다.

반면 Backup Exec 2014 자체 중복제거를 이용해 최초 전체 백업의 경우 분당 3,867MB(시간당 232GB 백업)으로 DR4000과 거의 동일한 속도를 나타내었으며, 2차 백업 시에는 분당 4,656MB(시간당 279GB 백업)의 속도가 나타나 DR 4000에 비해 시간당 약 100GB정도 속도 차이가 나는 것을 볼 수 있습니다.

이와 같은 결과는
백업 서버에서 중복제거 및 카탈로그 정보 처리를 동시에 하는 것 보다
각 처리를 DR4000 및 백업 서버로 나누어서 처리를 하는 것이 더욱 빠르다는 것을 보여주는 내용이라고 볼 수 있습니다.

 

3. 결론

DR4000 이라는 하드웨어를 이용한 중복제거와 소프트웨어를 이용한 중복제거를 비교하였을 때 백업 시 어느 한 쪽의 성능이 월등히 뛰어나다라고 확실히 내세울 수는 없지만 가장 중요한 부분은 백업하는 속도보다는 백업된 이후 백업 데이터의 관리가 더욱 중요하다고 판단됩니다.

즉, 기본적으로 데이터를 백업 하는 목적인 문제가 발생시 해당 데이터를 안전하게 복원하는 것이 가장 큰 목표라고 봤을때, 백업 서버에 중복제거 엔진을 설치하여 저장소를 관리하는 것 보다는 별도의 중복제거 스토리지를 구성하여 관리 하는 것이 유지관리 측면에서 더욱 안정적으로 관리할 수 있다는 생각입니다.

백업서버에 중복제거 엔진이 설치되는 경우 백업 카탈로그 및 백업 소프트웨어의 DB 관리등 여러가지 처리를 동시에 진행하다 보니 저장소 자체 문제가 빈번히 발생되는 경우가 있으며, NT 서버의 특성 상 MS 업데이트나 기타 어플리케이션의 영향으로 서버 재부팅 및 중복제거 엔진의 재시작을 요하는 경우가 빈번하여 유지관리에 어려움을 겪는 경우가 많이 발생되게 됩니다.

그에 반해 별도의 중복제거 스토리지를 구성하여 구축한 경우 해당 장비를 재부팅하거나 서비스를 재시작해야하는 경우가 거의 드물어 중복제거 된 데이터를 관리하는 데 더욱 용이한 장점을 가지고 있으며, 백업 서버를 재부팅 한다고 하더라도 중복제거된 스토리지에는 전혀 영향을 주지 않기 때문에 백업된 데이터를 안전하게 보관할 수 있다는 장점이 있습니다.

이러한 차이는 백업된 데이터 용량이 커져 중복제거를 요하는 데이터가 많아 질수록 점점 두드러지게 될 것으로 판단됩니다.

엔지니어 입장에서 판단하건데 5.5TB 이하의 데이터 백업 용량을 가지고 있을 경우 Backup Exec 중복제거 저장소와 DR4000은 유지 관리 및 안정성에서 큰 차이가 나지 않기 때문에 가용성 및 비용 대비 효율성을 검토하였을 때 Backup Exec 중복제거 저장소를 사용하는 것이 좋으며, 5.5TB 이상의 데이터 백업 용량을 가지고 있는 경우에는 DR4000을 사용하는 것이 바람직 하다고 판단됩니다. 긴 내용 읽어주셔서 감사합니다.

아이비인포텍 / 수석엔지니어 박민철 과장

About 오픈아이티

오픈아이티

Leave a Reply

첫번째 댓글을 작성해 주세요.

메일 알림 설정
wpDiscuz