시스템이중화장애 클러스터재해대책

시스템 이중화 HA클러스터 구성 기본 지식(업데이트 완료)

시스템 이중화 HA클러스터 구성 기본 지식에 참고 할만한 좋은 글이 있어 구글 번역 옮깁니다.
1화만 옮겨드리니(※) 혹시 HA클러스터링(시스템 이중화 구성 클러스터)에 관심 있으신분은 한번 살펴 보는것도 좋을 것 같습니다.
  ※예상보다 반응이 좋아서, 최대한 옮겨보고자 합니다. 


HA 클러스터 입문 - 제 1 회 서버가 다운되는 것? ~
https://jpn.nec.com/clusterpro/blog/20170403.html

HA 클러스터 입문 - 제 2 회 모든 것을 중복? ~
https://jpn.nec.com/clusterpro/blog/20170417.html

HA 클러스터 입문 ~ 제 3 회 이상의 서버에서 클러스터링? ~
https://jpn.nec.com/clusterpro/blog/20170515.html

HA 클러스터 입문 - 제 4 회 장애에 의한 업무의 인계 란? ~
https://jpn.nec.com/clusterpro/blog/20170601.html

NEC HA클러스터 소개자료
https://kr.nec.com/ko_KR/file/NEC_EXPRESSCLUSTER.pdf

NEC Express5800 Fault Tolerant Servers
https://kr.nec.com/ko_KR/file/NEC_FT_Server.pdf

HA 클러스터 입문 - 제 1회 서버가 다운 된다는 것? ~

시작하기

 

"design for failure"라는 생각을 알고 있습니까? 장애는 반드시 발생한다는 전제에 입각 한 시스템 설계의 생각입니다. 오류가 반드시 발생하는 것은 무엇을 의미할까요? 이것은 시스템을 구성하는 모든 것을 "언젠가는 고장 것"으로 취급하는 것입니다. 이야기가 조금 추상적이므로 구체적 예로 생각해 봅시다. 

1 대의 서버에서 Web 사이트를 운영하는 경우 어떤 부분의 고장이 상정 할 수 있을까요? "서버가 다운됐다"고해도 그 원인이되는 고장 부위는 다양합니다. 우선 하드웨어의 관점에서 살펴 보자.

 

하드웨어

서버를 구성하는 요소로서 CPU나 메모리, 디스크뿐만 아니라 마더 보드와 전원 공급 장치, 냉각 팬이 포함됩니다. 또한 LAN 및 FC(Fibre Channel), RAID(*) 확장 보드를 추가하는 경우에 그것도 서버 구성 요소입니다. 고장 빈도(내구성)에 차이는 있지만 "design for failure"의 관점으로는 이들 전부는 "언젠가는 고장 나는 것"으로 처리합니다.

*RAID는 여러 개의 디스크를 조합하여 복원력과 성능 향상 기술이지만, RAID 컨트롤러 자체의 고장 발생을 상정 해야 합니다.


 

소프트웨어

 

다음 소프트웨어 측면에서는 어떨까요. 우선 OS (Operating System) 자체의 오류입니다. OS의 버그(프로그램 문제)와 보안 취약점으로 인한 장애 등이 발생할 수 있습니다. 또한 Web 사이트의 기능을 제공하는 어플리케이션도 버그와 보안 취약점 등 유사한 장애는있을 수 있습니다. 다른 관점으로 Web 사이트에 급격한 트래픽 증가에 따른 높은 부하 상태의 장애도 가정 할 필요가 있습니다.


 

네트워크

 

그런데 하나의 서버에 하드웨어, 소프트웨어 각각의 관점에서 어떤 문제가 일어날 수 있는지살펴 봤습니다만, 이것으로 끝이 아닙니다. 이번 예시에서는 "Web 사이트를 운용"하고 있기 때문에, Web 사이트가 실행중인 서버와 Web 사이트에 액세스 해 오는 사용자를 연결하는 네트워크 주변에 대한 시야를 넓힐 필요가 있습니다. 

우선 서버와 연결된 네트워크 장치와 케이블의 장애입니다. 케이블의 장애는 종종 케이블의 단선을 의미합니다. 또한 고성능 네트워크 장비쯤 되면 전용 OS를 실행하기 때문에 OS의 버그와 보안 취약점으로 인한 장애도 가미 해야 합니다. "Web 사이트"로 상정하고 있기 때문에 이번에는 인터넷 회선을 제공하는 회선 회사 측의 네트워크 장애도 상정 해 둘 필요가 있습니다.

정리

 

어떻습니까. 1대의 서버에서 Web 사이트를 운영하는 단순한 구성에도 이만큼의 많은 장애를 상정하고 시스템을 설계 해야 합니다. 그리고 그 생각을 나타낸 것이 "design for failure"이며, 시스템을 설계 할 때의 원칙이라고도 합니다. 언제 일어날 지 모르는 장애에 불안 해 하는 것이 아니라 반드시 장애가 발생 한다고 가정 하여 대비할 수 있도록 신뢰성있는 시스템을 설계 해야 겠네요. 

게다가... 사실 서버를 설치하고 있는 건물 자체의 장애 대규모 재해에 의한 정전이나 붕괴 등도 상정 할 필요가 있는데, 그것은 다음 기회에..

 

HA 클러스터 입문 - 제 2 회 모든 것을 중복? ~

 


HA 클러스터 입문 ~ 3 회 이상의 서버에서 클러스터링? ~


HA 클러스터 입문 - 제 4 회 장애에 의한 업무의 인계 란? ~

21개의 댓글이 있습니다.

| 5달 전

좋은 자료 감사드려요~~
| 6달 전

이미지까지 번역해 주셨네요 
감사합니다 
| 6달 전

감사합니다!
| 6달 전

좋은 자료 감사합니다.
| 6달 전

잘 읽었습니다.
구글 번역이 조금 어색하긴하지만...
내용이 짤막짤막해서 읽는데 부담은 없네요~
| 6달 전

HA 쉬운듯 하면서 어렵네요...
지난 HA 관련 글 : https://www.sharedit.co.kr/posts/53
| 6달 전

HA 솔루션은 종류가 많죠. 로즈는 시장점유율이 낮은편이구요
| 5달 전

시장 점유율이 좀 아쉽긴 합니다. 여담이지만 해당 국내 총판 담당자분이 오랫동안 HA를 한우울만 파서 노하우는 참 많아서 좋아하는 제품이 되었습니다. ^^
| 5달 전

오래전 저의 글에 관심을 가져주셔서 감사합니다. ^^
| 6달 전

HA진짜 윗분들 설득 포인트가 리스크비용밖에 없는데... 예전에 한번 서버 먹통된 경험이 있어서 현재 HA는 아니지만 웹서버를 분산관리하고 있습니다. 좀 무식한 방법이긴 한데 DB자체를 서버 별로 분산해서 병렬식으로 관리하고 있네요. 죽어도 하나만 죽으라고.... HA도입되면 걱정거리 하나 없어지는 것이긴 한데 사고 터지지 않는 이상 비용면에서 설득하기 진짜 어려운 것 같아요. 그렇다고 클라우드로 갈 수도 없는 노릇이고 ㅋ
| 6달 전

WSFC (MSFC) 도 비싼 비용때문에 1:1 의 HA를 권장하지 않습니다. 실제로도 5:2 나 7:3의 형태로도 많이 사용합니다.
| 6달 전

고가용성 문제는 생각해야 될게 많고, 완벽을 고민해야 할수록 들어가는 돈이 계속 증가한다는 문제가.. 

이중화 하고 다중화 하면서 그 1번의 리스크를 커버해야 한다고 생각하면 설득하기 너무 어렵습니다. ㅠㅠ
그 한번의 장애시에 얼마의 비용손실이 될지 예측도 해야 하고 ㅠㅠ
| 6달 전

좋은 자료 감사합니다~
| 6달 전

HA에 대해 제대로 모르고 납품한 경우도 많이 봐왔습니다.
실제로는 전환조차안되도록 하고 납품한 경우도 봤구요;;;
이런걸 컨설팅 받으시지 라고 말하고 싶을때가 많습니다.ㅜ
| 6달 전

자료 감사합니다^^~
| 6달 전

HA구성이 간단해 보이지만 사실 그렇지 않지요. HA구성때문에 복잡성증가로 오류발생이 증가할수도 있고. HA구성에 대한 검증이 안되면 실제 장애시 서비스보장이 안 될수도 있습니다.
좋은 자료 감사합니다.
| 6달 전

개발 업체에서 HW 구성이라고 가져오는것 보면 대부분 HA 구성인데.. HA가 만능이라도 되는것처럼 환상을 가지는 경우가 많죠. 말씀 하신것처럼 HA 구성 자체가 문제를 일으키는 경우가 어찌보면 더 많다고 할수도 있습니다. 담당자가 완전히 장악을 하고 있지 않으면 문제가 생겼을때 HA로 인해 시스템이 꼬여서 싱글 시스템 재부팅 보다 훨씬더 많은 시간을 고생 하는 경우도 있습니다.
| 6달 전

개발업체에서 가져온 HA방식이 문제인거죠. 고가용성 클러스터는 당연히 일반사항보다는 장점이많습니다.
| 6달 전

담당자가 정확히 모르면 문제가 많은것도 맞구요.
| 6달 전

싱글은 트러블슈팅이라는 것이 거의 의미없기도하지요. 하지만 고가용성을 운영할때는 필요성/중요성이 있는 서버라는 이야기이므로 구성안할 수 도 없지요.
| 6달 전

네 좋은 의견들입니다. HA구성이 장애대응을 위해 필요한 건 맞지만 구성자체에 대한 신뢰성과 담당자가 운영에 대한 노하우가 있어야 제대로된 구성을 할 수가 있지요

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입
  • 5달 전
  • 댓글 : 5달 전
  • 5달 전
  • 댓글 : 5달 전
  • 5달 전
  • 댓글 : 5달 전
  • 6달 전
  • 댓글 : 5달 전
  • 6달 전
  • 댓글 : 5달 전
  • 시스템 이중화 HA클러스터 구성 기본 지식(업데이트 완료 [21]
  • 서포터
  • | 1013명 읽음
  • 6달 전
  • 댓글 : 5달 전
  • 6달 전
  • 댓글 : 5달 전
  • 6달 전
  • 댓글 : 6달 전
  • 6달 전
  • 댓글 : 5달 전
  • 6달 전
  • 댓글 : 5달 전