네트워크 #네트워크

회사 전체 네트워크 간헐적 중단

안녕하세요. 질문드립니다!


저희 회사 네트워크 구조가

ISP → 학교 → 회사 방화벽 → L3스위치(HPE1420)-1 → L3스위치-2 → L3스위치-3

이런식으로 되어있고


각 HPE1420 스위치에서 AP나 패치로 뿌려지는데, 문제가 있습니다.


간헐적으로 회사 전체 네트워크 통신이 중단됐다가 5~10분 후면 다시 올라오는데 상황이 발생할 때 마다 확인해본 결과


학교 → 회사 방화벽

회사 방화벽 → L3스위치

는 문제 없이 내려가고 로그도 찍히지 않습니다.


문제는 HPE1420이 비관리형 스위치다보니 로그를 확일 할 방법이 없습니다.


여기서 여쭙고 싶은게

1. 방화벽 → 스위치1 → 스위치2 → 스위치3 과 같은 직렬구조로 업링크 시켜서 사용하면 트래픽 병목 현상이 없는지?

2. 위 질문에 문제가 있다면 방화벽 → 스위치1,2,3 로 병렬구조로 변환한다면 해소가 될지? 또는 방화벽 → 스위치1 → 스위치2,3으로 해도 될지?

3. 회사에서 주로 사용하는게 Office, SharePoint/OneDrive, NAS(데이터 이동 시 최대 1~2TB 용량도 있음) 정도인데 학교에서 내려오는 QoS 정책은 없으니, 스위치 자체에 QoS 정책으로 문제가 되지는 않는지?


내용이 조금 복잡하지만 설명을 잘 했는지 모르겠네요 ㅠ 선배님들의 조언이 필요합니다.. 감사합니다!

17개의 답변이 있습니다.

1 추천 | 20일 전

1의 질의는 직렬 연결 방식인데, 이 구조에서는 스위치1에 트래픽이 집중되며, 스위치2, 3으로 이동하는 데이터는 모든 트래픽이 하나의 업링크 포트로 이동하기 때문에 병목이 발생할 가능성이 큽니다.

특히, NAS와 같이 대용량 데이터 전송(1~2TB)이 있는 경우, 이 경로를 통해 Office, SharePoint, OneDrive 트래픽까지 처리하면 상위 스위치의 포트 대역폭이 과부하 상태에 빠질 수 있습니다.

2의 질의 변경하면 각각의 스위치가 방화벽과 직접 연결되므로 병목 현상이 완화됩니다. 스위치 간 트래픽이 상위 스위치를 거치지 않고 바로 방화벽으로 연결되기 때문에 트래픽 분산 효과가 있습니다. 다시말해, 각 스위치가 독립적으로 연결되어 장애의 영향을 최소화합니다.

다만, 방화벽의 포트 수가 부족할 경우 추가적인 포트 확장이 필요할 수 있습니다.

만약, 해결방안을 고민한다면 이런 경우 방화벽-> 스위치1->스위치2, 스위치3 으로 변경해보세요. 단, 스위치1의 업링크 포트가 충분히 높은 대역폭(10Gbps 이상)이어야 병목이 최소화됩니다.

3의 질의는 학교에서 내려오는 QoS 정책이 없고 회사 내부에서 자체 QoS 정책을 사용하지 않는다면, 스위치가 기본적으로 모든 트래픽을 동일하게 처리합니다.

그러나 NAS의 대용량 파일 전송이 발생하면 같은 네트워크를 공유하는 Office, SharePoint, OneDrive와 같은 애플리케이션에 영향을 미칠 수 있습니다.


특히 HPE 1420 스위치는 기본적으로 관리형 스위치가 아니므로, QoS 정책 설정이 불가능하거나 제한적일 가능성이 높습니다.

해결방안이라고 한다면, QoS를 지원하는 L3 관리형 스위치로 교체하여 중요한 트래픽 을 우선 처리하고 NAS 트래픽에 낮은 우선순위를 할당하는 방안을 고려해 보세요. 참고로, HPE Aruba, Cisco Catalyst와 같은 고성능 스위치를 사용하면 트래픽 제어 및 우선순위 설정이 훨씬 수월합니다.

Reply

게시글 작성자 | 19일 전

답변 감사합니다. 병렬 연결로 오늘 임시변경했습니다. 그리고 최종적으로는 Aruba 관리형 스위치로 교체하기로 했습니다. 신규 스위치로 교체한 후에는 아무 문제도 없으면 좋겠네요..

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전

지금의 구성으로 문제가 되어 보이지는 않네요. 개선할 수는 있지만

구성이 문제가 있어서 장애를 유발할 정도는 아니라고 보이네요.

전체 네트워크가 문제가 발생하는 경우는 가끔 내부에 비허가 HUB를 사용하거나,

포트를 잘못 연결하여서 루핑이 돌 경우 그럴 수 있습니다.

아니면 특정 PC가 시스템에서 사용하는 IP를 사용함으로 인해서 그럴 가능성도 있구요...

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전

결국 네트워크

다운 되었을때 각 스위치

구간 확인 할수 밖에 없을 듯 합니다..

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

1st 5stars

0 추천 | 21일 전

회사 전체가 간헐적으로 중단된다면...

백본으로 작동하는 스위치 장비가 무엇인지 먼저 확인해 보는 게 우선적으로 필요할 것 같습니다.

백본 스위치는 가장 성능 좋은 스위치 장비를 사용하는 것이 좋은데... 경우에 따라서는 성능이 좋지 않은 제품이 의도하지 않게 백본 역할을 하는 구성일 수도 있기 때문에 성능이 좋지 않은 제품이 부하를 감당하지 못해 일정 시간 요청되는 트래픽을 차단 시켜 버릴 수도 있습니다.

잘못 구성된 예 중에 한가지는...

방화벽 장비의 포트들이 스위치 역할을 할 수도 있는데 네트워크 구성의 착오로 방화벽의 포트들이 백본 역할을 하면서 전체 네트워크에 영향을 미칠수도 있겠고요.


회사 전체 네트워크가 일시적으로 끊기더라도, 하위에 있는 스위치들은 정상적으로 작동하는 경우가 일반적이기 때문에... 회사 전체 네트워크가 끊길때 하위에 있는 스위치에 네트워크 케이블이 연결되어 있는 2대 기기 사이에서는 정상적으로 통신이 가능한지를 Test 해 보는 것이 정확한 문제 원인 파악에 도움이 되는 작업이 되겠고요.

사내에 있는 각각의 스위치들에 직접적으로 연결되어 있는 2대의 기기들 간에 통신이 가능한지를 확인해서 전체적인 연결이 끊길때 작동하지 않는 스위치가 어떤 것인지를 확인해 본다면 문제 해결에 상당히 도움이 될 걸로 보이네요.

Reply

| 21일 전

예를 들어...

L3스위치-3에 직접 연결되어 있는 2대 기기간에 통신이 되는지 Test.

L3스위치-2에 직접 연결되어 있는 2대 기기간의 통신이 되는지 Test.

L3스위치(HPE1420)-1에 직접 연결되어 있는 두 기기간에 통신이 되는지 Test...

그리고... 백본에 해당하는 스위치를 더 좋은 제품으로 교체하는 것이 좋겠고요.

HPE1420 스위치 성능이 너무 낮은 것 같습니다.

좀 더 성능 좋은 제품으로 교체할 것을 권장합니다.


Reply

게시글 작성자 | 19일 전

답변 감사합니다. 총 80개 정도의 포트가 필요하여 aruba 48포트 두개로 교체할 예정입니다.

일단은 전체 직렬 연결이 아닌 스위치에서 나머지 스위치 두개로는 병렬로 연결해서 임시조치 해봤습니다.

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전

네트워크 구성상 특이점이 없어보입니다.

간헐적인 문제는 L3쪽 라인에 별도 허브-> 허브가  있어 루핑 돌거나 L3 장비쪽 문제가 있는지 

체크가 필요해 봅니다. 

Reply

게시글 작성자 | 19일 전

답변 감사합니다.

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전

스위치들은 물리적 이슈가 간혹 발생 합니다.

테스트가 가능하다면 하단 스위치 부터 교체 해보면서 운영해보면 어디서 문제인 지 찾을 수 있겠지만

업무 상 그게 쉽지 않으면 중간 스위치들 제외하고 업링크를 상단에 연결해보시는 게 

현재 운영하는 시점에서는 영향이 덜 할 듯 합니다.

근데, 1420이 L3가 있던가요?? L3면 비관리형이 아닐거라서요!


유,무선 둘 다 운영중이시면 둘 다 발생하는 지 한쪽에서만 단절이 발생하는 지도 확인이 필요 할 듯 합니다. POE 스위치가 아니라면 같은 스위치에서 구성되었을 거 같긴 한데, 한쪽에서만 단절이 발생하면
원인을 찾는 게 좀 더 도움이 될 듯 하네요 !

Reply

게시글 작성자 | 19일 전

단절이 발생해서 원인을 찾으러 가는 시점에 다시 연결되곤해서,, 참 난감합니다. 결과적으로 스위치는 관리형 L2 스위치로 변경하기로 했습니다.

답변 감사합니다.

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전

연결 구조상으로 문제는 없어 보입니다.

방화벽 밑단으로 문제가 있어 보인다면, ioi님 말씀처럼 루핑이 의미 되기도 합니다.

방화벽 밑단으로 연결된 장비들 체크해보세요.

Reply

게시글 작성자 | 19일 전

답변 감사합니다.

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전
  • 1.사용량/인원에 따라 다르긴한데 큰 문제 없습니다.

  • 2.1번에 문제가 없다면 굳이 2번 할 이유도 없구요

  • 3.QOS 걸정도의 트래픽인지 먼저 확인이 필요 합니다.

결정적으로 전체 네트워크가 죽는다면 어디 루핑구간이 있는게 아닌지 확인이 먼저 일거 같네요.

사용자 자리들에 허브나 공유기 별도로 몰래 설치한게 있는지 확인 해보시면 좋을거같아요.

Reply

게시글 작성자 | 19일 전

답변 감사합니다.

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

0 추천 | 21일 전

질문하신 내용들 보니 문제가 되보이진 않습니다.

점심시간에 그냥 문제로 보이는 HPE1420 스위치를 다른 허브로 교체해보시고 문제가 있는지를 살펴보는게 우선 일것 같습니다.(트래픽과부하때문에 장비가 뻗어서 그런건지, 아님 하드웨어 자체의 문제인지)

그걸 교체하고 했는데도 문제가 생기면 다음 또 문제를 살펴보는것도 하나의 방법이라고 생각됩니다.

Reply

게시글 작성자 | 19일 전

답변 감사합니다.

Reply

댓글 남기기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

답변 달기

답변을 작성 하시려면 로그인이 필요합니다.

로그인 회원가입

IT 솔루션 또는 하드웨어 도입을 검토 중 이신가요?

쉐어드IT 솔루션 상담실에서 믿을 수 있는 제품과 업체를 추천 받으실 수 있습니다.

솔루션 상담실 IT 컨시어지 서비스

네트워크 카테고리의 다른 질문들...

  • 5일 전
  • 댓글 : 하루 전
  • 19일 전
  • 댓글 : 8일 전
  • 27일 전
  • 댓글 : 26일 전
  • 약 한 달 전
  • 댓글 : 29일 전