Cisco Connect Korea 2023 3편, 트랙 C 정리

Cisco Connect Korea 2023 3편, 트랙 C 정리

이번 3편에서는 Cisco Connect Korea 2023의 트랙 C, Hyperscale Infrastructure에 대한 세션 6개를 다룹니다. 어떤 내용의 세션이 소개되었는지 2편과 마찬가지로 3개 세션씩 나누어 1부, 2부로 정리했고요. 각 세션 마다 장표 3개씩만 발췌하여 핵심 내용 위주로 요약하겠습니다. 주요 아젠다는 아래와 같습니다.




 아젠다

 1. 트랙 C : Hyperscale Infrastructure 세션 1부

 2트랙 C : Hyperscale Infrastructure 세션 2부

  • 아젠다 별 링크를 클릭하면 해당 내용의 첫 부분으로 이동합니다.

  • 마우스의 뒤로가기 버튼을 클릭하면 다시 아젠다로 돌아옵니다



이 콘텐츠는 Cisco의 지원으로 제작되었습니다.







1. 트랙 C : Hyperscale Infrastructure 세션 1부


이번 트랙 C 1부에서는 다양한 클라우드 인프라를 어떻게 효율적으로 연결하여 운영할 수 있는지, 대 AI 시대를 맞아 IT인프라가 AI를 어떤식으로 지원해야 하는지, 점점 복잡해지는 IT인프라를 문제 없이 잘 관리하기 위해 어떤 서비스가 필요한지에 대해 알아봅니다. 그럼, 첫 번째 세션부터 핵심 내용 위주로 간단히 살펴볼까요?


 1) 기업의 멀티 클라우드 네트워킹 준비하기, 시스코 하정환 프로, 이요한 이사





  • 클라우드 송환 : 퍼블릭 클라우드 전환한 애플리케이션 및 워크로드를 갔다가 다시 온프레미스 또는 프라이빗 클라우드로 다시 돌려보내는 것, 송환 이유로 예상치 못한 비용, 운영 복잡성, 보안 3가지가 대표적인 요인으로 꼽힘

  • 비용 : 클라우드 전환 시 예상치 못한 많은 비용이 발생하고 지출이 증가함, 그만큼 클라우드에서의 비용 관리가 어렵다는 것을 의미하며 이때문에 FinOps가 새롭게 주목받고 있음

  • 운영 복잡성 : 클라우드로 전환한 많은 기업들이 인프라 운영의 복잡성 및 엔드투엔드 가시성 확보에 문제가 있음을 호고 -> 문제가 어디서 발생했고 어떻게 해결해야 하는지 어려움을 느낌

  • 보안 : 보안을 위해 멀티 클라우드 선택했으나 분산된 인프라에서 운영되는 다수의 워크로드를 안전하게 보호하고 운영할 수 있는 노하우가 부족

  • 여기에 연결성, 운영복잡성, 지속가능성도 고려해야 함

  • 이러한 사항을 해결할 수 있는 것이 클라우드 네트워킹 운영 + AIOps를 통한 간편한 관리 + 환경적 영향을 최소화시킬 수 있는 데이터 센터를 표방하는 ESG 경영임




  • 온프레미스에서도 멀티 AZ, 멀티 리전 구축 가능 : Cisco SDN을 사용해 패브릭 2중화로 데이터 센터 가용성 확보 혹은 프론트 엔드 & 백엔드 분리, 망분리 구축 가능, 서울DC와 대전DC로 나눠서 운영 가능(금융사 및 공공기관 레퍼런스 확보)

  • 퍼블릭 멀티 클라우드와 온프레미스의 네트워크를 연결해서 Cisco Nexus 단일 대시보드에서 GUI로 관리

  • 템플릿을 사용해 자동화된 네트워크 배포 및 운영 가능, 고객이 자사의 서비스를 빠르게 배포하고 운영할 수 있게 하기 위함

  • 온프레미스에서도 퍼블릭 클라우드처럼 고가용성 네트워킹이 가능하며 이 둘을 원활하게 연계할 수 있다는 것이 핵심

  • 하이브리드 클라우드 네트워크에서 시급한 문제는 빠른 쟁애 해결과 엔드 투 엔트 가시성 확보임

  • 이 2가지를 해결할 수 있는 것이 AIOps : 사전 대응이 가능, 이상징후 알람이 발생했을 때 무엇이 문제이며 징후는 어떻게 발생했고 영향은 어느 정도이며 어떻게 고쳐야 하는지 정보를 알 수 있고 원-클릭 교정 지원




  • 기업의 지속가능성 : 환경파괴 없이 지금 수준을 유지하고 발전시켜 나가는 것, 탄소배출량 관리가 핵심, 비즈니스 KPI에 중요한 요소가 되었으며 앞으로 더욱 중요해질것

  • 지속가능성을 위해 네트워크 에너지 소비 및 비용에대한 가시성 확보, 장비들의 온실 가스 배출량 모니터링, 총 전력 사용률을 관리해야 함

  • Cisco Nexus 대시보드에서 다양한 3rd party 솔루션과 통합해 데이터 수집, 모든 데이터 센터에 대한 ESG 경영 지표에 대한 정보를 일목 요연하게 보여주며 대시보드에서 어떤 조치를 취하면 향후 얼마나 좋아질 수 있는지, 탄소 배출량 감소 및 비용 절감 예측치를 알려줌

  • ESG 경영 차원에서 정량적 지표로 관리되어야 함







 2) 초거대 AI 시대, 네트워크 아키텍처 새판짜기, 시스코 최수영 상무, 임규현 프로





  • AI 마켓 트렌드 : 다양한 생성형 AI 활용률 증가, 2028년까지 글로벌 AI 인프라 시장 연평균 24.7% 성장 예상, 기술의 발전과 함께 AI 모델 수요 증가, 국내 시장 역시 매년 17% 상승 예상되며 AI 투자금 30%는 하드웨어 인프라에 투자 중

  • AI 인프라 구조 : 분산 병렬 처리때문에 GPU가 핵심, GPU 수량을 늘려 학습 시간을 줄여야 함, NVIDIA V100, A100, H100이 널리 활용되고 있음, H100에 이르러서는 네트워크 대역폭 400Gbps 이상 네트워크 필요

  • GPU 서버의 네트워크 연결 : 과거 CPU 중심의 네트워크는 서버 당 10G, 25G로 충분했으나 현재의 NVDIIA GPU 칩 하나가 필요로 하는 네트워크 대역폭이 400Gbps임

  • 게다가 하나의 서버에 GPU 8개가 장착될 경우 이 GPU들간의 통신에도 400Gbps 이상의 네트워크 대역폭을 연결할 수 있는 NIC 필요, 이 GPU가 다른 서버 및 스토리지와 연결되어 제성능을 발휘하기 위해서도 마찬가지로 400Gbps 이상의 네트워크 대역폭 및 NIC가 필요 

  • AI 인프라에서는 최소 400Gbps 이상의 고대역폭 네트워크가 필요하다는 의미



  • AI 트래픽 패턴 : GPU 연산 트래픽의 경우 GPU 클러스터 내에서 최초로 연산 명령을 내리면 다수의 GPU에서 동시에 연산 명령을 실행함, 이후 연산이 완료되면 결과를 다시 클러스터 내 모든 GPU에 전달하며, 아직 연산이 완료되지 않은 GPU는 계속 연산 수행, 모든 GPU 연산이 완료될 때까지 먼저 연산이 완료된 GPU는 기다려야 하는 상황, 이만큼 처리 지연 시간, 병목이 생기는 것 ->이것을 해결하기 위해 다양한 기술 사용

  • Grace CPU : GPU와 CPU를 직접 연결하여 GPU 내 메모리가 모자랄 경우 CPU Host의 메모리를 가져다 사용함

  • GPUDirect P2P : 1개 이상의 다수의 GPU에서 트래픽을 처리할 때 CPU를 거치지 않고 직접 GPU끼리 P2P로 직결해서 GPU 간의 병목 현상 해결

  • GPUDirect RDMA : GPU와 GPU 노드 간에는 GPUDirect RDMA를 통해 NIC에서 호스트 메모리를 통과하지 않고 바로 GPU 메모리를 읽을 수 있게 노드 간의 GPU를 또 직결함

  • GPUDirect Storage : 스토리지 연결 역시 마찬가지로 GPU와 Storage를 직결해서 병목 해결

  • 핵심은 기존 구조에서 CPU와 Host 메모리를 한번 거쳐가야 하는 구조를 생략하고 필요한 GPU와 GPU 상호간 직결 + GPU 자원을 사용해야 하는 시스템을 GPU와 직결해서 해결하는 것

  • CPU를 경유하지 않고 병목 없이 통신하게 하자는 것이 RDMA이며, 이 RDMA 통신을 이더넷으로 가능케 하는 것이 RoCEv2(RDMA Over Converged Ethernet) -> Lossless Network

  • ECN(Explicit Congention Notification) 프로토콜, PFC(Priority-based Flow Control, Switch to Switch) 프로토콜 활용

  • 네트워크 장비들 간의 흐름 제어뿐만이 아닌 네트워크와 연결된 GPU, Storage 등 모든 자원을 아우르는 네트워크 흐름 제어가 필요한 것이 AI 인프라의 네트워크 특징임




  • Non-Blocking Fabric 디자인 : 다운링크와 업링크 속도를 1:1로 동일하게 맞춤으로써 병목 현상을 제거, 이것을 지원할 수 있는 장비가 Cisco Nexus 9000 Series

  • Cisco NDFC : 목적에 맞는 네트워크 패브릭 디자인 + AI 네트워크를 위한 표준 설정을 배포 자동화 -> AI 네트워크에서는 각 장비 하나하나가 전체 성능에 끼치는 영향이 지대하기 때문에 무중단 OS 업그레이드 지원, 네트워크에서 발생하는 플로우 성능 모니터링을 위해 텔레메트리 서비스 제공

  • Cisco ND-Insights, AI 트래픽 플로우 별로어떤 이슈가 있고, 이 이슈로 인해 다른 트래픽 구간에 얼마나 영향을 끼치고 있으며, 향후 어떤 트렌드를 보일 것인지 예측할 수 있는, 기존에 모니터링하지 않았던 새로운 요소를 모니터링할 수 있다는 것이 핵심







 3) 전환기의 IT 인프라, 어떻게 운영해야 하나? 시스코 윤희진 프로





  • 기술지원서비스의 진화 : 1세대 하드웨어 장비 이슈 해결 -> 2세대 연계된 이기종 제품 이슈 해결(현상은 장비에서 발견되나 해결은 그 장비 외에 연계된 다른 장비까지 확인 필요) -> 3세대 복잡한 문제를 더 빠르게 해결할 수 있기 위해 AI 기능 활용

  • 현재의 복잡한 IT 환경을 제대로 지원하기 위해서는 현실적으로 '매우' 복잡한 디지털 트랜스포메이션을 기술지원해야 함

  • 레거시 시스템의 현대화에 클라우드 모델까지 합쳐지고 사용자 및 시스템 데이터까지 연계되면서 매우 복잡한 환경이 되었기 때문

  • 이런 환경에서 고객은 빠른 대응을 요구 : 따라서 문제가 발생하면 대응하는 수동적 대응에서 자동화 기술을 통해 분석 후 선제적 대응을 할 수 있는 능력을 키워나가야 함 -> IT 운영 환경 고도화가 필요




  • 시스코는 Cisco CX Cloud를 사용해 IT 솔루션 도입에서 활용 최적화 시점까지의 여정 모두를 체계적으로 관리

  • 기술지원에 필요한 절차 간소화 + 고객 맞춤 기술 전문가 가이드 + AI/ML을 활용한 인사이트 & 분석 + 고객의 사용 환경에 맞는 필요한 학슴 콘텐츠 제공으로 운영능력 고도화 제고

  • 각 항목 별 기술지원 서비스를 하나의 단일 화면에서 관리하고 기술지원을 받을 수 있다는 것이 핵심




  • 자산 관리 사례 : 1,200개의 시스코 장비 운영 중, 오래된 장비를 파악하고 향후 어떻게 교체해 나갈 것인지 계획 수립 필요 -> 6~12개월 안에 EOS가 예고되어있는, 교체가 필요한 장비를 CX Cloud에서 빠르게 확인, 드릴 다운으로 해당 장비에 대한 상세 정보 확인 가능(제품 하드웨어 및 소프트웨어 정보 + 기술지원 정보)

  • 보안 조치 사례 : 운영 장비 중 심각한 보안 취약점에 노출되어 해당 자산이 무엇인지 파악해야 하고 잠재적인 위협에 노출된 장비까지 한번에 파악해야 함 -> 필터에서 긴급한 조치가 요하는 항목을 선택해 해당 상황에 적용된 장비들을 리스트업 -> 장비의 상세 내역을 드릴 다운으로 확인하고 기술지원 케이스를 열어 빠르게 조치 가능

  • 장애에 대한 선제적 예방 사례 : 운영 중 장애가 발생하기 전에 예방할 수 있어야 함 -> 장애 발생 위험도를 중간, 심각 등 단계별로 나누어 일목요연하게 볼 수 있음 -> 마찬가지로 해당 장비를 클릭하여 세부 내역을 확인 -> 관리자가 주기적으로 잘 관리하고 있다면 위험도가 낮게 평가됨 -> 이어서 현재의 상태에 따라 시스코에서 제안하는 조치가 무엇인지 확인 후 조치할 수 있음

  • 운영 환경에 맞는 안정적인 OS 버전 권고 : 소프트웨어 탭을 클릭해 운영 버전이 낮아 운영에 심각한 장애를 초래할 수 있는 장비들을 리스트업 -> 현재 장비의 소프트웨어 버전 상태에 따라 AI가 그 소프트웨어가 가진 버그를 분석해 관리자에게 어떤 소프트웨어로 업그레이드 하면 좋다는 것을 권고 -> 이 때 단순히 최신 버전만을 권고하는 것이 아닌 기존에 알려진 버그 및 보안 취약점이 해결된 버전을 추천






2. 트랙 C : Hyperscale Infrastructure 세션 2부


이번 트랙 C 2부에서는 Active-Active 고가용성 데이터 센터로의 고도화 방안, 스마트팩토리에 필요한 IT/OT 컨버전스 아키텍처, 그리고 기업들이 현재 직면하고 있는 여러 과제들을 해결할 수 있는 데이터 센터 구축 솔루션에 대해 알아봅니다. 어떤 내용들이 소개되었는지 확인해볼까요?


 1) CIsco ACI 기반 AADC 사례와 통합관리 방안, 에스넷시스템 하진철 상무




  • 데이터센터에서 사용되는 SDN Fabric - Underlay 하나의 섀시 안에 꽂힌 다수의 스위치들이 각각의 개별적인 스위치가 아닌 하나의 거대한 스위치로 동작하는 것

  • SDN Overlay는 서버 가상화처럼 물리 서버의 자원을 활용해 VM을 만들고 이 VM들이 서버의 자원을 공유해서 사용하는 것과 마찬가지로, 하나의 거대한 네트워크 자원을 쪼개어 가상 네트워크 테넌트를 만들어서 사용하는 것을 의미하며, 마치 VM 처럼 손쉽게 가상 네트워크 테넌트를 생성하고 삭제할 수 있음




  • 데이터 센터 1단계 : 개발망에 샘플로 인프라 구성 후 SDDC의 요소 별로 적용해서 운영(SDC, SDN, SDS + CMP), 운영망으로 확장 -> 망을 가상화했는데 A 서비스에 문제가 생겼을 때 원인 파악이 어려움 -> 가시성 Active-Active 가용성 확보 필요성이 생김

  • 데이터 센터 2단계 : 1단계에서 테스트한 SDDC를 운영 망으로 확장하는 단계로 인프라 규모가 본격적으로 확장되고 가시성 확보에 주력, 이를 통해 트래픽 플로우 정보를 수집하여 보다 심도있는 분석 가능

  • 데이터 센터가 2단계에 이르면 DR 또는 Active-Active 데이터 센터를 논리적으로 구성하며 각 데이터 센터를 GSLB로 연동하여 하나의 거대한 데이터 센터처럼 운영 가능




  • Cloudwave : 에스넷시스템에서 개발한 Cisco ACI 기반의 멀티 클러스터 통합 관리 솔루션, Active-Active 데이터 센터를 간편하게 구현하고 Cisco Nexus Insight와 연동, AI/ML 기능을 활용해 데이터 센터 운영 간소화

  • 사용자 포탈 : 셀프 서비스 지향, 사용자가 서비스 별 OS를 확인하고 사용하려는 자원을 신청 -> 그럼 서비스가 배포되며 관리자는 이미 배포된 서비스 리스트 및 사용하는 리소스 사용량, 네트워크 플로우 모니터링

  • 관리자 포탈 : 배포된 클러스터 상태 확인, Nexus Insight와 연동되어 현재 네트워크 상태가 어떻고 어떤 문제가 있는지에 대한 가시성 확보 -> 이벤트 기반으로 플로우 정보를 확인할 수 있으며, IP로 검색해서 해당 IP의 트래픽 플로우에 대한 심층 분석 가능, ACI 설정도 Cloudwave관리자 포탈에서 할 수 있음

  • Active-Active 데이터 센터 구현 : 오픈스택과 VMware 기반 클러스터 2개를 하나의 거대한 네트워크로 묶고 L4 스위치 로드밸런서를 설치, 2개의 데이터 센터를 ACI로 확장하고 하나의 네트워크로써 관리함, 중간에 로드밸런서를 추가하여 2개의 데이터 센터를 마치 하나의 데이터 센터처럼 통합관리 가능







 2) IT/OT 컨버전스 아키텍처를 통한 스마트팩토리의 진화, 시스코 이정표 프로




  • 왜 IT/OT 컨버전스가 필요한가 : OT는 공장에서 운영되는 기기를 다루는 기술, IT에서 바라보는 OT는 이런 기기 자체가 아닌 기기에서 수집되는 데이터를 어떻게 관리하고 사용할 것인가에 대한 관점임 -> 데이터 처리장치는 빠르게 통합되고 있음, 공장에서 운영되는 다수의 서버와 로봇을 다루는 장치들을 통합해서 가상화된 통합 운영 환경으로 진화 중 -> OT의 IT화(아우디 제조공장 사례)

  • 공장의 수만개 이상에서 운영하는 이기종 기계 컨트롤러에 대한 관리를 하기 위해서는 가상화 + 단순하고 일관된 관리 방안이 필요

  • 따라서 IT와 OT의 연결, 융합은 Simple해야 함, 현재 매우 높아진 OT의 복잡성을 IT 기술을 활용함으로써 상당부분 해결할 수 있음 -> 독자적인 사양의 기기 및 이기종 기기들에 대한 관리 복잡성을 해결하기 위해 이 기기들에서 수집되는 데이터를 표준화하고 분석해서 활용하며, 이 과정에서 보안이 고려되는, 안전한 아키텍처로 전환될 것



  • IT/OT 컨버전스란 무엇인가 : 신공장에 적용하기 쉬움, 기존 공장에는 변화가 어렵기 때문, 공정 및 생산 라인에서 사용되는 고유한 설비/장치/센서들이 개별적인 환경에서 격리되어 Silo 환경에서 운영되고 있음

  • 따라서 어떻게 이 기기들에서 수집되는 데이터를 통합하고 분석함으로써 기기들을 통합 관리할 수 있으며, 보안을 강화할 수 있는지 고민 필요

  • 결국 각 기기들의 예지정비와 같은 효율적인 운영이 가능하려면 기기로부터 수집한 데이터를 IT에서 분석하고, 그 결과를 다시 OT로 내려주어야 함, 그런데 기존의 OT망은 100mbps라서 데이터 전달이 어려움 -> 10G 네트워크망 필요하나 기존에 많은 설비들이 운영되고 있는 공장의 네트워크 망을 전환하는 것은 쉽지 않음, 그래서 기존 공장에 IT/OT 컨버전스를 구현하기 어려운 것 -> 따라서 아예 처음 공장을 설계할 때부터 IT/OT 컨버지드 아키텍처를 적용해 10G 망으로 구성할 필요가 있음

  • 이러한 IT/OT 컨버전스 환경이 갖추어지면 IT/OT 인프라가 통합 운영됨, 이 위에 기존에 IT 환경에서 사용되던 고도의 모니터링 및 분석 솔루션을 적용해 OT망의 설비들 사이에서 흘러다니는 트래픽을 심도있게 분석하여 보안을 강화시킬 수 있음




  • IT/OT 컨버전스 구현을 위한 역량 : 레퍼런스 아키텍처를 통한 검증된 설계 도입 -> CVD(Cisco Validated Design), 시스코의 오랜 학습을 통해 사전 검증된 표준화된 모델로 설계를 간소화하고 소프트웨어 기반 관리로 OT 인프라로 전환할 수 있어야 함

  • 기존의 제조 레거시 인프라 : 이미 서로 다른 설비와 기기들로 갖추어진 환경들을 통합 관리하는 것은 매우 어려움

  • To-Be 제조 IT/OT 컨버지드 인프라 : OT 백본망을 가상화하여 기존에 IT에서 활용되던 다양한 인프라 운영 관리 기술을 적용해 좀 더 효율적인 관리 + 보안적으로 안전한 운영이 가능해짐

  • 통합 보안 아키텍처 : 기존에는 장비에 문제가 생기면 일단 생산성 문제 해결에 급급하여 사용자 인증 없이 빠르게 장애 해결 시도, 하지만 이렇게 사용자 인증 없이 조치하면 장애가 해결됐더라도 어떤 작업을 진행했고 누가 작업을 했는지에 대한 기록을 남기기 어려워 보안 상 큰 문제가 될 수 있음 -> 하지만 통합 보안 아키텍처에서는 로컬에서 직접 문제를 해결하든 원격으로 문제를 해결하든 모든 기록을 남길 수 있고, 사전에 인가된 사용자가 접근하여 안전하게 장애를 해결할 수 있음

  • 나아가 네트워크 세그멘테이션을 통해 특정 장비가 악성코드에 감염되더라도 이 장비에서 발생한 보안 사고가 다른 장비로 전파되는 것을 방지할 수 있음 -> 차세대 방화벽 뿐만 아니라 장비들이 연결 된 네트워크 로직 자체를 보안 아키텍처 기반으로 설계해야 함, 그래야 데이터를 서로 주고 받아도 되는 장비들과 데이터 통신이 되면 안되는 장비들을 설정해서 관리할 수 있음 -> 이것이 안전한 OT 환경의 시작임

  • 시스코만이 유일한 IT인프라와 OT인프라를 통합 제공할 수 있는 제조사, IT에서 사용하는 기술을 OT에서도 사용할 수 있어야 하며, 이에 대한 기반 기술을 폭넓게 보유하고 있음

  • IT와 OT 조직의 협업이 매우 중요, IT조직과 OT조직이 긴밀하게 협업해야 IT/OT 통합 레퍼런스 아키텍처 기반의 IT/OT 컨버전스를 구현할 수 있음






 3) 기업의 현재 주요 3대 IT 챌린지를 해결할 수 있는 현명한 데이터 솔루션 전략, 퓨어스토리지 강신우 이사





  • 데이터 센터의 지속가능성 : 탄소 배출 및 비용 관리, 데이터센터는 전세계 에너지의 2% 사용, 2025년까지 최대 20%에 이를 것, 일반 데이터센터 코로케이션 비용으로 계산했을 때 250PB를 5년간 운영하는 비용은 150억에 달함, 인프라 규모에 따라 천문학적 운영 비용이 발생함 -> 게다가 AI 모델 개발을 위해 데이터 센터 도입 비용 뿐만 아니라 운영 비용 역시 매우 크다는 것을 인지해야 함

  • 퓨어스토리지는 단일 디스크 크기로 현재 75TB 용량 제공 중이며 2026년에 300TB로 확장 예정 -> 3U 시스템에 1.5PB의 데이터를 저장할 수 있게 됨, 게다가 최대 15.9:1의 중복제거율을 통해 1TB를 가지고 16TB의 서비스를 운영할 수 있다는 것 -> 천문학적인 운영 비용을 크게 절감시킬 수 있음

  • 그리고 더 작은 장비가 사용되니 상면비용도 크게 절감시킬 수 있음 -> 장비 도입 비용 뿐만 아니라 운영 비용까지 고려해야 한다는 것

  • 유럽의 금융 고객은 이러한 퓨어스토리지 기술 및 솔루션을 활용해 기존의 1,200개에 달하는 랙은 현재 75개 랙으로 운영 중(94% 절감), 상면 절감은 곧 에너지 소비 절감으로 이어져 데이터 센터 지속가능성 향상에 일조




  • AI 인프라 구축 : 최고의 네트워크 인프라는 인피니밴드? 하지만 스토리지 연결을 위한 기본 권고 구성은 이더넷임, NVIDIA도 자사의 DGX 서버 구성 가이드에서 GPU 서버간 연결은 인피니밴드, 외장 스토리지 연결은 이더넷 연결 권고

  • 컴퓨팅과 스토리지를 단일 네트워크가 아닌 별도 네트워크로 구성하며 고성능 시스코 네트워크를 사용해 GPU 서버와 퓨어스토리지의 스토리지를 연결

  • 실제 스토리지 성능 테스트 결과 인피니밴드와 이더넷에 큰 차이가 없었음, 이더넷 연결이 향후 비용 효율적인 운영 및 오픈 하드웨어 기반 구성으로 확장성이 뛰어남

  • 퓨어스토리지 FlashBlade//S로 AI 학습 및 데이터 분석 환경을 하나의 스토리지 환경으로 통합 가능, 스케일 아웃 기반으로 용량과 성능을 쉽게 확장 가능, 게다가 Key 값만으로 메타데이터를 검색하는 Key-Value 기반 NFS 파일 프로토콜을 사용해서 데이터의 크기 및 종류에 상관없이 일관되게 고성능 제공, NVIDIA DGX 인증 획득



  • 시스템 장애는 물리적 장애와 논리적 장애로 나뉨

  • 물리적 장애 : 자연재해나 기후 변화, 하드웨어 노후화, 전기 및 네트워크 단에 대한 장애 -> 하드웨어 이중화로 해결 가능

  • CVD with Pure Storage : 다수의 데이터 센터에서 운영되는 다수의 퓨어스토리지를 하나의 거대한 가상 스토리지로 묶는 Active Cluster 기술을 사용해 데이터 센터 Active-Active 구성 지원,

  • 이 구성에서는 한쪽의 스토리지에 물리적 장애가 발생하더라도 L2가 확장되어 통합되었기 때문에 빠르게 VM이 다른 스토리지로 전환됨 -> 결과적으로 네트워크의 통합 뿐만 아니라 스토리지 통합도 이루어져야 진정한 Active-Active 무중단 데이터 센터 구현이 가능할 것

  • 논리적 장애 : 사용자의 실수로 인한 데이터 유실, 사이버 공격으로 인한 데이터 손실 -> 백업을 통한 백구

  • 랜섬웨어는 바로 시스템을 공격하는 것이 아닌 스토리지의 백업 스케쥴을 파악하고 이후에 스토리지 스냅샷을 삭제한 후 데이터 암호화 시행 -> 이 경우 퓨어스토리지의 SafeMode를 사용하고 있다면 복구 가능

  • SafeMode 활성화 시 임의 삭제된 데이터를 별도의 휴지통 공간으로 이동하며 설정한 기간 동안 삭제 불가 -> 따라서 주 스토리지 볼륨이 랜섬웨어에 감염되어 스냅샷이 삭제되고 데이터가 모두 암호화되었더라도 SafeMode의 데이터로 빠르게 복구 가능









여기까지 Cisco Connect Korea 2023의 트랙 C 세션 6개를 간단히 정리했습니다. 컨퍼런스룸에서 열린 트랙 별 세션뿐만 아니라 바깥의 부스 공간에도 많은 참석자들로 북적였는데요. 25분이라는 짧은 시간 동안 발표 내용을 완벽하게 이해하기란 어렵고 따로 질의응답 시간도 없었기에 이렇게 부스에 상주하고 있는 시스코 및 후원사 임직원들에게 찾아가 궁금증을 해소하려는 분들이 많았던 것 같습니다. 물론 부스 별로 진행하는 다양한 이벤트들도 참석자들의 발길을 잡아둔 요인이기도 했고요. 


반나절의 길지 않은 시간 동안 총 20개의 세션과 넓은 공간을 풍성하게 채운 부스, 그리고 많은 참석자들 덕분에 시스코 내부적으로도 올해 Cisco Connect Korea 2023이 4년만에 오프라인으로 돌아오길 잘했다고 평가하지 않을까 싶습니다. 규모뿐만 아니라 내용 면에서도, 시스코가 말 그대로 ALL IN했다는 것이 느껴지는 알찬 행사였습니다. 




그리고, 제가 간단히 소개한 모든 세션들은 아래의 웹페이지에서 발표자료와 다시보기 영상을 통해 자세히 확인하실 수 있습니다. 아마도 컨퍼런스 참석자 분들께는 별도의 안내 메일이 나갔을테니, Cisco에서 보내는 메일 놓치지 마시고요. 메일을 받지 못하신 분들은 아래의 링크를 참고해 주세요.



추가로, 콘텐츠에서 소개한 Cisco 솔루션에 대한 전문가의 상담이 필요하신 분들이 계시다면 아래 링크를 통해 신청하시기 바랍니다.


이것으로 Cisco Connect Korea 2023 행사의 세션 정리를 마칩니다. 끝!

7개의 댓글이 있습니다.

8달 전

자료 감사합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

8달 전

정보 감사합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

8달 전

좋은 정리 감사드립니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

9달 전

시스코 제품 도입 검토 중인데 정말 큰 도움이 되었습니다

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

9달 전

행사에 직접 가는것 보다 정리해주신 내용보는게 훨씬 이해가 잘됩니다.
감사합니다.!!!

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

9달 전

유익한 정보 감사합니다

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

9달 전

요약 너무 감사합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입