이번 콘텐츠에서는 후원사인 엑세스랩과 HS효성인포메이션시스템의 세션 내용을 정리했습니다. 개인적으로 엑세스랩 세션을 매우 흥미롭게 봤는데요. 어떤 내용이 소개되었는지 바로 보실까요? 아젠다는 아래와 같습니다.
아젠다 |
|
이 콘텐츠는 HS효성인포메이션시스템의 지원으로 제작되었습니다.
1. 데이터센터 서버의 블루오션, ARM 서버 사업 소개
다섯 번째 세션은 ARM 서버를 개발하는 엑세스랩의 세션으로, 주제는 '데이터센터 서버의 블루오션 ARM 서버 사업 소개'입니다. x86 서버가 주류인 데이터 센터 서버 시장에서 ARM 서버가 어느 정도의 영향력을 발휘할 수 있을 지 궁금한데요. 주요 세션 내용을 토대로 ARM 서버의 특징에 대해 함께 알아봅시다.
■데이터 센터의 전력 문제
현대의 데이터 센터는 전력 사용량이 점점 많아지고 있고, 그에 대한 전력 비용도 앞으로 더 가파르게 상승할 것으로 예측되고 있습니다. 올해 6월 분산 에너지 활성화 특별법이 시행되어 지방에서 주로 생산하는 발전소의 전력을 대부분의 데이터 센터가 위치하고 있는 수도권으로 가져오면 예전과는 달리 더 비싼 전력 요금을 지불해야 하기 때문입니다. 그래서 국내 빅테크 기업들이 데이터 센터를 부산, 춘천, 충주 등 지방에 짓고 있는 것인데 이렇게 데이터 센터를 새로 지을 때는 제로 에너지 빌딩이라는 탄소 중립 정책도 따라야 하기에 추가적인 솔루션을 도입해야 하죠.
그리고, 2022년 카카오 데이터 센터 화재 사건은 전력 문제로 인한 심각한 장애를 드러낸 사례입니다. 데이터 센터는 AI, GPU 등의 고성능 장비로 인해 점점 더 많은 전기를 필요로 하고 있으며, 이걸 해결하지 않으면 안정적인 서비스 제공이 어려운 상황에 놓일 수 있습니다. 즉, 전력 문제는 데이터 센터 운영 측면에서 가장 골치아픈 문제라고 봐야겠죠.
■ARM 서버가 이러한 데이터 센터의 전력 문제를 해결할 수 있을까?
ARM 서버는 전통적인 인텔 및 AMD 서버와 달리 저전력이면서도 고성능을 제공하는 서버 아키텍처입니다. ARM 기반의 프로세서는 이미 스마트폰에서 널리 사용되고 있으며, 이 기술을 서버에 도입한 것이 ARM 서버인데요. ARM 서버는 특히 저전력이면서도 발열이 적고 성능이 뛰어난 특성 덕분에 데이터 센터에서 큰 관심을 받고 있습니다.
그리고 ARM 서버의 성장은 급속도로 이루어질 것이라고 예측되고 있습니다. 실제로 지난 3년간 글로벌 서버 시장에서 ARM 서버만이 꾸준한 성장을 기록했고, 위 장표의 오른쪽 차트와 같이 향후 ARM 서버의 비중이 x86 서버를 능가하게 될 것이라고 합니다만, 이건 사실 너무 긍정적인 예측 같기는 합니다.
하지만 고무적인 사실은, 글로벌 빅테크 기업들이 앞다투어 ARM 서버를 도입하고 있다는 것입니다. 2018년, Amazon은 자사의 클라우드 서비스를 위해 ARM 기반의 서버용 CPU를 개발하여 시장에 내놓았고, 이것은 ARM 서버의 가능성을 보여준 중요한 사례입니다. 이어서, Apple도 2020년에 Intel 칩에서 자체 개발한 ARM 기반의 M1 칩으로 전환하면서 고성능 ARM 서버 칩이 주목받게 되었고요. Oracle 역시 2021년 ARM 서버 기반 클라우드를 공개하였으며, Microsoft, Google, 그리고 NVIDIA까지도 ARM 서버를 도입하고 있습니다. 특히 NVIDIA는 GPU 회사로 잘 알려져 있지만, 최근 ARM 서버를 활용한 데이터 센터 사업에 집중하고 있죠.
또한, 국내 기업인 SK텔레콤도 ARM 서버 사업에 진출하겠다고 발표하며, 과거 메인 프레임 제조사로 명성을 떨친 일본의 Fujitsu는 Fugaku라는 ARM 기반 슈퍼컴퓨터를 만들었습니다. ARM 서버가 저성능이라 서버를 만들 수 없다는 세간의 우려를 불식시킨 사례라고 할 수 있습니다.
■전통의 x86 아키텍처 기반 서버와 비교해 ARM 서버가 가진 특징
ARM 서버의 가장 큰 강점은 저전력임에도 불구하고 고성능을 발휘할 수 있다는 점입니다. Intel, AMD와 같은 x86 아키텍처의 서버 프로세서는 하이퍼스레딩 기술을 통해 물리적 코어를 가상으로 확장하여 성능을 높이려 하지만, 이 방법은 AI, 멀티미디어 스트리밍 등 실시간 고성능 연산이 필요한 작업에는 성능 저하를 유발할 수 있습니다.
반면 ARM 서버는 다수의 물리적 코어를 탑재해 이런 성능 저하 없이 안정적인 성능을 제공합니다. 특히 최신 ARM 서버 칩은 5나노미터 또는 7나노미터 공정으로 제작되어, 더 작은 칩 사이즈로도 뛰어난 전력 효율과 성능을 제공합니다. 인텔 서버의 경우 여전히 10나노미터 공정을 사용하고 있으며, ARM 서버는 이보다 훨씬 앞선 공정 기술을 사용하고 있기 때문이라는군요. 최근 발표에 따르면 Intel도 3나노미터 공정의 Intel3 기반의 6세대 Xeon 프로세서를 생산할 것이라고 발표했는데, 현재 사용되고 있는 Intel의 최신 서버 프로세서인 5세대 Xeon 프로세서는 10나노미터 공정입니다.
게다가 ARM 서버는 AI 추론에서도 x86 서버보다 성능 효율성이 더 좋습니다. 위 장표 가장 오른쪽의 차트를 보시면, 전력 대비 성능이 ARM 서버가 더 뛰어난 것을 보실 수 있는데요. 이렇게 ARM 서버는 저전력 뿐만 아니라 AI 추론 성능에서도 효율이 좋아 AI에 투자하려는 기업들에게도 좋은 선택지가 될 수 있습니다.
데이터 센터 운영의 핵심은 효율성입니다. 데이터 센터는 부동산과 마찬가지로 얼마나 많은 서버를 효율적으로 설치하고 운영할 수 있는지가 중요한데요. 기존의 Intel, AMD 서버는 발열이 많아 랙에 모든 서버를 꽉 채울 수 없는 문제가 있지만, ARM 서버는 발열이 적어 랙에 더 많은 서버를 설치할 수 있다고 합니다. 덕분에 공간 효율성은 크게 향상되고, 전력 소모가 적어 운영 비용도 절감할 수 있겠죠.
마지막으로 ARM 서버는 소프트웨어 호환성 측면에서도 지속적으로 강화해 나가고 있습니다. 물론 역사와 전통을 자랑하는 x86 서버 만큼은 아니겠지만, 클라우드 환경에서 활용하는 유명한 오픈소스들을 위 장표와 같이 지원하고 있고요. 리눅스 OS부터 RDBMS, 분산형 DB, NoSQL, 인프라 자동화, 빅데이터, AI 라이브러리까지 다양한 소프트웨어 호환성을 확보했고, 계속 확장되고 있다고 합니다.
물론 이 소프트웨어들과의 호환성이 x86 서버 만큼 완성도가 높은지는 별도로 검증해 봐야 할 것일테지만, 클라우드 서비스를 제공하는 글로벌 빅테크 기업들도 ARM 서버를 많이 활용하고 있는 만큼, 많이 사용하는 오픈소스에 대해서는 어느 정도 검증이 끝났다고 봐도 되지 않을까요?
■국내 최초, 유일한 ARM 서버 개발 기업 엑세스랩
엑세스랩은 국내 최초이자 유일하게 ARM 서버를 프로세서만 제외한 모든 부분을 자체 개발하고 있는 기업입니다. 현재 카카오, SK 브로드밴드, 한국남동발전, 삼아알미늄에 ARM 서버를 납품했고, 삼성전자도 반도체 패키징 공장에서 PoC를 진행 중이라고 합니다. 그리고 하와이 주립대학에 ARM 서버를 납품했는데 5년 동안 다운타임 한번 없이 안정적으로 운영되고 있다는군요.
엑세스랩의 사례 중 대구의 한국자동차연구원 사례는 기존의 Intel 서버로 구성한 백업 서버를 ARM 서버를 납품해 교체하고, 오픈소스 스토리지 프로젝트인 Ceph 구축까지 담당해 소프트웨어 기술력까지 검증받은 사례입니다. 이렇게 엑세스랩은 ARM 서버 하드웨어 자체 개발 역량 뿐만 아니라 서버 원격 관리 소프트웨어와 클라우드 인프라 구축 및 개발 역량까지 갖춘, ARM 서버 기반 IT 인프라에 최적화된 국내 유일한 기업이라고 할 수 있겠습니다.
현재 운영 중인 데이터 센터의 전력, 공간, 운영 효율성 측면에서 다양한 애로사항을 겪고 있는 기업이라면 ARM 서버로 교체함으로써 이러한 문제들의 상당 부분을 해결할 수 있지 않을까요? 이러한 서버 인프라를 교체하는 데에 개인적으로 중요한 것은 소프트웨어 호환성이라고 보고 있는데, 이 부분이 앞서 보신 장표와 같이 해결될 수 있고 엑세스랩의 소프트웨어 기술력이 더해진다면 얼마든지 ARM 서버 교체 프로젝트를 추진할 수 있지 않을까 싶습니다.
AI의 붐으로 강력한 성능의 GPU 서버가 최근 주목을 많이 받고 있는 반면 실제 AI를 구동하는 기기 측면에서는 온디바이스 AI가 관심을 끌고 있죠. ARM 서버도 이러한 효율성 측면에서 강점이 많은 만큼, 앞으로의 서버 시장에서 가시적인 성과를 꾸준히 내기를 기대해 봅니다.
2. 생성형 AI 시대, 고성능 인프라의 중요성
이제 마지막 세션이네요. 이번 세션의 주제는 '생성형 AI시대, 고성능 인프라의 중요성'입니다. 최근 가장 핫한 IT 트렌드인 생성형 AI와 이를 효과적으로 지원하기 위한 고성능 인프라 및 데이터 레이크의 중요성에 대해 다룬 세션인데요. 기업들이 AI 기술을 적극적으로 도입하면서, AI 분석에 적합한 데이터 저장소와 고성능 컴퓨팅 인프라가 필수적인 요소로 떠오르고 있는 요즘, HS효성인포메이션시스템이 마련한 대안은 무엇인지 알아보겠습니다.
■생성형 AI 트렌드의 변화
최근 몇 년간 AI 기술은 빠르게 진화하고 있으며, 특히 2023년 ChatGPT의 등장 이후 생성형 AI는 전 세계적으로 큰 관심을 받고 있습니다. 이전까지 AI는 주로 데이터를 분석하는 데 사용되었지만, 생성형 AI는 텍스트, 이미지, 영상 등 다양한 데이터를 처리하고, 사용자가 입력한 자연어를 이해해 이를 기반으로 답변을 제공하는 멀티 모달(MM) 모델로 진화해 나가고 있죠. 생성형 AI 모델의 유행은 LLM에서 시작되었지만, 특정 산업군에 적용하는 sLLM부터 온디바이스용 SLM, 이미지나 오디오에 특화된 LMM 등으로 파생되었습니다.
그리고, 이러한 생성형 AI 모델은 단순한 언어 처리에서 더 나아가 수요 예측, 스마트 팩토리 운영, 예지 정비와 같은 다양한 산업 분야에서 활용되고 있습니다. 그리고 기업들이 필요로 하는 AI 모델 역시 각기 다를 수 있겠죠. 예를 들어, 수학적 분석을 필요로 하는 기업은 이러한 기능에만 강점을 가진 AI 모델을 선택할 수 있습니다.
그렇다면, 이러한 다양한 AI 모델 중 우리 회사에 알맞은 AI 모델을 선택하고 활용하기 위해 고려해야 할 것들은 무엇이 일을까요? AI 기반 비즈니스의 목표, 데이터의 보안, 도입 비용 등도 중요한 항목이겠지만 무엇보다 중요한 것은 AI를 제대로 활용할 수 있는 빅데이터를 수집하고 분석할 수 있는 인프라를 갖추는 것입니다.
그래서 주목받고 있는 것이 현대화된 아키텍처를 갖춘 데이터 수집 및 분석 플랫폼입니다. AI 분석을 위한 고성능 인프라는 GPU 클러스터와 같은 고성능 컴퓨팅 시스템을 필요로 하죠. 데이터 분석에서 중요한 것은 데이터를 빠르게 처리하고, 그 데이터를 기반으로 정확한 모델을 학습시키는 것입니다. 이 과정에서 중요한 것은 데이터의 저장과 접근입니다. 그래서 데이터를 효율적으로 관리하고, 분석에 필요한 데이터를 신속하게 제공할 수 있는 데이터 레이크 아키텍처가 필요한 것입니다.
과거에는 주로 정형 데이터(구조화된 데이터)만을 다루는 데이터 웨어하우스가 사용되었습니다. 그러나 비정형 데이터를 분석하기 위해서는 데이터 레이크가 필요합니다. 데이터 레이크는 비정형 데이터를 대규모로 저장하고 분석할 수 있는 환경을 제공합니다. 더 나아가 최근에는 데이터 레이크와 데이터 웨어하우스의 장점을 결합한 레이크 하우스라는 개념이 등장하여, 기업의 데이터 분석 환경을 더욱 유연하게 지원하고 있습니다.
■AI 인프라에서 중요한 요소, GPU와 스토리지
AI 분석을 지원하는 인프라에서 중요한 3가지 요소는 연산파워(GPU 및 HPC 시스템), 데이터(고성능 데이터 인프라), 알고리즘(AI 모델 개발/운영할 AI솔루션)입니다. 이 중 HS효성인포메이션시스템은 연산파워와 데이터 이 두 가지 요소에 집중하고 있는데요. 기업들이 고성능 AI 인프라를 구축할 때 가장 많이 고려하는 요소는 GPU의 선택입니다. 그러나 무조건 최신 GPU가 필요한 것은 아닙니다. HS효성인포메이션시스템은 고객의 비즈니스 목표와 분석 요구에 맞춰 최적의 GPU를 제공하는 맞춤형 솔루션을 제안하고 있습니다.
예를 들어, 기업이 H100 GPU를 요청했지만 담당자와 이야기를 나눠보면 L40S GPU만으로도 충분한 케이스도 있을 수 있습니다. 무조건 고성능의 GPU를 제공하는 것이 아닌 고객의 환경에 최적인 GPU 기반의 HPC를 컨설팅해 줄 수 있는 능력을 갖추고 있다는 것이 중요한 점이겠죠. 그래서 HS효성인포메이션시스템은 위 장표와 같이 기업의 비즈니스 목표를 6가지로 나누어 그에 알맞은 GPU를 제안하고 있습니다.
AI 분석은 데이터를 수집하고, 전처리한 후, 이를 학습시키고 평가하는 일련의 워크플로우를 따릅니다. 각 단계마다 요구되는 스토리지의 성능과 비용 효율성이 달라지기 때문에, 다양한 분석 환경을 지원할 수 있는 멀티 프로토콜 스토리지 시스템이 꼭 필요한데요. HS효성인포메이션시스템은 HCSF(Hitachi Content Software for File)이라는 고성능 스토리지 솔루션을 제공해 AI 분석 환경에 최적화된 저장소를 구축합니다. HCSF는 초고성능 분산 병렬 파일시스템과 대용량 오브젝트 스토리지로 나누어 데이터를 관리할 수 있습니다.
HCSF는 이 두 가지 유형의 스토리지를 핫 티어와 콜드 티어로 자동으로 분류하는데요. 핫 티어에서 비활성화된 데이터를 알아서 오브젝트 스토리지로 이동시켜 비용을 절감할 수 있고요. 또한, 데이터 분석가가 그 데이터가 필요해서 OS에 접근하게 되면 자동으로 오브젝트 스토리지에 있던 데이터를 다시 NVMe 스토리지로 불러올 수 있습니다. 이러한 유연한 데이터 관리 기능 덕분에 기업은 AI에 필요한 데이터를 효율적으로 관리할 수 있게됩니다.
■HS효성인포메이션시스템의 데이터레이크 구축 사례
HS효성인포메이션시스템은 다양한 산업 분야에서 앞서 소개한, AI를 위한 고성능 인프라와 데이터 레이크 솔루션을 구축했습니다.
●국내 대형 IT 기업: 자체 LLM 개발을 위해 HPC 클러스터와 HCSF를 도입해 AI 분석 환경 구축
●국내 은행: 실시간 데이터와 준실시간 데이터를 HCSF에 통합 저장해 AI 분석에 필요한 데이터 환경 구축
●국내 대형 제조사: 방대한 데이터의 효율적인 처리를 위해 GPU DB와 HCSF를 도입해 빅데이터 분석 환경 구축
앞서 언급했던 것처럼 각기 다른 비즈니스 요건임에도 불구하고 HS효성인포메이션시스템의 HPC 클러스터와 HCSF가 성공적으로 구축되어 잘 활용될 수 있다는 것에 주목해 주시면 됩니다. 그런데 사실, 이러한 AI 인프라 구축 프로젝트를 하게 되면 참여하는 제조사 모두 저마다의 강점을 자랑하는 데에 급급하기 때문에 기업의 담당자 입장에서는 선택이 어려울 수 있습니다. 그 자랑을 단순히 소개 자료로 하는 것이 아닌 PoC와 BMT로 증명할 수 있다면, 그리고 앞서 보신 이러한 구축 사례에 적용된 하드웨어 인프라와 소프트웨어까지 한꺼번에 제공할 수 있는 역량을 갖춘 기업이라면 좀 다르게보이지 않을까요? 그 기업이 어디인지는 굳이 다시 말씀드리지 않아도 되겠죠?
여기까지 부산에서 진행된 HS효성인포메이션시스템의 '데이터센터 현대화 컨퍼런스 2024'의 6개 세션 내용을 모두 정리했습니다. 세션 내용이 온라인 웨비나 형태로 소개되지 않아 평소와는 다르게 세션 내용을 많이 다루느라 분량이 다소 길어졌는데요. 그럼에도 불구하고 저는 세션 장표의 일부만 소개한 것이니, 전체 발표자료가 궁금하신 분들은 아래의 링크에서 확인해 보시기 바랍니다.
추가로, 우리 회사도 보유 중인 IT 인프라와 애플리케이션의 현대화가 필요해 HS효성인포메이션시스템 전문가와의 상담이 필요하신 분들이 계시다면, 아래 링크에서 신청하실 수 있습니다.
이 콘텐츠가 데이터센터 현대화에 대한 방안을 찾고 계신 IT 담당자 분들께 조금이나마 도움이 되었기를 바랍니다. 끝!
2개의 댓글이 있습니다.
정보 참고하겠습니다.
Reply댓글 남기기
댓글을 남기기 위해서는 로그인이 필요합니다.
로그인 회원가입참고하겠습니다.
Reply댓글 남기기
댓글을 남기기 위해서는 로그인이 필요합니다.
로그인 회원가입