2개로 나눠 출시된 제온 프로세서, 어떻게 다를까?

2개로 나눠 출시된 제온 프로세서, 어떻게 다를까?

오랜 기간 동안 인텔은 데이터센터 CPU 시장의 절대 강자로 군림해왔습니다. 제온(Xeon) 프로세서의 높은 성능과 안정성, 광범위한 생태계 지원을 바탕으로 인텔®은 데이터센터 CPU의 표준으로 자리잡았고, HPE, 델(Dell Technologies), 레노버(Lenovo)와 같은 OEM 파트너들 역시 인텔 CPU를 장착한 다양한 서버들을 기업들에게 공급해왔죠. 그러나 최근 몇 년간 클라우드 서비스의 폭발적인 성장과 다양한 클라우드 기술의 발전으로 IT 트렌드가 변화하기 시작했습니다.




<이미지 출처: Anandtech, AMD hits record high share in x86 cpus in Q1 2024, 클릭하면 커짐>


위 이미지는 2018년 2분기부터 2024년 1분기까지의 데이터센터 CPU 시장에서 인텔과 AMD의 점유율을 보여주고 있는데요. 과거 9:1 수준의 점유율 차이가 조금씩 줄어들더니, 2020년 ~ 2022년은 거의 75:25까지 차이가 좁혀집니다. 그리고, 앞으로 이 점유율 차이는 더욱 좁혀질 수 있다는 것이 여러 IT 미디어들의 전망입니다.


하지만, 인텔은 이런 상황을 그냥 두고 보지만은 않았습니다. 그리고 대책을 빠르게 강구해 이런 변화에 대응하고 있는데요. 그래서 이번 콘텐츠에서는 인텔의 전략은 무엇인지, 그리고 그 결과물인 인텔® 제온® 6 프로세서는 어떤 특징을 가지고 있는지 자세히 알아보겠습니다. 콘텐츠 목차는 아래와 같습니다.



콘텐츠 목차


 1. 반격의 시작, 인텔® 제온® 6 프로세서 출격

 2. 범용적인 용도에 알맞은 인텔® 제온® 6 E-코어 프로세서

 3. AI, HPC 용도에 제격인 인텔® 제온® 6 P-코어 프로세서

 4. 결론: 최신 제온® 6 프로세서 탑재 서버로 교체해야 할 명분은?

 ※ 콘텐츠 퀴즈 & 설문 이벤트

  • 목차 별 링크를 클릭하면 해당 내용의 첫 부분으로 이동합니다.

  • 마우스의 뒤로가기 버튼을 클릭하면 다시 아젠다로 돌아옵니다


이 콘텐츠는 인텔의 지원으로 제작되었습니다.








1. 반격의 시작, 인텔® 제온® 6 프로세서 출격




<이미지 출처: Gartner, Gartner Newsroom>


클라우드 서비스는 2010년대 이후 데이터센터 시장의 핵심 성장 동력으로 자리 잡았습니다. 산업의 태동 초기에는 인텔® 제온® 프로세서가 클라우드 환경에 최적화된 아키텍처와 기술로 시장을 선점했죠. 하지만, 클라우드에서 활용되는 워크로드가 점점 다양화되고, 클라우드 사업자들은 자신들의 비즈니스가 더욱 확대되기를 원함과 동시에 운영 효율성에도 관심을 두기 시작했습니다. 




클라우드 서비스의 기초는 가상화이고, 물리 서버 자원을 가상화시켜 빌려주는 것이기 때문에 가상화 기술이 핵심입니다. 가상화 기술은 한정된 물리 코어의 수 보다 더 많은 수의 vCPU를 제공해 왔지만 어쨌든 물리 코어를 활용해야 하는 기술이니만큼, 물리 코어 수가 많을 수록 고객들에게 더 많은 vCPU를 제공할 수 있죠.


그래서 코어의 수가 많은 CPU 사용하면 같은 수의 서버로도 더 많은 vCPU를 제공할 수 있으니 데이터센터 운영 비용을 절감할 수 있게 되는겁니다. 즉, 클라우드 사업자들의 주된 관심사는 CPU 코어의 높은 성능보다는, 코어 별 성능이 좀 떨어지더라도 더 많은 수의 코어를 장착하고, 전력 효율도 좋은 CPU 쪽으로 옮겨가게 되었습니다. 이런 현상을 빠르게 캐치한 AMD는 자사의 데이터센터 CPU, EPYC 프로세서의 코어 수를 늘리는 쪽으로 집중합니다. 그 결과가 앞서 서두에 보여드린 데이터센터 CPU 시장 점유율의 변화라고 보시면 되겠습니다.



<이미지 출처: The Register, 인텔® wants to run AI on CPUs and says its 5th-gen Xeons are ones to do it>


반면 인텔은 조금 다른 노선을 택했습니다. 기존에 자신들이 잘 하던 IPC 성능 향상에 더해, 특정 영역에서의 성능을 더욱 끌어올릴 수 있는, CPU의 연산을 도와줄 수 있는 별도의 연산 가속 엔진을 탑재한 것인데요. 신기술 도입을 위한 제조 공정의 변화, 그리고 CPU에 별도의 연산 가속 엔진 추가 및 품질 향상에 초점을 맞춘 4세대 인텔® 제온® 스케일러블 프로세서(코드명 : 사파이어 래피즈)가 몇 번의 연기 끝에 2023년 1월에 출시됩니다. 그리고 다음 세대인 5세대 인텔® 제온® 스케일러블 프로세서(코드명 : 에메랄드 래피즈)를 2023년 12월에 출시하는데요. 




<이미지 출처: AIwire, 인텔® Officially Launches Sapphire Rapids with Built-in Acceleration>


경쟁사의 다 코어 전략에 맞서 인텔은 코어 자체의 성능 향상과 연산 가속 엔진 추가로 승부수를 띄웁니다. 코어 수가 CPU가 제공하는 가치의 전부는 아니라는 것인데요. 그래서 인텔은 가속엔진을 무려 12개나 탑재했다고 발표했는데요. 그 중 주요 가속엔진 4개를 간단히 소개하면 아래와 같습니다.





이러한 가속기들은 특정 영역에서의 작업을 CPU 대신 처리함으로써 CPU의 부하를 줄여줍니다. 결과적으로 CPU가 보다 효율적으로 자신이 가진 성능을 최대한 높은 수준으로 발휘할 수 있도록 돕는 것인데요. 덕분에 가속기가 활용되는 특정 분야에서의 작업 성능은 인텔이 앞섰지만, 성능 보다는 더 많은 수의 코어를 바탕으로 최대한 많은 VM을 제공하기를 원했던 클라우드 사업자의 입맛을 충족시키기에는 경쟁사 대비 조금 부족하지 않았나 싶습니다.









그래서 인텔은 2024년 6월, 인텔® 제온® 6 프로세서를 출시합니다. 5세대 인텔® 제온® 프로세서 출시 이후 6개월 만에 차세대 프로세서를 출시한 것인데요. 종전까지 브론즈, 실버, 골드, 플래티넘 이렇게 4개 등급으로 구분했던 프로세서를 E-코어 프로세서와 P-코어 프로세서 두 가지 유형으로 좀 더 단순하게 라인업을 정리했습니다.




<이미지 출처: Storage Review, 인텔® Xeon 6 Review(Sierra Forest – 6780E, 6766E)>


 이 두 가지 인텔® 제온® 6 프로세서를 간단히 요약하면

  • 인텔® 제온® 6 (코드명: 시에라 포레스트) E-코어(Efficiency Cores) 프로세서

최대 144코어, 전력 효율성이 높고 병렬 작업이 많은 클라우드 데이터센터에 알맞음

  • 인텔® 제온® 6 (코드명: 그래나이트 래피즈) P-코어(Performance Cores) 프로세서

최대 128코어, 고성능 연산에 최적화되어 AI, 고성능 컴퓨팅(HPC), 대규모 데이터 분석에 적합


자, 그럼 이제 인텔® 제온® 6 E-코어 프로세서와 P-코어 프로세서의 특징에 대해 좀 더 자세히 뜯어봐야겠죠? 경쟁사의 매서운 공격을 잘 막아내기 위해 어떤 특징으로 무장했는지 살펴봅시다.








2. 범용적인 용도에 알맞은 인텔® 제온® 6 E-코어 프로세서



 1) 인텔 3 공정 기반 컴퓨트 다이에 꾹꾹 눌러담은 144코어 프로세서


<이미지 출처: Wccftech, 인텔® Xeon 6700E “Sierra Forest” CPUs Launched>


인텔® 제온® 6 E-코어 프로세서의 E는 Efficiency의 약자입니다. 즉, 효율, 능률을 강조한 프로세서인데요. 인텔® 제온® 6 E-코어 프로세서의 컴퓨트 다이는 최신 인텔 3 공정을, I/O 다이는 이전 세대 제온 프로세서에서도 사용되었던 인텔 7 공정을 기반으로 제작되어 패키징되었습니다. 그럼, 주요 특징을 간단히 살펴볼까요?


  • 코어 수 대폭 증가

인텔® 제온® 6 E-코어 프로세서는 64개 - 144개의 물리적 코어를 지원하며, TDP는 64코어 프로세서가 205W, 144코어 프로세서는 330W에 불과합니다. 이전의 5세대 제온® 스케일러블 프로세서의 64코어 대비 코어 밀도가 2배 이상으로 증가해서 대규모 병렬 작업에서 유리함은 물론, TDP도 높지 않아 운영 효율성이 아주 좋습니다.


  • 하이퍼스레딩 제외

5세대 인텔® 제온® 스케일러블 프로세서까지 빠지지 않고 지원되었던 Hyper Threading(하이퍼스레딩) 기술이 인텔® 제온® 6 E-코어 프로세서에서는 제외됐습니다. 논리적으로 2개 코어가 동작하도록 지원하는 하이퍼스레딩은 모든 작업에서 2개의 논리적, 가상 코어가 활성화되는 것은 아니거든요. 그래서 인텔은 하이퍼스레딩을 과감하게 없애고 확실한 물리 코어 수를 최대화시켜 프로세서의 작업 코어 당 작업 효율성을 높이는 데에 집중했습니다.


  • EMIB(Embedded Multi-die Interconnect Bridge)



<이미지 출처: 인텔® 반도체 칩 패키징>


인텔의 EMIB 기술은 4세대 인텔® 제온® 스케일러블 프로세서부터 사용된, 특허받은 후공정 패키징 기술로, 칩렛 간의 고속 통신을 지원하는 핵심 기술입니다. 칩렛 간의 연결을 위해 대형 실리콘 인터포저를 사용하는 대신, 패키지 기판에 내장된 작은 실리콘 브리지를 사용해서 비용과 전력 소비를 줄이면서도 높은 데이터 전송 속도를 제공하는 핵심 기술이라고 할 수 있죠. 


여기서 칩렛은 칩에서 필요한 기능을 분리해 설계한 작은 칩 조각을 의미합니다. 이 칩 조각들을 각각 기능별로 따로 만든 뒤, 첨단 후공정 기술을 활용해 하나의 패키지로 집적한 것인데요. 과거에는 여러 기능을 하나의 큰 칩에 통합하는 SoC(System on Chip) 방식을 주로 사용했다면, 현재는 칩렛을 활용해 다양한 칩을 결합하여 하나의 패키지로 만드는 SiP(System in Package) 방식이 주목받고 있습니다. 


이러한 칩렛에 로직, 메모리, 센서 등 다양한 기능을 집적하는 기술을 이종집적(Heterogeneous Integration)이라고 부르고 있고요. 인텔의 EMIB(Embedded Multi-die Interconnect Bridge)는 이러한 이종집적 기술을 구현하기 위한 인텔의 첨단 패키징 기술이라고 보시면 되겠습니다.




 2) 인텔® 제온® 6 E-코어 프로세서, 어디에 활용하면 좋을까?



  • 클라우드 네이티브 애플리케이션: 가상화 및 컨테이너 환경



<이미지 출처: Increment, The Cloud Native Computing Foundation: The container incubator>


가상화 및 컨테이너 환경에서는 대규모 데이터를 동시에 처리해야 하는 병렬 작업이 핵심입니다. 인텔® 제온® E-코어 프로세서는 최대 144코어에 달하는 고밀도의 물리 코어를 사용해 다수의 작업을 동시에 처리하는 데에 매우 유리한데요. 가상화 환경에서 vCPU는 워크로드 간의 자원 배분을 원활히 하기 위해 CPU 자원을 많이 사용할 수밖에 없는데, 코어수가 많으면 그럴 필요 없이 그냥 워크로드 당 코어를 직접적으로 할당해줄 수 있죠. 즉, 워크로드의 작업 효율이 올라간다는 것입니다.



  • 프론트엔드 서버



<이미지 출처: Systango, RESTful Web Services and Architecture with the web API>


웹 서버와 같은 프론트엔드 단에 있는 서버들은 백엔드의 데이터베이스 서버와 매우 빈번하게 데이터 조회 및 응답이 발생합니다. 그리고 다른 서버들과의 API 호출을 통해 대량의 I/O가 발생할 수 있는데요. 이 때 인텔® 제온® 6 E-코어 프로세서가 가진 다수의 코어가 빛을 발합니다. 게다가 많은 코어를 확보하기 위해 많은 서버를 확보하지 않아도 되니 데이터센터 내 랙 밀도를 높여 상면 공간을 줄일 수 있고, 이는 곧 전력 소비 절감으로 이어져 데이터센터 운영 비용을 절약할 수 있겠죠?



  • 엣지 컴퓨팅




엣지 컴퓨팅 환경은 데이터센터처럼 다수의 서버를 둘 만한 공간이 부족합니다. 공간 뿐인가요? 전력 공급 역시 한정적일 수밖에 없죠. 게다가 현장에서 바로 데이터를 처리해 활용할 수 있어야 합니다. 따라서, IoT 디바이스, 스마트 제조, 자율 주행 차량과 같은 엣지 컴퓨팅 환경에서는 실시간 데이터 처리와 빠른 데이터 전송, 그리고 전력이 충분하지 않은 환경에서도 안정적으로 작동할 수 있는 인텔® 제온® 6 E-코어 프로세서 기반 시스템이 제격입니다.


여기까지 인텔® 제온® 6 E-코어 프로세서의 특징에 대해 살펴봤고요. 앞서 언급했던 것과 같이 인텔® 제온® 6 프로세서는 한 종류가 더 있습니다. 바로 P-코어 프로세서인데요. 마찬가지로 어떤 특징을 가지고 있는지 알아봅시다.







3. AI, HPC 용도에 제격인 인텔® 제온® 6 P-코어 프로세서


 1) 최대 128코어에 높은 메모리 대역폭, 하이퍼스레딩까지 지원하는 고성능 프로세서



<이미지 출처: ServerTheHome, Intel Xeon 6 Granite Rapids AP Launch Overview> 


인텔® 제온® 6 P-코어 프로세서의 P는 Performance의 약자입니다. 말 그대로, 뛰어난 성능에 초점을 맞춘 프로세서인데요. 최대 128코어를 지원하는 인텔® 제온® 6 P-코어 프로세서 6980P 제품은 기본 클럭 속도 2.0GHz와 최대 클럭 속도 3.9GHz에 이르고요. DDR5-6400 및 MRDIMM-8800 메모리(Multiplexed Rank Dual Inline Memory Modules, 2개의 DDR5 메모리를 하나로 합친 차세대 DRAM)를 지원해 방대한 데이터 처리가 필요한 데이터센터 환경에서 충분한 메모리 대역폭을 제공합니다. 게다가 L3 캐시 메모리도 504MB로 144코어를 지원하는 인텔® 제온® 6 E-코어 프로세서 6780E 제품의 108MB보다 거의 5배나 많은 것이 특징입니다.


그리고, 인텔® 제온® 6 P-코어 프로세서에는 인텔® 제온® 6 E-코어 프로세서에서 제거되었던 하이퍼스레딩(HT) 기술이 온전히 남아있습니다. 덕분에 E-코어 프로세서 대비 코어 수가 적은 한계를 극복할 수 있게 되었는데요. 하이퍼스레딩은 하나의 물리적 코어가 두 개의 논리적 코어처럼 작동하게 함으로써, 논리적 스레드 수를 두 배로 확장하는 기술입니다. 그래서 P-코어 프로세서는 물리적 코어 수의 부족을 보완하며, 멀티스레드 작업에서 높은 성능을 발휘할 수 있게 됐죠.



 2) 인텔® 제온® 6 P-코어 프로세서에만 적용된 AI 가속 엔진


데이터센터 환경은 단순히 코어의 성능 향상만으로는 다양한 워크로드를 효율적으로 처리할 수 없을 정도로 점점 고도화되고 있습니다. 인텔은 이러한 환경 변화에 대응하기 위해 인텔® 제온® 6 P-코어 프로세서에 몇 가지 가속 엔진을 탑재했는데요. 앞서 언급한, 4세대 제온® 스케일러블 프로세서에 탑재된 총 12개의 가속 엔진은 E-코어 프로세서에도 14개나 들어있습니다.(2 x DSA, 2 x IAA, 2 x QAT, 2 x DLB, 6 x VMD) 그런데, 이 가속 엔진 외에 인텔® 제온® 6 P-코어 프로세서에만 있는, AI 연산을 위한 특별한 엔진 2개가 더 있는데요. 이게 P-코어 프로세서의 핵심인지라, 간단히 살펴보고 넘어갑시다.



  • Intel AMX (Advanced Matrix Extensions)



<이미지 출처: Intel, 인텔® Advanced Matrix Extensions 개요>


AMX는 행렬 연산(Matrix Operations)을 가속화하는 인텔의 명령어 집합으로, 특히 AI와 머신러닝에서 요구되는 대규모 행렬 계산을 최적화하기 위해 설계되었습니다. 주로 AI 모델 학습과 같은 고성능 컴퓨팅 작업에 사용되는데요. 주요 특징은 아래와 같습니다.


  • 대규모 행렬 연산 최적화

AMX는 행렬 곱셈 및 행렬-벡터 연산을 최적화하여, NLP(자연어 처리)이미지 인식딥러닝 모델 학습 등에서 빠른 계산을 제공합니다. 행렬 연산은 AI 연산에서 매우 중요한 작업으로, AMX는 이러한 연산을 CPU 내에서 수행할 수 있도록 하여, GPU 의존도를 줄이고 전력 효율성을 높여줍니다.


  • AI 모델 학습에 최적화

AMX는 특히 딥러닝에서 중요한 역할을 하는데요. 행렬 계산이 많은 작업에서 GPU 없이도 AI 모델 학습을 문제없이 처리할 수 있습니다. 그래서 AMX는 CPU 내부에서 AI 모델을 학습하면서 속도와 비용 효율성을 높이는 데 아주 중요한 기술이라고 할 수 있습니다. 그리고 고속 행렬 연산을 통해 CPU에서 많은 계산 작업을 동시에 수행할 수 있어 AI 추론 및 경량 머신러닝의 작업 효율도 높여줍니다.



  • Intel AVX (Advanced Vector Extensions)



<이미지 출처: Intel, 인텔® AVX-512란 무엇입니까?>


AVX는 벡터 연산(Vector Operations)을 가속화하는 인텔의 명령어 집합으로, 여러 데이터를 동시에 처리할 수 있게 합니다. AVX는 주로 과학적 연산금융 계산영상 처리 및 AI 모델 학습 등에서 사용되며, CPU의 병렬 처리 성능을 높이는 데에 주안점을 두고 있다고 할 수 있는데요. 


AVX는 SIMD(Single Instruction, Multiple Data) 방식으로 한 번에 여러 데이터 포인트를 동시에 처리하는데, 특히 AVX-512는 512비트 벡터 연산을 빠르게 처리함으로써 대규모 데이터셋을 활용해야 할 때 매우 유용합니다. 그래서 과학적 계산과 이미지 프로세싱비디오 인코딩과 같은 고성능 연산을 요구하는 워크로드에서 중요한 역할을 할 수 있고요. 딥러닝과 같은 AI 연산에서 벡터화를 활용하여 수천 개의 파라미터를 한 번에 처리할 수 있어 NLP와 같은 문맥 분석이나 이미지 분류와 같은 비전 작업에서 AVX가 요긴하게 활용됩니다.


이 두 엔진의 특징을 간단히 요약하면, 인텔® AMX는 주로 행렬 연산을 가속화하여 AI와 머신러닝 워크로드에서 높은 성능을 제공하는, 딥러닝 및 대규모 행렬 계산에 최적화된 기술입니다. 반면 인텔® AVX는 벡터 연산을 최적화하여 과학적 계산금융 계산AI 모델 학습 등 다양한 워크로드에서 높은 성능을 발휘하는 기술이라고 할 수 있습니다. 이 두 기술은 인텔® 제온® 6 P-코어 프로세서에만 탑재되어 있다는 것을 기억해 주세요. 



 3) 인텔® 제온® 6 P-코어 프로세서, AI & HPC 용도로 딱!


바로 앞전에 언급한 뛰어난 성능에 더해 인텔® AMX, AVX 기술 덕분에 인텔® 제온® 6 P-코어 프로세서는 AI와 HPC 용도로 제격입니다. 그리고 고성능 데이터베이스에도 딱이죠. 그럼 구체적으로 어떻게 활용하면 좋을 지 좀 더 자세히 알아볼까요?



  • AI & HPC : 유전체 분석, 시뮬레이션, 금융 리스크 분석 및 계산




HPC(High-Performance Computing)는 유전체 분석, 과학적 시뮬레이션 등 계산량이 많은 작업을 필요로 합니다. 그리고 이 과정에서 AI 모델이 활용되는데요. 인텔® 제온® 6 P-코어 프로세서는 128개의 물리적 코어와 256개의 논리적 스레드로 생명과학 분야에서 유전자 서열 데이터를 빠르게 처리함으로써 연구 시간을 단축시키고, 결과적으로 프로젝트에 소요되는 비용을 절감할 수 있습니다.




또한 기후 변화 모델링, 분자 시뮬레이션, 고체 물리학 연구 등에서 요구되는 복잡한 연산을 고성능 메모리와 앞서 말씀드린 연산 가속 엔진을 통해 보다 빠른 시뮬레이션 결과를 제공하는 데에 기여할 수 있고요. 그리고 대량의 금융 데이터를 빠르게 처리하고, 금융 리스크 분석에 필요한 대규모 계산 속도를 높임으로써 AI 모델이 결과를 빠르게 도출해낼 수 있도록 돕습니다.


따라서, 사내에 이러한 대량의 데이터 분석 및 활용을 목적으로 하는 신규 프로젝트 기회가 생긴다면, 그에 알맞은 서버는 인텔® 제온® 6 P-코어 프로세서 기반 서버가 제격이라고 할 수 있겠습니다. 이러한 프로젝트의 성공 열쇠는 얼마나 프로젝트 시간을 단축시킬 수 있느냐일텐데요. 데이터를 분석할 AI 모델은 데이터 과학자들이 잘 만들테니, IT 운영자는 그 데이터 과학자들이 단 기간에 연구 성과를 낼 수 있도록 탄탄한 인프라를 제공해 줘야하는 막중한 임무가 주어지겠죠? 그 임무를 무리 없이 수행할 수 있도록 인텔® 제온® 6 P-코어 프로세서가 도와줄 수 있을겁니다.



  • 고성능 데이터베이스를 활용한 실시간 데이터 분석




인텔® 제온® 6 P-코어 프로세서는 내장된 IAA(In-Memory Analytics Accelerator) 가속 엔진을 활용해 인메모리 데이터베이스(In-Memory DB)와 같이 대규모 데이터를 메모리에서 직접 처리하는 시스템에서 디스크 I/O 병목 현상을 줄이고 지연 시간을 크게 단축시킵니다. 그래서 금융 서비스나 전자상거래 플랫폼에서 실시간 고객 데이터 분석 상황에서 유용하게 활용될 수 있죠. 이러한 강점에 더해, 금융, 전자상거래, 물류 등의 산업에서 대규모 트랜잭션을 빠르게 처리할 수 있는 OLTP 환경에서도 PCIe 5.0 레인과 DDR5-6400 메모리를 활용해 대규모 트랜잭션의 지연 시간을 최소화시켜줍니다.


따라서, 만약 대외 고객들을 대상으로 실시간 데이터 처리가 중요한 이커머스, 핀테크 서비스를 운영하는 기업이라면 인텔® 제온® 6 P-코어가 탑재된 신규 서버를 도입해 더 빠르고 민첩한 서비스 사용성을 구현할 수 있을겁니다. 이커머스 서비스에서는 약간의 지연도 고객 이탈로 직결되는데요. 물론 이러한 서비스 지연에는 네트워크와 스토리지 등 다른 요소들도 영향을 끼칠 수 있겠지만, 가장 앞단에서 고객의 데이터를 처리하는 서버의 성능이 월등해야 함은 굳이 강조하지 않아도 잘 아시리라 생각합니다.








4. 결론: 최신 제온® 6 프로세서 탑재 서버로 교체해야 할 명분은?


<이미지 출처: Intel, ntel® Xeon® 6 Processors with Performance-Cores (P-Cores)>


지금까지 살펴본 바와 같이 인텔® 제온® 6 E-코어, P-코어 프로세서는 그 용도가 서로 명확하게 갈립니다. AI와 HPC와 같이 고성능이 필요한 용도라면 P코어 프로세서가, 이 외에 나머지 범용적인 작업에는 E-코어 프로세서가 알맞다고 요약할 수 있겠는데요. 하지만, 이 내용 만으로는 IT 담당자 분들이 경영진에 현재 사용하고 있는 구 세대 인텔® 제온® 스케일러블 프로세서가 탑재된 서버를 인텔® 제온® 6 프로세서가 장착된 최신 서버로 교체해야 한다는 명분으로 삼기에는 내용이 조금 부족하지 않나 하는 생각도 듭니다. 그래서 각 프로세서 별로 경영진에게 제안할, 명분으로 삼을만한 내용을 소개해 드리면서 이번 콘텐츠를 마무리하겠습니다.



  • 데이터센터 운영 비용을 크게 절감할 수 있는 인텔® 제온® 6 E-코어 프로세서





IT 인프라 운영에 있어 지속 가능성은 매우 중요한 화두입니다. 단어가 좀 어려워서 그렇지, 지속 가능성이라고 해봐야 별거 없습니다. 오랫동안 안정적으로 데이터센터를 더 적은 전력으로 운영할 수 있어야 한다는 것으로 이해하면 쉬운데요. 이 지속 가능성을 위해 기업들은 서버 가상화 기술을 사용해 노후화된 서버들을 소수의 최신 서버로 통합하고, 서버 자원 활용률을 끌어올려 상면 공간을 절약해 왔죠.


그래서 마찬가지 관점으로, 인텔® 제온® 6 E-코어 프로세서 도입을 가상화 기술처럼 접근하면 어떨까요? 물리 코어 수가 워낙 많으니 기존에 활용하던 2세대, 3세대 인텔® 제온® 스케일러블 프로세서기반 서버들, 나아가 나온지 10년도 훨씬 넘은 제온® 구세대 프로세서 기반 서버들을 다수 사용하는 기업이라면, 마치 서버 가상화 솔루션을 도입하는 것처럼 인텔® 제온® 6 E-코어 프로세서 기반 서버로 갈아타면 됩니다.






10여년 전부터 유행했던 서버 가상화는 물리 서버의 평균 서버 자원 활용률이 30%도 되지 않는다는 것에 착안해, 서버의 자원 활용률을 80% 이상으로 끌어올려 한대의 서버에 3대 이상의 가상 머신을 올려 독립적인 애플리케이션을 운영할 수 있다는 것을 강점으로 내세웠습니다. 자원 활용률에 따라 1:5, 최대 1:10까지 서버를 통합할 수 있다는 가상화 솔루션 업체의 제안서도 심심치 않게 볼 수 있었는데요. 이렇게 하기 위해서는 최신 프로세서를 갖춘 서버도 도입해야 했습니다. 기존에 사용하던 노후화된 서버는 물리 코어 수가 적으니, 가상화 기반의 vCPU를 많이 만들기 위해 코어 수가 많은 최신 프로세서를 탑재한 서버로 갈아타야 했을 테니까요.


인텔® 제온® 6 E-코어 프로세서가 딱 이 상황에 알맞습니다. 보통 19인치 표준 랙에는 UPS 전원장치, 네트워크 스위치, 방화벽, 스토리지, 19인치 모니터링 모니터 등을 사용한다면 대략 5~6개의 서버를 설치할텐데요. 만약 1개의 랙에 2U 서버 6개를 설치한 랙 9대를 전산실에서 운영하는 기업이 있다고 해봅시다. 이 경우 2U 서버는 보통 16코어 CPU를 2개 장착한, 2소켓 서버가 일반적이니 이 전산실에 설치된 총 코어 수는 구세대 인텔® 제온® 스케일러블 프로세서 16(코어) x 2(2소켓) x 6(서버 수) x 9(랙 수) = 1,728입니다. 


이때 서버만 인텔® 제온® 6 E-코어 프로세서 144코어 제품으로 교체하면? 144(코어) x 2(2소켓) x 6(서버 수) x 1(랙 수) = 1,728입니다. 세상에, 랙 9대를 랙 1대로 줄일 수 있네요? 하지만 이건 서버 수만 따져본거고, 각각의 9대 랙에 설치된 네트워크 스위치와 스토리지를 그대로 활용하려면 2~3대의 랙은 더 필요할겁니다. 그래도 랙 수는 3~4대 수준으로 줄어드니 상면 공간은 1/3 정도면 충분하겠군요. 상면 공간만 줄어드나요? 서버 수가 적어지니 서버에 연결할 네트워크 스위치 수도 더 적게 필요할겁니다.





게다가 더 놀라운 것은 공간만 줄어드는 것이 아닙니다. 서버 수가 54대에서 6대로 줄었으니 전력 소비량도 어마어마하게 줄어들겠죠? 단순 프로세서의 TDP만 계산해 보더라도 2세대 인텔® 제온® 스케일러블 프로세서 16코어 제품 TDP는 100W이니 54 x 2(2 소켓) x 100W = 10,800W = 약 11KW입니다. 반면 인텔® 제온® 6 E-코어 프로세서 144코어 제품을 사용한 서버를 도입하면 6 x 2(2 소켓) x 330W = 3,960W = 약 4KW입니다. 프로세서의 전력 소비량 역시 거의 1/3 수준으로 줄어드네요. 이렇게 필요한 전력 량이 줄어들면? 네, UPS 수도 줄일 수 있습니다.


프로세서의 전력 소비량이 이만큼 줄어드는 것으로 끝일까요? 아닙니다. 동일한 공간에 서버 랙 자체가 줄어들었고, 그 랙 안에서 동작하는 서버들의 주도 줄었으니 당연히 랙 별로 방출하는 발열도 감소합니다. 그럼 항온항습기와 같은 냉각 시설도 적게 필요하니 이런 시설에 소요되는 전력량도 줄어듭니다. 최신 프로세서로 교체만 했을 뿐인데 전력 량을 어마어마하게 아낄 수 있군요. 


물론 인텔® 제온® 6 E-코어 프로세서가 탑재된 서버로 교체하는 비용 역시 만만치 않겠지만, 평균 서버 운영 기간을 5년, 아니 10년으로 잡았을 경우 전력 비용 + 줄어든 장비 수에 따른 추가 전력 감소(네트워크 스위치, UPS 등) + 항온항습시설에 대한 투자 감소등을 고려하면 ROI는 금새 뽑을 수 있을겁니다. 만약 여기에 기존에 사용하던 가상화 솔루션까지 활용한다면? 전산실 운영 비용 절감이 어느 정도까지 될 지 가늠이 잘 안되는군요. 


최신 서버를 도입하면 그에 걸맞은 다른 장비들도 교체해야 할겁니다. 하지만 그런 요소들을 모두 고려한다 하더라도 인텔® 제온® 6 E-코어 프로세서의 효율이 워낙 좋기 때문에, 제온 구세대 프로세서가 탑재된 오래된 서버를 사용하는 분들이라면 충분히 교체할 가치가 있지 않을까요?



  • 일부 AI 작업에서 GPU가 없어도 된다고? AI 전용 가속 엔진으로 무장한 인텔® 제온® 6 P-코어 프로세서




<이미지 출처: Intel, Usher in a New Era of Accelerated AI on Intel® CPUs>


AI 워크로드는 일반적으로 GPU에 의존해왔지만, 인텔® 제온® 6 E-코어 프로세서의 AI 전용 가속 엔진은 이러한 틀을 깨고 있습니다. 인텔® AMX가 AI 연산의 핵심인 행렬 연산을 가속시켜 일부 AI 워크로드에서 GPU를 대체하거나 보완하는 역할을 수행할 수 있거든요. 그리고 자연어 처리(NLP)와 이미지 인식과 같은 작은 규모의 AI 워크로드에서 GPU 없이도 탁월한 처리 성능을 제공할 수 있죠. 인텔® AMX와 AVX 덕분에, 인텔® 제온® 6 P-코어 프로세서는 소규모 모델 학습 및 추론에 있어 NVIDIA T4와 같은 엔트리 급 GPU는 충분히 대체할 수 있을 것입니다.





GPU는 뛰어난 성능에도 불구하고 높은 비용과 전력 소비로 인해 데이터센터 운영에서 부담이 될 수 있습니다. 인텔® 제온® 6 P-코어 프로세서는 이러한 문제를 일정 부분 해결해 줄 수 있는데요. 고성능 데이터센터 GPU 대비 훨씬 낮은 비용과 전력 효율성으로 AI 워크로드를 처리할 수 있는 대안으로 경영진에게 제안할 수 있지 않을까요? GPU의 대체제와 보완재 두 가지 역할을 모두 수행할 수 있다는 것을 강조하면 가능할 것 같습니다. 예를 들어, AI 학습의 데이터 준비 작업이나 간단한 추론 작업을 인텔® 제온® 6 P-코어 프로세서가 처리하고 GPU는 대량의 데이터 학습에 집중함으로써 전체 AI 워크로드의 효율성을 향상시키는 것이죠.





하지만, 그럼에도 불구하고 CPU는 어디까지나 CPU입니다. 인텔® 제온® 6 P-코어 프로세서가 일반적인 CPU보다 아무리 AI 워크로드 처리 성능이 좋다 한들, 데이터센터 GPU보다 병렬 처리 성능, AI 모델 학습 및 추론 성능은 떨어질 수밖에 없습니다. 태생적으로 CPU는 순차처리 성능이 좋고, GPU는 병렬처리 성능이 좋으니까요. 게다가 고성능 데이터센터 GPU의 경우 연산을 담당하는 코어 수가 CPU 코어 수보다 몇십 배 더 많은 수천, 수만 단위입니다.


물론 코어 당 성능은 CPU가 훨씬 높긴 하지만, 단순 반복 작업이 엄청나게 많이 필요한 AI 모델 학습에는 코어 별 성능이 다소 낮더라도 아주 많은 수의 코어로 동시에 연산을 수행하는 병렬 처리가 더 중요합니다. 그래서 GPT와 같은 대규모 언어 모델의 학습에는 여전히 고성능의 데이터센터 GPU, AI 가속기가 필요한 것이라고 할 수 있죠.




<이미지 출처: Extreme Tech, Intel: Upcoming Gaudi3 AI Accelerator Will Compete With Nvidia H100, AMD MI300>


그런데, 이러한 커다란 AI 모델 학습 및 추론에 활용되는 고성능 데이터센터 GPU가 인텔에도 있다는 사실, 알고 계셨나요? AI 를 위한 가속기는 NVIDIA만 공급할 수 있다는 편견은 이제 깨셔야 할 때입니다. AMD까지 아는 분이라면 조금 낫네요. 하지만, 기억하세요. 인텔도 AI 가속기가 있습니다. 이에 대한 이야기는 다음 콘텐츠에서 아주 자세히 다뤄보겠습니다.



  • 데이터센터 운영 효율성을 끌어올릴 수 있는 절호의 기회, 텔® 제온® 6 프로세서로 잡아보세요


여기까지 인텔의 최신 데이터센터 CPU, 인텔® 제온® 6 프로세서에 대해 자세히 알아봤습니다. 워낙 방대한 내용을 한 콘텐츠에 담아내느라 내용이 길어졌는데, 사실 이것도 많이 줄인 것임을 알아주셨으면 좋겠네요. 이번 콘텐츠를 통해 인텔® 제온® 6 프로세서에 대한 이해도가 조금이라도 높아지셨다면 더할나위 없이 기쁘겠습니다.





그리고, 위와 같이 기간 한정 이벤트도 진행 중에 있습니다. 힘들게 여기까지 읽었는데, 그에 대한 보상이 있어야겠죠? 꼭 이벤트에 참여하셔서 기프티콘도 받아가시기 바랍니다. 퀴즈가 좀 어려울 수 있는데, 콘텐츠를 꼼꼼히 읽은 분들이라면 쉽게 맞추실 수 있을겁니다.


이 콘텐츠가 사내에서 인텔® 제온®  프로세서 기반의 x86 서버를 운영하시는 IT 담당자 분들께 조금이나마 도움이 되었기를 바랍니다. 끝!


8개의 댓글이 있습니다.

15일 전 | 아이티정 | 02-898-9840

참여했습니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

15일 전

참여합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

15일 전

참여했습니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 한 달 전

정보 참고하겠습니다. 감사합니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 한 달 전

참여했습니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 한 달 전

참여 완료하였습니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 한 달 전

참여했습니다

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

약 한 달 전

참여했습니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입