Azure 클라우드 세미나 후기, Azure 기초개념 및 사례 정리

Azure 클라우드 세미나 후기, Azure 기초개념 및 사례 정리
지난 3월21일(목) 오후 3시30분부터 강남역 꿈틀라운지 세미나실에서 Azure 클라우드 세미나가 진행 되었습니다. 예상보다 많은 분들이 등록 해 주셨지만 평소 세미나 참석률을 감안했을 때 자리가 충분하리라고 생각했는데, 막상 세미나 시작 시간이 다가올 수록 참석자 분들이 계속 늘어나더군요. 결국 36명이 참석 해 주셔서 자리가 부족했습니다. 애초에 소규모 인원을 대상으로 준비했던 세미나여서 장소가 많이 협소하여 불편을 드린 점 이 자리를 빌어 죄송하다는 말씀을 드립니다. 2월 세미나 때와 달리 너무 많이 와주셔서 저도 당황스러웠어요. ㅎㅎㅎ



아무튼, 이번 세미나는 꽉꽉 드러찬 자리 만큼 내용도 알차고 질문도 많고 예상치 못한 격렬한(?) 토론도 이어진 세미나였습니다. Azure에 대한 소개를 3가지 주제로 나누고, 마지막 후원사 세션을 추가해 총 4개 주제로 아래와 같이 정리 해 보겠습니다.

 
1. Microsoft Azure 데이터센터 소개

이번 주제에서는 Microsoft Azure의 데이터센터 현황에 대한 내용을 다룹니다. 업계에서 가장 많은 수의 Region과 자체 네트워크, 강력한 서버 성능과 스토리지, 그리고 방대한 컴플라이언스 준수와 포괄적인 SLA까지... 자세한 내용을 보시려면 아래 '자세히 보기'를 클릭하세요.
 
1. Microsoft Azure 데이터센터 소개 자세히 보기




Azure는 현재 운영중인 클라우드 데이터센터 중 가장 많은 Region(리젼)을 보유하고 있습니다. 전세계에 42개를 운영 중에 있고 곧 12개를 오픈할 예정이라 총 54개의 Region을 갖게 되는 것인데, 이는 AWS(현재 21개, 4개 추가 예정)와 Google(18개)보다 훨씬 많은 숫자입니다. Region이 많다는 것은 그만큼 클라우드 인프라가 많다는 것이고, 서비스를 이용하려는 기업의 위치에 Region이 있는지 여부는 클라우드 서비스를 선택하는 데에 가장 중요한 요소 중 하나라고 볼 수 있죠. Region에서 만큼은 AWS, Google보다 경쟁력이 좋다고 할 수 있겠습니다. 국내만 보더라도 Azure는 서울 부산 2개 Region으로 한국 중부와 남부를 커버하고 있습니다.



주요 Region의 전경 및 내부 모습은 위와 같구요. 이런 IDC가 전 세계에 54개가 있는 것입니다.


Azure의 경쟁력은 단순히 Region만 많다는 것에 그치지 않는데요. 보시는 것 처럼 클라우드 서비스 기업 중 가장 넓은 네트워크 망을 갖추고 있습니다. 어찌보면 Region이 가장 많으니 당연한 결과라고도 볼 수 있겠죠. 그리고 이 네트워크 망을 지역 별 ISP(국내 SK, KT, LGU+)가 아닌 자체 네트워크 망으로 구축했고 facebook과 공동으로 투자하여 해저케이블까지 깔았습니다.(이 점은 Google과 똑같죠?) 커버리지 범위가 넓다는 것은 곧 거리가 아무리 멀리 떨어져 있더라도 이 전용 네트워크 망을 통해 빠른 속도로 서비스를 이용할 수 있다는 의미가 됩니다. 그만큼 Region의 수 못지 않게 클라우스 서비스 경쟁력에 있어 중요한 요소라고 볼 수 있겠습니다.


이 자체 네트워크망 덕분에 한국에서 멀리 떨어져있는 지역에서도 비교적 빠른 속도로 서비스를 이용할 수 있습니다. 물론 한국의 수치보다는 현저하게 느린 편이지만 한국에서 한국 ISP를 통해 현지 ISP를 거쳐서 서비스를 이용하는 것 보다는 Azure의 자체 네트워크를 이용하는 것이 훨씬 빠릅니다. 한국에서 전세계 어느 지역의 Ping test를 해 봐도 300ms를 넘지 않는 것을 보실 수 있습니다.

즉, 전 세계 어디에 있던 데이터가 Azure Region에 올라가기만 하면 300ms 이하의 지연(Latency)을 기록하는 것으로 이해하면 될 것 같네요. 동아시아 지역이라면 국내에서 사용하는 것과 크게 다르지 않는 수준으로 서비스를 이용할 수 있습니다. 이 자체 네트워크망을 이용하는 별도의 망 사용료를 낼 필요는 당연히 없습니다. 데이터 다운로드에 대한 비용만 내면 됩니다.


속도에 대해서는 이 표로 보시는 게 더 와닿으실 것 같습니다. TCP Up and Download 테스트 시 한국에서 800Mbps정도 기록하고 있는 것을 보실 수 있고 북미지역 까지는 크게 차이가 없습니다. 이 전 장표에서 262ms의 지연을 보였던 UK South에서도 Download 속도가 400Mbps가까이 나오는 것을 보실 수 있습니다. 이 정도면 적어도 자료 공유에 있어서 불편을 느끼기는 어려울 것 같네요. Region이 있는 지역이라면 어디든 Azure 자체 네트워크 망을 통해 Download 기준 400Mbps ~ 800Mbps의 속도를 보여준다고 볼 수 있겠습니다. 



Azure는 Microsoft 내부 사용 목적으로 2008년에 처음 시작되었습니다. AWS, Google과 마찬가지로 Azure 역시 내부용으로 사용하다가 외부에 IaaS 형태로 비즈니스를 하게 된 것이죠. 위 장표는 Azure 데이터 센터에 있는 서버의 세대 별 스펙을 보여주고 있는데요. 이 서버를 우리는 VM형태로 이용할 수 있는 것이죠. Gen 3부터 스토리지에 SSD를 사용하기 시작했고 Godzilla부터 HDD를 버리고 SSD만 사용하게 됩니다.

그리고 Beast부터는 이 SSD도 일반 SSD가 아닌 NVME형태를 사용 함으로써 더 빠른 속도를 제공하고 있습니다.(요즘 나오는 노트북의 SSD는 대부분이 NVME죠.) 글로벌로 빠른 퍼포먼스를 필요로 하는 게임회사의 경우 서비스 자체는 AWS에 올려두고 DB영역은 Azure의 Beast같은 VM을 이용하여 서비스를 운영하고 있다고 합니다.

특이한 것은 Gen 5, 6의 스펙표 가장 하단에 보시면 FPGA라고 되어 있는데요. FPGA는 Field-programmable Gate Arrays의 약자로 딥러닝에 최적화 된 칩셋입니다. TensorFlow 같은 딥러닝을 수행하는 서버라도 이 FPGA 칩셋이 있는 서버가 훨씬 빠른 퍼포먼스를 보여줍니다. 


Azure는 일반적인 목적 외에 특수한 목적에 맞는 서버도 갖추고 있습니다. 위와 같이 HPC를 위한 서버(HPC, HB, HC), GPU연산에 최적화 된 서버(GPU GEn 5, NDv2), 강력한 스토리지 성능을 위한 Lv2와 같은 다양한 라인업을 갖추고 사용자들에게 VM으로 제공하고 있습니다.


서버 성능이 좋아도 컴플라이언스를 준수하지 못하면 서비스를 이용하기 어려울 수 있습니다. Azure는 보시는바와 같이 가장 많은 컴플라이언스를 준수하고 있어 글로벌 기업들이 Azure 클라우드를 이용하는 데에 소위 걸리적거리는 게 가장 적다고 볼 수 있습니다. 특히 한국의 ISMS 인증도 받아서 국내기업들이 안심하고 클라우드 서비스를 이용할 수 있습니다.

SLA는 다른 클라우드 서비스들과 마찬가지로 99.9% 이상을 보장합니다. 특히 단일 VM에 대해서는 업계에서 유일하게 Azure만 99.9%의 SLA를 보장합니다.(Azure Premium SSD에 VM을 올렸을 경우에 한해) 지난 2월 Oracle Cloud World에서 Oracle 역시 SLA를 많이 강조했었는데요. Compute 영역에서 데이터를 이용할 수 있는지에 대한 SLA를 보장했었던 Oracle과 달리 Azure는 그 이용하는 VM자체에 대한 SLA를 보장하는 것이 특징입니다. 서비스 장애 발생 시 보상받을 수 있는 범위에 대해서 포괄적인 것도 중요하지만 내가 이용하고 있는 단일 서비스 그 자체에 대해서도 콕 찝어서 보상을 받을 수 있는지 여부는 매우 중요한 부분이니까요. 저는 개인적으로 SLA는 서비스를 제공하는 기업의 자신감의 척도라고 생각하고 있습니다.

 
스토리지의 경우 일반적인 HDD와 SSD외에 PCI-E나 NVME같은 고성능의 SSD인 Premium SSD를 제공하고 있습니다. 여기에 더해서 조만간 이 Premium SSD보다 2.5배의 성능을 자랑하는 Ultra SSD를 올해 하반기에 런칭한다고 합니다. IOPS가 무려 16만이네요. 초고성능인 만큼 가격도 어마어마하다고 하는데 아직 공개가 되진 않았습니다만 비용보다는 성능이 필요한 기업의 수요는 반드시 있기 때문에 이 역시 클라우드 서비스 선택에 있어 좋은 경쟁포인트가 될 것 같습니다.


Azure는 서비스 안정성을 위해 머신러닝 기술을 활용합니다. 디스크에서 발생되는 로그를 분석해서 만약 디스크에서 장애가 발생할 것으로 보이면 이 장애를 미리 예측하여 해당 VM을 다른 영역으로 옮겨주어 혹시 모를 디스크 장애로 인한 VM 재부팅을 최소화 시켜 줍니다. 이는 곧 서비스를 그만큼 안정적으로 제공하고 있다는 것이겠죠. 사용자에서 알아차릴 수 없게끔 백엔드에서 이런 과정들이 자동으로 진행되고 있다고 합니다.
 

Windows라는 가장 오래되고 성공적인 상용 OS를 가지고 있는 Microsoft이지만 Linux를 가장 폭넓게 지원하는 기업이기도 합니다. 위 장표 내용처럼 현존하는 대부분의 Linux 애플리케이션과 기술들을 Azure위에서 안정적으로 운영하실 수 있습니다. 단, UNIX는 지원이 어렵다고 합니다만 UNIX를 클라우드에서 운영하는 일은 거의 없으니 큰 문제는 아닌 것으로 보입니다. 최근 추세 역시 U2L 즉 UNIX to Linux이니까요.

하지만 여전히 UNIX를 고수하는 업종 및 기업이 꽤 있습니다. 특히 금융쪽이 UNIX의 의존도가 높은 편이죠. 이 UNIX를 Oracle이 Cloud에서 지원하고 있습니다. 관련 내용은 여기서 확인해 보실 수 있습니다. 
 
2. 글로벌 서비스를 위한 Azure 기능 소개

이번 주제에서는 글로벌 서비스를 위해 Azure에서 제공하는 다양한 기능에 대해서 알아봅니다. 하지만 다른 클라우드서비스에서도 제공하는 기능들이 많기 때문에 Azure만의 차별점은 많지는 않은데요. CDN에 있어서 동적콘텐츠를 보다 잘 다루기 위한 Dynamic Site Acceleration과 같은 기능은 AWS에서 제공하지 않는 Azure만의 특징이기도 합니다. 자세한 내용을 보시려면 아래 '자세히 보기'를 클릭 해 주세요.
 
2. 글로벌 서비스를 위한 Azure 기능 소개 자세히 보기


보통 기업에서 어떤 애플리케이션을 만들어 서비스를 제공하게 되면 해당 나라 혹은 지역에서만 제공할 수 밖에 없습니다. 그 서비스가 잘 되면 그때서야 글로벌 서비스를 기획하고 해외 지역에 데이터센터를 구축 혹은 임대하여 서비스를 제공하게 되는 것이죠. Azure와 같은 클라우드 서비스 덕분이 이제는 런칭 단계부터, 처음부터 글로벌 서비스를 시작할 수 있게 되었습니다. 특히 게임사들에게 클라우드서비스는 정말 단비같은 존재가 되었고, 덕분에 AWS뿐만 아니라 많은 클라우드 서비스 기업의 가장 많은 고객이 게임사 입니다.

Azure는 이런 글로벌 서비스를 위해 위와 같이 3단계로 나누어 지원합니다. Global 단위의 서비스는 전세계에 설치되어 있는 Region 데이터센터를 서로 연결하여 커버합니다. 지역 별 서비스는 해당 지역에서 가장 가까운 Region의 데이터센터 안에서 가상네트워크로 연결하고요. 내부에서만 사용하는 서비스라면 애플리케이션 끼리만 연결합니다. 그리고 이 모든 연결이 Azure Region 데이터선테 자체 네트워크망을 통해 전세계 어디든 서비스를 제공할 수 있습니다.


이 서비스는 L2 기반의 Traffic Manager와는 달리 L7, 애플리케이션 기반의 서비스 입니다. 전세계 어디에 있든 Azure Region과 연결 된 좀 더 작은 규모의 서버팝(POP)에 연결하여 애플리케이션을 가속하고 로드밸런싱을 제공합니다. 보다 촘촘하게 지역을 커버하여 보다 빠른 퍼포먼스를 제공하는 서비스로 현재 Preview 단계이며 GA(Global Announce)는 아직 되지 않았다고 합니다. Preview와 GA의 차이는 SLA 제공 유무로 보시면 됩니다. 아직 이 서비스는 기능 테스트는 가능하나 SLA가 보장되지 않기에 Preview단계라고 보시면 되겠습니다.


Azure에서도 L4, TCP/IP 기반의 로드밸런서를 사용할 수 있습니다. 이는 다른 클라우드 서비스들과 큰 차이가 없어 보입니다. 어떤 클라우드 서비스를 이용하시든 이런 L4 로드밸런서는 사용하실 수 있습니다. 구축 역시 간편한 편입니다.



L4 로드밸런서가 나왔으니 이번엔 L7 로드밸런서 차례네요. Azure Application Gateway는 L7 로드밸런서로 SSL 오프로드는 물론 SSL 인증서 관리, 로그 분석 등의 다양한 기능을 제공합니다. 관건은 성능일텐데요. 2월에 웨비나로 소개 해 드렸던 Citrix ADC(구 넷스케일러) 역시 Azure위에 올라가 있어서 앞의 장표에 나온 L4와 이 장표의 L7를 모두 커버하는 L4/L7 로드밸런서로 이용할 수 있습니다. 제 생각에는 Azure 기본 로드밸런서보다 Citrix ADC가 더 나은 성능을 보여주지 않을까 싶습니다. 그렇지 않다면 Citrix ADC를 이용할 이유는 없을 테고 Citrix가 Azure 마켓 플레이스에 ADC를 올려두지 않았을 테니까요.


CDN역시 제공됩니다. 특히 글로벌게임 기업, 이커머스 기업들이 많이 이용합니다. 이 Azure에는 3가지 CDN을 제공하는데요. 글로벌 No.1 CDN인 Akamai와 미국 통신사 Verizon에서 제공하는 CDN, 그리고 Azure 자체 CDN이 있습니다. 각기 성능과 가격이 다 다르다고 하는데, 당연히 Akamai가 가장 성능도 좋고 비싸지 않을까 싶습니다. 이 CDN은 커버리지가 진짜 가장 중요한 경쟁력인데, Akamai는 자체 데이터센터 외에 이용 가능한 글로벌 서버팝이 아마 CDN 회사 중(AWS같은 클라우드 기업 제외) 압도적으로 No.1일 겁니다.(139개국에 서버수가 24만대에 달하는데 AWS CloudFront에 시장을 많이 빼앗기고 있죠.)  



Azure CDN은 AWS CDN인 CloudFront와는 달리 Dynamic Site Acceleration이라는 기능을 제공합니다. 전세계 인터넷 회선 속도와 상관없이 CDN의 캐싱 기능을 이용하면 콘텐츠에 접근하는 최종사용자의 위치에 가장 가까운 서버팝에 데이터를 보내 사용자가 빠른 속도로 콘텐츠를 이용할 수 있는데요. 하지만 이 캐싱은 사용자가 서버 요청에 어떤 응답을 보이느냐에 따라 제공 유무가 갈립니다.

사용자가 서버에 요청하여 콘텐츠 보여달라고 하는 전통적인 캐싱을 위한 데이터인 이미지, 영상같은 데이터는 정적인 콘텐츠이기 때문에 캐싱하는 데에 별 문제가 없습니다. 하지만 콘텐츠가 이런 정적 콘텐츠가 아닌 쇼핑몰 장바구니 처럼 사용자가 저장하는 데이터가 수시로 달라지고 이 데이터의 이미지를 가져오는 이미지 호스팅 서버 역시 계속 달라지는 동적콘텐츠 처럼 예상치 못한 응답을 보내게 되면 일반적인 캐싱 즉 엣지 단 캐싱이 어렵게 되는 거죠.

이때 Dynamic Site Acceleration을 이용하면 이러한 문제에 대응할 수 있습니다. 이 DSA는 Azure CDN의 추가 옵션같은 기능으로 경로최적화, TCP최적화, 개체 사전인출, 적응 이미지 압축이라는 4가지 기능을 제공합니다.(뒤에 두가지는 Akamai CDN을 선택해야 이용 가능) 자세한 내용은 여기서 확인하실 수 있습니다.


Kubernetes역시 Azure에서 편하게 관리하실 수 있습니다. 다른 클라우드 서비스들과 마찬가지로 Kubernetes Cluster를 Azure에서 클릭 몇번으로 간편하게 생성하고 배포하고 관리할 수 있습니다. 애플리케이션 개발 및 테스트 민첩성을 높이기 위한 컨테이너 플랫폼인 Kubernetes는 Google에서 만들었는데요. 마이크로서비스의 확산으로 그 쓰임새가 더욱 늘어나고 있고 Azure에서도 어렵지 않게 Kubernetes를 관리하실 수 있습니다.
 
3. Azure 사용 용도 및 사례

이번 주제에서는 Azure의 다양한 사례에 대해서 살펴봅니다. 본사와 해외 지사간의 연결, 하이브리드 환경에서의 클라우드 사용, 온프레미스 시스템의 클라우드로의 전환, 장기 데이터 보관, 렌더링이나 딥러닝, HPC 등 고성능을 필요로 하는 작업 등 다양한 사례가 소개 되었는데요. 자세한 내용을 보시려면 아래 '자세히 보기'를 클릭 해 주세요.
 
3. Azure 사용 용도 및 사례 자세히 보기

먼저 본사와 해외지사 간 연결 사례 입니다. 위와 같이 이 기업은 일반 인터넷망을 이용하여 본사와 해외지사를 연결 했는데요. 자체 전용망이 아닌 일반 인터넷망을 이용하게 되면 속도가 매우 느립니다. 본사에서 미주에 있는 데이터를 조회 한다거나, 본사와 해외 지사간의 화상회의를 진행하게 될 때 엄청난 지연으로 인해 사용자 경험이 현저하게 떨어지게 됩니다.


Azure를 이용하면 Azure VPN으로 Azure 전용망에 연결하여 속도를 10배 이상 올릴 수 있습니다. 일반 인터넷망 속도가 너무 느렸기 때문에 10배가 향상 되었다 하더라도 본사에서 만큼의 속도는 나오지 않겠지만 적어도 어느 정도 지연을 감안 하더라도 협업을 할 수 있는 수준 까지는 가능하게 된 것이죠.


위 사례의 기업은 중동 사막 한 가운데에 플랜트를 설치하고 인터넷을 위성 서비스로 이용하고 있는데 인터넷 자체가 너무 느려서 본사와 현장 직원 간의 데이터를 주고받는 시간이 너무 오래 걸렸습니다. 그래서 Azure의 가장 가까운 Region에 VPN으로 연결하여 그 Region에 데이터를 두고 본사와 지사가 해당 데이터를 주고 받는 형태로 문제를 해결했고 비용 역시 위와 같이 저렴한 편이라 만족스럽게 Azure를 사용하고 있다고 하는군요.


기업이 Azure IDC까지 전용선으로 연결할 수 있게 되면 속도는 더욱 빨라질 수 있습니다. 현재는 KINX가 국내에서 유일하게 Azure IDC에 유일하게 붙을 수 있는 사업자인데 하반기에 KT가 추가된다고 하는군요. 아무튼, Azure 한국 IDC에 기업 전용선으로 연결하고, 그 이후 해외 지사는 Azure VPN으로 연결하여 기존에 자체 전용선을 이용했을 때 대비 지연을 40% 줄이고 밴드위스를 40% 높였다고 합니다. 즉, 기업에서 구축해 둔 환경은 그대로 유지한 채 글로벌 네트워크만 Azure로 대체하여 성능향상 효과를 본 것입니다.

 
이 저가 항공사의 경우 티켓팅 시스템이 호주에 있어서 한국에서 티켓팅을 할 경우 반드시 호주의 티켓팅 시스템을 거쳐와야 하기 때문에 대륙을 넘나드는 트래픽이 발생하게 됩니다. 거기에 알 수 없는 이유로 장애가 발생하여 다운타임도 발생했었다고 합니다. 그래서 서울과 호주의 네트워크 연결을 Azure 네트워크를 사용하여 기존 전용선 대비 비용을 50%이상 절감시켰고 장애발생 없이 안정적으로 서비스를 운영하고 있습니다.



이번에는 온프레미스와 클라우드를 연결한 하이브리드 클라우드 사례입니다. 이 항만회사의 경우 회사 정책 상 반드시 DB는 기업 내부 즉 온프레미스에 있어야 했습니다. 하지만 주 고객은 해외에 있기 때문에 해외의 고객들이 이 회사와의 거래를 위해 회사 홈페이지에 접속하여 자료를 다운받아야 하는데 계약서 3mb 하나에 15분이나 걸렸다고 합니다. 게다가 중간에 끊기는 경우도 다반사여서 고객의 불만이 높은 상황이었던 거죠. 그래서 이 회사는 Azure를 이용해 Web Server를 해외 고객 지역에 있는 Region에 배포하여 다운로드 속도를 15분에서 15초로 단축시켰습니다.



위 사례는 Citrix 세미나에서도 소개 해 드렸던 사례입니다. 기존에 온프레미스에서 사용하던 CBC 방식의 VDI를 Azure위에 올려서 안정적으로 사용하고 있습니다. Citrix가 클라우드 회사 중 Microsoft와 가장 긴밀하게 협력하고 있어 로컬에서 사용하는 것 만큼의 퍼포먼스를 Azure에서도 제공할 수 있습니다. 보다 자세한 내용은 여기서(4. Azure 기반의 Windows 10 VDI 마이그레이션 방안) 확인하실 수 있습니다.
 
이번에는 데이터 보관에 대한 사례입니다. 위 기업은 데이터를 아카이브 용도로 매우 오랫동안 보관해야 하는 니즈가 있었습니다. Azure에는 다른 클라우드 서비스와 마찬가지로 데이터 보관에 있어 위와 같이 핫, 쿨, 아카이브 3가지 옵션을 제공합니다. 용량이 많은 데이터라 하더라도 자주 조회하거나 다운로드 받을 필요가 없다면 아카이브 옵션을 이용해서 저렴한 비용으로 안정적으로 데이터 백업 서비스를 이용할 수 있습니다. 3가지 옵션에 대한 데이터 이동은 별도의 스케쥴링을 통해 관리하실 수 있다고 합니다.



이번에는 CDN 사례 입니다. 위 회사는 삼성전자 베트남 공장과 거래하는 회사인데 본사 데이터센터는 IDC에 있고 이 영동 IDC에서 베트남 호치민의 ERP에 접속해서 데이터 조회를 하게 되면 속도가 너무 느려 업무에 많은 불편을 겪었다고 합니다. 그래서 Azure CDN을 도입하게 되었는데 Azure는 베트남에 Region이 없음에도 불구하고 근처 서버팝에서 싱가폴 Region에 VPN 연결을 하여 ERP 사용 속도가 120% 이상 증가했다고 합니다.


이번에는 게임사례 입니다. 게임업종은 가장 많이 클라우드 서비스를 이용하는 업종이기도 한데요. 위 게임의 경우 멀티 클라우드를 이용하여 글로벌 서비스를 하고 있으며 Azure도 이용하고 있다고 합니다. 신작게임의 대부분은 클라우드 서비스를 이용해 런칭한다고 보셔도 될 것 같습니다.


배틀그라운드의 경우 VM에서 이용하는 CPU Core수의 합계가 무려 18,000 Core라고 합니다. 얼마나 많은 양의 인프라를 이용하는 것인지 감이 잘 안오실 텐데요. 한창 인기를 끌 때 AWS와 Azure 데이터센터에서 구축할 수 있는 VM수가 모자를 지경이었다고 합니다.

클라우드가 많이 활용되는 분야 중 하나는 바로 인공지능 영역입니다. 머신러닝, 딥러닝 분야에 많이 활용하고 있는데요. 인공지능의 경우 알고리즘은 이미 1970년대에 개발 되었지만 시스템 인프라 구성이 어려워 발전이 매우 더뎠습니다. 하지만 지금은 tensorFlow같은 오픈소스와 클라우드의 힘으로 개발 진척이 급속도로 빨라졌고 위와 같인 이미지 기반 머신러닝 기술도 점점 발전하고 있습니다.


클라우드 인프라에서 강력한 GPU 연산 성능을 갖춘 시스템도 직접 구축하지 않고 관리할 필요 없이 간편하게 이용할 수 있습니다. 첫 번째 주제에서 보셨던 GPU 최적화 된 서버를 사용하여 위와 같은 영역에 활용할 수 있습니다.


고성능의 연산능력이 필요한 Maya, 3ds Max같은 애플리케이션도 Azure Batch 렌더링 기능을 이용해 작업속도를 증가시킬 수 있습니다. 고가의 워크스테이션보다 훨씬 더 고성능의 렌더링을 클라우드를 이용해 수행할 수 있게 된 것이죠. 단, 이는 시간이 중요한 케이스인지, 시간은 어느 정도 걸려도 직접 장비를 구비하고 비용을 최소화 시키는 것이 중요한 케이스인지에 따라 달라질 수 있습니다.


요즘 상영하는 헐리우드 영화와 블록버스터급 드라마 치고 CG가 적용되지 않은 작품은 거의 없을 것입니다. 제작사에서 촬영한 필름을 가지고 이런 CG회사들이 렌더링을 하는거죠. 위와 같이 글로벌 No.1 영화 렌더링 회사 역시 Azure를 이용해 CG 렌더링을 하고 있다는군요. 무려 45만 Core를 이용하여 기존의 6개월 치 작업기간을 3개월로 줄였다고 합니다. 이런 회사들은 빠른 시간에 결과물을 만들어 내는 것이 비용을 줄일 수 있는 가장 좋은 방법이니 클라우드 서비스가 딱일 것 같습니다.



마지막으로 Azure는 HPC 영역도 커버할 수 있습니다. 위 CG 렌더링 사례와 같이 CPU Core를 클라우드 회사 인프라가 받쳐주는 한 무한대로 늘려서 사용할 수 있기 때문입니다. 2개월 동안 처리 할 작업을 5,000 Core를 이용해 2주만에 처리했다고 합니다. 업무의 모든 부분을 클라우드로 전환하여 사용하는 것이 아닌, 기존 온프레미스와 연계해서 핵심적인 영역 몇개만 클라우드로 이용하여 효율을 높이는 것입니다.
 
4. 빅데이터 분석 서비스, ANALYSYS 9

후원사 세션으로 진행 된 이번 시간에는 빅데이터 분석 서비스인 ANALYSYS 9에 대해서 알아 봅니다. 모바일앱 사용자 1,000만명의 데이터와 오프라인 9,000만개의 Wifi 공유기 데이터를 믹스하여 기업의 마케팅, 비즈니스 리뉴얼, 경쟁사 분석, 신규 시장 진입 등에 활용할 수 있는 서비스인데요. 후원사인 NSMG는 이 방대한 빅데이터를 Azure위에 올려서 실시간으로 분석하고 있습니다. 자세한 내용을 보시려면 아래 '자세히 보기'를 클릭 해 주세요.
 
4. 빅데이터 분석 서비스, ANALYSYS 9 자세히 보기


ANAYSIS 9은 NSMG에서 자체 개발한 빅데이터 분석엔진인 TARGET 9을 기반으로 위와 같이 다양한 데이터를 분석하여 기업에 제공합니다. 이러한 데이터를 제공하는 곳은 글로벌로 보면 닐슨이라는 매우 유명한 기업이 있고 국내에도 나스미디어, DMC미디어 등 미디어랩사에서 주로 제공하고 있습니다. 그리고 기업들은 이런 데이터를 제공하는 기업에서 데이터를 구매하여 자사 비즈니스에 활용하고 있죠.


ANALYSIS 9은 위 표와 같이 다른 회사 대비 분석대상의 표본을 명확하게 공개하고 있는데 그 대상이 무척 광범위 합니다. 뿐만아니라 분석 영역 역시 업계에서 유일하게 온라인, 오프라인, 그리고 이 둘을 합친 영역까지 가장 많습니다. 그렇다면 저 수많은 데이터는 대체 어떻게 수집하고 있는 것일까요?


먼저 온라인의 경우 100개 이상의 제휴 모바일앱을 통해 1,000만 사용자의 데이터를 수집했습니다. 제휴 모바일앱을 사용하는 사용자가 앱에서 제공하는 서비스 사용 시 동의하게 되면 이용 약관에 TARGET 9으로 데이터를 수집한다는 내용이 포함되어 있는 것이죠. 오프라인의 경우 전국에 설치되어 있는 Wifi 공유기 9천만개의 데이터를 하나씩 태깅하여 분류하고 있으며 이 공유기로부터 위치 기반 데이터를 수집하고 있습니다.

즉, 100개의 제휴 모바일앱 사용자가 앱을 사용하는 패턴과 오프라인에서 Wifi 공유기에 접속하게 될 경우 어느 위치에 있고 자주 가는지를 알 수 있는 것입니다. 온라인과 오프라인의 데이터를 혼합하여 새로운 시각의 데이터를 제공할 수 있게 되는 것이죠. 이런 데이터 수집과 분석 모두 처음에는 AWS에 구축했으나 비용과 NSMG에서 원하는 퍼포먼스가 나오지 않아 Azure로 옮겼다고 합니다.



위와 같이 이렇게 수집, 분석된 데이터는 맥도날드 앱의 사용자 중 백화점 방문자가 어느 정도이며 그 중 신세계 백화점 방문자는 또 어느 정도 되는지 알 수 있습니다. 


또한 맥도날드 매장 방문자 중 소셜 커머스 앱을 사용하는 사람은 몇명이며 이들 중 쿠팡 앱을 사용하는 사람은 몇명인지도 알 수 있습니다. 특히 저 맥도날드 매장 방문자 수치는 맥도날드에서 가지고 있는 내부 데이터와 오차가 거의 없어 맥도날드에서도 깜짝 놀랐다고 하네요. 그만큼 정교하게 데이터를 수집하고 있다는 반증이라고 볼 수 있겠습니다.



오프라인 데이터를 수집하는 공유기는 우와 같이 지역과 키워드 조합으로 태깅하여 관리하고 있습니다. 그리고 이 공유기를 지도 형태로 볼 수 있는 시스템도 갖추고 있는데요. 스마트폰으로 잠깐 시연해 주시는 것을 봤는데 네이버 지도나 구글 지도에 9천만개의 고유의 이름을 가진 공유기가 표시된다고 보시면 됩니다.



실제 기업의 시용사례를 살펴보겠습니다. 드롭박스의 경우 이 데이터를 활용해 자신들의 서비스가 어느 지역에 위치한 사용자가 많고 경쟁사 현황은 어떤지 분석할 수 있었습니다. 드롭박스 앱을 사용하는 사람들이 어느 지역에 분포하는 지를 공유기에서 수집된 데이터로 분석한 것이죠. 3개 클라우드 스토리지 서비스 모두 강남지역에서 사장 많이 사용 되는군요. 드롭박스의 지역별 특성 보다는, 그냥 사용자가 경쟁사 대비 적은 것 같습니다.



디스커버리의 경우 앱 사용자들이 어느 앱을 통해 온라인 쇼핑을 즐기는 지 분석할 수 있습니다. 오픈마켓 -> 소셜커머스 -> 홈쇼핑 순으로 나타났네요.



이번엔 온라인 쇼핑이 아닌 다른 소비/여가 관련 앱을 사용하는 현황을 파악했습니다. 디스커버리는 아웃도어 브랜드인데 등산앱 사용자 중 디스커버리 앱의 사용자 수는 적은 편이었습니다. 재미있는 것은 골프앱 사용자들이 디스커버리 앱을 많이 사용하고 있네요. 디스커버리에서 골프 의류를 출시해야 하는 것은 아닌가 싶네요. 아니면 골프에 관심 많은 사용자들이 선호하는 아웃도어 브랜드는 디스커버리이니 골프 애호가들에게 맞춤 마케팅을 실시하는 등의 계획을 세워볼 수도 있겠죠.


맥도날드의 경우 배달앱에 진출을 하는 것에 대한 타당성 판단을 위해 데이터를 의뢰 했습니다. 맥도날드 이용고객이 어느 배달앱을 많이 사용하는지, 매달앱 사용자들은 어느 프랜차이즈 앱을 사용하는지에 대한 정보를 토대로 어느 배달앱에 진출해야 하는지에 대한 결정을 내릴 수 있습니다.


벤츠는 자동차에 설치된 공유기를 추적하여 벤츠 사용자들의 거주지/근무지를 파악했습니다. 강남 서초 송파의 비율이 높은데 송파구의 경우 벤츠를 모는 사람들은 근무하는 사람들 보다는 거주하는 사람들이 많았습니다. 벤츠를 몰고 송파에 살지만 일은 강남에서 하는 셈인거죠. 이렇게 근무지보다 거주지 비율이 높은 지역에 벤츠가 제공하는 퇴근길의 편안함, 반대로 거주지보다 근무지 비율이 높은 지역에 벤츠가 제공하는 출근길 혹은 외근길의 역동적인, 전문가적인 이미지 등을 강조하는 마케팅을 고려해 볼 수도 있을 것 같습니다.

이처럼 ANAYSIS 9은 제휴 모바일앱과 지역+키워드로 태깅한 공유기 정보를 혼합하여 기업 입장에서 의사결정에 도움받을 수 있는 유용한 데이터를 제공해 주고 있습니다. 단, 데이터 제공만 하고 이 데이터를 더 깊게 해석하여 어떻게 사용하는가는 기업들의 몫입니다. 기업들은 이 데이터를 가져다가 마케팅 회사와 논의하여 새로운 마케팅 프로그램을 런칭할 수 있겠죠. NSMG는 이 마케팅 프로그램에 대한 성과면에 있어서는 책임소재를 기업(광고주)에게 맡기고 철저하게 양질의 데이터를 제공하는 데에만 초점을 맞추고 있습니다. 
 

여기까지 Azure 클라우드 세미나에서 다뤄진 Azure와 이 Azure를 활용한 빅데이터 분석 서비스에 대한 내용을 정리 해 봤습니다. AWS의 넘사벽 위치를 조금씩 빼앗아가며 성장하고 있는 Azure가 방대한 글로벌 Region을 앞세워 좋은 성과를 계속해서 만들어 내고 있는데요. 작년말 AWS 장애 사태로 Azure로 넘어오거나 멀티클라우드를 고려하게 되는 기업들이 많아져 앞으로 Azure를 찾는 기업은 더욱 늘어날 것으로 보입니다.

또한 ANALYSYS 9의 경우 상당히 인상적이었는데요. 개인적으로 전 직장에서 이와 유사한 사업을 추진하다가 법적인 문제로 작년 초에에 포기했던 경험이 있는데요. NSMG는 작년 말에 각종 판례 분석 및 법무법인의 자문을 통해 성공적으로 서비스를 런칭했다고 합니다. 제가 직접 도맡아서 추진하다가 제대로 못했던 비즈니스를 잘 하고 있어서 더욱 관심이 가지 않았나 싶네요.

이것으로 이번 세미나 후기에 대한 정리를 마칩니다. 끝!





 

4개의 댓글이 있습니다.

5달 전

포스터보고 빵터졌네요.
짤방으로 써도 아깝지 않겠습니다.

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

5달 전

애져 스택도 ^^;

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

5달 전

애져 포탈등도 다루면 재밌는주제일것같습니다

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

5달 전

와우~ 사례위주라 좋으네요

Reply

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입

댓글 남기기

댓글을 남기기 위해서는 로그인이 필요합니다.

로그인 회원가입