14:00 - 14:40 | Actionable 데이터 사이언스 - 정우재 상무 Head of Data Science, Asia Pcific & Japan, Pivotal 데이터 과학과 AI는 '불확실성과의 씨름'으로 정의할 수 있으며, 불확실성은 다양한 형태로 존재하고 있습니다.(예:통신사 고객 이탈율, 유통업 상품추천, 금융업 리스크 관리) 불확실성을 측정하고 줄이는 과제는 엄청난 비지니스 가치가 있으며, 이는 데이터 과학 및 AI의 목표입니다.데이터 과학을 통한 혁신의 핵심 요소에는 데이터 사이언스 과제에 적용되는 방법론과 실제 사용자들에게 가치 전달 수단이 되는 모형의 배포입니다. 피보탈에서 권장하는 애자일 및 Extreme Programing 방법론의 데이터 사이언스에 적용기, 그릭 데이터 사이언스 모형의 운영 및 배포 옵션들을 소개합니다. |
14:40-15:20 | 오픈소스 GPDB&MADlib을 활용한 네티워크 분석 및 데모 - 이홍돈 이사 Senior Daa Science, Pivotal 사회, 시스템에 속한 모든 개별 시스템에 속한 모든 개별 개체들은 다른 누군가, 무엇과 관계를 맺고 소통하고 거래를 합니다.기존의 분석 관점이 주로 개별 개체의 속성(행동,인구통계,거래 등)에 집중하였다면, 새로운 가치를 뽑아낼 수 있는 기회의 영여그로 '관계'와 '구조'에 집중하는 그래프 이론 기반의 네트워크 분석을 들 수 있습니다. 하지만 네트워크 분석 알고리즘들이 대부분 연산부하가 노드 수에 기하급수적으로 늘어나기 때문에 대용량 데이터의 경우 로컬 분석환경이나 기존의 RDBMS로는 분석이 불가능하거나 시간이 매우 오래 걸리는 한계가 있습니다. 이러한 도전을 분석 플랫폼 GPDB(Greenplum Database)와 SQL기반 기계학습 툴 MADlib을 활용하여 어떻게 극복할 수 있느제, 그사용방법은 무엇인지, 어떤 적용사례가 있는지 소개해 드리겠습니다. |
Q&A | 세션 중 질문은 채팅창을 통해서 남기실 수 있습니다. |
1개의 댓글이 있습니다.
오픈소스 관련 온라인 세미나 같네요..등록해볼렵니다.
Reply댓글 남기기
댓글을 남기기 위해서는 로그인이 필요합니다.
로그인 회원가입