04-29 02:46
Notice
Recent Posts
Recent Comments
관리 메뉴

Scientific Computing & Data Science

[Data Science / Articles] SAS 코리아 조성식 대표가 전하는 '빅 데이터' 이야기 본문

Data Science/Articles

[Data Science / Articles] SAS 코리아 조성식 대표가 전하는 '빅 데이터' 이야기

cinema4dr12 2014. 6. 3. 10:38

원문 : http://www.ciokorea.com/news/21146

1976년 설립 이래 38년 간 데이터 애널리틱스에만 집중해온 기업이 있다. 빅 데이터라는 용어가 2011년께 본격화된 점을 감안하면 적어도 30년 이상은 앞서 빅 데이터의 한 축을 준비해온 셈이다. 설립 이래 단 한 번도 마이너스 성장이 없었으며, 정리해고 또한 한 차례도 없었다. 매년 매출의 25%는 R&D에 투자해왔으며 본사 직원의 75%가 석박사급이다. 가트너에 따르면 비즈니스 애널리틱스 분야에서 2위 기업보다 점유율이 두 배나 높은 선두 기업이다. 그리고 지난 해에는 마침내 30억 달러 매출을 돌파했다. 


빅 데이터 시대, 제대로 물 만난 기업 ‘SAS’ 이야기다. 만 10년째 SAS 코리아를 이끌고 있는 조성식 대표를 만나 데이터 분석 전문 기업이 바라보는 빅 데이터 트렌드의 진화 방향은 무엇인지, 기업은 어떻게 준비해야 하는지, 나아가 우리나라는 빅 데이터에 어떻게 대비해야 하는지 들어봤다.

빅 데이터 핵심은 ‘가치’

“빅 데이터의 핵심 개념은 어느 날 갑자기 나온 것이 아닙니다. 개념과 방법론은 오래 전부터 존재했죠. 환경과 인프라가 부족해 오늘날처럼 이용할 수 없었던 것입니다. 즉 빅 데이터는 하둡, 인메모리 기술, 클라우드 컴퓨팅 등의 기술이 확산되면서 대용량 비정형 데이터를 다룰 수 있게 됨에 따라 등장한 용어입니다.”

조 대표는 먼저 빅 데이터라는 용어에 대한 진단으로 이야기를 시작했다. 과거 ‘마이닝’이라고 불렸던 분석기술, 스코어링 기술 등이 이미 비슷한 개념이며, SAS만 하더라도 15년 전부터 텍스트 애널리틱스 작업을 해왔다고 그는 설명했다.

“시장에 ‘오해’가 존재한다고 봅니다. 빅 데이터 스토리지 기업은 대용량 데이터를 담을 수 있는 스토리지 신제품에 빅 데이터를 거론합니다. 하둡 전문 기업은 하둡이 빅 데이터의 핵심인 것처럼 이야기하죠. 물론 ‘볼륨’과 분산형 파일 시스템이 빅 데이터의 주요 특징이기 합니다. 그러나 빅 데이터의 본질적 핵심은 데이터에서 가치를 찾아내는 것이어야 한다고 봅니다.”

그는 그저 방대한 데이터를 모아놓는다고 ‘빅 데이터’가 되는 것은 아니라며, 용량(Volume), 다양성(Variety), 생성 속도(Velocity)로 일컬어지는 빅 데이터의 3V 정의에 덧붙여 가치(Value)를 덧붙여 생각해야 한다고 강조했다.

동의할 수 있는 지적이다. 빅 데이터가 시대의 화두로 부상하면서 수많은 벤더들이 저마다의 빅 데이터를 규정하고 각자의 솔루션을 제시하고 있다. '빅 데이터 2.0', '빅 데이터 3.0'이라는 다분히 마케팅적인 규정도 그렇게 등장하고 있다. 하지만 기업 전체의 관점에서 핵심은 어떤 가치를 어떻게 창출하느냐일 것임 분명하다.

“IT의 진화 과정을 살펴볼 수도 있을 것 같습니다. 초창기에는 그저 데이터가 존재했습니다. 자동화 개념이 IT의 전부였습니다. 여기에 가치를 부여하면서 인포메이션이라는 용어가 사용되기 시작했고 거기에서 또 지식(knowledge)라는 용어로 이어졌습니다. 그 다음에는 인텔리전트라는 말이 많이 나왔습니다.”

조 대표는 이제 최적화(Optimization), 현대화(Modernization)라는 단어로 발전하는 양상이라고 진단했다. 폭증하는 데이터에 적응하고 과거 데이터를 대응하는 것 뿐 아니라 예측과 사전적(Proactive) 대응을 하는 방향으로, 즉 의사결정을 지원하는 방향으로 진화하고 있다고 그는 설명했다.

“그리고 이제 사물인터넷(IoT)까지 등장하고 있습니다. 데이터가 더욱 폭증할 것이라는 이야기입니다. 쉽지 않은 과제입니다만 기업의 경쟁력은 이러한 방대한 데이터를 활용해 어떻게 의사 결정에 반영할지, 수십 억 건의 데이터를 어떻게 실시간으로 분석할지에 따라 좌우될 것입니다.”


기업을 위한 방법론

빅 데이터가 기업 경쟁력에 결정적 요소로 작동할 것이라면, 기업은 어떻게 대응해야 할까? 이미 압박감을 느끼는 경영진 측에서 먼저 빅 데이터 계획을 주문하는 경우도 늘고 있다. 각종 데이터를 보유하고 있는 상황에서 ‘데이터 기반 의사 결정’을 내리고 싶다면 무엇부터 어떻게 준비해야 할 지에 대해 구체적인 답변을 요청했다.

“SAS에게 물어보라고 하면 됩니다.” 조 대표는 농담조로 이야기를 시작했다. “아주 공통된 시발점입니다. 이에 대해 저희는 먼저 기본 요건을 델타(DELTA)로 규정합니다. 내부에 있건 외부에 있건 데이터(D)가 먼저 있어야 하고 다음으로 엔터프라이즈(E) 차원에서 시각이 필요합니다. 그 다음으로는 리더십(L)의 지원이 필요하며 타깃(T) 설정과 애널리틱스(A)가 있어야 한다는 이야기입니다.”

그는 이어 방법론에 대한 설명을 이어갔다. “각 조직에 고민하는 것을 받아 요건 정리하고 추립니다. 할 수 있는 것을 축약해 중요도를 설정하죠. 그 다음에 팀을 구성하고 데이터 과학자와 데이터 준비(preparation) 작업을 진행합니다. 우리 내부에서는 BACC(Business analytics competency center)라고 부르는 방법론입니다. 이렇게 하면 가시적으로 확인할 수 있습니다.”

그는 특히 BACC를 상설기관을 두는 것이 큰 도움이 된다고 조언했다. COE(center of excellence) 또는 BECC라고도 불리는 이 기관을 만들어 경영진들이 수시로 확인하고 관심을 가지는 것이 성공의 비결이라는 설명이다.


국가 차원의 데이터 과학자 전략 필요

SAS는 데이터 과학자(Data Scientist) 교육 활동을 활발히 펼치고 있는 기업이기도 하다. 교육 과정을 진행해 인증서를 발급하고 있는 한편 10년 넘게 데이터 마이닝 공모전도 진행하고 있다.

“빅 데이터 관련 단체가 이미 한두 곳이 아닙니다. 무엇을 해야 하고 어떻게 하면 좋을지 무수히 논의합니다. 저는 그 중에서도 데이터 과학자 교육이 시급하고 중요하다고 판단하고 있습니다.”

논의가 많다 보니 요건도 다양하고 정책도 뚜렷하지 않다. 이것저것 서로가 하려다 보니 통일적인 전략도 도출되지 않는 상태다. 그는 이러한 현상에 대해 ‘교육’이 해법일 수 있다고 제언했다.

“산업계, 학계, 정계 다 모여서 공통분모를 발굴해 데이터 과학자에 대한 요건 정리부터 먼저 하는 것이 중요하다고 봅니다. 기술적인 관점은 물론 데이터 분석과 통계 능력 등이 해당되겠죠. 빅 데이터가 워낙 다양한 스펙트럼을 지니다 보니 정의와 요건, 접근법이 혼란스러운 측면이 있는데, 교육을 통해 자꾸 확산됨으로써 애매모호한 정의들이 깨끗해질 수 있다고 봅니다. 데이터 과학자라는 직업이 미래에 각광받을 것이 분명한 상황에서 국가와 기업, 개인 모두에게 득이 될 것입니다.”

Comments