01-05 17:59
Notice
Recent Posts
Recent Comments
관리 메뉴

Scientific Computing & Data Science

[Data Science / Articles] 뜨는 직종 '데이터 과학자'··· 미래의 직업으로 어떨까? 본문

Data Science/Articles

[Data Science / Articles] 뜨는 직종 '데이터 과학자'··· 미래의 직업으로 어떨까?

cinema4dr12 2014. 2. 20. 15:36

원문: http://www.ciokorea.com/news/12847?page=0,1

데이터에서 진정한 가치를 이끌어내고 싶은가? 데이터 과학자 1~2명을 고용하는 것이 해답일 수 있다. '데이터 과학자'라는 직종의 현황과 미래를 짚어본다. 

지난 수 개월 동안 새로운 범주의 데이터 전문가인 데이터 과학자에 대한 관심이 급증했다. 비즈니스, 애널리틱스, 컴퓨터 기술 등이 조합된 이 새로운 직업은 에너지, 전자 상거래, 건강 관리, 재무 서비스 등 다양한 분야로 진출하고 있다. 그리고 전문가들은 이것이 시작에 불과하다고 입을 모으고 있다.

IT 컨설팅 및 인재 파견기업 모디스(Modis)의 휴스턴 부사장 로라 켈리는 "기업들은 점차 데이터 및 애플리케이션 중심적으로 변모하고 있다. 그들은 빅 데이터 환경을 모델화하고 마이닝(Mining) 할 수 있는 사람을 필요로 한다"라고 말했다.

그녀에 따르면 데이터 과학자가 데이터 분석가 등의 다른 데이터 전문가들과 구별되는 점은 비즈니스적 결정을 이끌어내는 데이터 이면의 로직(Logic)을 생성할 수 있는 능력이다. 캘리는 "데이터 과학자는 데이터를 추출하고 모델을 구성하며 주도적으로 양적 분석을 적용할 수 있어야 한다"라고 말했다.

캘리에 따르면 이런 막중한 책임 때문에 평균 급여가 11만~ 14만 달러 정도로 책정되고 있다. 그녀는 "현재 데이터 과학자에 대한 수요가 발생하고 있다. 필요한 기술을 적절히 확보하고 있으면 영입 시도가 이어지는 것”이라고 말했다.

롤리에 위치하고 있는 노스 캐롤라이나 대학 고급 분석 기관(Institute for Advanced Analytics at North Carolina State Universit)의 책임자 마이클 라파의 사례를 들어보자. 지난 6년 동안 라파와 그의 동료 교수들은 전문적인 데이터 과학자를 양성하기 위해 대학원 과정을 개선해왔다.

라파는 "데이터 과학자는 실시간 스트림(Stream)을 포함하여 다양한 출처로부터 조직화된 데이터와 조직화되지 않은 데이터를 이끌어내야 하며 비즈니스적 가치를 창출하기 위해서 이를 이해해야 한다. 단지 데이터의 규모뿐만이 아니라 다양성과 속도도 중요하다"라고 말했다.

외톨이 통계학자, 컴퓨터 공학자, MBA 학위 소지자를 통해 빅 데이터를 처리하려 시도하는 기업들은 실패할 것이라고 라파는 단언하고 있다. 대신 이런 기술을 고루 갖추고 비즈니스와 기술적 문제를 완전히 이해하는 전문가가 필요하다는 설명이다.

MBA 학위 소지자들은 제품 개발과 관리 등 비즈니스적 개념을 이해하지만 데이터를 분석하고 해석할 수 없다. 수학자들과 통계학자들은 비즈니스에 관한 지식에 친숙하지 않다.

라파는 "데이터 과학자는 단지 모델링에 능할 뿐 아니라 비즈니스적 문제를 해결하는데 있어 개방성을 지향해야 한다. 우리는 다양한 학문을 총 망라하는 방법을 학생들에게 교육하고 있다"라고 말했다.

이런 접근방식의 효용성은 프로그램 참여자의 100%가 졸업 전에 일자리를 찾으면서 증명되었다. 그는 "찾는 곳도 많고 보수도 높다"라고 말했다. 이 프로그램은 최근 연간 등록자 수를 40명에서 80명으로 확대했다. 라파는 "민간 및 공공 부문의 수요 증가를 충족시키기 위해 규모를 증가시켰다"라고 전했다.

라파는 또 "데이터 과학자"라는 용어 자체 통계학자와 컴퓨터 공학자보다 훨씬 매력적으로 느껴지는 측면이 있다면서, “데이터 과학은 상상을 잡아내는 학문"이라고 말했다.

일리노이 대학교의 데이터 과학 여름학교(Data Sciences Summer Institute)의 교육 책임자 에릭 혼은 여기에 비록 상당한 컴퓨터 공학이 포함된다 하더라도 데이터 공학에는 분명 신비로움이 존재한다는데 동의했다.

예를 들어, 그의 학생들뿐만이 아니라 동대학의 일리노이 정보공학 연구소 소속원들은 다양한 기계 학습 알고리즘, 자연어 처리, 지식 검색 알고리즘에 대한 교육을 받고 있다. 또한 그들은 이런 알고리즘을 건강 관리 등 다양한 영역에 적용하는 방법을 배우고 있다.

라파와 마찬가지로 혼도 자신의 프로그램에 대한 관심이 증가하는 것을 실감하고 있지만 지금 당장은 등록자수를 늘릴 수 없다고 전했다.

데이터 과학자 선발하기
이베이(eBay)의 거래를 담당하고 있는 페이팔의 수석 과학자 목 오는 꿈의 데이터 과학자 팀을 꾸리고 있는 인물이다. 그는 향후에도 혼이나 라파의 기관에서 프로그램을 이수한 사람들 같은 지원자를 발굴한다는 계획이다.

페이팔은 고객과 협력사들이 생성하는 수십 테라바이트의 데이터를 연구하여 구매 추이를 예측하기 위한 계획을 세우고 있다. 오는 지출 및 행태 데이터를 세심하게 혼합하여 페이팔과 협력사 생태계로 새로운 고객을 끌어들일 수 있는데 도움이 되는 프로필을 개발하고 추이를 파악하길 희망하고 있다.

오가 원하는 이상적인 지원자는 비즈니스, 애널리틱스, 컴퓨터 공학 등 모든 기술을 갖춘 인물이다. 그러나 충분한 자질을 갖춘 사람이 드물다는 것이 문제다. 그는 "이 세 가지를 모두 갖춘 사람을 만나는 것은 쉽지 않다"면서, 따라서 3가지 훈련을 조합하여 데이터 공학팀을 꾸리고 있다고 전했다.

* 다수(80%)는 기계 학습, 자연어 처리, 데이터 마이닝에 초점을 맞춘 박사 학위 소지자들일 것이다.

* 10%는 핵심 성과 지표를 개발하기 위한 데이터 모델링과 분석기술을 갖춘 통계학자들일 것이다.

* 나머지 10%는 "왜 사람들이 페이팔 사용을 멈추고 있는가?" 등 적절한 질문을 던질 수 있는 MBA 학위 소지자들이 될 것이다.

오는 자신의 전문 팀이 페이팔을 다음 세대로 발전시키고 고객들에게 더 나은 서비스를 제공할 것이라 확신하고 있다.

비즈니스 인텔리전트(Business Intelligent) 소프트웨어 제조사 클릭 뷰의 제품 관리 부사장 도날드 파머는 대부분의 기업들이 데이터 공학을 활용하여 프로세스를 향상시키고 새로운 비즈니스 기회를 발견할 수 있다고 말했다. 예를 들어, 투자정보 서비스 기관에서 데이터 과학자들은 거래 및 위험 관리를 위한 알고리즘을 개발할 수 있으며, 제약 분야에서는 약제 시험 결과를 연구할 수 있다.

하지만 파머는 데이터 과학자를 영입하는 기업들이 감안해야 할 점은 실패에 관대할 수 있어야 한다는 것이라고 말했다.

그는 "데이터 공학은 전적으로 경험적인 학문이다. 기업들은 실패할 가능성이 있을 뿐 아니라 실패할 것으로 예상되는 구조를 세워야만 한다. 그렇지 않으면 데이터 과학자들은 충분히 노력하지 않을 것"이라고 말했다.

자금이 부족한 기관에 있어서는 쉽지 않은 결정이다. 데이터 과학자가 되기까지 자신의 일상을 게시한 블로그 "데이터 싸이언스 101(Data Science 101)"의 운영자 라이언 스완스트롬은 "이따금 모델에서 적절한 아이디어를 다시 얻기 위해 실패해야 한다. 물론 위험이 따르며 비용도 발생한다”라고 말했다.

적절한 환경에서 데이터 과학자는 기업에 노다지를 캐줄 수 있는 잠재력을 갖고 있다. 특히 페이팔 등 새로운 고객을 찾고 기존의 고객에 대한 서비스 향상에 초점을 맞춘 기관들에는 그 효과가 더욱 클 것이다. 스완스트롬은 컴퓨터 공학, 비즈니스, 분석 등을 물리학 또는 심리학 등 주변 학문들과 연계함으로써 결과를 향상시킬 수 있을 것으로 생각하고 있다.

모디스의 켈리는 데이터 과학자의 역할을 "진행 중인 작업"으로 명명하고 있다. 그녀는 "1년 전과 지금 기업들이 생각하는 데이터 과학자는 완전히 다르다"라고 평가했다.

혼은 분명 수요가 존재한다며 다음과 같이 말했다. "데이터를 사용할 수 있게 되면서 데이터 과학자 훈련을 원하는 사람들의 수가 점차 늘어날 것이다." 

Comments