일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- WebGL
- No SQL
- 김양재 목사님
- c++
- MongoDB
- 빅데이터
- 확률
- probability
- 몽고디비
- Artificial Intelligence
- openCV
- Deep learning
- 빅데이타
- nodeJS
- 우리들교회
- 딥러닝
- Machine Learning
- 빅 데이터
- node.js
- 주일설교
- 김양재
- 빅 데이타
- 김양재 목사
- Big Data
- Statistics
- 데이터 과학
- 통계
- R
- 인공지능
- data science
- Today
- Total
Scientific Computing & Data Science
[Data Science / Articles] 이제는 빅 데이터 대비할 때 • • • ‘5가지 가이드라인’ 본문
[Data Science / Articles] 이제는 빅 데이터 대비할 때 • • • ‘5가지 가이드라인’
cinema4dr12 2014. 4. 6. 18:26원문 : http://www.ciokorea.com/news/10968
“빅 데이터(Big data)” 계획을 잘 세우고 있는가? 아직도 제대로 된 계획이 없다면 이제는 정말 차근차근 고민해봐야 할 시점이다.
빅 데이터가 미래의 핵심 전략적 사업 부문으로 일컬어지고 있다. (물론 혹자는 보는 관점에 따라 과장 선전이라고 말하기도 한다.) 이 말은 즉 고급사무실에 앉아 있는 임원들이 IT부문에게 빅 데이터에 대한 의견을 구할 날이 그저 시간문제일 뿐이라는 뜻이다.
그들에게 무슨 말을 해줘야 할까? 애널리스트들은 분명 대부분의 IT 부서들이 이미 많은 양의 데이터 처리에 어느 정도 익숙하긴 하지만, 빅 데이터는 그 이전에 하고 있는 데이터 웨어하우징(data warehousing), 데이터 마이닝(data mining), 비즈니스 인텔리전스(Business Intelligence) 분석 등과는 완전히 다르다고 지적하고 있다.
이들에 따르면 오늘날 데이터는 그 어느 때보다 빠른 속도로, 더욱 다양하게 생성되고 있으며 과거의 데이터와는 달리 대부분이 비정형(unstructured), 미가공(raw) 형태의 데이터다. 간혹 “그레이 데이터(gray data)”라고 불리기도 한다.
애널리스트들은 블로그, 소셜미디어 네트워크, 기계의 센서 및 위치기반 데이터 등과 같은 비정형 데이터가 완전히 새로운 과제를 만들어내고 있다면서, 그 데이터들을 재빨리 포착하고, 관리하고, 분석한다면 과거에는 인지할 수 없었던 사실과 패턴들을 밝혀낼 수 있을 것이라고 입을 모으고 있다.
CSC(Computer Sciences Corp.) 리딩 에지 포럼, 테크놀로지 프로그램(Leading Edge Forum, Technology Programs)의 디렉터 폴 구스타프손은 “우리는 오랫동안 데이터를 수집해왔지만, 아주 제한된 수준이었다. 많은 데이터를 생산해냈지만, 아무도 그것을 많이 활용하지 않았다. 이전에도 데이터는 보관되었고, 비즈니스 프로세스들을 중심으로 모델화되었지만, 더 광범위하게 정의되는 기업의 핵심 지식으로 구축되지는 않았다. 이제는 수집에서 연결로의 전환이 새롭게 요구되고 있다”라고 말했다.
일례로, 맥킨지 글로벌 인스티튜트(McKinsey Global Institue)에서 5월에 발행된 보고서에 따르면 치료의 질, 성공률, 의료기록 등과 관련된 데이터를 효율적으로 이용함으로써 미국의 의료 산업계는 효율성을 증진시키고 생산성을 높일 수 있을 것으로 기대된다.
이 보고서는 업계가 그러한 빅 데이터 전략을 활용하면 돈으로 환산하면 3,000억 달러 이상의 가치를 매년 창출해낼 수 있을 거라 추정했다. 뿐만 아니라 보고서에서는 빅 데이터가 일반 소매점의 영업 마진을 60% 이상 증대시킬 잠재력도 가지고 있음을 시사하고 있다.
전문가들은 IT가 데이터 혁명의 선두에 서 있다고 관측했다. 카탈리나 마케팅(Catalina Marketing)의 CIO 에릭 윌리엄스는 “CEO 사무실에 걸어 들어와 ‘나는 이 기업을 바꿀 수 있고, 5년 전에는 전혀 알 수 없었던 지식을 단 몇 초안에 당신에게 제공할 수 있다’ 고 말할 기회다”라고 말했다.
윌리엄스는 카탈리나가 미국 최대의 소매업계 체인점들에 의해 수집된 1억 9,000만 명 이상의 식료품점 소비자들에 관한 정보를 포함하여 2.5페타바이트에 달하는 충성고객 데이터베이스를 유지하고 있다는 사실을 언급하며, 후에 이 정보들은 구매 내력에 근거하여 계산대에서 사용하는 쿠폰들을 만드는데 사용될 예정이라고 말했다.
윌리엄스를 비롯하여 업계를 주시하고 있는 다른 전문가들은 기업들이 실시간 예측 인텔리전스(real-time predictive intelligence)의 시대로 나아가기 위해, 기술 매니저들이 테라바이트와 페타바이트 단위로 측정되는(잠재적으로는 엑사바이트, 제타바이트까지 확장될 수 있는) 데이터에 대해 보다 수준 높은 분석을 지원할 수 있도록 그들의 기업 정보 관리 구조와 문화를 발전시켜야 한다고 주장했다.
윌리엄스는 “IT는 언제나 기업에 더 가까워질 수 있는 방법을 찾고 싶다고 말하고 있다. 빅 데이터야말로 바로 딱 그렇게 할 수 있는 기회다”라고 덧붙였다.
'Data Science > Articles' 카테고리의 다른 글
[Data Science / Articles] 링크드인 데이터 과학자가 전하는 '3가지 빅 데이터 레슨' (0) | 2014.04.06 |
---|---|
[Data Science / Articles] 데이터 과학자와 BI 전문가와의 차이 그리고 데이터 과학자가 되는 법 (0) | 2014.04.06 |
[Data Science / Articles] 데이터 과학자가 되기 위해 필요한 것 (0) | 2014.04.06 |
[Data Science / Articles] “데이터 과학자 부족, 새로운 폰 노이만 병목 현상” (0) | 2014.04.06 |
[Data Science / Articles] “데이터 과학자 양성으로 빅 데이터 시대 준비” (0) | 2014.04.06 |