일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- data science
- 딥러닝
- node.js
- 빅데이타
- 데이터 과학
- 통계
- 빅 데이타
- 김양재 목사님
- R
- probability
- 몽고디비
- MongoDB
- WebGL
- 빅 데이터
- c++
- openCV
- Machine Learning
- 주일설교
- Artificial Intelligence
- nodeJS
- No SQL
- 김양재 목사
- Statistics
- Big Data
- 빅데이터
- Deep learning
- 김양재
- 확률
- 우리들교회
- 인공지능
- Today
- Total
목록data scientist (36)
Scientific Computing & Data Science
원문 : http://www.ciokorea.com/news/11516스트레타 컨퍼런스의 창립자인 에드 덤빌이 데이터와 정보 사이의 간극에 대해 이야기했다. 비즈니스와 테크놀로지의 영역에서 데이터는 중요한 위상을 지닌다. 다가올 오렐리 스트레타 컨퍼런스(O'Reilly Strata Conference) 역시 참석자들에게는 데이터 주도의 혁신적인 방법론에 관하여 살펴볼 수 있는 좋은 기회가 될 것이다. 오렐리 스트레타 컨퍼런스 2012년 윈터 에디션은 빅 데이터에 관한 이해를 원하는 비즈니스맨 및 새로운 미래 테크놀로지를 만들어내고 있는 급진적 데이터 과학자를 위한 세션을 제공할 예정이다. 지난 몇 년간 하둡(Hadoop)과 카산드라(Cassandra), 그리고 맵리듀스(MapReduce)로 대표되는 오픈..
원문 : http://www.ciokorea.com/news/106172011년 11월 2일 서울 양재동 엘타워에서 열린 ‘빅 데이터 월드 2011’의 부대행사로 마련된 CIO 라운드테이블에서 아마존의 데이터 마이너(Data Minor) 존 라우저가 데이터 과학자(Data Scientist)의 필요성에 대해 강조했다. 라우저는 최초의 데이터 과학자로 수학자이자 천문학자인 ‘토비어스 마이어’를 꼽았다. 라우저에 따르면, 토비어스 마이어는 1750년에 9개의 상수를 3개의 방정식에 적용해 27개의 공식으로 위도 측정의 오차를 최소화했다. 라우저는 “데이터가 많을수록 더 정확하게 측정할 수 있다는 것을 입증했기 때문에 마이어를 최초의 데이터 과학자로 볼 수 있다”라고 밝혔다. 라우저는 “데이터 과학자는 공학과..
원문 : http://www.ciokorea.com/news/9250지금까지 기업들이 BI나 데이터 웨어하우스(DW)에 IT예산을 쏟아부었지만, 원하는 분석 결과를 얻지 못했다. 분석툴에 문제가 있는 게 아니라, 좀더 근원적인 문제는 데이터 분석 결과를 읽고 이를 해석할 수 있는 능력을 지닌 '데이터 과학자(Data Scientist)'가 없다는 데서 출발한다. 데이터 과학자들은 똑똑하고 분석적이며 통계 모델을 사용해 거대한 정보로부터 쓸만한 결론을 이끌어 내는 것을 업으로 삼는 사람들이다. 데이터 과학자들에 대한 수요가 소프트웨어 엔지니어들만큼 많지는 않다. 그러나 데이터 마이닝과 데이터 과학 분야의 전문가들은 이러한 추세가 곧 변할 것이라고 예측하고 있다. 포레스터 리서치의 수석 애널리스트 브라이언 ..
원문 : http://www.ciokorea.com/news/10382IBM의 빅 데이터 제품 담당 부사장 앤줄 밤브리가 데이터 과학자(Data Scientist)의 역할이 무엇인지에 일문일답으로 설명했다 Q. 데이터 과학자란 무엇인가? A. 데이터 과학자란 실제 비즈니스 결과를 끌어내는 활동들간의 트렌드를 발견하기 위해 기업의 대용량 데이터를 분석하는 사람이다. 데이터 과학자들은 기업이 경쟁우위를 가지고 살아남으려면 무엇이 필요한 지를 제시할 수 있는 사람이다. 그들은 빅데이터에서 어떻게 하면 최대 가치를 끌어내고 새로운 정보를 통합할 지에 대해 C레벨 직접 임원들에게 조언을 주고 함께 일한다. 많은 방법으로 데이터 과학자는 오늘날의 업무에서 변화 담당자로서 부서를 조정하고 정보를 통합한다. Q. 어떤..
원문 : http://www.ciokorea.com/news/14901데이터 과학자는 빅 데이터 트렌드 속에서 부상하고 있는 대표적 직업군이다. 이들은 수 페타바이트(petabyte)의 데이터를 조작해 새로운 수익 가능성을, 그리고 궁극적으로는 비즈니스의 흐름을 만들어내는 전문가들이다. 맥킨지 글로벌 인스티튜트는 보고서를 통해 빅 데이터를 적절히 활용함으로써 기업들이 60% 이상의 영업 마진 증대 효과를 거둘 수 있을 것이라 설명한 바 있다. 그러나 많은 기업들이 그들이 보유한 데이터를 제대로 활용할 인재를 확보하는데 어려움을 겪고 있는 것 역시 사실이다. CIO들은 비즈니스적 통찰력과 데이터베이스 전문 기술, 그리고 커뮤니케이션 능력을 고루 갖춘 인재를 탐색하고 고용하는데 고군분투하고 있다. IT 채용..
원문 : http://www.ciokorea.com/news/18948빅 데이터와 관련해 여러 미디어들은 엄청난 돈을 들여 기술 좋은(그리고 돈도 많이 받는) 데이터 과학자를 고용해야 한다고 호들갑이다. 하지만 미디어만 믿고 대학원 지원서를 썼다간 낭패를 볼 지도 모른다. 대부분 기업들은 빅 데이터를 ‘스마트 데이터’로 전환시키기 위해 데이터 과학자를 새로 고용하는 대신 데이터 분석 기술을 강화하고 기존 직원들을 교육하는데 초점을 맞추고 있기 때문이다. 중소기업과 ‘빅 데이터’일단 대부분의 중소기업들은 요즘 한창 난리인 빅 데이터 열풍에 크게 동조하지 못하고 있다는 진단이다. 컴티아 연구소장 팀 허버트는 중소기업 문제의 대부분이 실제로 빅 데이터와 관계가 없는 것이기에 이와 관련해 새로운 인력을 고용하는..
빅데이터의 현재 상태에 신속하게 반응하려면 유동 데이터가 필요하다. 신용카드 거래를 완료하거나 이메일을 보내려면, 데이터가 어느 한 위치에서 다른 위치로 전송되어야 한다. 데이터가 데이터 센터나 클라우드의 데이터베이스에 저장되어 있다면 그 데이터는 유동성이 없다. 반면, 데이터가 하나의 위치에서 다른 위치로 전송될 때 이 데이터는 유동적이다.비즈니스 인사이트를 얻기 위해 거의 실시간에 가깝게 방대한 양의 데이터를 처리해야 하는 기업들은 데이터가 계속적으로 흐르고 있는 동안에도 데이터를 정비하고 있을 가능성이 높다. 유동 데이터와 방대한 양의 데이터는 손에 손을 잡고 있다. 연속적인 스트림의 방대한 양의 데이터에 대한 많은 실세계 예시들이 현재 사용되고 있다:센서들은 고도로 민간한 의료 장비와 연결되어 성..
빅데이터 워크플로우를 이해하려면, 먼저 프로세스가 무엇인지 그리고 이것이 데이터-집약적 환경에서 워크플로우와 어떤 관련이 있는지를 이해해야 한다. 프로세스는 기업이나 기관들에서 의사결정 및 업무목표 규정에 유용한 고수준의 전체 구조로 설계된다.이와는 대조적으로, 워크플로우는 업무에 대한 개별적인 방향성을 두고 프로세스 보다 더욱 특정의 데이터를 요구한다. 프로세스는 프로세스의 전반적 목표에 상응하는 하나 이상의 워크플로우로 구성된다.방법론적 시각에서 볼 때 빅데이터 워크플로우는 표준 워크플로우와 유사하다. 사실 어느 워크플로우든 업무 목표를 달성하기 위해서는 각 단계에서 데이터가 필요하다. 헬스케어 상황에서의 워크플로우를 예로 들어보자.가장 기초적인 워크플로우는 "채혈" 프로세스이다. 채혈은 전반적인 진..
ETL 도구들은 하나의 빅데이터 환경에서 얻은 데이터를 다른 데이터 환경으로 이전하는데 필요한 세 가지 중요한 기능(추출(Extract), 변형(Transform), 불러내기(Load))을 결합한다. 전통적으로, ETL은 데이터 웨어하우스 환경에서 일괄 처리 작업을 하는데 사용되어 왔다. 데이터 웨어하우스는 사업자들에게 사업 중점에 관계되는 데이트에 대한 분석과 리포트를 강화하는 수단을 제공한다. ETL 도구들은 데이터 웨어하우스가 요구하는 포맷으로 데이터를 변형한다.변형은 사실상 데이터가 데이터 웨어하우스에 로딩되기 전 중간 위치에서 실행된다. IBM, Informatica, Pervasive, Talend, Pentaho를 포함한 많은 소프트웨어 벤더들이 ETL 소프트웨어 툴을 제공한다.ETL은 다음..
원문: http://www.ciokorea.com/slideshow/19630/?slide=1#stage_slide오늘날 디지털 세계에는 데이터가 부족할 수가 없다. 오히려 데이터 과부하 시대라고 하는 표현이 더 어울리겠다. 기업들은 클라우드, 모바일 기술, 소셜 미디어에 투자하고 있다. 이와 함께 기업에 미치는 영향을 생각하면 얼마나 많은 데이터가 수집되고 있는지를 알 수 있을 것이다. 플로리다의 탐파(Tampa)에 본사를 둔 헤드헌팅 기업 케이포스(Kforce)의 최근 조사에 따르면 이런 데이터의 증가와 함께 데이터를 수집하고 정리하며 분석할 수 있는 사람들에 대한 수요도 늘어나고 있다고 한다. ETL(Extract(추출), Transfer(전송), Load(불러오기) 개발자데이터가 폭발적으로 증가하..