일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 딥러닝
- data science
- No SQL
- Artificial Intelligence
- 인공지능
- 김양재 목사님
- 통계
- 주일설교
- 빅 데이터
- 데이터 과학
- 빅데이타
- 빅데이터
- WebGL
- node.js
- 김양재
- MongoDB
- 김양재 목사
- c++
- 몽고디비
- R
- 우리들교회
- 확률
- openCV
- Big Data
- Machine Learning
- Deep learning
- 빅 데이타
- Statistics
- nodeJS
- probability
- Today
- Total
목록data science (52)
Scientific Computing & Data Science
원문 : http://www.ciokorea.com/news/20650받아들일 용의가 있고, 올바르게 활용할 수만 있다면 빅 데이터가 주는 장점은 거부하기 힘든 수준이다. 빅 데이터를 이용해 기업을 변화시킬 수 있고, 고객에게 좀 더 다가갈 수 있으며, 시장에서의 타깃 효율성과 이윤을 증가시킬 수도 있다. 이미 손 안에 있는 데이터를, 단지 알아보고 활용할 안목이 없어서 아깝게 버리고 있는 것이다. 데이터 과학자의 역할은 여기서 중요해진다. 데이터 과학자는 현재 시장에서 가장 ‘뜨거운’ 직종 중 하나다. 데이터 과학자에 적합한 인재는 숫자에 능숙하고, 기업 상황에 능하며 통계 컴퓨팅 언어를 마치 숙련된 피아니스트가 연주를 하듯 다룰 수 있는 사람일 것이다. 하지만 이런 이상적 인재상을 실제 직무 기술서와..
우선 정량적 데이터와 정성적 데이터에 대한 정의를 내려보자: 정량적 데이터: 숫자로 표현되는 수치 데이터.정성적 데이터: 자연언어에 의한 서술로 표현되는 범주형 데이터.다음 그림을 통해 이들에 대한 차이점을 보다 명확하게 이해해 보자: [그림 1.] 정량적 데이터와 정성적 데이터의 특성에 대한 차이점. 정량적 분석은 수치에 대한 분석을 포함한다. 분석 유형은 측정 수준에 따라 다르며, 측정에 대한 유형은 다음과 같이 크게 네 가지로 구분할 수 있다:명사형: 데이터의 논리적 순서를 정의할 수 없으며 데이터 분류에 사용된다.순서형: 데이터는 논리적 순서를 가지며 값들 간의 차이가 일정하지 않다.간격형: 데이터는 연속적이며 논리적 순서에 의존한다. 값들 간의 차이가 일정하며 차이가 0인 경우는 배제한다.비율형..
우리가 살고 있는 세계는 사방이 모두 데이터이다. 그것이 정형이든 비정형이든, 연속된 것이든 이산이든 날씨 데이터, 주식 거래 데이터, 소셜 미디어 사이트의 좋아요 수, 포토 앨범, 음악 재생 리스트 등 모든 것이 데이터이다. 사실 데이터라는 것은 모든 인간 활동의 기본 부산물이라 할 수 있다. 세계적 권위의 사전인 Oxford 사전은 데이터에 대해 다음과 같이 정의하고 있다:"Data are known facts or things used as basis for inference or reckoning." "데이터는 추측이나 예측을 위한 기반으로 활용되는 알려진 사실 또는 알려진 것이다."데이터는 다음과 같이 분류할 수 있다:Data 범주형(categorical)명사형(nominal)순서형(ordina..
원문 : http://www.ciokorea.com/news/16525이어지는 경기 불황, 그리고 그로 인한 고용시장의 침체는 앞으로도 한동안 구직자들을 힘겹게 할 전망이다. 그러나 이런 시장 상황 속에서도 ‘떠오르는' 직종은 있다. 데이터 과학자가 바로 그것이다. 데이터 과학자는 CNN을 통해서도 2012년 최고의 신규 유망 직종으로, 또 하버드 비즈니스 리뷰(Harvard Business Review)를 통해서도 21세기의 ‘가장 매력적인' 직종으로 선정된 바 있다. 데이터 과학자에 대한 이러한 평가는 빅 데이터 및 애널리틱스와 관련한 시장 전반의 관심과 관련 있다. 쏟아지고 있는 막대한 정보들 속에서 의미 있는 요소를 발굴하고 그것을 비즈니스 가치로 연결하는 것이 바로 데이터 과학자의 역할이기 때문..
원문 : http://www.ciokorea.com/news/18570UC 버클리(University of California at Berkeley)는 아이스쿨(iSchool: School of Information)이라는 새로운 석사 과정을 개설했다. 이 프로그램은 빅 데이터를 이용해 효율성을 개선하고, 새 수익원을 창출하고, 시장 경쟁력을 강화하기 희망하는 직종에 일자리를 얻고 싶어하는 학생들에게 이를 위한 지식과 툴, 교육을 제공하는데 목표를 둔 것이다. 행방불명 상태의 데이터 과학자(Data Scientists) 신설된 정보 및 데이터 과학 석사(MIDS) 프로그램은 UC버클리의 첫 온라인 학위 과정이다. UC버클리 정보대학원(School of Information)의 애나리 섹서니언 학장은 이 ..
원문 : http://www.ciokorea.com/news/17659"아마존은 '이 상품을 구매한 이들이 또한 구매한 것'에 대한 정보를 분석해 노출함으로써 1분기 만에 29%의 매출 성장을 이뤄냈다." "넷플릭스는 사용자 평점을 기반으로 시청자의 선호도에 부합하는 영화 콘텐츠를 노출했다. 그 결과 시청자의 75%가 추천 콘텐츠를 시청하고 있다." "교통 정보 업체 웨이즈는 사용자 교통 데이터를 분석해 제공함으로써 18개월 만에 4,000만 명의 사용자를 확보했다." 링크드인의 시니어 데이터 과학자 비탈리 고든이 전한 빅 데이터 성공 사례들이다. 빅 데이터에 대한 실용적 고민이 증가하고 있는 가운데, 한국 IDG가 주최한 '비즈니스 임팩트 & 빅 데이터 2013' 컨퍼런스가 7월 10일 역삼동 리츠 칼..
원문 : http://www.ciokorea.com/news/16936통계와 컴퓨터 과학의 깊은 지식에 훈련의 초점이 맞춰지면서, 데이터 과학자는 전통적인 데이터 분석가들에게 있어서 완전히 새로운 장이 열렸다. CIO들에게 그들의 전략적 우선순위를 꼽아보라고 한다면, 대부분 '빅 데이터'를 최우선 혹은 그 다음 순위로 대답할 것이다. CIO들이 말하는 가장 큰 도전과제 가운데 하나는 바로 기업으로 들어오는 복잡한 데이터의 점점 늘어가는 볼륨을 분석하고 사업적 가치를 짜내는데 필요한 인재를 찾는 일이다. 기업은 좋은 데이터 과학자들을 필요로 한다, 그것도 아주 많이이 주제에 대해 가장 자주 언급되는 보고서 가운데 하나인 맥킨지 글로벌 인스티튜트(McKinsey Global Institute)의 보고서는 2..
원문 : http://www.ciokorea.com/news/12825데이터 과학자가 되기 위해 필요한 습득한 기술들은 그 사람이 어떤 배경을 지녔느냐에 따라 다르다. IT채용 및 컨설팅 기업 모디스(Modis)의 휴스턴 지부 부사장 로라 켈리에 따르면, 데이터 과학자가 되는 경로는 어떤 기술력을 가졌느냐에 따라 달라진다고 한다. 켈리의 조언은 다음과 같다. *MBA 졸업생이라면, 통계 소프트웨어 프로그램 자격증을 따라. "일반 컴퓨터 과학 박사 학위를 취득하지 말고 주력 분야에 좀더 집중하라. *컴퓨터 과학 전공자라면, MBA 입학을 고려하라. 비즈니스를 이해하고 커뮤니케이션을 잘 할 수 있다는 것은 데이터 과학의 필수 요소다. 또한, 비즈니스 인텔리전스와 분석 소프트웨어 관련 자격증을 취득하라. *통..
원문 : http://www.ciokorea.com/news/11516스트레타 컨퍼런스의 창립자인 에드 덤빌이 데이터와 정보 사이의 간극에 대해 이야기했다. 비즈니스와 테크놀로지의 영역에서 데이터는 중요한 위상을 지닌다. 다가올 오렐리 스트레타 컨퍼런스(O'Reilly Strata Conference) 역시 참석자들에게는 데이터 주도의 혁신적인 방법론에 관하여 살펴볼 수 있는 좋은 기회가 될 것이다. 오렐리 스트레타 컨퍼런스 2012년 윈터 에디션은 빅 데이터에 관한 이해를 원하는 비즈니스맨 및 새로운 미래 테크놀로지를 만들어내고 있는 급진적 데이터 과학자를 위한 세션을 제공할 예정이다. 지난 몇 년간 하둡(Hadoop)과 카산드라(Cassandra), 그리고 맵리듀스(MapReduce)로 대표되는 오픈..
원문 : http://www.ciokorea.com/news/106172011년 11월 2일 서울 양재동 엘타워에서 열린 ‘빅 데이터 월드 2011’의 부대행사로 마련된 CIO 라운드테이블에서 아마존의 데이터 마이너(Data Minor) 존 라우저가 데이터 과학자(Data Scientist)의 필요성에 대해 강조했다. 라우저는 최초의 데이터 과학자로 수학자이자 천문학자인 ‘토비어스 마이어’를 꼽았다. 라우저에 따르면, 토비어스 마이어는 1750년에 9개의 상수를 3개의 방정식에 적용해 27개의 공식으로 위도 측정의 오차를 최소화했다. 라우저는 “데이터가 많을수록 더 정확하게 측정할 수 있다는 것을 입증했기 때문에 마이어를 최초의 데이터 과학자로 볼 수 있다”라고 밝혔다. 라우저는 “데이터 과학자는 공학과..