일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- openCV
- probability
- WebGL
- nodeJS
- 빅 데이터
- 김양재 목사
- 우리들교회
- Big Data
- Statistics
- 확률
- 데이터 과학
- 몽고디비
- c++
- data science
- 빅 데이타
- Artificial Intelligence
- 김양재 목사님
- 빅데이터
- 김양재
- 통계
- MongoDB
- node.js
- 주일설교
- 인공지능
- Machine Learning
- 딥러닝
- No SQL
- 빅데이타
- R
- Deep learning
- Today
- Total
목록Data Science (257)
Scientific Computing & Data Science
알고리즘은 우리의 직업을 빼앗을 것인가? 그렇다, 정말 그렇다... 그런데 이것은 좋은 것이다.알고리즘은 문제를 풀고 목표를 달성을 돕는 규칙이 있는 과정의 연속물이다. 또한 이러한 과정과 규칙을 구조화 할 때 즉각적으로 인공지능(Artificial Intelligence; A.I.)을 구현하기 위한 알고리즘을 자동화하는 것이 가능하다. 이것이 우리의 과중한 분석 업무를 돕는 인공지능이며 이로써 우리는 우리가 본래의 업무에 충실할 수 있게 된다.인공지능는 우리의 직업, 업무 스타일, 비즈니스 문화를 바꾸고 있다. 인공지능은 우리가 인간 본연의 일인 핵심 문제에 집중할 수 있도록 돕는다. 그러나 일터에서 인공지능을 이용하는 것은 단순하지 않다. 인공지능을 구현하기 위한 알고리즘의 수준은 천차만별이며 이들은..
Lahman 데이터를 이용한 야구 데이터 분석 Part 3.QUESTIONSQ1. American League의 지명타자 제도 도입으로 양 리그(National League와 American League) 간 득점의 차이가 생겼을까?Q2. MLB 전체 히스토리에서 투수의 완투비율은 어떻게 변화되어 왔는가? 지난 포스팅에 이어 질문을 하고 이에 대해 답하는 형식으로 야구 데이터 분석을 진행해 보기로 한다. Q1. American League의 지명타자 제도 도입으로 양 리그(National League와 American League) 간 득점의 차이가 생겼을까?이 질문에 대답을 하기 위해 American League에 지명타자 제도가 처음으로 도입된 해인 1973년도 이전과 이후의 양 리그 간 득점의 추이..
Lahman 데이터를 이용한 야구 데이터 분석 Part 2.QUESTIONSQ1. 각 10년 단위로 경기 당 평균 홈런 수는 몇 개인가?Q2. 각 10년 단위로 보았을 때 삼진 수와 홈런 수는 상관관계가 있을까? 본 포스팅에서는 Lahman 데이터 분석을 위한 준비를 했던 지난 글에 이어 본격적으로 데이터 분석을 하는 해보도록 한다.CRC Press의 "Analyzing Baseball Data with R"이 제시하는 질문에 답하는 유형으로 진행할 것이다.한 가지 첨언하면, 훌륭한 데이터 과학자의 자질 중 하나는 끊임없이 질문하고 그 질문에 데이터로 답을 할 수 있는 것임을 명심하자. Q1. 각 10년 단위로 경기 당 평균 홈런 수는 몇 개인가?이 질문에 답을 하려면 "Teams" 데이터를 불러온다.r..
Lahman 데이터를 이용한 야구 데이터 분석 Part 1. - 데이터 준비CONTENTS1. MLB 데이터 준비2. R의 Working Directory 구조3. MongoDB에 데이터 삽입 (Optional)4. MongoDB로부터 데이터 불러오기5. 맺음말 본 포스팅에서는 Database Journalist인 Sean Lahman의 최신 데이터를 이용하여 MLB에 대한 분석을 시도해 보고자 한다. 처음에는 KBO 데이터를 분석해보고자 하였지만, 데이터를 얻기가 불편하고 초기 준비 단계가 많아 데이터 획득이 훨씬 수월하고 방대한 데이터를 보유하고 참고자료가 풍성한 MLB부터 시도해 보기로 하였다. 차후에는 KBO 데이터를 획득부터 분석까지 시도해 보기록 하겠다. 분석 환경은 가장 인기있는 통계처리 언..
보호되어 있는 글입니다.
통계와 야구는 매우 밀접한 관계를 가지고 있지만, 단순히 안타수를 타수로 나누어 타율을 구하는 것 외에 통계는 더 많은 의미를 가지고 있다. 야구의 통계 분석 도구인 Sabermetric 역시 탸율보다 더 많은 의미를 담고 있습니다. 많은 야구팬들 또한 통계에 미친(?) 사람들(역으로, 통계에 미친 사람이 야구 팬일 확률도 높음)이며, 야구 데이터의 심오한 통계 분석을 해오고 있는데, 대개 그 도구는 R입니다. 야구 분석 웹사이트의 Dave Allen은, 그의 동료 Jeremy Greenhouse처럼 자주 R을 이용하여 PitchFX 데이터를 시각화합니다 (가령, 최적의 스윙률 분석). Ryan Elmore는 ESPN의 스포츠 분석팀에 R을 이용한 상세 데이터 분석에 영감을 주었습니다. Hardball ..
이전 글(R과 MongoDB 연동하기(rmongodb))에서 R의 MongoDB 관련 패키지인 rmongodb를 이용하여 R과 MongoDB를 연동하는 방법에 대해 소개한 바 있다. 그러나 rmongodb 패키지는 CRAN에서 제거되었으며, 이를 대신하여 mongolite 패키지를 사용할 수 있게 되었다. 이번 글에서는 mongolite 패키지를 이용하여 R과 MongoDB를 연동하여 데이터 도큐먼트 저장, 삭제, 업데이트 등을 하는 방법에 대하여 알아보도록 하겠다. 사용된 데이터는 다음 링크를 클릭하여 다운 받도록 한다: MongoDB 실행하기R의 Working Directory에 MongoDB 데이터를 저장할 폴더를 하나 생성하고 Command Line Tool에서 다음 명령을 통해 MongoDB를 ..
1895년 독일 물리학자 Wilhelm Röntgen은 그의 아내 Anna에게 그녀의 손의 X-레이를 보여주었다. Anna는 "나는 죽음을 보았다"라고 말했다. 의료 영상은 100여년 전에 시작과 동시에 패러다임을 깼고, 지난 몇년간 진화를 거듭한 딥러닝 메디컬 어플리케이션은 한번 더 현실을 뛰어넘어 새로운 가능성으로 우리를 안내했다. 아래 히트맵에서 볼 수 있는 바와 같이, 이미징과 진단에서 인공지능(Artificial Intelligence; AI)은 2015년에 피크에 도달하였고 계속 유지되고 있다. 2015년 1월 이후 벤쳐 캐피탈이 지원하는 헬스케어 AI 스타트업의 1/3이 이미징과 진단 분야에 속해 있으며 이후 펀딩 거래의 80%가 진행되고 있다. 예를 들어, 의료 영상 진단을 위해 딥러닝을 ..
원문: https://github.com/h2oai/h2o-tutorials/blob/master/tutorials/intro-to-datascience/intro-to-datascience.pdf
들어가기에 앞서...GPU(그래픽 처리 장치)는 최근 많은 계산이 요구되는 작업을 해야 하는 경우에 대해 더욱 인기를 얻고 있다. 이러한 장점에도, R에서의 GPU의 사용은 매우 제한되어 있었다. 불가능한 것이 아님에도 저수준 인터페이스 작업에 익숙하지 않은 프로그래머들에게 OpenCL이나 CUDA는 어렵다. 복잡한 GPGPU 코드를 추상화하는 R의 고수준 프로그래밍에 대한 바인딩을 생성하는 것은 R 유저들에게 GPU를 쉽게 활용할 수 있는 길을 열어준다. 이에 대한 핵심 아이디어를 제공하는 것이 gpuR 패키지이다. gpuR은 다음 세 가지 기발한 측면이 있다:'모든' GPU에 대해 적용이 가능하다.CUDA/OpenCL을 추상화하여 기존의 R 알고리즘에 쉽게 통합할 수 있다.객체가 GPU에서 지속 될 ..