일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 우리들교회
- openCV
- 김양재
- WebGL
- 확률
- nodeJS
- data science
- Deep learning
- 빅데이타
- 주일설교
- 김양재 목사
- 통계
- R
- Artificial Intelligence
- 빅 데이터
- c++
- node.js
- 김양재 목사님
- 딥러닝
- MongoDB
- 빅 데이타
- 데이터 과학
- Statistics
- No SQL
- 몽고디비
- Machine Learning
- probability
- 인공지능
- Big Data
- 빅데이터
- Today
- Total
목록머신 러닝 (12)
Scientific Computing & Data Science
이 글은 ParallelR의 R for Deep Learning (II): Achieve High-Performance DNN with Parallel Acceleration을 번역한 것입니다. 이전 포스트, R 딥러닝: 인공신경망 바닥부터 구현하기에서 신경망의 핵심 구성요소와 R에서 이것을 바닥부터 구현하는 방법에 대하여 알아보았다. 이제 R에서 구현안 것에 대한 연산 성능과 효율, 특히 멀티코어 CPU와 NVIDIA GPU 아키텍쳐에 대한 병렬 알고리즘에 관하여 집중적으로 알아보도록 하겠다. 성능 프로파일이 글에서 성능 분석을 위해 작지만 큰 데이터세트인 MNIST를 활용할 것이다. MNIST는 머신러닝 분야에서 손으로 쓴 숫자의 분류에 대한 정확도를 측정하기 위해 자주 사용되며, Kaggle 대회에..
1895년 독일 물리학자 Wilhelm Röntgen은 그의 아내 Anna에게 그녀의 손의 X-레이를 보여주었다. Anna는 "나는 죽음을 보았다"라고 말했다. 의료 영상은 100여년 전에 시작과 동시에 패러다임을 깼고, 지난 몇년간 진화를 거듭한 딥러닝 메디컬 어플리케이션은 한번 더 현실을 뛰어넘어 새로운 가능성으로 우리를 안내했다. 아래 히트맵에서 볼 수 있는 바와 같이, 이미징과 진단에서 인공지능(Artificial Intelligence; AI)은 2015년에 피크에 도달하였고 계속 유지되고 있다. 2015년 1월 이후 벤쳐 캐피탈이 지원하는 헬스케어 AI 스타트업의 1/3이 이미징과 진단 분야에 속해 있으며 이후 펀딩 거래의 80%가 진행되고 있다. 예를 들어, 의료 영상 진단을 위해 딥러닝을 ..
"Windows 환경에서 Docker를 이용하여 TensorFlow 설치"하는 방법에 대하여 소개한 바 있는데, 굳이 Docker를 이용하지 않고도 Anancoda 3를 통해 Windows OS 환경에서 TensorFlow를 설치하고 사용할 수 있다. Anaconda 3 설치다음 링크를 접속하여 Anaconda 3를 자신의 PC에 설치한다: https://www.continuum.io/downloadsAnaconda 3는 Python version 3.5를 지원한다. pip 명령을 통해 TensorFlow 설치Windows 시작 > 모든 프로그램 > Anaconda3(64-bit) > Anaconda Prompt를 관리자 권한으로 실행한다. Anaconda Prompt가 실행되면 TensorFlow의 C..
[Lec 00]수업의 개요와 일정[Lec 01]기본적인 Machine Learning의 용어와 개념 설명[Lab 01]TensorFlow의 설치 및 기본적인 Operations[Lec 02]Linear Regression의 Hypothesis와 Cost[Lab 02]TensorFlow로 간단한 Linear Regression 구현[Lec 03]Linear Regression의 Cost 최소화 알고리즘[Lab 03]Linear Regression의 Cost 최소화의 TensorFlow 구현[Lec 04]Multi-variable Linear Regression[Lab 04]Multi-variable Linear Regression을 TensorFlow에서 구현하기[Lec 5-1]Logistic Classi..
이 글은 본래 Capital of Statistic에 중국어로 간행된 것이며 많은 훌륭한 조언을 해준 He Tong에게 감사를 전한다.이 글에 수록된 모든 코드는 GitHub[링크]에 있다.데이터 과학자들은 R, SAS, SPSS, MATLAB 등과 같은 통계 소프트웨어에 이미 익숙해있다; 그러나, 일들 중 일부는 병렬 컴퓨팅에 상대적으로 미숙하다. 그래서 이 글에서 R에서 병렬 컴퓨팅 사용에 대한 기본개념을 소개하고자 한다. 병렬 컴퓨팅이란 무엇인가?병렬 컴퓨팅은 분명히 고성능 컴퓨터와 병렬 소프트웨어를 포함해야 한다. 고성능 컴퓨터의 피크(Peak) 성능은 급증하고 있다. 최근의 세계 500대 수퍼컴퓨터 랭킹에서 중국의 Sunway TaihuLight은 93 PFLOPS로 최고에 올라있다(링크). 대..
이번 글에서는 R에서 병렬처리를 하는 방법에 대하여 소개하도록 한다.R-bloggers의 글, How-to go parallel in R - basics + tips의 내용을 최대한 참고하여 정리해 보았다. [목차]1. lapply에 대하여2. parallel 패키지3. foreach 패키지4. 디버깅5. 캐싱(Caching)6. 계산 부하 밸런싱7. 이미지 프로세싱 예제 1. lapply에 대하여R이 기본적으로 제공하는 함수들 중 가장 많이 사용되는 함수가 lapply일 것이다.이와 유사한 함수로 apply, sapply, tapply 등이 있는데 각자의 쓰임새가 있으며, 자신이 R유저라고 자신한다면 이 함수들이 어느 상황에 적절히 쓰이는지 이해하고 자유자재로 다룰 수 있어야 한다고 생각한다. 다음 코..
데이터 과학이 R, Python, Hadoop, SQL 및 전통적 머신러닝 또는 통계 모델링에 대한 것이라고 믿는 사람들이 많다. 아래의 글들은 데이터 과학이 얼마나 현대적이며, 넓고 깊은 분야인지를 기본적으로 보여준다. 어떤 데이터 과학자들은 실제로 위에 나열된 것들 중 아무 것도 하지 않는다. 어떠한 코딩도 하지 않고, 대신, 머신 간 통신 프레임워크에서 다양한 어플리케이션들이 서로 대화하도록 하는 일을 데이터 과학자도 있다. 그러나 대부분의 데이터 과학자들이 R, Python, Hadoop 관련 시스템을 사용하는 것은 사실이다.심층 데이터 과학에 대한 글(아래 참고)을 읽어보면 데이터 과학 또한 많은 사람들(자신을 데이터 과학자라고 부르는 사람들)이 반복적으로 하는 일을 자동화하는 것을 알 수 있다..
* 이 글은 Data Science Central의 "Difference between Machine Learning, Data Science, AI, Deep Learning, and Statistics"을 번역한 것이다. 이번 글에서는 데이터 과학자의 다양한 역할과 머신러닝, 딥 러닝, AI, 통계학, IoT, 오퍼레이션 리서치, 응용 수학 등과 같은 관련 분야와 데이터 과학이 어떻게 다른지 공통점은 무엇인지 기술하고자 한다.데이터 과학은 넓은 분야를 포괄하는 만큼, 어떤 사업 분야에서도 마주칠 수 있는 데이터 과학자의 다양한 유형에 대해 살펴보기록 한다: 각자는 자신이 미처 몰랐던 스스로가 데이터 과학자임을 깨닫게 될 수도 있다.다른 과학 분야의 소양과 마찬가지로, 데이터 과학자들은 관련 소양으로부..
이번 글에서는 Support Vector Machine(이하 SVM)의 개념과 간단한 이론에 대해 이해하고자 한다. 1. SVM의 개념SVM의 개념은 매우 간단한데, 특징에 따라 서로 유사한 그룹끼리 칸막이를 쳐서 나누는 것이다.이 칸막이를 초평면(Hyperplane)이라고 부른다.SVM의 기초가 되는 수학적 이론은 수십년에 걸쳐 정리가 되었지만, 최근이 되어서야 주목을 받게 되었는데, 그 이유는 첫번째로 성능이 월등히 개선되었고, 이에 따라 여러 프로그래밍 언어를 지원하는 잘 정돈된 라이브러리가 등장했기 때문이다.SVM은 분류 및 수치 예측 등 거의 모든 학습 문제에 잘 대처할 수 있는데 특히 알고리즘의 성공적인 열쇠가 되는 것은 패턴 인식이다.주목할 만한 응용분야는 다음과 같다:바이오인포매틱스 분야에..