일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- R
- 김양재 목사님
- 빅 데이타
- MongoDB
- probability
- 주일설교
- Machine Learning
- 김양재 목사
- 빅 데이터
- 우리들교회
- Deep learning
- No SQL
- Big Data
- nodeJS
- node.js
- 몽고디비
- 확률
- c++
- Statistics
- 통계
- openCV
- WebGL
- 김양재
- 인공지능
- 빅데이터
- 빅데이타
- 딥러닝
- Artificial Intelligence
- 데이터 과학
- data science
- Today
- Total
목록스팸 필터 (2)
Scientific Computing & Data Science
Written by Geol Choi | Nov. 12, 2016 이전 글(Naive Bayes Spam Filter Part 1.)에서 Naive Bayes에 대한 이론을 다뤘습니다. 이번 글에서는 이론을 바탕으로 휴대폰의 SMS 데이터의 Spam Filter를 작성해 보도록 하겠습니다. 일반적인 데이터 분석 프로세스는, (1) 문제 정의(2) 데이터 획득(3) 데이터 클린업(4) 데이터 정규화(5) 데이터 변형 및 가공(6) 데이터 탐구 기반 통계(7) 데이터 탐구 기반 시각화(8) 예측 모델(9) 모델 평가(10) 결과에 대한 시각화 및 해석(11) 솔루션 배포 인데, Machine Learning에 의한 결과 도출도 이 순서와 크게 다르지 않으며, 전체적인 순서는 다음 그림과 같습니다. 1. 데이..
Written by Geol Choi | Nov. 07, 2016 이번 글에서는 Naive Bayes 이론을 기반으로 한 Spam Filter 작성에 대해 알아보도록 하겠습니다. Theoretical Background서로 종속적인 사건 A, B가 있을 때 사건 B가 일어났다는 전제 하에 사건 A가 일어날 확률은 다음과 계산됩니다: \(P(A\mid B) = \displaystyle{\frac{P(A \cap B)}{P(B)}}\) ...(1) 여기서 \(P(A \mid B)\)를 조건부 확률(Conditional Probability)이라고 하며, 이는 사건 A와 B가 동시에 일어날 확률, \(P(A \cap B)\)과 사건 B가 일어날 확률에 의해 결정됩니다. 즉, Bayes' Theorem이 의미하..