일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- openCV
- 김양재 목사님
- Big Data
- 몽고디비
- Artificial Intelligence
- R
- 주일설교
- Deep learning
- No SQL
- data science
- 통계
- 딥러닝
- 인공지능
- probability
- Machine Learning
- 빅데이터
- 데이터 과학
- node.js
- Statistics
- 김양재 목사
- nodeJS
- c++
- 빅 데이터
- WebGL
- 확률
- 빅데이타
- 김양재
- 빅 데이타
- MongoDB
- 우리들교회
- Today
- Total
목록확률 (42)
Scientific Computing & Data Science
포아송 분산 때때로 특정 범위 내에서 발생하는 사건의 수를 세는 확률 변수를 정의해야 할 필요가 습니다. 예를 들어, 실험자가 아이템 중 결함을 가지고 있는 아이템의 수에 관심이 있다거나 특정 시간 범위 내에 받는 전화 횟수 등입니다. 포아송(Poisson) 분포는 이러한 상황에 대한 적절한 모델을 제시합니다.Definition파라미터 λ를 갖는 포아송 확률 변수로 분한된 확률 변수 X는 다음과 같이 정의할 수 있으며: \( X \sim P(\lambda) \) \(\lambda\)는 이에 대한 확률 밀도 함수는 x = 0, 1, 2, 3, ...에 대해 \( P(X=x) = \displaystyle{\frac{e^{\lambda} \lambda^x}{x!}} \) 입니다. n이 충분히 클 경우(이를테면..
[Def] 초기하 분산(Hypergeometric Distribution)전체 N개의 아이템 중 r개가 특정 종류라고 가정하자. 예를 들어 N개의 공 중 r개의 공이 빨간 공이라고 하자. 임의로 하나의 아이템을 추출할 때 빨간 공이 선택될 확률은만약 복원 추출(아이템을 임의로 선택하고 확인 후 복귀)일 경우 확률 변수 X는 다음의 이항분포를 따른다.그러나 만약 비복원 추출일 경우 이항분포가 적용될 수 없다. (왜냐하면 매 시행마다 확률이 바뀌기 때문이다) 이 경우 초기하 분산이 적용되며에 대한 확률은이다. 또한 기대값과 분산은 각각 및 이다.
[Def] 음의 이항분포(Neagative Binomial Distribution)성공 확률 p로 동일한 독립 베르누이 시행에 있어 r번째까지의 시행은 파라미터 p와 r을 갖는 음의 이항분포(negative binomial distribution)를 갖는다고 하며, x = r, r+1, r+2, ...에 대한한 확률 밀도 함수는이며 기대값과 분산은 각각, 이다.
[Def.] 기하 분산(Geometric Distribution)성공 확률이 p로 동일한 독립 베르누이 시도(trials)에 있어 첫번째 성공을 포함한 시도 회수는 파라미터 p를 갖는 기하 분산(geometric distribution)을 가지며, 확률 밀도 함수는 x = 1, 2, ...에 대하여이며, 누적 분포 함수는이다.또한 기대값과 분산은 , 이다. 이에 대한 누적 분포 함수는
확률 변수 X1,...,Xn은 각각 기대값 μ와 분산 σ2를 갖는 독립 확률 변수라 할 때, 이들에 대한 평균은이며, 이에 대한 기대값은이며, 분산은이다. [Proof]
두 개의 확률 변수 X1과 X2에 대하여 다음 관계식이 성립된다:또한, 분산에 대하여이며,X1과 X2가 상호 독립 확률 변수일 때 Cov(X1,X2)=0 이므로가 성립된다.
X가 확률 변수이며 어떤 수 에 대해 Y = aX + b 이면,이며,가 성립된다. [Proof]
두 개의 확률 변수 X와 Y에 대한 공분산(Covariance)은 다음과 같이 정의됩니다: \(\mathrm{Cov}(X,Y) = \mathrm{E}( (X-\mathrm{E}(X)) (Y - \mathrm{E}(Y)) ) = \mathrm{E}(XY) - \mathrm{E}(X) \mathrm{E}(Y) \) 공분산 값은 양수 또는 음수 또는 0(확률 변수가 상호 독립일 경우)을 갖습니다. 두 개의 확률 변수에 대한 의존성을 나타내는 지표는 상관관계(Correlation)이며, 다음과 같이 정의됩니다: \( \mathrm{Corr}(X,Y) = \displaystyle{\frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)\mathrm{Var}(Y)}}} \) 이며, -1과..
두 개의 확률 변수 X, Y에 대해 공동 확률 밀도 함수(joint probability density function)이 두 개의 한계 분포의 곱으로 표현될 때 이 두 확률 변수를 서로 독립이라고 정의한다. 즉, 이산 확률 분포에 대해이며, 연속 확률 분포에 대해이다.
확률 변수 Y에 대한 확률 변수 X의 조건부 분포는 Y의 값이 알려져 있다는 가정 하에 확률 변수 X의 확률적 속성을 나타낸다.즉, 이산 확률 분포에 대해서이며, 연속 확률 분포에 대해서는이다. 이 때 는 확률 변수 Y의 한계 분포이다. 한계 분포와 조건부 분포에 대한 차이를 이해하는 것은 매우 중요하다.확률 변수 X에 대한 한계 분포는 확률 변수 Y에 대해 알려진 것이 없는 경우에 있어 유용한 분포이며, 확률 변수 Y의 값이 특정값 y의 조건 하에 확률 변수 X에 대한 조건부 분포는 확률 변수 Y값이 y로 알려진 경우에 유용하다.