일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 주일설교
- nodeJS
- 빅 데이터
- WebGL
- c++
- 김양재 목사
- probability
- 빅 데이타
- R
- No SQL
- data science
- Deep learning
- Statistics
- 빅데이타
- Machine Learning
- 확률
- Big Data
- Artificial Intelligence
- 통계
- 딥러닝
- 몽고디비
- node.js
- MongoDB
- 인공지능
- openCV
- 빅데이터
- 데이터 과학
- 김양재 목사님
- 김양재
- 우리들교회
- Today
- Total
목록Data Science (257)
Scientific Computing & Data Science
Written by cinema4d임베드 된 도큐먼트에 대한 쿼리 방법은 크게 두 가지로 요약할 수 있다: (1) 전체 도큐먼트에 대한 쿼리(2) 개별 키(key)/값(value) 쌍을 이용한 쿼리 상기 두 가지 방법에 대해 각각 알아보도록 하겠다. 1. 전체 도큐먼트에 대한 쿼리우선, 다음 명령을 통해 임베드 된 도큐먼트를 준비한다.> db.users.drop() true > db.users.insert({name: {first: "john", last: "kennedy"}}) > db.users.findOne() { "_id" : ObjectId("52edaa32f97299c19188c2dc"), "name" : { "first" : "john", "last" : "kennedy" } }"name" ..
by Geol Choi | February 1, 2014이번 글에서는 "$slice" 오퍼레이터에 대해 알아 보도록 하겠다. "$slice"는 특정 key의 array 아이템들 중 일부분을 추출하는데 사용된다.가령, 다음과 같이 아이템이 있다고 하자.> db.food.drop() > db.food.insert({"fruit": ["apple", "orange", "plum", "banana", "peach", "mango", "pineapple", "grape", "melon", "water melon", "cherry", "kiwi", "strawberry"]}) "fruit" 중 처음 다섯개의 아이템을 추출하려면 다음과 같은 입력한다.> db.food.find( {}, { fruit: { $slice..
포아송 분산 때때로 특정 범위 내에서 발생하는 사건의 수를 세는 확률 변수를 정의해야 할 필요가 습니다. 예를 들어, 실험자가 아이템 중 결함을 가지고 있는 아이템의 수에 관심이 있다거나 특정 시간 범위 내에 받는 전화 횟수 등입니다. 포아송(Poisson) 분포는 이러한 상황에 대한 적절한 모델을 제시합니다.Definition파라미터 λ를 갖는 포아송 확률 변수로 분한된 확률 변수 X는 다음과 같이 정의할 수 있으며: \( X \sim P(\lambda) \) \(\lambda\)는 이에 대한 확률 밀도 함수는 x = 0, 1, 2, 3, ...에 대해 \( P(X=x) = \displaystyle{\frac{e^{\lambda} \lambda^x}{x!}} \) 입니다. n이 충분히 클 경우(이를테면..
[Def] 초기하 분산(Hypergeometric Distribution)전체 N개의 아이템 중 r개가 특정 종류라고 가정하자. 예를 들어 N개의 공 중 r개의 공이 빨간 공이라고 하자. 임의로 하나의 아이템을 추출할 때 빨간 공이 선택될 확률은만약 복원 추출(아이템을 임의로 선택하고 확인 후 복귀)일 경우 확률 변수 X는 다음의 이항분포를 따른다.그러나 만약 비복원 추출일 경우 이항분포가 적용될 수 없다. (왜냐하면 매 시행마다 확률이 바뀌기 때문이다) 이 경우 초기하 분산이 적용되며에 대한 확률은이다. 또한 기대값과 분산은 각각 및 이다.
[Def] 음의 이항분포(Neagative Binomial Distribution)성공 확률 p로 동일한 독립 베르누이 시행에 있어 r번째까지의 시행은 파라미터 p와 r을 갖는 음의 이항분포(negative binomial distribution)를 갖는다고 하며, x = r, r+1, r+2, ...에 대한한 확률 밀도 함수는이며 기대값과 분산은 각각, 이다.
[Def.] 기하 분산(Geometric Distribution)성공 확률이 p로 동일한 독립 베르누이 시도(trials)에 있어 첫번째 성공을 포함한 시도 회수는 파라미터 p를 갖는 기하 분산(geometric distribution)을 가지며, 확률 밀도 함수는 x = 1, 2, ...에 대하여이며, 누적 분포 함수는이다.또한 기대값과 분산은 , 이다. 이에 대한 누적 분포 함수는
[Definition] 베리누이(Bernoulli) 확률 변수\( 0 \le p \le 1 \)의 파라미터 p를 갖는 베르누이 확률 변수는 0 또는 1의 값을 취하며 일어날 확률은, \(P(X=1) = p\) 이며, 일어나지 않을 확률은 \(P(X=0) = 1-p\) 이다. 이에 대한 기대값과 분산은 각각 \(E(X)=p\) 및 \(Var(X)=p(1-p)\)이다.[Proof]\( E(X) = \displaystyle{ \sum_{i=1}^{2}{x_i p_i} = x_1 p_1 + x_2 p_2 = (0)(1-p) + (1)(p) = p } \) \( Var(X) = E(X^2) - (E(X))^2 = \displaystyle{ \sum_{i=1}^{2}{x_i^2 p_i - p^2} = (0)^2(1..
확률 변수 X1,...,Xn은 각각 기대값 μ와 분산 σ2를 갖는 독립 확률 변수라 할 때, 이들에 대한 평균은이며, 이에 대한 기대값은이며, 분산은이다. [Proof]
by Geol Choi | February 1, 2014"$size"는 array의 크기를 이용하여 검색할 수 있는 오퍼레이터이다.우선 다음과 같이 아이템을 준비하자.> db.food.drop() > db.food.insert({"_id" : 1, "fruit" : ["apple", "banana", "peach"]}) > db.food.insert({"_id" : 2, "fruit" : ["apple", "kumquat", "orange"]}) > db.food.insert({"_id" : 3, "fruit" : ["cherry", "banana", "apple"]}) > db.food.insert({"_id" : 4, "fruit" : ["pineapple", "plum"]}) ID 1, 2, 3에 ..
by Geol Choi | February 2, 2014우선 다음과 같이 "food" 컬렉션에 array 타입으로 도큐먼트를 추가한다:> db.food.drop() > db.food.insert({"_id" : 1, "fruit" : ["apple", "banana", "peach"]}) > db.food.insert({"_id" : 2, "fruit" : ["apple", "kumquat", "orange"]}) > db.food.insert({"_id" : 3, "fruit" : ["cherry", "banana", "apple"]}) "apple"과 "banana" 모두를 포함하는 도큐먼트는 ID 1과 ID 3이다. "$all"을 통해 이 두 가지 모두를 포함하는 도큐먼트를 검색해 보자.> db.f..