일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 통계
- Machine Learning
- MongoDB
- c++
- Artificial Intelligence
- 인공지능
- data science
- 주일설교
- 김양재 목사님
- 빅데이타
- 데이터 과학
- 김양재 목사
- 우리들교회
- nodeJS
- WebGL
- R
- No SQL
- node.js
- 빅 데이타
- 몽고디비
- Statistics
- 확률
- Deep learning
- openCV
- 딥러닝
- 김양재
- Big Data
- 빅 데이터
- probability
- 빅데이터
- Today
- Total
목록Statistics (48)
Scientific Computing & Data Science
[데이터 직접 입력하기] R에서 데이터 입력의 가징 기본적인 것은 "c" 명령을 통해 사용자가 데이터를 직접 입력하는 것이며 다음과 같은 형식으로 입력한다:test.name = c(item.1, item.2, item.3, item.n)예를 들면, 다음과 같이 데이터를 입력할 수 있다. (반드시 아이템과 아이템 사이는 콤마(,)로 구분 짓는다)> myData = c(1,3,2,5,10) > myData [1] 1 3 2 5 10앞의 예는 숫자 데이터에 관한 것이었다. 만약 문자열 아이템을 데이터로 저장하려면 다음과 같이 따옴표 형식으로 입력한다:test.text = c(“item1”, “item2”, ‘item3’)예를 들어,> myData = c("dog", "pig", "cat", "horse") >..
[커맨드 패키지]R은 패키지(packages)라 불리우는 일련의 모듈들로 구성되어 있다. R을 시작할 때, 기본적으로 탑재된 패키지로 로딩되는데 현재 로딩된 패키지 리스트를 확인하려면 다음과 같이 입력한다:> search() [1] ".GlobalEnv" "tools:RGUI" "package:stats" "package:graphics" "package:grDevices" "package:utils" "package:datasets" [8] "package:methods" "Autoloads" "package:base" [표준 패키지]현재 로딩되어 있지는 않지만 사용가능한 패키지(물론 이들중에는 시작 시 자동으로 로딩되는 패키지들도 있다)의 리스트를 확인하려면 다음과 같이 입력한다:> installed..
R은 방대한 빌트인(built-in) 헬프 도큐먼트를 갖추고 있다. 가장 기본적인 헬프 명령은 "help(topic)" 형태이며 예를 들어 " barplot"에 대한 도움말을 알아 보고 싶다면> help(barplot)과 같이 입력하면 다음과 같이 헬프 창이 열린다.또 다른 명령으로는 "?topic" 형식이 있으며 마찬가지로 "barplot"에 대한 정보를 얻고자 한다면, > ?barplot와 같이 입력한다.웹 브라우저를 통해 헬프 시스템에 접속하려면> help.start() 만약 '/usr/bin/open'에 의하여 시작된 브라우저가 이미 실행중이라면, 다시 재시작되지 않을 것을 것입니다. 따라서, 당신은 반드시 해당 윈도우로 전환해야 합니다 만약 그렇지 않다면, 조금만 더 기다려보세요 ... 와 같이..
Descriptive Statistics - Sample Statistics표본 평균(Sample Mean)데이터 세트 \(\bar{x}\)의 표본 평균은 모집단으로부터 추출된 표본 집단의 기하평균이다. 만약 n개의 데이터 세트, \(x_1, x_2,...,x_n\)으로 구성된 표본 평균은 \( \bar{x} = \displaystyle{\frac{\displaystyle{\sum_{i=1}^{n}{x_i}}}{n}} \) 입니다. 표본 평균이 갖는 의미는 다음과 같습니다:확률변수 X의 랜덤 변수의 기대값 E(X)와 동일한 개념의 "중간값"으로 생각할 수 있습니다.관찰된 데이터 세트 내에서 미지의 확률분산의 기대값에 대한 추정으로 생각할 수 있습니다.표본 미디언 (Sample Median)순서를 정한 데..
[Definition] 모집단 / 표본 / 임의 표본 / 통계학적 추론모집단(population)은 특정 확률 분포로부터 얻을 수 있는 가능한 관찰결과로 구성된다. 표본(sample)은 실험자가 측정하거나 알려지지 않은 확률 분포를 관찰하는데 사용되는 모집단의 특정 부분집합이다. 임의 표본(random sample)은 모집단으로부터 임의로 선택된 샘플의 요소이며, 이 과정은 종종 표본이 모집단의 특성을 잘 반영한다는 것을 확인하기 위해 사용된다.통계학적 추론(statistical inference)이란, 모집단으로부터 추출된 표본을 이용하여 데이터 분석을 통해 확률 밀도 함수 등과 같은 특성을 분석하는 방법을 의미한다. 다음 그림은 확률 이론과 통계학적 추론과의 관계를 설명하고 있다.[그림 1.] 확률 ..
R은 S와 S-Plus 이후에 등장한 오픈 소스 통계 해석용 환경이다. S 언어는 1980년대 후반 AT&T 연구소에서 개발되었다. R 프로젝트는 1995년 뉴질랜드의 Auckland 대학교 통계학과의 Robert Gentleman과 Ross Ihaka에 의해 시작되었으며 이들의 이름을 앞자를 따서 R 프로젝트로 명명되었다. 이 프로젝트는 급속도로 많은 사람들의 관심을 끌게 되었으며, 현재 R 코어 개발 팀과 전세계의 자원 개발자들에 의해 유지되고 있다. R 프로젝트 웹페이지는 R에 대한 메인 정보 사이트이다. 이 사이트에서 소프트웨어, 패키지 및 도큐먼트를 다운로드 할 수 있다.R은 강력한 통계 프로그램이지만 우선적으로 프로그래밍 언어라 할 수 있다. 전세계의 개발자들이 수많은 루틴을 작성하고 있으며,..
중심 극한 정리(Central Limit Theorem)Definition만약 \(X_1,...,X_n\)이 평균값 \(\mu\)와 분산 \(\sigma^2\)을 갖는 동등한 확률 변수라면 이들의 평균 \(\bar{X}\)는 다음과 같이 근사화 될 수 있습니다: \( N \begin{pmatrix} \mu, \displaystyle{\frac{\sigma^2}{n}} \end{pmatrix} \) 이와 유사하게 분포의 합 \(X_1 + \cdot \cdot \cdot + X_n \)은 다음과 같이 근사화 됩니다: \(N(n \mu, n \sigma^2)\)Proof\( E(X_i) = \mu, \ Var(X_i) = \sigma^2, \ 1 \le i \le n \) 이므로 \( E(X_1 + \cdot..
이항분포 B(n,p)의 확률값은 N(np,np(1-p)) 분포로 근사화할 수 있다. 만약 확률 변수 X가 X ~ B(n,p)이면이며,이다. 이러한 근사화는 다음 조건에서 잘 맞는다:
만약 확률변수 Xi ~ N(μ,σ2), 1 ≤ i ≤ n 가 독립 확률 변수라면 이들의 평균는 다음의 분산을 따른다: [Proof]이므로이며,이므로따라서,