일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 빅데이타
- 확률
- 인공지능
- 몽고디비
- 우리들교회
- 빅 데이타
- 김양재
- 딥러닝
- data science
- MongoDB
- 김양재 목사
- node.js
- R
- 주일설교
- Big Data
- 데이터 과학
- Statistics
- probability
- Artificial Intelligence
- 빅 데이터
- 통계
- c++
- 빅데이터
- openCV
- WebGL
- nodeJS
- Deep learning
- Machine Learning
- No SQL
- 김양재 목사님
Archives
- Today
- Total
Scientific Computing & Data Science
[Data Mining with R Programming] Basic Quiz 본문
Data Science/Data Mining with R Programming
[Data Mining with R Programming] Basic Quiz
cinema4dr12 2015. 2. 19. 10:42dataset.csv
Question 1
첨부된 데이터를 로딩하고 column 이름을 출력하시오.
> myData = read.csv("dataset.csv")
> names(myData)
[1] "Ozone" "Solar.R" "Wind" "Temp" "Month" "Day"
Question 2
처음 두 개의 row를 출력하시오.
> myData[1:2,]
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
Question 3
주어진 dataset에는 얼마나 많은 data가 있는가?
> dim(myData)
[1] 153 6
Question 4
주어진 dataset의 마지막 두 개의 row를 출력하시오.
> rowLength = dim(myData)[1 > myData[(rowLength-1):rowLength,] Ozone Solar.R Wind Temp Month Day 152 18 131 8.0 76 9 29 153 20 223 11.5 68 9 30
Question 5
Ozone의 104번째 값을 출력하시오.
> Ozone = myData[,1]
> Ozone[104]
[1] 44
Question 6
Ozone에는 유실데이터 값이 몇 개나 존재하는가?
> bad = is.na(Ozone)
> bad
[1] FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
[17] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE FALSE FALSE FALSE FALSE TRUE
[33] TRUE TRUE TRUE TRUE TRUE FALSE TRUE FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE FALSE
[49] FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE FALSE
[65] TRUE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[81] FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[97] FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[113] FALSE FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[129] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[145] FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
> sum(bad)
[1] 37
Question 7
Ozone의 평균값은 얼마인가? 유실데이터 값을 제외하시오.
> mean(Ozone[complete.cases(Ozone)])
[1] 42.12931
Question 8
Wind 값이 10보다 크고 Temp 값이 70보다 작은 Ozone의 부분집합을 구하시오. 이 부분집합에 대하여 Ozone의 평균값은 얼마인가?
> good = complete.cases(myData)
> good
[1] TRUE TRUE TRUE TRUE FALSE FALSE TRUE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
[21] TRUE TRUE TRUE TRUE FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE TRUE
[41] TRUE FALSE FALSE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[61] FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE
[81] TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE FALSE TRUE TRUE
[101] TRUE FALSE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE
[121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
[141] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
> completeData = myData[good,]
> Ozone = completeData[,1]
> Wind = completeData[,3]
> Temp = completeData[,4]
> WindCond = Wind > 10
> WindCond
[1] FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE TRUE FALSE TRUE
[21] TRUE TRUE FALSE FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
[41] FALSE FALSE TRUE TRUE TRUE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[61] TRUE FALSE FALSE TRUE FALSE TRUE TRUE FALSE TRUE FALSE FALSE TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE
[81] FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE
[101] TRUE FALSE TRUE FALSE TRUE TRUE TRUE FALSE TRUE FALSE TRUE
> TempCond = Temp < 70
> TempCond
[1] TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE
[21] TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[41] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[61] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[81] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE
[101] TRUE FALSE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE TRUE
> mean(Ozone[WindCond & TempCond])
[1] 18.35294
Question 9
9월의 평균온도를 구하시오.
> Month = completeData[,5]
> mean(Temp[Month == 9])
[1] 76.89655
Question 10
6월의 최대 온도값은 얼마인가?
> max(Temp[Month == 6])
[1] 90
'Data Science > Data Mining with R Programming' 카테고리의 다른 글
Comments