난수, 시간측정, 그룹화 및 요약, 피봇팅, colSums, which.max

2019. 5. 28. 15:09

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
library(tm)
library(stringr)
library(dplyr)
library(tidyr)        #데이터 정리정돈 패키지.
library(tidytext)
 
install.packages("tidyr")
install.packages("tidytext")
 
 
 
 
set.seed(0)
matrix(rnorm(10), c(2,5))
 
#시간측정
 
x = 1:10000
y = 10001:20000
 
startTime = proc.time()
z = rep(0,10000)
 
 
for(i in 1:10000){
  
  z[i] = x[i] + y[i]  
 
}
 
proc.time() - startTime
 
a = c(1,2,3)
b = c(4,2,1)
 
a == b       # 요소 길이만큼의 
all(a == b)  # 하나의 불린형만 나온다. 
 
exp(a)       # 자연상수 의 1승 2승 3승.
log10(a)     # 밑이 10인 로그 
 
 
x = 50:59
max(x)
which.max(x)   #최대값이 나오는 인덱스를 리턴.
 
x = matrix(c(10,20,10,20), nrow = 2)
colSums(x)    #모든열의 합.
 
set.seed(123)
df = data.frame(k1=c("x", "x", "y", "y", "x"),
                k2=c("f", "s", "f", "s", "f"),
                d1=rnorm(5),
                d2=rnorm(5))
 
 
 
summarise(group_by(df, k1), myMean = mean(d1))   #그룹별 d1의 평균.
summarise(group_by(df, k1 ,k2), myMean = mean(d1))   #변수 두개로 묶은그룹별 d1의 평균.
 
 
#pivoting
summarise(group_by(df, k1, k2), myMean = mean(d1))   #4행 3열
 
#spread 적용 2행 3열, k2가 열로 온다.
spread(summarise(group_by(df, k1, k2), myMean = mean(d1)) , k2, myMean)
 
 
#spread 적용 2행 2열, k1가 열로 온다.
spread(summarise(group_by(df, k1, k2), myMean = mean(d1)) , k1, myMean)
 
 
#두 데이터프레임 합성. join, merge
#bind , 일반적으로 merge  사용
 
 
#merge: 두 df의 공통 key를 사용하여 병합.  행을 연결한다고 보면 된다.
#df1에 df2에는 있는 컬럼이 없을경우 0로 채워진다.
 
df = data.frame(k = c('b', 'b', 'a', 'c', 'a', 'a', 'b' ),
                d1 = 0:6)
df
 
 
df2 = data.frame(k = c('a', 'b', 'd'), d2 = 0:2)  # k가 a 이면 d2 = 0 b이면  d2 = 1
df2
 
merge(df, df2)
merge(df, df2, all = T)
merge(df, df2, all.x = T)
merge(df, df2, all.y = T)
 
Colored by Color Scripter
cs

저작자표시 (새창열림)

'딥러닝 모델 설계 > R STUDIO' 카테고리의 다른 글

k-means clustering example with R studio and iris data (0)	2019.05.28
감정 분석 기초 (0)	2019.05.28
k-means 클러스터링 예제 (0)	2019.05.27
tm라이브러리를 통한 코퍼스 manipulation (0)	2019.05.27
텍스트 마이닝 기초 (0)	2019.05.23

Software knowledge worth spreading

난수, 시간측정, 그룹화 및 요약, 피봇팅, colSums, which.max

'딥러닝 모델 설계 > R STUDIO' 카테고리의 다른 글

+ Recent posts

티스토리툴바