1
2
3
4
5
6
7
8
#연속형 변수 (int)
#범주형 변수 (factor)

var1 = c(1,2,3,4,5,6); #수치형 var2 = factor(c(1,2,3,1,2)); #범주형 var2 var1 + 3 # 수치형 변수로서 vector=wise 연산이 가능. var2 + 3 # 범주형 변수로서 vector-wise 연산 불가능. levels(var2) #범주형 변수의 카테고리를 출력. levels(var1) #수치형 변수에 대해서 NULL을 리턴. var3 = c("a" , "b " , "c ") var4 = factor(c("a","b","c")) class(var3) #문자형 변수 class(var4) #범주형 변수 mean(var1) #수치형에대한 평균 계산 mean(var2) #범주형이므로 계산 불가. var2 = as.numeric(var2) # factor -> numeric transform mean(var2) # numeric으로 바뀐 var2에 대해서 평균계산이 가능해졌다. #주로 쓰이는 변환타입 as.character() as.numeric() as.date() #벡터 : 1차원 , 한가지 변수 타입으로 구성 #행렬 : 2차원 , 한가지 변수 타입으로 구성 #DF : 2차원 , 한가지 변수 타입으로 구성 #list : 2차원 이상(다차원) 다양한 변수타입으로 구성. #array: 2차원 이상(다차원) #1. 벡터(1개 이상의 값, 동일한 타입) v = c(1,2,3) b = "hello" #2.df df1 = data.frame(v1 = c(1,2,3), v2 = c("hello", "hi" , "bye")) #3.matrix m1 = matrix(c(1:10), ncol = 2) class(m1) #4.array A1 = array(1:20, dim = c(2,5,2)) #2행 5열 깊이2의 3차원 배열 A1 #, , 1 = 1번째 깊이의 데이터 #, , 2 = 2번째 깊이의 데이터 #5.list L1 = list(f1 = c(1) , f2 = data.frame(c(1,2,3)), f3 = array(1:20, dim = c(2,5,2)) ) L1 #각 변수명에 해당하는 데이터가 각각 하나의 컬럼으로 출력된다. #함수의 리턴결과가 리스트인 타입이 많다. x = boxplot(mpg$cty) class(x) x
class(x$conf) class(x$stats) x$stats # 행 열 인덱스가 [,1] , [,2] 이런식으로 보이면 매트릭스 타입이다. x$stats[ 3, 1] #3번쨰 행의 1번쨰 열만 추출.(중위수)



+ Recent posts