1 2 3 4 5 6 7 8 | #연속형 변수 (int) #범주형 변수 (factor) var1 = c(1,2,3,4,5,6); #수치형
var2 = factor(c(1,2,3,1,2)); #범주형
var2
var1 + 3 # 수치형 변수로서 vector=wise 연산이 가능.
var2 + 3 # 범주형 변수로서 vector-wise 연산 불가능.
levels(var2) #범주형 변수의 카테고리를 출력.
levels(var1) #수치형 변수에 대해서 NULL을 리턴.
var3 = c("a" , "b " , "c ")
var4 = factor(c("a","b","c"))
class(var3) #문자형 변수
class(var4) #범주형 변수
mean(var1) #수치형에대한 평균 계산
mean(var2) #범주형이므로 계산 불가.
var2 = as.numeric(var2) # factor -> numeric transform
mean(var2) # numeric으로 바뀐 var2에 대해서 평균계산이 가능해졌다.
#주로 쓰이는 변환타입
as.character()
as.numeric()
as.date()
#벡터 : 1차원 , 한가지 변수 타입으로 구성
#행렬 : 2차원 , 한가지 변수 타입으로 구성
#DF : 2차원 , 한가지 변수 타입으로 구성
#list : 2차원 이상(다차원) 다양한 변수타입으로 구성.
#array: 2차원 이상(다차원)
#1. 벡터(1개 이상의 값, 동일한 타입)
v = c(1,2,3)
b = "hello"
#2.df
df1 = data.frame(v1 = c(1,2,3),
v2 = c("hello", "hi" , "bye"))
#3.matrix
m1 = matrix(c(1:10), ncol = 2)
class(m1)
#4.array
A1 = array(1:20, dim = c(2,5,2)) #2행 5열 깊이2의 3차원 배열
A1 #, , 1 = 1번째 깊이의 데이터
#, , 2 = 2번째 깊이의 데이터
#5.list
L1 = list(f1 = c(1) ,
f2 = data.frame(c(1,2,3)),
f3 = array(1:20, dim = c(2,5,2))
)
L1 #각 변수명에 해당하는 데이터가 각각 하나의 컬럼으로 출력된다.
#함수의 리턴결과가 리스트인 타입이 많다.
x = boxplot(mpg$cty)
class(x)
x
class(x$conf)
class(x$stats)
x$stats # 행 열 인덱스가 [,1] , [,2] 이런식으로 보이면 매트릭스 타입이다.
x$stats[ 3, 1] #3번쨰 행의 1번쨰 열만 추출.(중위수)
|
'딥러닝 모델 설계 > R STUDIO' 카테고리의 다른 글
tapply를 활용한 단어 빈도 조사 (0) | 2019.05.22 |
---|---|
리스트 <-> 벡터 , 속성값 추가 및 접근, lapply, tapply (0) | 2019.05.22 |
내장함수를 이용한 데이터 프레임 조작. (0) | 2019.05.22 |
국내지도그래프,시계열 그래프 , ggChoropleth , plotly , dodge (0) | 2019.05.22 |
USArrests, 행->컬럼. 지도 시각화, (0) | 2019.05.20 |