변수타입 복습 정리

2019. 5. 22. 12:20

1
2
3
4
5
6
7
8
                                                                                                                         
#연속형 변수 (int)
#범주형 변수 (factor)

var1 = c(1,2,3,4,5,6); #수치형
var2 = factor(c(1,2,3,1,2)); #범주형
var2

var1 + 3  # 수치형 변수로서 vector=wise 연산이 가능.
var2 + 3  # 범주형 변수로서 vector-wise 연산 불가능.


levels(var2)  #범주형 변수의 카테고리를    출력.
levels(var1)  #수치형 변수에 대해서 NULL을 리턴.

var3 = c("a" , "b " , "c ")
var4 = factor(c("a","b","c"))

class(var3)   #문자형 변수
class(var4)   #범주형 변수

mean(var1)    #수치형에대한 평균 계산
mean(var2)    #범주형이므로 계산 불가.

var2 = as.numeric(var2)  # factor -> numeric transform
mean(var2)      # numeric으로 바뀐 var2에 대해서 평균계산이 가능해졌다.

#주로 쓰이는 변환타입
as.character()
as.numeric()
as.date()


#벡터 : 1차원 , 한가지 변수 타입으로 구성
#행렬 : 2차원 , 한가지 변수 타입으로 구성
#DF   : 2차원 , 한가지 변수 타입으로 구성
#list : 2차원 이상(다차원) 다양한 변수타입으로 구성.
#array: 2차원 이상(다차원) 

#1. 벡터(1개 이상의 값, 동일한 타입)
v = c(1,2,3)
b = "hello"


#2.df

df1 = data.frame(v1 = c(1,2,3),
                 v2 = c("hello", "hi" , "bye"))

#3.matrix
m1 = matrix(c(1:10), ncol = 2)
class(m1)


#4.array
A1 = array(1:20, dim = c(2,5,2)) #2행 5열 깊이2의 3차원 배열
A1                               #, , 1 = 1번째 깊이의 데이터
                                 #, , 2 = 2번째 깊이의 데이터


#5.list
L1 = list(f1 = c(1) ,
          f2 = data.frame(c(1,2,3)),
          f3 = array(1:20, dim = c(2,5,2))
          )

L1                            #각 변수명에 해당하는 데이터가 각각 하나의 컬럼으로 출력된다.


#함수의 리턴결과가 리스트인 타입이 많다.
x = boxplot(mpg$cty)
class(x)
x

class(x$conf)
class(x$stats)
x$stats  # 행 열 인덱스가 [,1] , [,2] 이런식으로 보이면 매트릭스 타입이다.
x$stats[ 3, 1] #3번쨰 행의  1번쨰 열만 추출.(중위수)

저작자표시 (새창열림)

'딥러닝 모델 설계 > R STUDIO' 카테고리의 다른 글

tapply를 활용한 단어 빈도 조사 (0)	2019.05.22
리스트 <-> 벡터 , 속성값 추가 및 접근, lapply, tapply (0)	2019.05.22
내장함수를 이용한 데이터 프레임 조작. (0)	2019.05.22
국내지도그래프,시계열 그래프 , ggChoropleth , plotly , dodge (0)	2019.05.22
USArrests, 행->컬럼. 지도 시각화, (0)	2019.05.20

Software knowledge worth spreading

변수타입 복습 정리

'딥러닝 모델 설계 > R STUDIO' 카테고리의 다른 글

+ Recent posts

티스토리툴바