1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
head(iris)
 
= iris[-5]       #데이터셋에서 타겟벨류   삭제
= iris$Species   #데이터셋에서 타겟벨류만 저장.
 
 
kc = kmeans(x , 3)  #4개의 컬럼을 가진 df에 대해 클러스터 3개 
kc
 
#Within cluster sum of squares by cluster 가 클수록 중심간에 멀다.
kc$cluster
kc$centers
kc$betweenss    #군집과 군집간 중심거리의 제곱합.
kc$totss        #군집내 개체간 거리의 제곱합.
 
table(y, kc$cluster)  #행 - y , 열 - 클러스터
str(kc$cluster)
 
 
 
 
#######표준화
x.scaled = lapply(x, scale)
x.scaled
 
class(x)
x.scaled = as.data.frame(x.scaled)
 
kc = kmeans(x.scaled , 3)  #4개의 컬럼을 가진 df에 대해 클러스터 3개 
kc   #표준화하기 전보다 중심간 거리가 줄어들었다. // 성능 하락.
 
table(y, kc$cluster)
 
cs


+ Recent posts