1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 | head(iris) x = iris[-5] #데이터셋에서 타겟벨류 삭제 y = iris$Species #데이터셋에서 타겟벨류만 저장. kc = kmeans(x , 3) #4개의 컬럼을 가진 df에 대해 클러스터 3개 kc #Within cluster sum of squares by cluster 가 클수록 중심간에 멀다. kc$cluster kc$centers kc$betweenss #군집과 군집간 중심거리의 제곱합. kc$totss #군집내 개체간 거리의 제곱합. table(y, kc$cluster) #행 - y , 열 - 클러스터 str(kc$cluster) #######표준화 x.scaled = lapply(x, scale) x.scaled class(x) x.scaled = as.data.frame(x.scaled) kc = kmeans(x.scaled , 3) #4개의 컬럼을 가진 df에 대해 클러스터 3개 kc #표준화하기 전보다 중심간 거리가 줄어들었다. // 성능 하락. table(y, kc$cluster) | cs |
'딥러닝 모델 설계 > R STUDIO' 카테고리의 다른 글
Rvest 를 활용한 데이터 마이닝 (크롤링) (0) | 2019.05.29 |
---|---|
k-means clustering example with R studio and wine data (0) | 2019.05.28 |
감정 분석 기초 (0) | 2019.05.28 |
난수, 시간측정, 그룹화 및 요약, 피봇팅, colSums, which.max (0) | 2019.05.28 |
k-means 클러스터링 예제 (0) | 2019.05.27 |