데이터분석/데이터 분류 및 군집화

데이터 분류(Classification)과 군집화(Clustering)의 차이점

상선약수64 2023. 9. 21. 21:06
반응형

 

군집화와 분류의 차이점
이해하기 





 


분류 : 지도학습의 종류, 군집 : 비지도 학습 

 

1. 분류(Classification)과 군집(Clustering) 차이점

  • 분류 : 각개체의 소속집단의 정보를 알고 있을 경우새로운 데이터의 그룹을 예측하기 위한 것(지도학습) 
  • 군집 : 각개체의 소속집단의 정보를 모를 경우, 데이터의 특성을 알고 싶은 경우(비지도 학습)

 

2. 학습방법과 예시

  • 분류 : 분류 작업은 레이블(소속집단의 정보)된 학습 데이터를 사용하여 모델을 훈련하고, 이 모델을 사용하여 새로운 데이터를 예측하거나 분류합니다. 주요 분류 알고리즘에는 아래와 같고, 사례는 이메일 스팸 필터링, 손글씨 숫자 인식, 암 종양 여부 판단 등과 같은 것이 분류에 해당합니다.
    • 로지스틱 회귀
    • 의사결정 트리
    • 랜덤 포레스트
    • 최근접 알고리즘(KNN)
    • 앙상블 모델
    • SVM 
    • 나이브 베이즈 등 

 

  • 군집 : 군집화 작업은 레이블(소속집단의 정보) 없는 데이터를 사용하며, 유사성을 기반으로 데이터를 그룹화 합니다..  주요 군집화 알고리즘에는 아래와 같고, 사례는 고객 세분화, 이미지 분할, 텍스트 문서 토픽 모델링 등이 군집에 해당합니다.
    • K-평균 군집화
    • 계층적 군집화(H-Cluster)
    • DBSCAN
    • 혼합 가우시안 모델 등 입니다.