반응형
군집화와 분류의 차이점
이해하기
분류 : 지도학습의 종류, 군집 : 비지도 학습
1. 분류(Classification)과 군집(Clustering) 차이점
- 분류 : 각개체의 소속집단의 정보를 알고 있을 경우새로운 데이터의 그룹을 예측하기 위한 것(지도학습)
- 군집 : 각개체의 소속집단의 정보를 모를 경우, 데이터의 특성을 알고 싶은 경우(비지도 학습)
2. 학습방법과 예시
- 분류 : 분류 작업은 레이블(소속집단의 정보)된 학습 데이터를 사용하여 모델을 훈련하고, 이 모델을 사용하여 새로운 데이터를 예측하거나 분류합니다. 주요 분류 알고리즘에는 아래와 같고, 사례는 이메일 스팸 필터링, 손글씨 숫자 인식, 암 종양 여부 판단 등과 같은 것이 분류에 해당합니다.
- 로지스틱 회귀
- 의사결정 트리
- 랜덤 포레스트
- 최근접 알고리즘(KNN)
- 앙상블 모델
- SVM
- 나이브 베이즈 등
- 군집 : 군집화 작업은 레이블(소속집단의 정보) 없는 데이터를 사용하며, 유사성을 기반으로 데이터를 그룹화 합니다.. 주요 군집화 알고리즘에는 아래와 같고, 사례는 고객 세분화, 이미지 분할, 텍스트 문서 토픽 모델링 등이 군집에 해당합니다.
- K-평균 군집화
- 계층적 군집화(H-Cluster)
- DBSCAN
- 혼합 가우시안 모델 등 입니다.
'데이터분석 > 데이터 분류 및 군집화' 카테고리의 다른 글
의사결정나무를 이용한 분류모형 (0) | 2023.10.25 |
---|---|
분류모형의 성능평가 (0) | 2023.10.22 |
중심 기반 군집의 K-Means 군집화 알고리즘 (0) | 2023.10.06 |
데이터 계층적 군집화(Hierarchical Clustering) (0) | 2023.10.04 |
K-Nearest Neighbors 알고리즘 이해과 붓꽃(IRIS) 데이터 활용 (0) | 2023.09.21 |