클러스터링 좀 더 의미있는 인사이트를 추출하기 위해 유사한 데이터들을 클러스터(집단)으로 묶어주는 것 비지도학습 중 하나(정답이 주어지지 않은 상태에서 스스로 찾아내는 것) 정답을 주지 않아도, 알아서 클러스터를 나눠준다 하지만 해당 클러스터가 무엇을 의미하는지는 분석해주지 않는다 -유사한 데이터는 같은 클러스터로 묶는다 -유사하지 않은 데이터는 다른 클러스터로 묶는다 유사의 기준 1. 거리 2. 계층 3. 밀도 4. 분포 1. 거리 기반 클러스터링(K-Means) k개의 중심점을 임의로 배치한 후 각 중심점과 가까이 있는 데이터들을 클러스터로 묶어주고, 중심점을 클러스터 내 데이터들의 중심으로 이동시킨다 -> 중심점 위치 갱신 안할 때까지 반복 필요 라이브러리 임포트 from sklearn.cluste..