22' 데이터 분석 인재 사업/곱배기즈 (공모전)

자율학습 | GMM (Gaussian Mixture Model)

youngzzang 2023. 3. 21. 10:38

가정 : 군집화를 적용하고자 하는 데이터가 여러 개의 가우시안 분포를 가진 데이터 집합들이 섞여서 생성된 것

장점 : KMeans보다 유연하게 다양한 데이터 세트에 잘 적용될 수 있음 (기하학 모양의 군집, 서로 겹치는 군집에 대해서도 클러스터링이 잘 수행됨)

단점 : 군집화를 위한 수행시간이 오래 걸림

특징 : 주로 음성인식 모델링에 사용

 

 

여러 개의 정규 분포 곡선 (가우시안 분포)를 추출하고

개별 데이터가 그 중에 어떤 정규 분포에 속하는 지 결정하는 것이다!