- 서로 상관성이 있는 고차원 데이터를 상관성이 없는 저차원의 데이터로 변환
- 독립 변수들간의 상관관계가 존재하는 다중공선성 (Multicollinearity) 문제를 주성분 분석으로 파악하여, 정보 손실을 최소화하고 데이터의 설명력을 높게 유지하는 방향으로 차원 축소
- Scree plot을 통해 분석에 포함될 주성분 개수 확인 (예시) 제3주성분 (Comp. 3)까지의 설명 가능한 분산 합 (Cumulative Proportion)의 합이 0.8602이고 그 이후부터 분산의 기울기가 줄어듦으로 주성분 개수는 3개로 파악
'22' 데이터 분석 인재 사업 > 곱배기즈 (공모전)' 카테고리의 다른 글
자율학습 | 데이터 분석에서 로그 변환을 사용하는 이유 (0) | 2023.03.21 |
---|---|
자율학습 | Maximal Covering Location Problem (MCLP) (0) | 2023.03.21 |
자율학습 | GMM (Gaussian Mixture Model) (0) | 2023.03.21 |
자율학습 | 다중회귀분석 (독립변수가 2개 이상인 회귀분석) (0) | 2023.03.21 |
자율학습 | 상관관계 분석 (0) | 2023.03.21 |