728x90
머신러닝에 필요한 기초적인 수학 공부를 하기 위해 "선형대수와 통계학으로 배우는 머신러닝 with 파이썬" 이라는 책을 읽고 블로그에 요약해보고자 합니다. 오직 제 개인적인 공부 공간으로 사용할 목적으로 포스팅을 할 예정이니 자세한 내용이 궁금하신 분들은 아래 표지 책을 구매하여 공부하시길 바랍니다.
이전 포스팅 >>>>> [STUDY/인공지능] - [ML 책] 특이값 분해
[차원 축소]
- 노이즈 noise : data의 중요하지 않은 부분으로 데이터에서 정보를 얻을 때 방해함
- 노이즈 제거 방법 ? 차원 축소 dimension reduction
- 차원 축소 핵심? 주어진 데이터의 정보 손실을 최소화하면서 줄이는 것
- 특징 추출? 데이터 에서 두드러진 면을 찾는 것
차원 축소 방법
1. 비지도 학습 : PCA 주성분 분석
2. 지도 학습 : LDA 선형 판별 분석
[차원의 저주 Curse of dimensionality]
- 차원 축소로 해결할 수 있음
- 데이터의 차원이 커질수록 해당 차원을 표현하기 위해 필요한 데이터가 기하급수적으로 많아짐을 의미
- training dataset의 차원이 클수록 차원의 저주 때문에 해당 공간을 적절히 표현 못해 overfitting 과적합이 될 확률이 높음
728x90
'STUDY > 인공지능' 카테고리의 다른 글
[딥러닝] RNN, LSTM 설명 (0) | 2023.07.17 |
---|---|
[머신러닝/딥러닝] feature importance(MDI, Drop Column, Permutation) 각 각에 대한 설명, 코드 (0) | 2023.07.16 |
[ML 책] 특이값 분해 (0) | 2023.06.27 |
[ML 책] 고유값, 고유벡터, 고유값분해 (0) | 2023.06.22 |
[ML 책] 스칼라, 벡터, 행렬, 텐서, 행렬 곱, 행렬 원소곱, 행렬식, 역행렬 (0) | 2023.06.20 |