728x90
머신러닝에 필요한 기초적인 수학 공부를 하기 위해 "선형대수와 통계학으로 배우는 머신러닝 with 파이썬" 이라는 책을 읽고 블로그에 요약해보고자 합니다. 오직 제 개인적인 공부 공간으로 사용할 목적으로 포스팅을 할 예정이니 자세한 내용이 궁금하신 분들은 아래 표지 책을 구매하여 공부하시길 바랍니다.
이전 포스팅 >>>>> [STUDY/머신러닝\딥러닝] - [ML책] 엔트로피, 크로스 엔트로피, KL Divergence, Negative log Likelihood
[인공지능]
- 1956년에 처음 언급
- 딥러닝 < 머신러닝 < 인공지능
- 머신러닝 : 데이터의 패턴을 파악하는데 데이터의 역할이 매우 중요
- 딥러닝 : 신경망(Neural Network) 구조 기반으로 학습
[프로그램]
- 지식기반 프로그램 Knowledge base
- 규칙기반 프로그램 Rule base
[지도학습 Supervised Learning]
- 정답을 알고 있는 데이터
- 데이터의 특성 feature 필요
- 데이터 이름 필요
- 특성 데이터(feature data)기반으로 타깃 데이터(target data) 학습 가능
- Ex. k-최근접 이웃 알고리즘, 선형 회귀 분석, 로지스틱 회귀 분석, 나이브베이즈, 의사결정나무, 서포트 벡터 머신
[비지도학습 Unsupervised Learning]
- 정답을 모르는 데이터
- 타깃 데이터(target data) 정보 없음
- 시각화 해도 알 수 없음
- 오직, 데이터 분포의 형태를 통해 추측 가능
- Ex. k-평균 클러스터링, 계층 클러스터링, DBSCAN, 가우시안 혼합 행렬, 주성분 분석
[분류와 군집]
- 분류 classification : 주어진 특성 데이터(feature data)와 타깃 데이터(target data)기반으로 나눔
- 군집 clustering : 타깃 데이터(target data)없이 특성 데이터(feature data)로만 학습해 나눔
[머신러닝의 목표]
- data로부터 feature와 target data의 관계, 패턴을 학습해서 분류 또는 예측하는 것
- 예측, 분류 성능 높은 모형을 만드는 것
- data로부터 최적 파라미터를 구하고 하이퍼 파라미터 튜닝을 통해 모형 성능을 높여야 함
[머신러닝의 특징을 나타내는 요소]
- 파라미터 parameter : data에 기반한 값, data로부터 구한 파라미터는 새로운 data를 예측, 분류하는데 영향을 미침
- 하이퍼 파라미터 hyper parameter : 주어진 data가 아니고 외부 사용자가 직접 입력해야하는 값
728x90
'STUDY > 인공지능' 카테고리의 다른 글
[ML 책] 고유값, 고유벡터, 고유값분해 (0) | 2023.06.22 |
---|---|
[ML 책] 스칼라, 벡터, 행렬, 텐서, 행렬 곱, 행렬 원소곱, 행렬식, 역행렬 (0) | 2023.06.20 |
[ML 책] 엔트로피, 크로스 엔트로피, KL Divergence, Negative log Likelihood (0) | 2023.06.19 |
까먹지 않기 위한 파이토치 공부 내용 정리3 (0) | 2023.06.11 |
까먹지 않기 위한 파이토치 공부 내용 정리2 (0) | 2023.06.11 |