본문 바로가기

STUDY/인공지능

[ML 책] 지도 학습과 비지도 학습의 목적과 차이, 파라미터와 하이퍼 파라미터의 차이

728x90

머신러닝에 필요한 기초적인 수학 공부를 하기 위해  "선형대수와 통계학으로 배우는 머신러닝 with 파이썬" 이라는 책을 읽고 블로그에 요약해보고자 합니다. 오직 제 개인적인 공부 공간으로 사용할 목적으로 포스팅을 할 예정이니 자세한 내용이 궁금하신 분들은 아래 표지 책을 구매하여 공부하시길 바랍니다.

 

책 표지를 누르면 저자의 깃헙으로 이동됩니다:)

이전 포스팅  >>>>> [STUDY/머신러닝\딥러닝] - [ML책] 엔트로피, 크로스 엔트로피, KL Divergence, Negative log Likelihood 

 

[ML책] 엔트로피, 크로스 엔트로피, KL Divergence, Negative log Likelihood

머신러닝에 필요한 기초적인 수학 공부를 하기 위해 "선형대수와 통계학으로 배우는 머신러닝 with 파이썬" 이라는 책을 읽고 블로그에 요약해보고자 합니다. 오직 제 개인적인 공부 공간으로 사

chaeso-coding.tistory.com


[인공지능]

  • 1956년에 처음 언급
  • 딥러닝 < 머신러닝 < 인공지능
  • 머신러닝 : 데이터의 패턴을 파악하는데 데이터의 역할이 매우 중요
  • 딥러닝 : 신경망(Neural Network) 구조 기반으로 학습

 

[프로그램]

  • 지식기반 프로그램 Knowledge base
  • 규칙기반 프로그램 Rule base

 

[지도학습 Supervised Learning]

  • 정답을 알고 있는 데이터
  • 데이터의 특성 feature 필요
  • 데이터 이름 필요
  • 특성 데이터(feature data)기반으로 타깃 데이터(target data) 학습 가능
  • Ex. k-최근접 이웃 알고리즘, 선형 회귀 분석, 로지스틱 회귀 분석, 나이브베이즈, 의사결정나무, 서포트 벡터 머신

 

[비지도학습 Unsupervised Learning]

  • 정답을 모르는 데이터
  • 타깃 데이터(target data) 정보 없음
  • 시각화 해도 알 수 없음
  • 오직, 데이터 분포의 형태를 통해 추측 가능
  • Ex. k-평균 클러스터링, 계층 클러스터링, DBSCAN,  가우시안 혼합 행렬, 주성분 분석

 

[분류와 군집]

  • 분류 classification : 주어진 특성 데이터(feature data)와 타깃 데이터(target data)기반으로 나눔
  • 군집 clustering : 타깃 데이터(target data)없이 특성 데이터(feature data)로만 학습해 나눔

 

[머신러닝의 목표]

  • data로부터 feature와 target data의 관계, 패턴을 학습해서 분류 또는 예측하는 것
  • 예측, 분류 성능 높은 모형을 만드는 것
  • data로부터 최적 파라미터를 구하고 하이퍼 파라미터 튜닝을 통해 모형 성능을 높여야 함

 

[머신러닝의 특징을 나타내는 요소]

  • 파라미터 parameter : data에 기반한 값, data로부터 구한 파라미터는 새로운 data를 예측, 분류하는데 영향을 미침
  • 하이퍼 파라미터 hyper parameter : 주어진 data가 아니고 외부 사용자가 직접 입력해야하는 값
728x90