본문 바로가기

STUDY/인공지능

[ML 책] 머신러닝이란?

728x90

요즘들어 머신러닝/딥러닝 공부를 하면서 수학적 지식이 정말 필수적이구나라는 생각이 많이 듭니다. 물론 수학적인 지식없이도 머신러닝과 딥러닝을 쉽게 접할 수 있습니다. 하지만, 저와같이 인공지능 연구를 하고자 하는 사람이라면 선형대수, 통계학 등 수학 공부는 필수라고 생각이 듭니다.

 

머신러닝에 필요한 기초적인 수학 공부를 하기 위해  "선형대수와 통계학으로 배우는 머신러닝 with 파이썬" 이라는 책을 읽고 블로그에 요약해보고자 합니다. 오직 제 개인적인 공부 공간으로 사용할 목적으로 포스팅을 할 예정이니 자세한 내용이 궁금하신 분들은 아래 표지 책을 구매하여 공부하시길 바랍니다.

책 표지를 누르면 저자의 깃헙으로 이동됩니다:)


[지도학습]

  • 특성 데이터(feature data)와 타깃 데이터(target data)를 기반으로 학습을 하는 것
  • 지도학습을 기반으로 대상을 나누는 것을 분류(classification)라 함

[비지도학습]

  • 타깃(target) 정보가 주어져 있지 않아 타깃 데이터(target data)없이 특성 데이터(feature data)만으로 학습을 하는 것
  • 즉, 데이터 분포의 형태를 통해 추측만 가능함
  • 비지도학습을 기반으로 데이터를 나누는 것을 군집화(clustering)라 함

[머신러닝의 목표]

  • 데이터로부터 특성 데이터(feature data)와 타깃 데이터(target data)의 관계와 패턴을 학습하여 분류/예측을 하는 것
  • 위에서 언급한 알고리즘인 모형(model)이라함
  • 예측이나 분류 성능이 높은 모형을 만드는 것

[머신러닝 모형의 특징을 나타내는 요소]

  • 파라미터(parameter)
  • 하이퍼 파라미터(hyper parameter)

1. 파라미터 (parameter)

  • 머신러닝 모형의 특징을 나타냄
  • 데이터에 기반한 값이기에 새로운 데이터를 예측, 분류하는데 영향을 미침
  • 예시) 정규분포의 파라미터 : 평균과 분산, 주어진 데이터로부터 구한 평균과 분산이 얼마냐에 따라 정규분포의 형태가 달라짐.

2. 하이퍼 파라미터 (hyper parameter)

  • 주어진 데이터로부터 구하는 것이 아니라, 외부의 사용자가 직접 입력해야함

 

데이터로부터 최적의 파라미터를 구하고 하이퍼파라미터 튜닝을 통해 모형 성능을 높일 수 있음

 

 

 

 

728x90

'STUDY > 인공지능' 카테고리의 다른 글

Attention mechanism  (0) 2023.03.27
albumentations library  (0) 2023.02.24
[실습 ML] Gradient descent algorithm  (0) 2022.02.07
[기초 ML] Gradient descent algorithm  (0) 2022.02.07
[실습 ML] Simple Linear Regression  (0) 2022.02.03