본문 바로가기

STUDY/인공지능

[핵심 머신러닝] 머신러닝 및 인공지능 개요

728x90

****공부한 강의 : https://youtu.be/pFyFHUmxgu0

[핵심 머신러닝] 머신러닝 및 인공지능 개요

 

 

◎ 머신러닝(Machine Learning)

인간이 개발한 알고리즘을 컴퓨터 언어를 통해 기계에게 학습시키는 행위

 

Machine learned

by computer languages(인간과 컴퓨터가 소통하기 위한 수단) //C++, Python, Java, Matplotlib, R, Python 등

to perform the algorithm(문제를 해결하기 위한 방법들의 체계적인 모임) //Backpropagation, Gradient 등

created by numan

 

 

◎다변량 데이터

2개 이상의 데이터가 있으면 "다변량 데이터" 라고 부름. 하나면? 단변량 데이터

관측치: 샘플(고객, 제품, 청구건, 환자, ...) // 열에 담긴 내용

변수 : 각 관측치의 특성치 //행에 담긴 내용

 

◎ 데이터 구조

x : 어떤 원인이 되는 인자, 변수  // 독립변수, 예측변수, 입력(인풋)변수

y : x로부터 나오는 결과 // 종속변수, 반응변수, 출력(아웃풋)변수

 

◎ 머신러닝 모델링

일반적인 함수 : x -> function(x) -> y?

머신러닝 함수 : x -> function(x)? ->y

 

x와 y의 관계를 잘 찾는 알고리즘을 잘 설정하는 것이 관건이다.

 

◎ 빅데이터 모델링 및 예측

 y값이 없는 x가 왔을때 f(x) 함수식이 y값을 찾아주는 예측

 

◎ 학습데이터, 검증데이터

Training Data : 모델 f(x) 구축 시 사용되는 데이터

Testing Data : 구축된 모델을 검증하는데 사용되는 데이터

 

검증 데이터를 통해 예측값과 실제값이 많이 비슷하도록 모델을 만든다.

 

◎ 인공지능

어떠한 물체 + 함수 => 인공지능

 

◎ 모델 (F(x))의 종류

강의 16:47 그림

◎ 딥러닝이 왜 ? 뜨는가?

데이터량이 많을때

1) 딥러닝을 데이터 량이 많아질수록 성능 UP!

2) 일반 알고리즘은 일정 량의 데이터 량을 지나면 성능 향상에 크게 기여되지 않음.

 

◎ 가장 많이 쓰이는 알고리즘 통계

강의 18:32 그림

가장 많이 쓰이는 알고리즘은 회귀 분석, 클러스터링

 

728x90