****공부한 강의 : https://youtu.be/pFyFHUmxgu0
◎ 머신러닝(Machine Learning)
인간이 개발한 알고리즘을 컴퓨터 언어를 통해 기계에게 학습시키는 행위
Machine learned
by computer languages(인간과 컴퓨터가 소통하기 위한 수단) //C++, Python, Java, Matplotlib, R, Python 등
to perform the algorithm(문제를 해결하기 위한 방법들의 체계적인 모임) //Backpropagation, Gradient 등
created by numan
◎다변량 데이터
2개 이상의 데이터가 있으면 "다변량 데이터" 라고 부름. 하나면? 단변량 데이터
관측치: 샘플(고객, 제품, 청구건, 환자, ...) // 열에 담긴 내용
변수 : 각 관측치의 특성치 //행에 담긴 내용
◎ 데이터 구조
x : 어떤 원인이 되는 인자, 변수 // 독립변수, 예측변수, 입력(인풋)변수
y : x로부터 나오는 결과 // 종속변수, 반응변수, 출력(아웃풋)변수
◎ 머신러닝 모델링
일반적인 함수 : x -> function(x) -> y?
머신러닝 함수 : x -> function(x)? ->y
x와 y의 관계를 잘 찾는 알고리즘을 잘 설정하는 것이 관건이다.
◎ 빅데이터 모델링 및 예측
y값이 없는 x가 왔을때 f(x) 함수식이 y값을 찾아주는 예측
◎ 학습데이터, 검증데이터
Training Data : 모델 f(x) 구축 시 사용되는 데이터
Testing Data : 구축된 모델을 검증하는데 사용되는 데이터
검증 데이터를 통해 예측값과 실제값이 많이 비슷하도록 모델을 만든다.
◎ 인공지능
어떠한 물체 + 함수 => 인공지능
◎ 모델 (F(x))의 종류
◎ 딥러닝이 왜 ? 뜨는가?
데이터량이 많을때
1) 딥러닝을 데이터 량이 많아질수록 성능 UP!
2) 일반 알고리즘은 일정 량의 데이터 량을 지나면 성능 향상에 크게 기여되지 않음.
◎ 가장 많이 쓰이는 알고리즘 통계
가장 많이 쓰이는 알고리즘은 회귀 분석, 클러스터링
'STUDY > 인공지능' 카테고리의 다른 글
Deep Learning 데이터 준비하기 (0) | 2021.10.15 |
---|---|
딥러닝에 들어가기 앞서,, (0) | 2021.10.15 |
ლ개발 환경 갖추기 2탄 (pytorch, arnarconda, dlib 등)ლ (1) | 2021.01.21 |
ლ개발 환경 갖추기 (pytorch, arnarconda, dlib 등) ლ (0) | 2021.01.18 |
ლ논문01_"StarGAN v2: Diverse Image Synthesis for Multiple Domains"ლ (1) | 2021.01.18 |